SRE (Site Reliability Engineering)
Conteúdo Programático
- Como tornar os sistemas confiáveis;
- Noções básicas sobre SLIs, SLOs e SLAs.
- Metas de confiabilidade e orçamentos de erro.
- O que medir: usando SLIs.
- Medindo os SLIs.- Quantificando riscos e consequências de SLOs.
- Monitoramento: Velocidade, cálculos, Interfaces, Alertas
- Alerta sobre SLOs- Eliminando o trabalho árduo
- Simplicidade
- Resposta ao Incidente
- Plantões.
- Cultura pós-morte: aprendendo com o fracasso
- Gerenciando Carga
- Identificação e recuperação de sobrecarga
- Modelo de Engajamento SRE
- Casos de Uso - Exemplos