Bluejay ajuda equipes de engenharia a auditar continuamente alertas em recursos de infraestrutura e aplicação e a configurar automaticamente as melhores práticas de alerta - levando a uma redução de 30% nos tempos de inatividade. Quando um alerta é acionado, Bluejay fornece um run-book com inteligência artificial para ajudar os engenheiros a depurar e resolver o problema mais rapidamente.
Ferramentas de monitoramento (como AWS Cloudwatch e NewRelic) coletam métricas de desempenho de infraestrutura e aplicação, mas os alertas sobre essas métricas precisam ser configurados manualmente. As ferramentas de gerenciamento de incidentes atuais entram em ação apenas após um alerta ser acionado. Mas se os alertas não forem configurados inicialmente, tudo o que vem depois se torna irrelevante.
Para nós, gerenciamento de incidentes significa reduzir a possibilidade de incidentes em vez de reagir a eles. Isso requer a construção de mecanismos de alerta fortes que eliminem o trabalho manual para os engenheiros. Além disso, é crucial otimizar continuamente os limites para evitar a fadiga de alertas para os engenheiros de plantão. Nenhuma das ferramentas de gerenciamento de incidentes faz isso hoje.
Acreditamos que o gerenciamento de incidentes não deve começar após a interrupção. Deve começar com alertas abrangentes e bons processos de plantão que evitem que esses incidentes de produção aconteçam.
Bluejay faz exatamente isso.
- Bluejay identifica os alertas ausentes em serviços de infraestrutura e aplicação usando suas
ferramentas de monitoramento existentes
- Automatiza a configuração e implantação de alertas com um único clique
- Quando um alerta é acionado, notifica os engenheiros de plantão por e-mail, slack e telefone
- Junto com a notificação, fornece instruções contextuais para depurar, resolver e mitigar os
problemas
- Analisa continuamente os alertas e otimiza os limites para detectar incidentes potenciais e
prevenir a fadiga de alertas