Bluejay aide les équipes d'ingénierie à auditer en continu les alertes sur les ressources d'infrastructure et d'application et à mettre en place automatiquement les meilleures pratiques d'alerte, ce qui conduit à une réduction de 30 % des temps d'arrêt. Lorsqu'une alerte est déclenchée, Bluejay fournit un livre de procédures alimenté par l'IA pour aider les ingénieurs à déboguer et résoudre le problème plus rapidement.
Les outils de surveillance (comme AWS Cloudwatch et NewRelic) collectent des métriques de performance d'infrastructure et d'application, mais les alertes sur ces métriques doivent être configurées manuellement. Les outils de gestion des incidents actuels n'interviennent qu'après le déclenchement d'une alerte. Mais si les alertes ne sont pas configurées au départ, tout ce qui suit devient sans importance.
Pour nous, la gestion des incidents signifie réduire la possibilité d'incidents plutôt que de réagir aux incidents. Cela nécessite de construire de solides mécanismes d'alerte qui éliminent le travail manuel pour les ingénieurs. De plus, il est crucial d'optimiser continuellement les seuils pour éviter la fatigue des alertes pour les ingénieurs d'astreinte. Aucun des outils de gestion des incidents ne fait cela aujourd'hui.
Nous croyons que la gestion des incidents ne doit pas commencer après la panne. Elle doit commencer par des alertes complètes et de bons processus d'astreinte qui empêchent ces incidents de production de se produire.
Bluejay fait exactement cela.
- Bluejay identifie les alertes manquantes sur les services d'infrastructure et d'application en utilisant vos outils de surveillance existants
- Automatise la configuration et le déploiement des alertes en un seul clic
- Lorsqu'une alerte est déclenchée, elle notifie les ingénieurs d'astreinte par email, slack et téléphone
- Avec la notification, elle fournit des instructions contextuelles pour déboguer, résoudre et atténuer les problèmes
- Analyse en continu les alertes et optimise les seuils pour détecter les incidents potentiels et prévenir la fatigue des alertes