Les alertes d'ingénierie fournissent une notification rapide des déviations significatives ou critiques du système par rapport aux zones de fonctionnement normales.
Notre produit, Bluejay, aide les équipes d'ingénierie à auditer en continu les alertes sur les ressources d'infrastructure et d'application et à mettre en place automatiquement les meilleures pratiques d'alerte - conduisant à une réduction de 30 % des temps d'arrêt.
Lorsqu'une alerte est déclenchée, Bluejay fournit un runbook alimenté par l'IA pour aider les ingénieurs à déboguer et résoudre le problème plus rapidement.
Les outils de surveillance (comme AWS Cloudwatch et NewRelic) collectent des métriques de performance d'infrastructure et d'application et sont utilisés pour effectuer des analyses de la cause première et gérer les incidents/pannes de production.
Nous croyons que la gestion des incidents ne doit pas commencer après la panne. Elle doit commencer par des alertes complètes et de bons processus d'astreinte qui empêchent ces incidents de production de se produire. Notre produit, Bluejay, fait exactement cela.
· Bluejay identifie les alertes manquantes sur les services d'infrastructure et d'application en utilisant les outils de surveillance existants
· Automatise la configuration et le déploiement des alertes en un seul clic
· Lorsqu'une alerte est déclenchée, elle notifie les ingénieurs d'astreinte par email, slack et téléphone
· Avec la notification, elle fournit des instructions contextuelles pour déboguer, résoudre et atténuer les problèmes
· Analyse en continu les alertes et optimise les seuils pour détecter les incidents potentiels et prévenir la fatigue des alertes
Notre proposition de valeur est d'éliminer les temps d'arrêt évitables et d'assurer une résolution rapide des pannes inévitables.