Bluejay hilft Ingenieurteams, kontinuierlich Alarme für Infrastruktur- und Anwendungsressourcen zu prüfen und automatisch die besten Praktiken für Alarmierung einzurichten, was zu einer Reduzierung der Ausfallzeiten um 30 % führt. Wenn ein Alarm ausgelöst wird, bietet Bluejay ein KI-gestütztes Handbuch, um Ingenieuren zu helfen, das Problem schneller zu debuggen und zu lösen.
Überwachungstools (wie AWS Cloudwatch und NewRelic) sammeln Leistungsmetriken von Infrastruktur und Anwendungen, aber Alarme für diese Metriken müssen manuell eingerichtet werden. Aktuelle Vorfallmanagement-Tools kommen erst zum Einsatz, nachdem ein Alarm ausgelöst wurde. Wenn die Alarme jedoch nicht von Anfang an eingerichtet sind, wird alles nachgelagerte irrelevant.
Für uns bedeutet Vorfallmanagement, die Möglichkeit von Vorfällen zu reduzieren, anstatt auf Vorfälle zu reagieren. Dies erfordert den Aufbau starker Alarmierungsmechanismen, die manuelle Arbeit für Ingenieure eliminieren. Darüber hinaus ist es entscheidend, Schwellenwerte kontinuierlich zu optimieren, um Alarmmüdigkeit bei Bereitschaftsingenieuren zu vermeiden. Keines der heutigen Vorfallmanagement-Tools tut dies.
Wir glauben, dass das Vorfallmanagement nicht nach dem Ausfall beginnen sollte. Es muss mit umfassenden Alarmen und guten Bereitschaftsprozessen beginnen, die diese Produktionsvorfälle verhindern.
Bluejay tut genau das.
- Bluejay identifiziert die fehlenden Alarme sowohl für Infrastruktur- als auch für Anwendungsdienste mit Ihren vorhandenen Überwachungstools
- Automatisiert die Einrichtung und Bereitstellung von Alarmen mit einem Klick
- Wenn ein Alarm ausgelöst wird, benachrichtigt es die Bereitschaftsingenieure per E-Mail, Slack und Telefon
- Zusammen mit der Benachrichtigung bietet es kontextbezogene Anweisungen zum Debuggen, Lösen und Abschwächen der Probleme
- Analysiert kontinuierlich Alarme und optimiert die Schwellenwerte, um potenzielle Vorfälle zu erkennen und Alarmmüdigkeit zu verhindern