J'ai fait des recherches sur les plateformes de surveillance de sites web et une chose qui revient souvent est la façon dont elles gèrent la gestion des incidents. C'est une chose de recevoir des alertes de disponibilité, mais les lier directement à la réponse aux incidents (pages de statut, flux de travail d'astreinte, intégrations avec Slack/PagerDuty, etc.) semble beaucoup plus précieux lorsque vous gérez des sites de production.
J'entends aussi souvent parler de Pingdom, Datadog, et New Relic, qui sont souvent utilisés pour la gestion des incidents avec PagerDuty, Opsgenie, ou Slack.
Pour les équipes qui gèrent déjà la surveillance et les flux de travail d'incidents, quelle plateforme offre réellement l'intégration la plus fluide ? Restez-vous avec un tout-en-un comme Better Stack ou associez-vous un moniteur léger avec un outil de gestion des incidents dédié ?

