Conference45min
Fini les nuits difficiles: Comment l'IA a transformé nos astreintes
nAIghts Watch automatise la gestion des incidents IT de niveau 1 grâce à une IA multi-agents : détection, analyse, exécution d’actions et reporting. Résultats : astreintes réduites de 80 %, résolution 20 fois plus rapide, amélioration de la satisfaction et libération de temps pour l’innovation SRE.
Jean-Philippe FourèsIguane Solutions
Chaque nuit, des ingénieurs sont réveillés, pas toujours pour des urgences critiques mais très souvent pour des incidents simples : limite d'espace disque, service qui ne répond plus, charge CPU anormale.
Ces incidents, dits de "niveau 1" sont faciles à résoudre en quelques minutes. Pourtant on réveille l'astreinte pour cela.
La durée totale va prendre 1 heure:
1 heure pendant laquelle:
Chez Iguane Solutions, on développe nAIghts Watch : un système multi-agents IA qui résoud automatiquement des incidents de niveau 1 h24.
Detection d'alerte
Analyse des logs et métriques
Exécute des commandes pré-validés par des SREs: restart, log rotate, ...
Vérifie le retour à la normale
Rédige un rapport d'incident complet.
Résultats:
-> Diminution de la sollicitation des astreintes de 80%
-> Résolution 20x plus rapide (60 minutes → 3 minutes)
-> Amélioration de la satisfaction de nos techs et de nos clients: chaque incident à un rapport!
-> Nos SREs ont plus de temps pour innover et entrainer le système agentique
Ces incidents, dits de "niveau 1" sont faciles à résoudre en quelques minutes. Pourtant on réveille l'astreinte pour cela.
La durée totale va prendre 1 heure:
- reveil de l'agent,
- prise en compte de l'alerte
- investiguer
- résoudre le soucis
- vérifier que c'est ok
- répondre au ticket
1 heure pendant laquelle:
- le service in indisponible
- perte de revenue
- un agent est sous pression
Chez Iguane Solutions, on développe nAIghts Watch : un système multi-agents IA qui résoud automatiquement des incidents de niveau 1 h24.
Detection d'alerte
Analyse des logs et métriques
Exécute des commandes pré-validés par des SREs: restart, log rotate, ...
Vérifie le retour à la normale
Rédige un rapport d'incident complet.
Résultats:
-> Diminution de la sollicitation des astreintes de 80%
-> Résolution 20x plus rapide (60 minutes → 3 minutes)
-> Amélioration de la satisfaction de nos techs et de nos clients: chaque incident à un rapport!
-> Nos SREs ont plus de temps pour innover et entrainer le système agentique
Jean-Philippe Fourès
VP Product at Iguane Solutions, specializes in AI-powered infrastructure management and platform system administration. With 15+ years of experience in Tech (Android, Big Data Telco, Cloud infrastructure), I led the product development of nAIghts Watch, transforming how enterprises handle incident response.
comments.speakerNotEnabledComments