Incident plateforme
Incident Report for smsmode©
Postmortem

Résumé de l'incident

  • Service impacté : SMS
  • Type de problème : Envoi de SMS indisponible
  • Impact sur le client : Fort
  • Durée de l'incident : 15 minutes

    • Début : 28/09/2024 à 10:45 CET
    • Fin : 28/09/2024 à 11:00 CET
  • Description : Une interruption temporaire des envois de SMS est survenue en raison d’une intervention technique imprévue.

Impact
L'incident a affecté les services suivants :

  • API REST SMS : Indisponibilité pour l’envoi de messages.
  • Interface utilisateur (ui.smsmode.com) : Envoi de SMS indisponible via la plateforme web.
  • Notifications de livraison (DLR) : Suspension temporaire de la réception des accusés de livraison.

Les campagnes en cours et les notifications critiques ont été fortement impactées.Analyse des causes
L'incident a été causé par une erreur humaine survenue lors de l'exécution d'une procédure technique courante. Plus précisément :

  • Une étape critique de la procédure de basculement (switch) a été omise, entraînant une indisponibilité temporaire des services.
  • Les validations prévues dans la procédure actuelle n’ont pas suffi à prévenir cette omission.

Actions correctives et préventives

  1. Mise à jour des processus techniques :
  • Ajout d’une étape de validation manuelle obligatoire pour chaque action critique, notamment les procédures de basculement.
  • Automatisation de la procédure de switch pour minimiser les interventions humaines, en utilisant des outils internes développés à cet effet.
  1. Sensibilisation des procédures et MAJ de celles-ci :
  • Formation spécifique des équipes techniques sur les procédures sensibles, avec des ateliers pratiques sur les impacts potentiels des erreurs humaines.
  • Intégration d’un module de simulation d’incidents dans le cadre des formations pour améliorer la gestion des situations critiques.
  1. Renforcement des outils de supervision :
  • Déploiement de nouveaux outils d'alerte et de monitoring pour détecter immédiatement les anomalies liées aux procédures techniques.
  • Mise en place d’un tableau de bord en temps réel pour surveiller l’état des services lors des interventions.
Posted Nov 21, 2024 - 08:00 CET

Resolved
Cher client,

Nous vous informons qu'un incident sur la plateforme a eu lieu ce jour impactant directement les envois de sms.

Service impacté : SMS
Type de problème : Envoi de sms indisponible
Impact sur le client : Fort
Date début : 28/09/2024
Heure début : 10:45CET
Heure de fin : 11:00CET
Description : Les envois de sms étaient indisponibles.

Nous vous prions de nous excuser pour la gêne occasionnée.

Cordialement
L'équipe smsmode©
https://www.smsmode.com
https://statuspage.smsmode.com
Mail : support@smsmode.com
tel : =33 (0)4 91 05 64 62

---------------------------------------------- English follows

Hello,

We would like to inform you that there has been an incident on the platform impacting directly the sending of the messages.

Impacted service: SMS
Type of problem: Sending messages unavailable
Impact on the customer: Strong
Start date: 28/09/2024
Start time: 10:45CET
End Time: 11:00CET
Description : Sending messages was unavailable

We apologize for the inconvenience caused.

Cordially.

The smsmode© team
https://www.smsmode.com
https://statuspage.smsmode.com
Mail: support@smsmode.com
phone: = 33 (0) 4 91 05 64 62
Posted Sep 28, 2024 - 11:11 CEST
This incident affected: API's (API REST SMS, API HTTPS (deprecated)), Notification (DLR), and Products (Interface ui.smsmode.com).