Annonce

#1 2017-11-21 11:48:53

o2switch
o2switch
Lieu : Clermont-Ferrand
Inscription : 2014-06-17
Site Web

[21/11/2017] [11h GMT+1] Retour incident "ronron"

Bonjour,

Nous avons eu des retours de certains hébergés, concernant des problématiques de performances récurrentes sur "ronron".
Nous avons constaté, de notre côté, quelques cas mais ne sommes pas parvenus à reproduire avec exactitude l'origine du problème. Ni même d'en trouver un probant.

Ce jour, le 21/11/2017 vers 11h, il semble que "ronron" ait remonté des erreurs franches : coupures intempestives, IO.
Malgrès cela, le matériel semble être en ordre, et les self-tests ne présentent pas d'erreur.

Aussi, lorsque "ronron" a coupé à 11h nous avons pris la décision radicale de changer tout le matériel dans l'urgence. Afin de minimiser des impacts futurs et résoudre définitivement des cas remontés.

Ainsi, n'étant pas en mesure de trouver une justification probante, nous avons déplacé les données vers un serveur neuf.
Bien entendu, aucune perte, et le fonctionnement, les configurations restent similaires.

Par la même occasion nous avons aussi modifié le stockage NVMe associé à MySQL par une carte PCI-Express neuve.
Nous suspectons en effet des latences anormales sur ce matériel.

Le serveur est de nouveau en ligne vers ~11h30. Les services sont en relance et le tout devrait rapidement redevenir optimal.

Cordialement
Equipe o2switch.

Hors ligne