Annonce

#1 2021-01-27 19:21:28

o2switch
o2switch
Lieu : Clermont-Ferrand
Inscription : 2014-06-17
Site Web

[27/01/2020] Incident "rixo"

Bonjour,

Notre équipe a constaté des lenteurs par périodes courtes, depuis quelques heures, sur un serveur de l'hôte rixo.
Après analyse, il était à constater des blocages IO, où la lecture des blocks devenait impossible sur un volume RAID.

Nous avons alors testé :
- Le remplacement de chacun des disques, successivement du volume RAID concerné.
Pas de changement.
- Le remplacement du controleur RAID matériel et des cables SAS.
Pas de changement.

En conséquence nous avons changé complètement le serveur impacté.
Les disques SAS et NVMe sont reconnus sans erreur, et le fonctionnement parait optimal.

Le nouveau serveur physique, neuf, reste en observation dans nos salles techniques.
Nous suspectons donc, en origine, le backplane du serveur 2U concerné d'avoir été responsable des erreurs.

Le nouveau serveur sera racké dans la journée du Jeudi 28 Janvier à l'emplacement baie initial.
Date de secours de cette opération : 29 Janvier. Délai ~10mns.
Le serveur défaillant sera détruit.

Cordialement
Service Technique

Hors ligne