Pages : 1
Bonjour,
Nous rencontrons un incident électrique sur 8 baies.
L'incident est en cours de résolution, et lié à la maintenance d'une chaine électrique (A) et de ses onduleurs.
Les serveurs sont tous reliés à deux chaines différentes (A & B), par deux canalis différents. Tous les serveurs concernés étaient donc double-alimentés.
Durant la maintenance de la chaine onduleur A, la chaine B a repris la charge suite à un défaut sur la chaine A, mais, pour une raison en cours d'investigation un disjoncteur de Canalis (rangée de distribution électrique) de la chaine B se met en défaut (aucune raison apparente).
Début d'incident : 14/06/2024 - 10h36
Incident en cours de résolution. Les serveurs vont redevenir UP rapidement. (planificatif ~15 à 20mns)
L'équipe électrique sur place réalise une recherche sur l'origine du double incident. et prendra dans la foulée les mesures pour éviter toute réitération.
Ce type de maintenance, de routine et déjà opérée par le passé, n'est jamais notifiée au préalable. En effet, le datacenter concerné est construit sous une architecture de type Tier 4 qui impose une tolérance aux pannes. une redondance et une continuité de service. Aussi, en circonstance normale, cela ne devrait et n'aurait jamais dù arriver.
Nous nous excusons pour la gène générée.
Nous faisons au plus vite.
Cordialement
Equipe Technique
Hors ligne
95% des serveurs sont redémarrés.
Attention : une charge système au redémarrage d'un serveur peut justifier des erreurs 500/502/503 pendant quelques instants. Le tout va redevenir stable automatiquement.
Cordialement
Equipe Technique
Hors ligne
Pages : 1