L’une des plus grandes bourses mondiales d’instruments dérivés a connu une panne massive la semaine dernière. Plusieurs marchés sur le CME ont été suspendus de trading pendant plus de dix heures – la cause ? Le système de refroidissement du centre de données a été victime d’une cascade de défaillances due à la négligence des procédures techniques.
Une erreur de procédure a conduit à une catastrophe technique
CyrusOne, l’opérateur du site à Aurora, Illinois, a reconnu une violation grave des normes opérationnelles. Les employés et les prestataires responsables de la maintenance de l’infrastructure n’ont pas respecté les directives concernant la préparation des tours de refroidissement pour la période de froid. Cet oubli élémentaire – le non-respect des procédures – a entraîné le gel des composants critiques du système de refroidissement.
L’eau non gelée dans les tours de refroidissement a provoqué une augmentation rapide de la pression dans le système. Les appareils, incapables de contrôler la température, ont commencé à fonctionner dans des conditions menaçant leur intégrité. Le système d’échange thermique – essentiel au maintien de la stabilité de toute l’infrastructure – a été endommagé.
Les actions correctives ont aggravé la situation
Fait notable, les tentatives de réparation effectuées par le personnel de CyrusOne se sont avérées contre-productives. Le CME a indiqué que les interventions techniques dans le centre de données, au lieu de résoudre le problème, ont conduit à d’autres défaillances des équipements de refroidissement. L’absence de procédures d’urgence coordonnées et les décisions techniques inappropriées ont prolongé la temps d’indisponibilité.
Risque de dépendance à un seul nœud
Avant que CyrusOne ne reprenne le site en 2016, il appartenait à la CME elle-même. Le contrat de location de quinze ans signé à l’époque exigeait que la bourse laisse toute l’opération du centre de données entre les mains d’un opérateur externe. Une telle structure – où un nœud clé de l’infrastructure mondiale de la bourse de dérivés dépend d’un seul tiers – constitue une menace systémique importante.
Le CME a reconnu dans un communiqué officiel qu’il comprend pleinement l’ampleur des conséquences de cet incident pour les acteurs mondiaux du marché. La panne a montré à quel point il est risqué de concentrer des fonctions critiques dans un seul site infrastructurel.
(BlockBeats News, 7 décembre)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
La pause de trading sur le CME a révélé des lacunes critiques dans la gestion de l'infrastructure
L’une des plus grandes bourses mondiales d’instruments dérivés a connu une panne massive la semaine dernière. Plusieurs marchés sur le CME ont été suspendus de trading pendant plus de dix heures – la cause ? Le système de refroidissement du centre de données a été victime d’une cascade de défaillances due à la négligence des procédures techniques.
Une erreur de procédure a conduit à une catastrophe technique
CyrusOne, l’opérateur du site à Aurora, Illinois, a reconnu une violation grave des normes opérationnelles. Les employés et les prestataires responsables de la maintenance de l’infrastructure n’ont pas respecté les directives concernant la préparation des tours de refroidissement pour la période de froid. Cet oubli élémentaire – le non-respect des procédures – a entraîné le gel des composants critiques du système de refroidissement.
L’eau non gelée dans les tours de refroidissement a provoqué une augmentation rapide de la pression dans le système. Les appareils, incapables de contrôler la température, ont commencé à fonctionner dans des conditions menaçant leur intégrité. Le système d’échange thermique – essentiel au maintien de la stabilité de toute l’infrastructure – a été endommagé.
Les actions correctives ont aggravé la situation
Fait notable, les tentatives de réparation effectuées par le personnel de CyrusOne se sont avérées contre-productives. Le CME a indiqué que les interventions techniques dans le centre de données, au lieu de résoudre le problème, ont conduit à d’autres défaillances des équipements de refroidissement. L’absence de procédures d’urgence coordonnées et les décisions techniques inappropriées ont prolongé la temps d’indisponibilité.
Risque de dépendance à un seul nœud
Avant que CyrusOne ne reprenne le site en 2016, il appartenait à la CME elle-même. Le contrat de location de quinze ans signé à l’époque exigeait que la bourse laisse toute l’opération du centre de données entre les mains d’un opérateur externe. Une telle structure – où un nœud clé de l’infrastructure mondiale de la bourse de dérivés dépend d’un seul tiers – constitue une menace systémique importante.
Le CME a reconnu dans un communiqué officiel qu’il comprend pleinement l’ampleur des conséquences de cet incident pour les acteurs mondiaux du marché. La panne a montré à quel point il est risqué de concentrer des fonctions critiques dans un seul site infrastructurel.
(BlockBeats News, 7 décembre)