Một trong những sàn giao dịch hợp đồng phái sinh lớn nhất thế giới đã trải qua một sự cố nghiêm trọng trong tuần vừa qua. Một số thị trường trên CME đã bị ngưng hoạt động hơn mười giờ – nguyên nhân? Hệ thống làm mát tại trung tâm dữ liệu gặp sự cố theo chuỗi do bỏ qua các quy trình kỹ thuật.
Lỗi quy trình dẫn đến thảm họa kỹ thuật
CyrusOne, nhà vận hành trung tâm tại Aurora, Illinois, đã thừa nhận vi phạm nghiêm trọng các tiêu chuẩn vận hành. Nhân viên và nhà thầu chịu trách nhiệm duy trì hạ tầng không tuân thủ các hướng dẫn chuẩn bị các tháp làm mát cho mùa đông. Đây là một sơ suất cơ bản – không tuân thủ quy trình – đã khiến các thành phần quan trọng của hệ thống làm mát bị đóng băng.
Nước không đóng băng trong các tháp làm mát đã dẫn đến áp suất trong hệ thống tăng đột biến. Các thiết bị mất khả năng kiểm soát nhiệt độ bắt đầu hoạt động trong điều kiện đe dọa tính toàn vẹn của chúng. Hệ thống trao đổi nhiệt – yếu tố then chốt để duy trì sự ổn định của toàn bộ hạ tầng – đã bị hư hỏng.
Các biện pháp sửa chữa làm tình hình tồi tệ hơn
Điều đáng chú ý là các nỗ lực sửa chữa của nhân viên CyrusOne đã phản tác dụng. CME đã thông báo rằng các can thiệp kỹ thuật tại trung tâm dữ liệu thay vì giải quyết vấn đề, lại dẫn đến các sự cố mới của các thiết bị làm mát. Thiếu các quy trình khẩn cấp phối hợp và các quyết định kỹ thuật sai đã kéo dài thời gian ngừng hoạt động.
Rủi ro phụ thuộc vào một nút duy nhất
Trước khi CyrusOne tiếp quản trung tâm vào năm 2016, nó thuộc sở hữu của chính CME. Hợp đồng cho thuê lại 15 năm ký kết vào thời điểm đó yêu cầu sàn giao dịch giữ toàn bộ hoạt động của trung tâm dữ liệu trong tay nhà vận hành bên ngoài. Cấu trúc này – nơi một nút hạ tầng quan trọng của sàn phái sinh toàn cầu phụ thuộc vào một thực thể thứ ba – tạo ra rủi ro hệ thống đáng kể.
CME trong tuyên bố chính thức đã thừa nhận rằng họ hoàn toàn hiểu quy mô hậu quả của sự cố này đối với các nhà tham gia thị trường toàn cầu. Sự cố đã cho thấy mức độ rủi ro khi tích tụ các chức năng quan trọng trong một trung tâm hạ tầng duy nhất.
(BlockBeats News, 7 tháng 12)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Ngừng giao dịch trên CME đã tiết lộ những thiếu sót nghiêm trọng trong quản lý hạ tầng
Một trong những sàn giao dịch hợp đồng phái sinh lớn nhất thế giới đã trải qua một sự cố nghiêm trọng trong tuần vừa qua. Một số thị trường trên CME đã bị ngưng hoạt động hơn mười giờ – nguyên nhân? Hệ thống làm mát tại trung tâm dữ liệu gặp sự cố theo chuỗi do bỏ qua các quy trình kỹ thuật.
Lỗi quy trình dẫn đến thảm họa kỹ thuật
CyrusOne, nhà vận hành trung tâm tại Aurora, Illinois, đã thừa nhận vi phạm nghiêm trọng các tiêu chuẩn vận hành. Nhân viên và nhà thầu chịu trách nhiệm duy trì hạ tầng không tuân thủ các hướng dẫn chuẩn bị các tháp làm mát cho mùa đông. Đây là một sơ suất cơ bản – không tuân thủ quy trình – đã khiến các thành phần quan trọng của hệ thống làm mát bị đóng băng.
Nước không đóng băng trong các tháp làm mát đã dẫn đến áp suất trong hệ thống tăng đột biến. Các thiết bị mất khả năng kiểm soát nhiệt độ bắt đầu hoạt động trong điều kiện đe dọa tính toàn vẹn của chúng. Hệ thống trao đổi nhiệt – yếu tố then chốt để duy trì sự ổn định của toàn bộ hạ tầng – đã bị hư hỏng.
Các biện pháp sửa chữa làm tình hình tồi tệ hơn
Điều đáng chú ý là các nỗ lực sửa chữa của nhân viên CyrusOne đã phản tác dụng. CME đã thông báo rằng các can thiệp kỹ thuật tại trung tâm dữ liệu thay vì giải quyết vấn đề, lại dẫn đến các sự cố mới của các thiết bị làm mát. Thiếu các quy trình khẩn cấp phối hợp và các quyết định kỹ thuật sai đã kéo dài thời gian ngừng hoạt động.
Rủi ro phụ thuộc vào một nút duy nhất
Trước khi CyrusOne tiếp quản trung tâm vào năm 2016, nó thuộc sở hữu của chính CME. Hợp đồng cho thuê lại 15 năm ký kết vào thời điểm đó yêu cầu sàn giao dịch giữ toàn bộ hoạt động của trung tâm dữ liệu trong tay nhà vận hành bên ngoài. Cấu trúc này – nơi một nút hạ tầng quan trọng của sàn phái sinh toàn cầu phụ thuộc vào một thực thể thứ ba – tạo ra rủi ro hệ thống đáng kể.
CME trong tuyên bố chính thức đã thừa nhận rằng họ hoàn toàn hiểu quy mô hậu quả của sự cố này đối với các nhà tham gia thị trường toàn cầu. Sự cố đã cho thấy mức độ rủi ro khi tích tụ các chức năng quan trọng trong một trung tâm hạ tầng duy nhất.
(BlockBeats News, 7 tháng 12)