Đằng sau sự cố công nghệ lớn nhất lịch sử: Chỉ một lỗi nhỏ có thể gây ra sự hỗn loạn

 - Nếu những sự kiện gần đây - một nỗ lực ám sát, một ứng cử viên phó tổng thống mới của Đảng Cộng hòa, Tổng thống đương nhiệm mắc bệnh Covid trước khi từ bỏ nỗ lực tái tranh cử - không khiến bạn cảm thấy đủ lo lắng về sự mong manh của trật tự toàn cầu thì đừng quên rằng một công ty an ninh mạng có thể bạn chưa bao giờ nghe nói đến đã tạo ra một sự cố lớn cho thấy Internet có thể ngừng hoạt động như thế nào mà không có cảnh báo trước.

 

Mặc dù trước đây bạn có thể chưa biết đến cái tên CrowdStrike nhưng chắc chắn bạn sẽ không quên nó sớm. Chỉ với một lỗi duy nhất trong một bản cập nhật phần mềm định kỳ, công ty đã gây ra vụ ngừng hoạt động máy tính lớn nhất trong lịch sử - tạo ra một loại khủng hoảng công nghệ mà các sản phẩm của họ được thiết kế để ngăn chặn.

Mặc dù CrowdStrike cho biết bản cập nhật bị lỗi đã được khôi phục nhưng vấn đề mà nó gây ra không hẳn là giải pháp “tắt và bật lại” như cũ mà hầu hết chúng ta đều quen thuộc. Lỗi khiến máy tính Windows rơi vào chế độ Màn hình xanh chết chóc có thể sửa được. Nhưng trong nhiều trường hợp, nó đòi hỏi con người phải mất nhiều công sức để xử lý.

Bây giờ có thể là thời điểm thích hợp để mua cho nhân viên công nghệ thông tin của bạn một ít cà phê ngon và bánh mì tròn vì mỗi và mọi thiết bị bị ảnh hưởng — đối với một số tổ chức, chúng ta đang nói đến hàng nghìn thiết bị — có thể sẽ phải được quản trị viên đánh giá và khởi động lại vào chế độ an toàn, và sau đó tập tin vi phạm có thể phải được xóa bằng tay.

Ông Kevin Beaumont, nhà nghiên cứu bảo mật và cựu nhà phân tích mối đe dọa của Microsoft, cho biết trong một bài đăng trên X: “Bạn không thể tự động hóa việc đó. Vì vậy, điều này sẽ gây tổn hại vô cùng lớn cho khách hàng của CrowdStrike”.

Và ngay cả khi doanh nghiệp của bạn không liên quan gì đến CrowdStrike thì việc ngừng hoạt động vẫn có thể hủy hoại một ngày của bạn.

Hãy nghĩ đến một quán cà phê sử dụng dịch vụ đặt chỗ trực tuyến của bên thứ ba, ký hợp đồng đặt hàng giao hàng và chấp nhận thẻ tín dụng và thẻ ghi nợ thông qua điểm bán hàng, được kết nối với hệ thống phụ trợ của bộ xử lý thanh toán. Bạn không cần phải là khách hàng của CrowdStrike mới gặp rắc rối trước sai lầm của công ty công nghệ và đó là lý do khiến đợt ngừng hoạt động toàn cầu hồi cuối tuần vừa rồi trở nên khó chịu.

Chúng ta đã từng gặp phải những đợt mất điện đáng sợ trước đây và chắc chắn chúng ta sẽ gặp lại những lần đó. Nhưng quy mô ngừng hoạt động của CrowdStrike một lần nữa nhấn mạnh mức độ kết nối của thế giới thông qua một mạng lưới mà hầu như không ai trong chúng ta hiểu được.

Ông Stuart Madnick - Giáo sư công nghệ thông tin tại Trường Quản lý MIT Sloan, cho biết: “Có những tổ chức mà chúng ta phụ thuộc rất nhiều mà chúng ta thậm chí không nhận ra mình phụ thuộc đến mức nào cho đến khi hệ thống ngừng hoạt động”.

Microsoft ước tính sự cố ngừng hoạt động của CrowdStrike đã ảnh hưởng đến khoảng 8,5 triệu thiết bị Windows. Các hãng hàng không đã hủy 5.000 chuyến bay trên khắp thế giới vào thứ Sáu (19/7), trong khi tình trạng chậm trễ vẫn kéo dài suốt cuối tuần và đến thứ Hai (22/7). Các bệnh viện và dịch vụ của chính phủ bị hạn chế hoạt động, và ở một số khu vực, hệ thống liên lạc 911 ngừng hoạt động.

Có thể dễ dàng đổ lỗi cho CrowdStrike về việc cập nhật hệ thống cẩu thả hoặc các hãng hàng không không xây dựng các giao thức sao lưu mạnh mẽ hoặc thậm chí là đổ lỗi cho Microsoft vì đã thống trị thị trường máy tính cá nhân. Nhưng các chuyên gia công nghệ thông tin cho rằng có những vấn đề mang tính hệ thống rộng lớn hơn đang diễn ra ở đây.

Anil Khurana, giám đốc điều hành của Trung tâm Kinh doanh Toàn cầu Baratta tại Trường Kinh doanh McDonough của Georgetown cho biết, các công ty cần “một mô hình dự phòng và sao lưu hoạt động tốt hơn. Nền tảng công nghệ của chúng ta có sự kết hợp giữa các hệ thống cũ kết hợp với các hệ thống hiện đại, điều đó có nghĩa là liên kết yếu nhất sẽ quyết định hiệu suất tổng thể của hệ thống. Tôi gọi nó là mô hình ‘ngôi nhà của những lá bài’.”

Hiện tại, các biện pháp bảo vệ đã được áp dụng nhưng các cơ quan quản lý trên toàn thế giới đang tạm hoãn việc quản lý rủi ro an ninh mạng. Khurana cho biết, hệ thống công nghệ thông tin là cơ sở hạ tầng thực sự quan trọng, điều này cho thấy chúng “phải trải qua sự nghiêm ngặt, thử nghiệm và giám sát giống như những gì chúng tôi thấy đối với những hãng như Boeing hay JPMorgan”.

Tôi hỏi ông Madnick liệu thế giới có tiếp tục gặp phải sự cố ngừng hoạt động như vụ vừa rồi nữa hay không. Ông Madnick đã trả lời rằng, “nó có thể trở nên tồi tệ hơn không? Câu trả lời là có, có thể.”

Theo Giáo sư công nghệ thông tin tại Trường Quản lý MIT Sloan, “có rất nhiều lợi ích mà công nghệ mang lại cho chúng ta và thực sự mang lại hiệu quả, trong 99% thời gian”. Điều quan trọng nhất là chuẩn bị cho 1% số lần xảy ra sự cố.

 

Trích Nguồn Báo điện tử VNMedia (http://vnmedia.vn)

http://vnmedia.vn/cong-nghe/202407/dang-sau-su-co-cong-nghe-lon-nhat-lich-su-chi-mot-loi-nho-co-the-gay-ra-su-hon-loan-98b0a2c/

Đã đăng bởi Phetit trong mục Công nghệ
3620 lượt xem

Bài viết liên quan

00:00 Thịnh hành Cách xây dựng ứng dụng nhanh và dễ dàng

Cách xây dựng ứng dụng nhanh và dễ dàng

3184 lượt xem