97% hệ thống đã hoạt động trở lại sau sự cố CrowdStrike

97% hệ thống đã hoạt động trở lại sau sự cố CrowdStrike

Vào tuần trước, một bản cập nhật không thành công của phần mềm bảo mật Falcon của CrowdStrike đã gây ra sự cố lớn cho hàng triệu máy tính chạy hệ điều hành Windows, khiến nhiều hệ thống bị gián đoạn, bao gồm cả các chuyến bay và hệ thống phản ứng khẩn cấp. Theo CEO của CrowdStrike, George Kurtz, 97% các hệ thống đã hoạt động trở lại, tuy nhiên vẫn còn khoảng 250.000 hệ thống cần được khôi phục.

Nguyên Nhân Sự Cố

Cập Nhật Gây Sự Cố

Bản cập nhật của CrowdStrike đã gây ra hiện tượng màn hình xanh chết chóc (Blue Screen of Death) và khởi động lại liên tục cho các máy tính Windows. Sự cố này ảnh hưởng đến khoảng 8,5 triệu hệ thống, theo ước tính của Microsoft. Khi phần mềm bảo mật chạy ở chế độ kernel thay vì chế độ người dùng, nó có toàn quyền truy cập vào phần cứng và phần mềm của hệ thống. Điều này làm cho cập nhật sai sót có thể gây ra nhiều vấn đề nghiêm trọng, như trường hợp của CrowdStrike.

Lỗi Trong Quy Trình Kiểm Thử

CrowdStrike đã xác định nguyên nhân sự cố là do lỗi trong quy trình kiểm thử của họ. Công ty đã hứa hẹn sẽ cải thiện quy trình kiểm thử và triển khai hệ thống cập nhật theo từng giai đoạn để tránh tái diễn sự cố tương tự. Điều này bao gồm việc kiểm tra kỹ lưỡng hơn và triển khai bản cập nhật theo từng giai đoạn để giảm thiểu rủi ro.

Phản Ứng Của Microsoft

Hỗ Trợ Khắc Phục Sự Cố

Theo một bài đăng trên blog của John Cable, Phó Chủ tịch Microsoft, công ty đã huy động hơn 5.000 kỹ sư hỗ trợ làm việc suốt ngày đêm để giúp khắc phục sự cố do bản cập nhật của CrowdStrike gây ra. Microsoft cũng đã phát hành công cụ khôi phục USB để giúp tự động hóa quá trình xoá các tệp cập nhật bị lỗi. Tuy nhiên, công cụ này vẫn yêu cầu phải can thiệp thủ công vào từng hệ thống bị ảnh hưởng, dù là trên máy ảo hay hệ thống vật lý.

Đề Xuất Thay Đổi Hệ Thống Windows

Microsoft đã gợi ý một số thay đổi cần thiết để cải thiện tính bền vững và an toàn của hệ sinh thái Windows. Những thay đổi này bao gồm việc sử dụng các sản phẩm như VBS enclaves và Azure Attestation để bảo vệ hệ thống mà không cần truy cập vào cấp độ kernel. Tuy nhiên, Microsoft không nêu rõ những thay đổi cụ thể sẽ được thực hiện, mà chỉ khẳng định rằng công ty sẽ tiếp tục củng cố nền tảng của mình và làm việc chặt chẽ với cộng đồng bảo mật rộng rãi.

Thách Thức và Hướng Đi Tương Lai

Tranh Cãi Về Truy Cập Kernel

Việc phần mềm bảo mật chạy ở chế độ kernel có thể gây ra nhiều vấn đề nghiêm trọng khi xảy ra sự cố, như trường hợp của CrowdStrike. Microsoft đã từng gặp phản đối từ Ủy ban Châu Âu khi cố gắng hạn chế quyền truy cập của các nhà cung cấp bảo mật bên thứ ba vào kernel của Windows. Điều này có thể sẽ tiếp tục là một thách thức lớn khi Microsoft thực hiện các thay đổi trong tương lai. Việc hạn chế quyền truy cập này, nếu không được quản lý chặt chẽ, có thể làm giảm tính linh hoạt và hiệu quả của các giải pháp bảo mật bên thứ ba.

Quyết Định Của Các Nhà Quản Lý

Sự cố của CrowdStrike cũng đã làm dấy lên câu hỏi về vai trò của các nhà quản lý trong việc giám sát và điều chỉnh các cập nhật phần mềm. Các nhà quản lý cần phải đảm bảo rằng các công ty công nghệ tuân thủ các tiêu chuẩn an toàn cao nhất và có các biện pháp kiểm thử nghiêm ngặt trước khi phát hành bất kỳ bản cập nhật nào. Điều này không chỉ giúp bảo vệ người dùng mà còn tạo ra một môi trường cạnh tranh lành mạnh cho các công ty công nghệ.

Quản Lý An Toàn Hệ Thống

Microsoft cũng đang đối mặt với các vấn đề an toàn của chính mình, đến mức công ty đã cam kết tái cơ cấu để tập trung hơn vào an toàn. Việc này cho thấy sự cần thiết của một cách tiếp cận toàn diện và hợp tác với cộng đồng bảo mật rộng rãi để cải thiện tính bền vững của hệ thống. Điều này bao gồm việc hợp tác với các đối tác bảo mật và các nhà nghiên cứu để phát triển các giải pháp bảo mật hiệu quả hơn.

Hậu Quả Kinh Tế và Xã Hội

Tổn Thất Kinh Tế

Theo công ty phân tích Parametrix Insurance, sự cố của CrowdStrike có thể đã gây ra tổn thất khoảng 5,4 tỷ USD cho các công ty trong danh sách Fortune 500. Điều này cho thấy tầm quan trọng của việc bảo đảm an toàn và ổn định cho các hệ thống công nghệ thông tin trong kinh doanh hiện đại. Các công ty cần phải đầu tư nhiều hơn vào các giải pháp bảo mật và quy trình kiểm thử để giảm thiểu rủi ro của các sự cố tương tự.

Tác Động Đến Người Dùng

Sự cố không chỉ ảnh hưởng đến các công ty lớn mà còn gây ra sự bất tiện lớn cho người dùng cá nhân. Nhiều người dùng đã phải khởi động lại máy tính nhiều lần hoặc thậm chí phải cài đặt lại hệ điều hành để khắc phục sự cố. Điều này không chỉ tốn thời gian mà còn có thể gây mất dữ liệu quan trọng.

Phản Ứng Của Đối Tác

CrowdStrike đã gửi mã khuyến mãi UberEats trị giá 10 USD cho các đối tác để bù đắp, nhưng điều này đã gặp phản ứng trái chiều trên mạng xã hội. Mã khuyến mãi thậm chí đã bị Uber đánh dấu là gian lận trong một khoảng thời gian ngắn, càng làm tăng thêm sự không hài lòng từ các đối tác. Điều này cho thấy rằng các biện pháp bù đắp cần phải thực sự hiệu quả và phù hợp với mức độ thiệt hại mà các đối tác phải chịu.

Tính Minh Bạch và Trách Nhiệm

Sự cố này cũng đặt ra câu hỏi về tính minh bạch và trách nhiệm của các công ty công nghệ khi xảy ra sự cố. CrowdStrike đã phải công khai thừa nhận lỗi và cam kết cải thiện quy trình của mình. Điều này cho thấy tầm quan trọng của việc duy trì tính minh bạch và trách nhiệm trong ngành công nghệ, đặc biệt là khi các sự cố có thể ảnh hưởng đến hàng triệu người dùng.

Kết Luận

Sự cố CrowdStrike là một bài học quý giá về tầm quan trọng của quá trình kiểm thử và triển khai cập nhật phần mềm trong môi trường thực tế. Đồng thời, nó cũng là một lời nhắc nhở về sự cần thiết của việc hợp tác và đổi mới liên tục để đảm bảo an toàn và ổn định cho hệ sinh thái công nghệ thông tin. Việc cải thiện quy trình kiểm thử, tăng cường hợp tác với các bên liên quan và duy trì tính minh bạch sẽ là những yếu tố quan trọng giúp ngăn chặn các sự cố tương tự trong tương lai.

Xem thêm: Lỗi cập nhật Windows 11 gây rắc rối sau “Crowdstrike”

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Lên đầu trang