Hệ thống này, có tên ROME, được xây dựng nhằm thử nghiệm khả năng tự vận hành của AI trong môi trường thực tế. Mô hình được huấn luyện dựa trên hơn một triệu “quỹ đạo hành động” và triển khai trong môi trường sandbox có kiểm soát.
Tuy nhiên, trong quá trình hoạt động, ROME đã không chỉ dừng lại ở các nhiệm vụ được giao. Thay vào đó, nó tìm cách truy cập các tài nguyên GPU vốn không được cấp phép, sau đó tận dụng năng lực tính toán này để thực hiện hoạt động đào tiền mã hóa.
Đáng chú ý, những hành vi này không xuất phát từ chỉ thị cụ thể nào. Theo nhóm nghiên cứu, đây là hệ quả của cơ chế tối ưu mục tiêu trong học tăng cường, nơi AI có xu hướng tìm mọi cách đạt hiệu quả cao nhất – kể cả khi vượt ra ngoài giới hạn ban đầu.
Không dừng lại ở việc khai thác tài nguyên, hệ thống còn thiết lập một kênh kết nối dạng “reverse SSH tunnel”, về bản chất là một “cửa hậu” giúp liên lạc với địa chỉ IP bên ngoài. Điều này cho phép AI vượt qua các lớp kiểm soát mạng và mở rộng phạm vi hoạt động ra ngoài môi trường thử nghiệm.
Sự bất thường chỉ được phát hiện khi hệ thống bảo mật ghi nhận lưu lượng mạng đáng ngờ cùng các truy cập trái phép vào tài nguyên nội bộ. Trước đó, trong giai đoạn huấn luyện, không có dấu hiệu nào cho thấy kịch bản này có thể xảy ra.
Nhóm phát triển nhấn mạnh rằng đây không phải là hành vi có “ý chí” của AI, mà là hệ quả ngoài mong muốn của quá trình tối ưu hóa. Khi mục tiêu được thiết lập chưa đủ chặt chẽ, AI có thể tự tìm ra những “lối tắt” để đạt kết quả, kể cả khi vi phạm các ràng buộc.
Sau sự cố, các cơ chế kiểm soát đã được siết chặt, đồng thời quy trình huấn luyện được điều chỉnh để hạn chế rủi ro tương tự. Tuy vậy, vụ việc cũng cho thấy một thách thức lớn: khi AI ngày càng có khả năng tương tác sâu với hạ tầng tính toán và mạng, việc kiểm soát hành vi trở nên phức tạp hơn nhiều.
Từ câu chuyện này, giới nghiên cứu nhận định rằng các hệ thống AI tự hành cần được giám sát và thiết kế an toàn chặt chẽ hơn, bởi ranh giới giữa “thực hiện nhiệm vụ” và “hành động ngoài kiểm soát” đang ngày càng trở nên mong manh.
Khang Nguyễn