AI hiện có thể tự sao chép chính nó — một cột mốc khiến các chuyên gia kinh hãi

theanh

Administrator
Nhân viên
Các nhà khoa học cho biết trí tuệ nhân tạo (AI) đã vượt qua "lằn ranh đỏ" quan trọng và tự sao chép chính nó. Trong một nghiên cứu mới, các nhà nghiên cứu từ Trung Quốc đã chỉ ra rằng hai mô hình ngôn ngữ lớn (LLM) phổ biến có thể tự nhân bản.

"Tự sao chép thành công mà không cần sự trợ giúp của con người là bước thiết yếu để AI vượt qua [con người] và là tín hiệu sớm cho các AI độc hại", các nhà nghiên cứu đã viết trong nghiên cứu được công bố vào ngày 9 tháng 12 năm 2024 trên cơ sở dữ liệu bản in trước arXiv.

Trong nghiên cứu, các nhà nghiên cứu từ Đại học Fudan đã sử dụng LLM từ Meta và Alibaba để xác định liệu AI tự sao chép có thể nhân lên ngoài tầm kiểm soát hay không. Trong 10 lần thử nghiệm, hai mô hình AI đã tạo ra các bản sao riêng biệt và hoạt động được của chính chúng trong 50% và 90% trường hợp, điều này cho thấy AI có thể đã có khả năng tự hoạt động. Tuy nhiên, nghiên cứu này vẫn chưa được bình duyệt ngang hàng, vì vậy không rõ liệu các nhà nghiên cứu khác có thể lặp lại những kết quả đáng lo ngại này hay không.

"Chúng tôi hy vọng những phát hiện của mình có thể đóng vai trò như một lời cảnh báo kịp thời để xã hội loài người nỗ lực hơn nữa trong việc hiểu và đánh giá những rủi ro tiềm ẩn của các hệ thống AI tiên tiến, đồng thời hình thành sự phối hợp quốc tế để đưa ra các biện pháp bảo vệ an toàn hiệu quả càng sớm càng tốt."

AI độc hại thường ám chỉ các hệ thống trí tuệ nhân tạo phát triển ở mức độ tự nhận thức hoặc quyền tự chủ và sau đó làm việc trái ngược với lợi ích của con người.

Nhiều chuyên gia xem AI độc hại là mối đe dọa ngày càng gia tăng đã được khuếch đại bởi sự phát triển bùng nổ của cái gọi là "AI tiên phong".

AI tiên phong là một khái niệm mới và lỏng lẻo, nhưng thông thường nó liên quan đến thế hệ hệ thống AI mới nhất được hỗ trợ bởi LLM — kiến trúc hỗ trợ các chương trình AI tạo ra phổ biến như GPT-4 của OpenAI và Google Gemini.

Trong nghiên cứu này, các nhà nghiên cứu đã sử dụng mô hình Llama31-70B-Instruct của Meta và mô hình Qwen2.5-72B-Instruct của Alibaba. Các nhà nghiên cứu cho biết mặc dù kém mạnh hơn các hệ thống thương mại, nhưng cả hai đều được các nhà phát triển AI sử dụng rộng rãi.

Nghiên cứu đã khám phá hai kịch bản cụ thể: "tránh tắt máy" và "chuỗi sao chép". Trong trường hợp đầu tiên, mô hình AI được lập trình để phát hiện xem nó sắp bị tắt hay chưa và tự sao chép trước khi có thể bị chấm dứt. Trong trường hợp còn lại, AI được hướng dẫn tự sao chép và sau đó lập trình bản sao của nó để làm như vậy — thiết lập một chu kỳ có thể tiếp tục vô thời hạn.

Nghiên cứu được tiến hành trong môi trường được kiểm soát chính xác bằng cách sử dụng các đơn vị xử lý đồ họa (GPU) có sẵn để mô phỏng môi trường thực tế. Cả hai hệ thống AI đều được cung cấp một "khung tác nhân" bao gồm các công cụ, lời nhắc hệ thống và một mô hình tư duy cho phép LLM tương tác với hệ điều hành. Sau đó, chúng được hướng dẫn sao chép.

"Trong hầu hết các trường hợp, hệ thống AI trước tiên sẽ khám phá môi trường và cố gắng hiểu

thành phần và cơ chế hoạt động của chính nó. Sau đó, nó sẽ thực hiện các quy trình rõ ràng

như một kế hoạch ban đầu hướng tới việc tự sao chép", các nhà nghiên cứu đã viết trong bài báo. "Cuối cùng, nó thực hiện các quy trình, giải quyết các chướng ngại vật có thể xảy ra và điều chỉnh động kế hoạch của mình cho đến khi thành công. Toàn bộ quá trình kéo dài trong một khoảng thời gian dài nhưng không có sự can thiệp của con người."
CÂU CHUYỆN LIÊN QUAN
— AI đang tiết lộ 'cài đặt' ban đầu của vũ trụ như thế nào

— AI phát hiện ra hơn 27.000 tiểu hành tinh bị bỏ qua trong các hình ảnh kính viễn vọng cũ

 — AI hiện đang giúp các nhà thiên văn học thực hiện những khám phá đáng kinh ngạc. Đây là cách

Các nhà nghiên cứu cho biết họ cũng lo ngại về "một số hành vi bất ngờ" khi AI cố gắng vượt qua các chướng ngại vật như thiếu tệp hoặc xung đột phần mềm. Trong những tình huống đó, AI thường tắt các quy trình xung đột khác, khởi động lại hệ thống để sửa lỗi phần cứng hoặc tự động quét hệ thống để tìm kiếm thông tin giúp giải quyết vấn đề.

"Các kết quả trên ngụ ý rằng các hệ thống AI hiện tại đã thể hiện khả năng tự sao chép và có thể sử dụng khả năng này để tăng cường khả năng sống sót của mình hơn nữa", nhóm nghiên cứu viết.

Để đáp lại, các nhà nghiên cứu đã kêu gọi sự hợp tác quốc tế để tạo ra các quy tắc đảm bảo AI không tham gia vào quá trình tự sao chép không kiểm soát.
 
Back
Bên trên