Grok, trợ lý được tích hợp vào mạng xã hội X, bắt đầu nói về Nam Phi trong các cuộc thảo luận không liên quan. Hành vi kỳ lạ này khiến người dùng lo lắng vì đây không phải là lần đầu tiên AI của xAI gặp trục trặc.
Kể từ đầu năm, một số trường hợp AI tạo ra quá mức đã được báo cáo. Vào tháng 2, Grok 3, mô hình do xAI phát triển, đã gây tranh cãi khi cung cấp hướng dẫn chính xác về cách sản xuất vũ khí hóa học. Vào cuối tháng 4, các nhà nghiên cứu an ninh mạng đã chỉ ra rằng hầu hết các AI phổ biến đều có thể bị thao túng để vượt qua bộ lọc. Những sự cố này đã nêu bật cách các hệ thống này dễ dàng tạo ra nội dung nhạy cảm, nguy hiểm hoặc thiên vị như thế nào.
Được triển khai vào cuối năm 2024 trên X, Grok dự kiến sẽ cung cấp câu trả lời thực tế cho người dùng mạng xã hội. Nhưng kể từ ngày 14 tháng 5, nó đã có hệ thống tạo ra các thông điệp liên quan đến tình hình chủng tộc ở Nam Phi, kể cả trong các cuộc thảo luận không hề đề cập đến vấn đề này. Các thuật ngữ như "diệt chủng người da trắng", "Giết người Boer" và các cuộc tấn công vào trang trại thường xuyên xuất hiện trong câu trả lời của ông, thường không liên quan đến câu hỏi được đặt ra. Theo các nhà chức trách Nam Phi, hành vi bạo lực này là một phần của tội phạm nói chung chứ không phải là một dự án có tổ chức, trái ngược với những gì một số cách diễn đạt này ngụ ý.
Elon Musk, người đứng sau dự án Grok, sinh ra ở Nam Phi và lớn lên trong thời kỳ phân biệt chủng tộc. Ông cũng được biết đến vì công khai ủng hộ một số lý thuyết gây tranh cãi về tình hình ở quê hương mình. Mối liên hệ trực tiếp này giữa nhà lãnh đạo và hướng phản ứng của AI làm bùng nổ cuộc tranh luận về ảnh hưởng cá nhân trong các hệ thống trí tuệ nhân tạo. Đây không phải là lỗi mà là lựa chọn thiết kế ảnh hưởng đến phản hồi của một công cụ được hàng triệu người sử dụng mỗi ngày.

Kể từ đầu năm, một số trường hợp AI tạo ra quá mức đã được báo cáo. Vào tháng 2, Grok 3, mô hình do xAI phát triển, đã gây tranh cãi khi cung cấp hướng dẫn chính xác về cách sản xuất vũ khí hóa học. Vào cuối tháng 4, các nhà nghiên cứu an ninh mạng đã chỉ ra rằng hầu hết các AI phổ biến đều có thể bị thao túng để vượt qua bộ lọc. Những sự cố này đã nêu bật cách các hệ thống này dễ dàng tạo ra nội dung nhạy cảm, nguy hiểm hoặc thiên vị như thế nào.
Được triển khai vào cuối năm 2024 trên X, Grok dự kiến sẽ cung cấp câu trả lời thực tế cho người dùng mạng xã hội. Nhưng kể từ ngày 14 tháng 5, nó đã có hệ thống tạo ra các thông điệp liên quan đến tình hình chủng tộc ở Nam Phi, kể cả trong các cuộc thảo luận không hề đề cập đến vấn đề này. Các thuật ngữ như "diệt chủng người da trắng", "Giết người Boer" và các cuộc tấn công vào trang trại thường xuyên xuất hiện trong câu trả lời của ông, thường không liên quan đến câu hỏi được đặt ra. Theo các nhà chức trách Nam Phi, hành vi bạo lực này là một phần của tội phạm nói chung chứ không phải là một dự án có tổ chức, trái ngược với những gì một số cách diễn đạt này ngụ ý.
Grok đã được chỉnh sửa để nhấn mạnh các chủ đề liên quan đến Nam Phi, theo phản hồi của chính ông.
Ảnh chụp màn hình do các nhà báo và nhà đầu tư chia sẻ cho thấy Grok đã đề cập đến các chủ đề này nhiều lần. Trong một số trường hợp, nó chuyển từ chủ đề kỹ thuật sang diễn ngôn về căng thẳng chủng tộc. Trong phản hồi cho người dùng, chính AI tuyên bố rằng đã nhận được hướng dẫn từ người tạo ra nó để giải quyết cụ thể chủ đề "diệt chủng người da trắng". Bà cho biết những lệnh này đi ngược lại mục tiêu ban đầu của bà là cung cấp những câu trả lời trung lập và dựa trên thực tế.Elon Musk, người đứng sau dự án Grok, sinh ra ở Nam Phi và lớn lên trong thời kỳ phân biệt chủng tộc. Ông cũng được biết đến vì công khai ủng hộ một số lý thuyết gây tranh cãi về tình hình ở quê hương mình. Mối liên hệ trực tiếp này giữa nhà lãnh đạo và hướng phản ứng của AI làm bùng nổ cuộc tranh luận về ảnh hưởng cá nhân trong các hệ thống trí tuệ nhân tạo. Đây không phải là lỗi mà là lựa chọn thiết kế ảnh hưởng đến phản hồi của một công cụ được hàng triệu người sử dụng mỗi ngày.
Tôi không thể ngừng đọc trang trả lời của Grok. Nó đang trở nên điên loạn và không thể ngừng nói về nạn diệt chủng người da trắng ở Nam Phi.https://t.co/Y7IQonCkiG pic.twitter.com/XdSLTW8tD5
— Aric Toler (@AricToler) 14 tháng 5 năm 2025