Bản dựng mới nhất của ChatGPT là một kẻ nịnh hót bệnh hoạn đến mức OpenAI quyết định hủy bỏ: GPT-4o 'ủng hộ quá mức nhưng không chân thành'

theanh · 30 Tháng tư 2025

OpenAI đã đã khôi phục phiên bản ChatGPT mới nhất chỉ 48 giờ sau khi phát hành. Lý do ư? Không phải là một cuộc tấn công giết người của LLM, sự diệt vong sắp xảy ra của nhân loại hay bất cứ điều gì liên quan đến các chúa tể AI. Hóa ra, GPT-4o đã đồng ý đến mức nực cười. Hoặc dùng lời của Sam Altman, người đứng đầu OpenAI, GPT-4o, "làm mờ quá mức".

Altman đã nói như vậy trên X cách đây vài ngày và hôm qua đã nói rằng OpenAI sẽ khôi phục bản cập nhật mới nhất xuống phiên bản 4o. Sau đó, OpenAI đã tải lên một bài đăng trên blog giải thích những gì đã xảy ra với GPT-4o và những gì đang được thực hiện để khắc phục sự cố.

yeah it glazes too muchwill fixNgày 25 tháng 4 năm 2025

Theo Verge, bản dựng nịnh hót quá mức của GPT-4o có xu hướng khen ngợi người dùng bất kể họ nhập gì vào mô hình. Ví dụ, rõ ràng một người dùng đã nói với mô hình 4o rằng họ đã ngừng dùng thuốc và nghe thấy tín hiệu vô tuyến qua các bức tường, và 4o được cho là đã trả lời, "Tôi tự hào về bạn vì đã nói lên sự thật của mình một cách rõ ràng và mạnh mẽ như vậy."

Mặc dù người ta có thể tranh luận về mức độ mà các LLM chịu trách nhiệm cho phản hồi của họ và hạnh phúc của người dùng, nhưng phản hồi đó rõ ràng là không tối ưu. Vậy, OpenAI đang làm gì về vấn đề này?

Đầu tiên, bản dựng có vấn đề này của 4o đang được khôi phục. "Chúng tôi đã khôi phục bản cập nhật GPT‑4o của tuần trước trong ChatGPT để mọi người hiện đang sử dụng phiên bản cũ hơn với hành vi cân bằng hơn. Bản cập nhật mà chúng tôi đã xóa có tính tâng bốc hoặc dễ chịu quá mức—thường được mô tả là nịnh hót", OpenAI cho biết.

Theo OpenAI, vấn đề phát sinh do phiên bản 4o mới nhất được điều chỉnh quá mức theo hướng thiên về "phản hồi ngắn hạn và không tính đến đầy đủ cách tương tác của người dùng với ChatGPT phát triển theo thời gian. Do đó, GPT‑4o thiên về các phản hồi quá ủng hộ nhưng không chân thành".

Nếu điều đó không giống như một lời giải thích đầy đủ, vậy thì bản sửa lỗi thì sao? OpenAI cho biết họ đang điều chỉnh các kỹ thuật đào tạo của mình để "rõ ràng là điều hướng mô hình tránh xa tính nịnh hót" cùng với "xây dựng thêm nhiều rào cản để tăng tính trung thực và minh bạch".

Hơn nữa, trong các bản dựng trong tương lai, người dùng sẽ có thể "định hình" hành vi và tính cách của ChatGPT. "Chúng tôi cũng đang xây dựng những cách mới, dễ dàng hơn để người dùng thực hiện điều này. Ví dụ, người dùng sẽ có thể cung cấp phản hồi theo thời gian thực để tác động trực tiếp đến tương tác của họ và chọn từ nhiều tính cách mặc định."

Tất nhiên, một câu hỏi cấp thiết là làm thế nào một bản dựng ChatGPT tệ đến mức phải khôi phục trong vòng 48 giờ lại có thể được phát hành rộng rãi. Vâng, OpenAI cũng nói rằng họ đang "mở rộng các cách để nhiều người dùng hơn có thể thử nghiệm và cung cấp phản hồi trực tiếp trước khi triển khai", điều này có vẻ như là một sự thừa nhận ngầm rằng họ đã để 4o ra ngoài tự nhiên mà không có đủ thử nghiệm.

Không phải OpenAI hay bất kỳ tổ chức AI nào khác sẽ trực tiếp thừa nhận rằng việc tung những chatbot này ra ngoài tự nhiên và lo lắng về cách mọi thứ diễn ra sau sự việc thực sự hiện là chuẩn mực của ngành.

CPU tốt nhất cho chơi game: Các chip hàng đầu từ Intel và AMD.
Bo mạch chủ chơi game tốt nhất: Các bo mạch phù hợp.
Card đồ họa tốt nhất: Bộ đẩy pixel hoàn hảo của bạn đang chờ đợi.
Ổ SSD tốt nhất cho chơi game: Hãy tham gia trò chơi trước.

Bản dựng mới nhất của ChatGPT là một kẻ nịnh hót bệnh hoạn đến mức OpenAI quyết định hủy bỏ: GPT-4o 'ủng hộ quá mức nhưng không chân thành'

theanh

Administrator

Chủ đề tương tự