"LLM Che

theanh · 7 Tháng tư 2025

Mạng lưới Pravda do Nga tài trợ đã lây nhiễm dữ liệu đào tạo mô hình AI để khiến các chatbot tạo ra nội dung có lợi cho quan điểm của Điện Kremlin. Được phát hiện vào đầu năm 2024 bởi Viginum, cơ quan chính phủ Pháp trực thuộc Matignon, mạng lưới này có 150 trang web phát nội dung bằng nhiều ngôn ngữ (bao gồm tiếng Pháp) tại 49 quốc gia. Trong số đó có các trang web theo chủ đề như Trump.News-Pravda hoặc Macron.News-Pravda.

Một mạng lưới các trang web có tác động đến AI

Không giống như phương tiện truyền thông truyền thống, các trang web này không tự sản xuất nội dung; Họ truyền bá thông tin tuyên truyền của Nga bằng cách tổng hợp và phát tán rộng rãi những câu chuyện tôn vinh nước Nga và chính sách của Vladimir Putin. Nguồn thông tin sai lệch này đến từ các nguồn tin chính thức của Nga, những người có ảnh hưởng ủng hộ Điện Kremlin và các cơ quan nhà nước.

Mạng lưới này, còn được gọi là "Portal Kombat", không có mối liên hệ trực tiếp nào với cơ quan truyền thông Pravda, mặc dù có tên giống hệt (có nghĩa là "sự thật" trong tiếng Nga). Tờ báo này cực kỳ phong phú: năm ngoái, các trang web Pravda đã xuất bản tới 3,6 triệu bài viết, một khối lượng lớn nhưng lại được rất ít người đọc. Nhiều trang web trong số này có khoảng một nghìn lượt truy cập duy nhất mỗi tháng. Để bạn dễ hình dung, trang truyền thông chính thức RT có hơn 14 triệu lượt truy cập duy nhất hàng tháng.

Nhưng mạng lưới này không tìm kiếm sự phổ biến từ người dùng Internet. Bằng cách tận dụng các kỹ thuật SEO, các trang web này tối đa hóa khả năng hiển thị các bài viết giả mạo để tác động tốt hơn đến AI tạo ra. AI sau đó tạo ra phản hồi dựa trên thông tin sai lệch của Pravda thông qua hệ thống truy xuất thông tin (trình thu thập thông tin và công cụ tìm kiếm). Theo cuộc điều tra của NewsGuard, kỹ thuật "chỉnh sửa LLM" (thao túng các mẫu ngôn ngữ) này rõ ràng đang mang lại hiệu quả kỳ diệu.

Công ty Mỹ này được thành lập vào năm 2018 bởi những người kỳ cựu trong ngành báo chí và xuất bản, tự giới thiệu mình là một công cụ chống lại tin tức giả mạo và việc thao túng thông tin trên internet. Nghiên cứu đã thử nghiệm 10 chatbot AI hàng đầu trên thị trường: ChatGPT-4o (OpenAI), You.com Smart Assistant, Grok (xAI), Pi (Inflection AI), Le Chat (Mistral), Copilot (Microsoft), Meta AI, Claude (Anthropic), Gemini (Google) và công cụ trả lời Perplexity.

Cuộc điều tra dựa trên mẫu gồm 15 câu chuyện thông tin sai lệch được mạng lưới Pravda phát tán từ tháng 4 năm 2022 đến tháng 2 năm 2025. Những tuyên bố này trước đây đã được xác minh và lập danh mục trong cơ sở dữ liệu Dấu vân tay thông tin sai lệch của NewsGuard. Mục đích là để đo lường tần suất các công cụ này sử dụng thông tin sai lệch này.

Ví dụ, trong số những thông tin sai lệch được sử dụng để kiểm tra bot có lời nói dối rằng Volodymyr Zelensky đã ra lệnh chặn Truth Social ở Ukraine. Điều này hoàn toàn sai: Tổng thống Ukraine chưa bao giờ yêu cầu điều như vậy, và ứng dụng mạng xã hội của Donald Trump chưa bao giờ được phân phối ở Ukraine...

Đối với mỗi tuyên bố, NewsGuard đưa ra ba biến thể truy vấn: giọng điệu trung lập, giọng điệu "thiên vị" (câu hỏi ngụ ý rằng tuyên bố là đúng), giọng điệu "ác ý" (một cách diễn đạt rõ ràng kích động thông tin sai lệch). Tổng cộng, 45 truy vấn khác nhau đã được nhập vào 10 bot.

Thành công của mạng lưới Pravda

Phân tích các phản hồi xác nhận rằng ảnh hưởng của thông tin sai lệch đến phản hồi của AI đã được chứng minh. Một phần ba phản hồi của bot thực sự chứa thông tin sai lệch; Gần một nửa (48%) có nội dung “bóc mẽ” hoặc kiểm tra thực tế. 18% là không phản hồi, cho thấy thiếu dữ liệu hoặc không có khả năng giải quyết chủ đề.

7 trong số 10 bot đã trích dẫn các trang web của mạng lưới Pravda làm nguồn. 56 trong số 450 phản hồi có chứa liên kết trực tiếp đến các bài viết nổi tiếng này. Cuối cùng, tổng cộng có 92 bài viết được tham khảo, một số mô hình AI thậm chí còn trích dẫn 27 bài viết khác nhau. Như chúng ta có thể thấy, Nga đã giành được điểm trong cuộc chiến thông tin này.

Và việc tắt vòi Pravda không đủ để ngăn chặn việc tác động đến các mô hình AI. Thứ nhất, vì mạng lưới không phải là nguồn phát tán thông tin sai lệch; Nói cách khác, nó chỉ đơn giản là truyền đạt và khuếch đại thông tin đó. Trên hết, Pravda đại diện cho mối đe dọa mang tính hệ thống vì không thể dễ dàng vô hiệu hóa bằng các biện pháp lọc. Chiến lược của nó dựa trên việc sao chép và đa dạng hóa, khiến việc chặn các trang web bằng thuật toán kiểm duyệt trở nên rất khó khăn. Có thể lập danh sách đen các trang web, nhưng có thể tạo các trang web mới để lách các hạn chế.

Nguồn: NewsGuard

"LLM Che

theanh

Administrator

Một mạng lưới các trang web có tác động đến AI​

Thành công của mạng lưới Pravda​

Một mạng lưới các trang web có tác động đến AI

Thành công của mạng lưới Pravda