Người đánh giá chất lượng của Google hiện đang đánh giá xem nội dung có phải do AI tạo ra hay không

theanh

Administrator
Nhân viên
Google đang chỉ đạo những người đánh giá chất lượng của mình đánh dấu các trang có nội dung chính tự động hoặc do AI tạo ra – và đánh giá chúng là chất lượng thấp nhất, theo John Mueller, Trưởng nhóm phân tích tìm kiếm và quan hệ tìm kiếm của Google, phát biểu tại Search Central Live ở Madrid.

Điều này đã được Aleyda Solis chia sẻ hôm nay trên LinkedIn:
https://www.linkedin.com/embed/feed/update/urn:li:share:7315652793879437312?collapsed=1
Thay đổi này là một phần của bản cập nhật tháng 1 năm 2025 của Nguyên tắc đánh giá chất lượng tìm kiếm. Trong trường hợp bạn bỏ lỡ bất kỳ thông tin nào khác từ bản cập nhật đó, sau đây là bản tóm tắt về những thay đổi quan trọng nhất từ phiên bản mới nhất.

1. Google giới thiệu định nghĩa mới: Trí tuệ nhân tạo tạo sinh​

Với bản cập nhật Hướng dẫn đánh giá chất lượng tìm kiếm mới nhất, Google đã lần đầu tiên bổ sung định nghĩa và khuôn khổ cho trí tuệ nhân tạo tạo sinh. Tài liệu của Google gọi đây là một công cụ hữu ích, nhưng có thể bị lạm dụng.

Việc bổ sung AI tạo sinh xuất hiện trong Phần 2.1 (Định nghĩa quan trọng):
“AI tạo sinh là một loại mô hình máy học (ML) có thể sử dụng những gì đã học được từ các ví dụ được cung cấp để tạo nội dung mới, chẳng hạn như văn bản, hình ảnh, nhạc và mã. Các công cụ khác nhau tận dụng các mô hình này để tạo nội dung AI tạo sinh. AI tạo sinh có thể là một công cụ hữu ích để tạo nội dung, nhưng giống như bất kỳ công cụ nào, nó cũng có thể bị lạm dụng.”

2. Google sắp xếp lại và mở rộng các định nghĩa về thư rác​

Google đã cải tổ đáng kể cách định nghĩa các trang web spam.

Phần trước 4.6.3 (MC tự động tạo) đã không còn nữa. Thay vào đó, Google đã thêm các tiểu mục mới và tăng cường tập trung vào nội dung được mở rộng, ít tốn công sức, bao gồm cả việc sử dụng sai mục đích AI tiềm ẩn.

Những điểm mới trong năm 2025 đưa các nguyên tắc phù hợp với những thay đổi lớn về chất lượng tìm kiếm của Google từ năm ngoái:
  • Lạm dụng tên miền đã hết hạn (Mục 4.6.3): Điều này xảy ra khi "tên miền đã hết hạn được mua và sử dụng lại chủ yếu để mang lại lợi ích cho chủ sở hữu trang web mới bằng cách lưu trữ nội dung cung cấp ít hoặc không có giá trị cho người dùng".
  • Lạm dụng danh tiếng trang web (Mục 4.6.4): Khi "nội dung của bên thứ ba được xuất bản trên trang web lưu trữ chủ yếu là do các tín hiệu xếp hạng đã được thiết lập của máy chủ lưu trữ đó, mà máy chủ lưu trữ này kiếm được chủ yếu từ nội dung của bên thứ nhất. Mục tiêu của chiến thuật này là để nội dung được xếp hạng tốt hơn so với khi tự nó xếp hạng".
  • Lạm dụng nội dung được mở rộng (Mục 4.6.5): Tạo ra nhiều nội dung “với ít nỗ lực hoặc tính nguyên bản mà không cần chỉnh sửa hoặc quản lý thủ công”. Trí tuệ nhân tạo tạo ra được đề cập đến như một ví dụ về công cụ tự động được sử dụng cho mục đích này.
  • MC [Nội dung chính] được tạo ra với rất ít hoặc không cần nỗ lực, rất ít hoặc không có tính nguyên bản và rất ít hoặc không có giá trị gia tăng cho khách truy cập trang web (Mục 4.6.6): Đây là mục tổng hợp mới dành cho nội dung diễn đạt lại chất lượng thấp, thường thấy ở AI tạo ra và các hình thức tạo tự động khác.
Mục 4.6.6. là điều Mueller muốn lưu ý trong bài thuyết trình của mình, cụ thể là phần này:
“Xếp hạng Thấp nhất được áp dụng nếu tất cả hoặc hầu hết MC trên trang (bao gồm văn bản, hình ảnh, âm thanh, video, v.v.) được sao chép, diễn giải, nhúng, tự động hoặc AI tạo hoặc đăng lại từ các nguồn khác mà hầu như không tốn công sức, ít hoặc không có tính nguyên bản và ít hoặc không có giá trị gia tăng cho khách truy cập vào trang web. Những trang như vậy nên được xếp hạng Thấp nhất, ngay cả khi trang ghi nhận công lao cho nội dung từ một nguồn khác.” [được nhấn mạnh thêm].
Vậy thì, chính xác thì người đánh giá sẽ biết nội dung được tạo tự động hay AI như thế nào? Không có hướng dẫn cụ thể nào dành cho nội dung do AI tạo ra, nhưng có một số hướng dẫn mới về "nội dung diễn đạt lại":
  • Mục 4.6.6: "Các công cụ tự động cũng có thể được sử dụng để tạo nội dung diễn đạt lại bằng cách nêu lại hoặc tóm tắt nội dung trên các trang khác."
  • Mục 4.6.7: "Nội dung diễn đạt lại có thể khó nhận ra hơn nhiều… Nội dung diễn đạt lại có khả năng:Chỉ chứa thông tin thường được biết đến hoặc các sự kiện được biết đến rộng rãi
  • Có nhiều điểm trùng lặp với các trang web trên các nguồn đã được công nhận rộng rãi như Wikipedia, các trang web tham khảo, v.v.
  • Có vẻ như tóm tắt một trang cụ thể như thảo luận trên diễn đàn hoặc bài báo mà không có bất kỳ giá trị gia tăng nào
  • Có các từ hoặc dấu hiệu khác cho thấy đang tóm tắt hoặc diễn đạt lại các công cụ AI tạo ra, chẳng hạn như các từ như 'Là một mô hình ngôn ngữ AI'"

3. Google giải thích về xếp hạng thấp so với thấp nhất​

Phần mới này giới thiệu hướng dẫn cho người đánh giá về thời điểm nội dung không đủ tệ để nhận được xếp hạng Thấp nhất, nhưng vẫn xứng đáng được xếp hạng Thấp. Đây là sự khác biệt:
  • Thấp: Một số MC được sử dụng lại, nhưng ít nhất cũng có nỗ lực tối thiểu để tuyển chọn hoặc sửa đổi nó.
  • Thấp nhất: Hầu như tất cả MC đều được sao chép hoặc diễn giải mà không có nỗ lực hoặc giá trị gia tăng nào.
Hướng dẫn đánh giá chất lượng tìm kiếm chia sẻ các ví dụ về nội dung được đóng gói lại như sau:
  • “Đăng lại trên phương tiện truyền thông xã hội với ít bình luận hoặc thảo luận bổ sung”
  • “Các trang có nội dung từ các nguồn khác (ví dụ: các trang có video nhúng hoặc các trang có hình ảnh được 'ghim lại') với ít bình luận, thảo luận hoặc tuyển chọn bổ sung của người tạo nội dung trên trang”
  • “Danh sách 'Tốt nhất' dựa trên các đánh giá hiện có và danh sách có ít nội dung gốc”.
Google muốn người đánh giá đánh dấu nội dung mỏng cố gắng vượt qua như là bản gốc nhưng không đáp ứng tiêu chuẩn về trải nghiệm người dùng chất lượng.

4. Google thêm nội dung "lấp đầy"​

Phần mới này đề cập đến nội dung "lấp đầy" — tức là nội dung ít tốn công sức, ít liên quan, có thể chiếm ưu thế về mặt hình ảnh trên một trang trong khi không hỗ trợ mục đích của nó.
"Lấp đầy có thể làm tăng nội dung một cách giả tạo, tạo ra một trang có vẻ phong phú nhưng lại thiếu nội dung mà khách truy cập trang web thấy có giá trị."
Điều này nhấn mạnh rằng ngay cả khi nội dung không gây hại, nó vẫn có thể nhận được xếp hạng Thấp nếu nó khiến việc truy cập vào tài liệu thực sự hữu ích trở nên khó khăn hơn. Đặc biệt nhắm mục tiêu: các trang chôn thông tin hữu ích bên dưới quảng cáo, phần giới thiệu chung chung hoặc các đoạn văn dài dòng:
  • Phần nội dung thừa được đặt nổi bật và làm mất tập trung khỏi MC
  • Các trang có vẻ dài hơn hoặc phong phú hơn thực tế bằng cách thêm khoảng trống
Người đánh giá được khuyến khích đánh giá cách bố cục trang và hệ thống phân cấp nội dung ảnh hưởng đến khả năng đạt được mục tiêu của người dùng như thế nào.

5. Google trở nên nghiêm ngặt hơn đối với các khiếu nại phóng đại hoặc gây hiểu lầm nhẹ​

Nguyên tắc đánh giá chất lượng tìm kiếm của Google]hiện nhắm mục tiêu rõ ràng vào các khiếu nại phóng đại hoặc gây hiểu lầm nhẹ về người tạo trang web, ngay cả khi các khiếu nại đó không đến mức lừa dối trắng trợn.

Mục 5.6 mới được thêm vào giải thích:
“Thông tin lừa dối về trang web hoặc người tạo nội dung là lý do chính khiến trang web bị xếp hạng Thấp nhất”.
Nhưng cũng cảnh báo rằng những sự phóng đại ít trắng trợn hơn (ví dụ: thông tin xác thực được thổi phồng, chuyên môn được chế tạo) hiện đủ để đảm bảo xếp hạng Thấp:
“Đôi khi thông tin về trang web hoặc nhà cung cấp nội dung có vẻ bị phóng đại hoặc gây hiểu lầm nhẹ, chẳng hạn như các tuyên bố về kinh nghiệm hoặc chuyên môn cá nhân có vẻ cường điệu hoặc chỉ được đưa vào để gây ấn tượng với khách truy cập trang web.”
Điều này có nghĩa là người đánh giá được cho là dựa vào những gì nội dung chính thực sự chứng minh, cộng với nghiên cứu bên ngoài, thay vì coi các tuyên bố là đúng:
“Đánh giá E-E-A-T phải dựa trên chính MC, thông tin bạn tìm thấy trong quá trình nghiên cứu danh tiếng, thông tin xác thực, v.v., không chỉ dựa trên tuyên bố của người sáng tạo nội dung hoặc trang web rằng 'Tôi là chuyên gia!'”
Nếu người đánh giá thấy rằng trình độ mà người sáng tạo tuyên bố giống chiêu trò tiếp thị hơn là bản chất, thì tài liệu này là rõ ràng:
“Nếu bạn thấy thông tin về trang web hoặc người sáng tạo nội dung bị phóng đại hoặc có thể gây hiểu lầm nhẹ, nên sử dụng xếp hạng Thấp.”

Một số thay đổi nhỏ khác​

Google cũng đã thực hiện một số thay đổi nhỏ khác.
  • Các trang có chất lượng thấp nhất (Mục 4.0): Google đã thêm dòng này: "Cần phải có xếp hạng Thấp nhất nếu trang được tạo ra để mang lại lợi ích cho chủ sở hữu trang web (ví dụ: để kiếm tiền) với rất ít hoặc không có nỗ lực nào mang lại lợi ích cho khách truy cập trang web hoặc phục vụ mục đích có lợi khác."
  • Mục đích của trang lừa đảo, Thông tin lừa đảo về trang web, Thiết kế lừa đảo (Mục 4.5.3): Google đã sửa đổi mục này và thêm thông tin, chia nhỏ các thông tin này thành bảng và danh sách có dấu đầu dòng kèm theo các ví dụ.
  • Loại xếp hạng mới: Công thức thấp 3: Loại xếp hạng này sẽ được áp dụng cho các trang công thức có nhiều nội dung không liên quan, quảng cáo xen kẽ và quảng cáo.
  • Tiện ích mở rộng chặn quảng cáo (Mục 0.4): Người xếp hạng hiện phải "tắt mọi khả năng chặn quảng cáo của trình duyệt mà bạn sử dụng để xem các trang web cho nhiệm vụ xếp hạng." Điều này áp dụng cho các trình duyệt như Chrome tự động chặn một số quảng cáo.
 
Back
Bên trên