Google vẫn lấy nội dung của báo chí để huấn luyện AI, ngay cả bị từ chối

(CLO) Một lãnh đạo cấp cao của Google vừa thừa nhận tại tòa rằng họ vẫn dùng nội dung báo chí cho tính năng “Tổng quan AI” (AI Overview), kể cả từ những nhà xuất bản đã yêu cầu không được sử dụng để huấn luyện AI.

Phiên điều trần đang diễn ra tại tòa án liên bang ở Washington DC, là một phần của vụ kiện chống độc quyền do Bộ Tư pháp Mỹ thực hiện, nhằm làm rõ xem Google có lạm dụng vị trí độc quyền trong ngành tìm kiếm hay không.

Theo tường thuật từ Bloomberg, Eli Collins, Phó chủ tịch tại DeepMind - bộ phận nghiên cứu AI của Google, tiết lộ rằng dù các tổ chức báo chí đã dùng cài đặt “từ chối” không cho phép dùng nội dung của họ để huấn luyện AI, Google vẫn dùng nội dung đó để hiển thị trong phần trả lời AI trên công cụ tìm kiếm.

untitled(5).png
Ảnh minh họa: Unsplash

Một luật sư của Bộ Tư pháp đã hỏi thẳng rằng: “Khi đưa AI Gemini vào công cụ tìm kiếm, liệu nó có thể dùng nội dung mà các nhà xuất bản đã từ chối không?”

Collins trả lời: “Đúng, nếu dùng cho tìm kiếm”. Nói cách khác, dù một nhà xuất bản không cho phép dùng nội dung của họ để huấn luyện AI, thì Google vẫn có thể trích dẫn lại nội dung đó trong phần Tổng quan AI, như thể mô hình chưa hề bị "cấm học".

Một số tổ chức báo chí cho rằng cách làm này khiến họ mất doanh thu và lượng truy cập lớn. Người dùng không cần bấm vào bài viết gốc nữa vì nội dung đã được AI của Google tóm tắt sẵn ở đầu trang. Chegg, nền tảng học tập trực tuyến, thậm chí đã kiện Google, nói rằng tính năng này làm sụp đổ mô hình kinh doanh của họ.

Google đáp trả rằng các trang web có thể kiểm soát việc này bằng cách dùng file robots.txt – một đoạn mã cho phép họ chặn Google thu thập dữ liệu từ trang web. Nhưng vấn đề là robots.txt chỉ cho phép chặn toàn bộ, chứ không thể chặn riêng phần Tổng quan AI.

Nếu nhà xuất bản muốn ngăn AI lấy nội dung, thì họ buộc phải chặn luôn cả việc hiển thị trang trong kết quả tìm kiếm bình thường. Một lựa chọn rất khó.

Thêm một chi tiết quan trọng được tiết lộ: theo một tài liệu nội bộ do Bộ Tư pháp Mỹ công bố tại tòa, Google đã phải xóa khoảng 80 tỷ "mã thông báo" nội dung, tức một nửa dữ liệu huấn luyện của Gemini, sau khi lọc ra các trang web đã “từ chối” tham gia. Tài liệu này có từ tháng 8/2024.

Tóm lại, các nhà xuất bản muốn ngăn AI của Google dùng nội dung của mình thì gần như không có cách nào hiệu quả. Còn Google thì vẫn đang tìm cách “lách luật”: không huấn luyện AI bằng dữ liệu bị từ chối, nhưng vẫn để AI trích lại nội dung ấy trong phần trả lời người dùng.

Xem thêm

Ngày càng nhiều nước siết quyền truy cập mạng xã hội của trẻ em

Ngày càng nhiều nước siết quyền truy cập mạng xã hội của trẻ em

(CLO) Úc là quốc gia đầu tiên trên thế giới ban hành lệnh cấm trẻ em dưới 16 tuổi sử dụng mạng xã hội, đánh dấu xu hướng ngày càng nhiều nước tìm cách hạn chế quyền truy cập của trẻ vị thành niên vào các nền tảng trực tuyến do lo ngại về sức khỏe tâm thần, an toàn và tác động lâu dài đối với sự phát triển của trẻ.

Nvidia bắt tay các 'ông lớn' của Hàn Quốc xây dựng trung tâm dữ liệu AI

Nvidia bắt tay các 'ông lớn' của Hàn Quốc xây dựng trung tâm dữ liệu AI

(CLO) Nvidia ngày 8/6 công bố hàng loạt thỏa thuận hợp tác với các tập đoàn hàng đầu Hàn Quốc gồm SK Hynix, Naver và Doosan nhằm phát triển các trung tâm dữ liệu trí tuệ nhân tạo (AI) và mở rộng việc ứng dụng công nghệ của hãng, trong bối cảnh làn sóng đầu tư AI trên toàn cầu tiếp tục tăng tốc.

Thái Lan kiện Facebook vì các vụ lừa đảo trực tuyến

Thái Lan kiện Facebook vì các vụ lừa đảo trực tuyến

(CLO) Hội đồng Bảo vệ Người tiêu dùng Thái Lan cho biết sẽ đệ đơn kiện Facebook trong tuần tới, đánh dấu vụ kiện đầu tiên tại nước này nhằm vào nền tảng mạng xã hội vì không bảo vệ đầy đủ người dùng trước các nội dung lừa đảo.

Anthropic được định giá 965 tỷ USD, vượt qua OpenAI

Anthropic được định giá 965 tỷ USD, vượt qua OpenAI

(CLO) Anthropic ngày 28/5 thông báo đã huy động được 65 tỷ USD trong vòng gọi vốn series H, qua đó nâng mức định giá sau đầu tư lên 965 tỷ USD. Động thái này giúp Anthropic vượt qua đối thủ OpenAI, công ty từng được định giá 852 tỷ USD hồi tháng 3.

CEO OpenAI: AI không gây ra 'thảm họa việc làm' như lo ngại

CEO OpenAI: AI không gây ra 'thảm họa việc làm' như lo ngại

(CLO) Giám đốc điều hành OpenAI, Sam Altman, cho biết sự phát triển nhanh chóng của trí tuệ nhân tạo không gây ra “thảm họa việc làm” toàn cầu như nhiều người từng lo ngại, đồng thời thừa nhận ông đã đánh giá quá cao tác động của AI đối với lao động văn phòng.

Mạng xã hội bị ví nguy hiểm ngang thuốc lá với trẻ em

Mạng xã hội bị ví nguy hiểm ngang thuốc lá với trẻ em

(CLO) Các bác sĩ hàng đầu tại Vương quốc Anh kêu gọi chính phủ siết chặt kiểm soát mạng xã hội đối với trẻ em, cho rằng tác động của việc sử dụng mạng xã hội quá mức hiện nguy hiểm tương đương thuốc lá.

Cỡ chữ bài viết: