Báo chí - Công nghệ

Ngành xuất bản số lún sâu vào khủng hoảng khi các công ty AI ngày càng xâm phạm 'trắng trợn'

Ngọc Ánh (theo Dig Watch, The Atlantic) • 26/06/2025 19:53

(CLO) Ngành xuất bản trực tuyến đang tiếp tục lún sâu vào khủng hoảng khi trí tuệ nhân tạo không chỉ học từ họ mà còn đang dần thay thế bằng cách chiếm đoạn giá trị do họ tạo ra.

Những bản tóm tắt gọn gàng do AI tạo ra đang chiếm lĩnh kết quả tìm kiếm, đẩy các trang báo điện tử đến sách trực tuyến vào tình trạng hụt hơi trong cuộc chiến giữ chân độc giả và dòng tiền.

Từ Meta đến OpenAI, nhiều công ty công nghệ lớn bị cáo buộc đã sử dụng các kho dữ liệu lậu như LibGen để huấn luyện mô hình ngôn ngữ mà không xin phép hay chi trả tác quyền. Tài liệu bị hút vào bao gồm hàng triệu cuốn sách, bài báo khoa học, và nội dung báo chí - phần lớn nội dung thậm chí nằm sau các bức tường thu phí.

Một số trường hợp còn ghi nhận việc tải về dữ liệu từ các mạng chia sẻ tệp dữ liệu như BitTorrent, làm dấy lên lo ngại về vi phạm bản quyền ở quy mô chưa từng có.

Các tổng quan tin tức do AI tạo ra trong công cụ tìm kiếm Google khiến các trang web tin tức sụt giảm mạnh lượng truy cập, ngược lại tiếp tục "làm giàu" cho các gã khổng lồ công nghệ (Big Tech)

Hậu quả đã bắt đầu hiện rõ. Theo CEO Cloudflare, Matthew Prince, lưu lượng truy cập từ các công cụ tìm kiếm đến trang báo đang giảm nhanh. Trước đây, cứ mỗi khi Google thu thập hai trang web, họ lại dẫn người dùng đến một trong số đó. Giờ thì phải thu thập tới 18 trang, mới có một người được chuyển hướng sang trang gốc.

OpenAI còn tệ hơn: cứ 1.500 trang được “đọc” thì chỉ có 1 người được gửi đến nhà xuất bản gốc. Điều đó đồng nghĩa với việc ít người đọc báo thật, ít lượt nhấp quảng cáo, ít đăng ký trả phí – và nhiều nhà báo có nguy cơ mất việc.

"Mọi người không còn đọc bài gốc nữa. Họ đọc bản tóm tắt của AI và thấy vậy là đủ", Prince nói trong sự kiện tại Cannes do Axios tổ chức. Theo ông, khi niềm tin được dồn vào AI, thì nội dung gốc – vốn là xương sống của ngành xuất bản – sẽ dần biến mất.

Trong khi các công ty AI viện dẫn lý lẽ "sử dụng hợp lý" (fair use) để bảo vệ hành vi của mình, thì giới xuất bản không đồng tình. Nhiều vụ kiện đã được nộp, từ các nhà văn nổi tiếng đến các tập đoàn truyền thông. Phía nguyên đơn cho rằng việc AI đào dữ liệu từ sách và báo mà không xin phép là vi phạm trắng trợn quyền sở hữu trí tuệ.

Các nhà xuất bản tin tức cần có các biện pháp tự bảo vệ mình trước sự "đánh cắp" nội dung ngày càng "trắng trợn" của các công ty AI. Ảnh: Pixabay

Cloudflare hiện đang phát triển một công cụ mới nhằm ngăn chặn việc thu thập dữ liệu trái phép từ AI. Công cụ này, theo Prince, đã nhận được sự ủng hộ mạnh mẽ từ ngành và có thể trở thành tuyến phòng thủ đầu tiên cho những nhà xuất bản muốn bảo vệ nội dung của mình khỏi bị AI “đào mỏ”.

Ngành xuất bản giờ đây đứng trước lựa chọn nghiệt ngã: hoặc thích nghi với thế giới do AI thống trị – với những bản tóm tắt ngắn gọn nhưng không nuôi sống được ai, hoặc vùng lên bảo vệ quyền làm chủ tri thức của con người, nơi mỗi con chữ đều được trả công xứng đáng.

Đây không còn là câu chuyện công nghệ. Đây là một trận chiến văn hóa – giữa sáng tạo và tự động hóa, giữa con người và cỗ máy.