Tại hội thảo do INMA phối hợp với OpenAI tổ chức, các chuyên gia cho biết việc ứng dụng AI đã chuyển từ thử nghiệm sang triển khai ở quy mô lớn trong ngành báo chí.
Yahoo News cá nhân hóa nội dung cho 190 triệu người dùng
Erica Greene, giám đốc kỹ thuật về học máy tại Yahoo News, cho biết nền tảng này hiện phục vụ khoảng 190 triệu người dùng và vận hành một hệ thống cá nhân hóa ở mức độ cao. Tại mỗi thời điểm, hệ thống có thể đánh giá tới 80.000 nội dung khác nhau, sau đó chọn ra khoảng 200 nội dung phù hợp nhất để hiển thị trên trang chủ của từng người dùng.
Việc lựa chọn này dựa trên nhiều tín hiệu như hành vi đọc, thời gian dừng lại ở bài viết, tần suất quay lại, cùng các yếu tố ngữ cảnh như thời gian trong ngày hoặc vị trí truy cập. Nhờ đó, nội dung được cập nhật liên tục và thay đổi theo từng phiên truy cập, thay vì cố định như cách làm truyền thống.
Bên cạnh dữ liệu hành vi, Yahoo News còn xây dựng hệ thống dữ liệu có cấu trúc để “hiểu” nội dung. Mỗi bài được phân tích để xác định chủ đề, nhân vật và các yếu tố liên quan, giúp nâng cao độ chính xác trong việc đề xuất. Cách làm này cũng cho phép phát triển các tính năng như tóm tắt nội dung hoặc nhóm các bài viết cùng chủ đề theo thời gian thực.
Đại diện Yahoo News nhấn mạnh rằng biên tập viên vẫn giữ vai trò kiểm soát cuối cùng nhằm đảm bảo các nội dung quan trọng không bị bỏ qua. Cá nhân hóa vì thế được sử dụng để tăng trải nghiệm, không thay thế hoàn toàn quyết định biên tập.
Times Internet: Cá nhân hóa để thoát phụ thuộc nền tảng
Ở một góc nhìn khác, Times Internet cho rằng thách thức lớn nhất của báo chí hiện nay nằm ở khoảng cách công nghệ so với các nền tảng số.
Trong nhiều năm, các tòa soạn - đặc biệt tại Ấn Độ - phụ thuộc nhiều vào nguồn truy cập từ Google và YouTube. Tuy nhiên, nguồn traffic này rất thất thường và đã giảm mạnh khi các công nghệ AI, đặc biệt là các mô hình ngôn ngữ lớn, phát triển. Điều này buộc các nhà xuất bản phải tìm cách chủ động giữ độc giả thay vì phụ thuộc vào nền tảng bên ngoài.
Theo Times Internet, vấn đề cốt lõi là người dùng hiện đã quen với trải nghiệm cá nhân hóa cao từ các nền tảng số như TikTok hay Netflix, nơi các nội dung khác nhau được đề xuất cho từng cá nhân. Trong khi đó, nhiều cơ quan báo chí vẫn vận hành theo cách cũ, dữ liệu phân tán, phản ứng chậm và khó theo kịp nhu cầu thay đổi liên tục.
Không chỉ cạnh tranh với các báo khác, sản phẩm tin tức hiện còn phải cạnh tranh trực tiếp với mạng xã hội, thương mại điện tử hay ứng dụng dịch vụ - những nền tảng có lượng dữ liệu người dùng lớn hơn và khả năng giữ chân cao hơn. Trong khi đó, báo chí lại thường thiếu dữ liệu trực tiếp và khó xác định chính xác nhu cầu của người đọc.
Để thích ứng, Times Internet đã chuyển từ cách làm dựa trên dữ liệu quá khứ sang sử dụng AI có khả năng cập nhật theo thời gian thực. Hệ thống của họ được điều chỉnh sau mỗi 15-30 phút để phản ứng nhanh với tin tức mới và thay đổi trong hành vi người dùng.
Dù vậy, đơn vị này vẫn giữ cách tiếp cận thận trọng. Các công cụ AI được sử dụng để hỗ trợ đánh giá nội dung, nhưng biên tập viên vẫn là người quyết định cuối cùng. Theo họ, chấp nhận bỏ sót một số nội dung còn hơn để hệ thống lan truyền thông tin không phù hợp, nhằm đảm bảo chất lượng và độ tin cậy của sản phẩm báo chí.
Trong bối cảnh đó, khả năng khai thác dữ liệu và triển khai AI hiệu quả được xem là yếu tố quyết định để duy trì tăng trưởng. Các chuyên gia nhận định, những tòa soạn xây dựng được hệ thống cá nhân hóa phù hợp sẽ có lợi thế rõ rệt trong việc giữ chân độc giả và phát triển bền vững.