Cá nhân hoá tin tức bằng AI:Chưa hiệu quả khi dữ liệu người dùng không đủ
Các tòa soạn trên toàn cầu đang đẩy mạnh cá nhân hóa tin tức bằng trí tuệ nhân tạo (AI) hướng đến phục vụ đối tượng “né tránh tin tức” thời sự. Còn ở Việt Nam, vấn đề này đang được các chuyên gia truyền thông quan tâm, các cơ quan báo chí coi là một xu hướng tương lai nhưng trước mắt còn khá nhiều thách thức, đặc biệt là bài toán dữ liệu…
Vẫn phải máy và người cùng chọn
Ngày càng nhiều tòa soạn sử dụng trí tuệ nhân tạo (AI) để cải thiện hiệu suất và thực hiện các công việc phụ trợ. Trong bối cảnh người dùng ở nhiều nước đang ngày càng giảm hứng thú với tin tức và có xu hướng né tránh các nội dung thời sự thì việc tận dụng AI để mang lại trải nghiệm tin tức cá nhân hóa và dễ tiếp cận hơn. Các nền tảng đã sử dụng hệ thống gợi ý tin tức trong nhiều năm.
Tuy nhiên, điều khiến AI tạo ra bước ngoặt thực sự là khả năng điều chỉnh định dạng tin tức không chỉ là nội dung được chọn lọc. Một số tờ báo đã tích hợp các công cụ AI cho phép độc giả tóm tắt bài viết tự động (như Aftonbladet ở Thụy Điển) hoặc chuyển văn bản thành âm thanh (như Miami Herald ở Mỹ).
Ở Argentina, tờ Clarín đang sử dụng UalterAI để cung cấp các trích dẫn, số liệu và giải thích thuật ngữ kỹ thuật. Tại Mỹ, The Washington Post thử nghiệm hệ thống “Ask Post” – công cụ AI giúp trả lời các truy vấn dựa trên kho lưu trữ tin tức của báo…

Ở Việt Nam, chuyên gia công nghệ thông tin Bùi Trung Hiếu, Công ty trách nhiệm hữu hạn giải pháp phần mềm MFITE cho rằng, trong bối cảnh thông tin phát triển bùng nổ, nhu cầu cá nhân hóa nội dung đang trở thành một xu thế tất yếu, đặc biệt trong lĩnh vực báo chí và truyền thông số.
Có 3 nguyên nhân chính của việc tăng mạnh nhu cầu cá nhân hóa hiện nay là: Dữ liệu người dùng ngày càng nhiều; sự cạnh tranh từ mạng xã hội; nâng cao hiệu quả kinh doanh và trải nghiệm người dùng.
Cùng với đó, có 4 cách tiếp cận cá nhân hóa chính gồm: Cá nhân hóa chủ động (Explicit Personalization), người dùng tự khai báo sở thích, chủ đề quan tâm… khi đăng ký tài khoản; hệ thống sẽ hiển thị nội dung dựa trên thông tin người dùng cung cấp. Cá nhân hóa thụ động (Implicit Personalization), hệ thống theo dõi hành vi người dùng (click, thời gian đọc, lượt tương tác…) để phân nhóm và đề xuất nội dung phù hợp; đây là hình thức phổ biến và có độ chính xác cao vì dựa vào hành vi thực tế.
Cá nhân hóa theo ngữ cảnh và xu hướng (Contextual/Trending Personalization), gợi ý nội dung theo thời gian, địa điểm hoặc những chủ đề đang được quan tâm nhiều trong cộng đồng – nhằm đảm bảo tính cập nhật và độ “nóng” của thông tin.
Cá nhân hóa bằng trí tuệ nhân tạo (AI) và học máy (AI-powered Personalization), đây là hình thức cá nhân hóa tiên tiến nhất hiện nay, sử dụng mô hình học máy (machine learning) để kết hợp hành vi người dùng với nội dung bài viết nhằm tạo ra đề xuất theo từng cá nhân (1-1 personalization). Mỗi người dùng sẽ có một trải nghiệm duy nhất, không trùng lặp.
Chia sẻ riêng về góc độ cá nhân hoá bằng trí tuệ nhân tạo - hình thức cá nhân hóa tiên tiến nhất hiện nay thì ông Hiếu cho rằng một số cơ quan báo chí ở Việt Nam đã làm rồi nhưng hiệu quả chưa cao do dữ liệu chưa đủ. Giải pháp của vấn đề này trước mắt theo ông Hiếu vẫn phải làm kiểu “Half – Half” tức là không phụ thuộc hoàn toàn vào AI mà phải vừa máy chọn, vừa người chọn…
Muốn cá nhân hoá bắt buộc phải có dữ liệu
Trên thực tế báo chí Việt Nam, theo ông Nguyễn Hoàng Nhật – Phó Trưởng ban Nhân dân Điện tử thì ở Việt Nam việc áp dụng hình thức cá nhân hoá tin tức bằng trí tuệ nhân tạo đến nay chưa hiệu quả vì báo chí Việt Nam chưa làm chủ được công nghệ, chưa đủ dữ liệu người dùng…
“Đây là điều mà các cơ quan báo chí ở Việt Nam đều đang hướng đến, nhưng còn lúng túng cách làm, chưa chủ động công nghệ…” – ông Nhật khẳng định.
Đồng quan điểm này, chuyên gia công nghệ Bùi Công Duyến cho rằng, Việt Nam hiện nay mới chỉ có một số cơ quan báo chí lớn có lượng người truy cập lớn triển khai cách thức này như VnExpress, Znews, Dân trí, Thanh niên...
Ông Duyến cũng cho biết thêm rằng, ngoài dữ liệu lớn còn cần có lượng truy cập lớn thì việc cá nhân hoá bằng trí tuệ nhân tạo mới đạt hiệu quả cao.

Rõ ràng là cốt lõi của cá nhân hóa dựa trên AI nằm ở dữ liệu - rất nhiều dữ liệu. Các thuật toán AI sàng lọc hàng núi dữ liệu để trích xuất những hiểu biết sâu sắc hữu ích. Những hiểu biết sâu sắc này cho phép các cơ quan báo chí xác định được đối tượng công chúng một cách chính xác, xác định xu hướng và dự đoán nhu cầu của người dùng.
Phó Tổng biên tập Báo VnExpress Nguyễn Thu Hương cho biết, cá nhân hoá ngày càng trở thành một tính năng phổ biến, nhưng thực hiện lại không đơn giản. “Muốn cá nhân hoá bắt buộc phải có dữ liệu. Chúng tôi theo đuổi cá nhân hoá trong nhiều năm qua, với mong muốn đem lại một trải nghiệm tốt hơn cho độc giả, họ dễ dàng tiếp cận nội dung yêu thích vào đúng thời điểm với ít nỗ lực nhất. Họ sẽ gắn bó và trung thành hơn với sản phẩm… Cá nhân hoá hiển thị, tuỳ chọn nội dung yêu thích, khu vực gợi ý tin tức (recommendation), gửi thông báo theo từng cá nhân,... là những hành động chúng tôi đã thực hiện. Tuy nhiên, tính tác động chỉ ảnh hưởng trong phạm vi nhỏ. Cá nhân hoá toàn bộ mặt trang, gồm cả quảng cáo, là điều chúng tôi hướng tới…” – bà Hương cho hay.
Những phân tích trên đây chỉ ra rằng, việc cá nhân hoá tin tức bằng AI quả thực vẫn là một bài toán khó đối với báo chí Việt Nam. Để tiếp tục hành trình đó, các cơ quan báo chí phải tiếp tục làm tốt hơn nữa vấn đề thu thập dữ liệu người dùng và giải bài toán tăng lượng truy cập hơn nữa. Đó là chưa kể, một thực tế cũng cần phải quan tâm đó là người làm báo bây giờ muốn cá nhân hóa nội dung để phục vụ bạn đọc trung thành, thứ nhất cần biết rõ bạn đọc là ai, ở đâu, giới tính, lứa tuổi - đây là những thông tin ban đầu.
Thứ hai, là tìm hiểu xem họ thích đọc những gì, đọc qua kênh nào, đọc lúc nào và cần tìm hiểu xem họ đọc vào lúc nào, trực tiếp từ trang báo hay qua share link, phải nắm rõ thời gian để phục vụ bạn đọc…
Thậm chí như trao đổi của Phó Tổng biên tập Báo Tuổi trẻ Lê Xuân Trung: “Ở giai đoạn phát triển hiện nay của báo chí số, cá nhân hóa nội dung không chỉ dừng lại ở việc gửi đúng người - đúng nội dung - đúng thời điểm. Điều khó nhất, cũng là mục tiêu cao nhất, là làm sao để chăm sóc được độc giả trung thành như cách doanh nghiệp chăm sóc khách hàng và thậm chí còn hơn thế nữa…”.
Có thể nói, những vấn đề đặt ra trong bài toán cá nhân hoá tin tức bằng AI sẽ là mục tiêu hướng đến trong thời gian tới nhưng chắc chắn lộ trình đó cần sự song hành linh hoạt giữa con người và tận dụng công nghệ. Để làm tốt, đòi hỏi những đổi mới sáng tạo tích cực, bền bỉ từ các cơ quan báo chí, trước hết là các cơ quan báo chí lớn có nguồn lực.