Phát biểu tại phiên thảo luận "Tự chủ chiến lược của cơ quan báo chí trong kỷ nguyên số" trong khuôn khổ Diễn đàn Báo chí toàn quốc 2026 ngày 20/6 tại TP Hải Phòng, ông Quách Hoài Nam - Chủ tịch Công ty AMI cho biết, trong bối cảnh chuyển đổi số diễn ra mạnh mẽ, dữ liệu đã trở thành một trong những tài sản chiến lược quan trọng nhất của các cơ quan báo chí.
Bức tranh phân mảnh của dữ liệu báo chí
Ông Nam phân tích, dữ liệu ở trong báo chí hiện tại được phân theo 5 lớp, đó là dữ liệu về mặt nội dung, dữ liệu về khán giả, dữ liệu về tương tác, dữ liệu thương mại, dữ liệu vận hành, dữ liệu niềm tin xã hội.
Đồng thời, dữ liệu trong hoạt động báo chí không phải là khái niệm mới khi các số liệu phát hành báo in, chỉ số rating truyền hình, lượng truy cập website hay dữ liệu tương tác trên các nền tảng số, tất cả đều là những dạng dữ liệu đã tồn tại từ lâu.
Tuy nhiên, thực tế hiện nay cho thấy, dữ liệu trong các tòa soạn đang ở tình trạng phân tán và cục bộ.
“Từ số liệu về phát hành báo in, lượt xem trên website, đến số liệu rating ở truyền hình, dữ liệu đang tồn tại ở trạng thái phân tán, bao gồm dữ liệu tự có, dữ liệu từ bên thứ ba”, ông Nam cho biết.
Theo ông, thách thức lớn hiện nay là dữ liệu đang được tạo ra liên tục trên nhiều nền tảng, thông qua nhiều công cụ khác nhau và thuộc quyền quản lý của nhiều bộ phận hoặc đơn vị.
Các loại dữ liệu từ hành vi xem, nội dung sản xuất đến hiệu quả phân phối và tương tác đang bị chia nhỏ bởi quá nhiều công cụ đo lường khác nhau như Google Analytics, Nielsen hay các hệ thống CMS nội bộ và mạng xã hội. Mỗi nền tảng này lại có một chuẩn báo cáo riêng, dẫn đến tình trạng "ông nói gà, bà nói vịt" khi định nghĩa về cùng một khái niệm.
Chẳng hạn, một lượt xem trên ứng dụng di động, trên YouTube và trên mạng xã hội có thể mang ba ý nghĩa hoàn toàn khác nhau. Sự thiếu hụt một "ngôn ngữ chung" xuyên suốt và nhất quán khiến việc cộng dồn, so sánh hay tin tưởng vào dữ liệu để ra quyết định trở nên cực kỳ khó khăn. Điều này tạo ra một rào cản lớn khi các tòa soạn muốn đánh giá chính xác giá trị thực sự mà nội dung của họ mang lại cho độc giả và đối tác quảng cáo.
Tiềm năng chưa khai phá của 5 lớp dữ liệu
Theo ông Nam, giá trị của dữ liệu không nằm ở khối lượng được thu thập hay lưu trữ, mà ở khả năng biến dữ liệu thành cơ sở cho các quyết định quản trị, phát triển nội dung và vận hành tòa soạn. Do đó, tự chủ dữ liệu đang dần trở thành năng lực cốt lõi quyết định khả năng cạnh tranh và phát triển bền vững của báo chí trong kỷ nguyên số.
Để quản trị hiệu quả, ông Nam cho rằng, 5 lớp cơ bản của dữ liệu báo chí cần được khai thác đúng cách để tạo ra những giá trị đột phá cho tòa soạn.
Chẳng hạn như lớp dữ liệu nội dung không chỉ đơn thuần là kho lưu trữ mà còn giúp ban biên tập biết rõ "sức khỏe" của từng bài viết thông qua các chỉ số định lượng. Dữ liệu khán giả cho phép bộ phận kinh doanh phân khúc người dùng dựa trên hành vi thực tế thay vì chỉ dựa vào nhân khẩu học bề mặt, từ đó tự động hóa quảng cáo hướng tới đối tượng.
Trong khi đó, dữ liệu tương tác giúp nhận diện chính xác thời điểm và lý do khán giả rời bỏ nội dung, còn dữ liệu thương mại giúp định giá quảng cáo dựa trên hiệu quả thực tế sau khi họ đã xem.
Để dữ liệu trở thành nền tảng đáng tin cậy cho hoạt động quản trị, theo ông Nam, hệ thống dữ liệu cần đáp ứng ba nguyên tắc cốt lõi: Thứ nhất là dữ liệu phải mang tính xuyên suốt; thứ hai dữ liệu phải có sự nhất quán và thứ ba là dữ liệu phải kiểm chứng được, tức là khi có nghi vấn thì dữ liệu đó cần phải được truy vấn ngược lại.
Những rào cản từ tư duy công nghệ
Mặc dù nhận thức về vai trò của dữ liệu ngày càng được nâng cao, nhiều cơ quan báo chí vẫn gặp khó khăn trong quá trình triển khai thực tế.
Một trong những sai lầm phổ biến của các tòa soạn là quá tập trung vào công nghệ. Nhiều đơn vị đầu tư mạnh vào phần mềm, bảng điều khiển kỹ thuật số (dashboard) hoặc các giải pháp phân tích dữ liệu mà chưa xác định rõ mục tiêu sử dụng, chất lượng dữ liệu hiện có hay đối tượng sẽ trực tiếp khai thác dữ liệu đó.
Bên cạnh đó là tình trạng dữ liệu tồn tại nhưng không tham gia vào quá trình ra quyết định. Nhiều hệ thống phân tích có thể cung cấp lượng lớn thông tin, nhưng các quyết định chuyên môn và quản trị vẫn được đưa ra theo thói quen hoặc kinh nghiệm truyền thống.
"Trong bối cảnh dữ liệu được tạo ra với tốc độ ngày càng lớn, việc lưu trữ thiếu chiến lược không những không tạo ra giá trị mà còn có thể trở thành gánh nặng về mặt lưu trữ, gánh nặng về mặt tài chính. Chi phí lưu trữ ngày càng lớn hơn nhưng giá trị về mặt khai thác có thể không tương xứng”, ông Nam nói.
Kiểm toán - bước khởi đầu của tự chủ dữ liệu
Theo ông Nam, hành trình tự chủ dữ liệu nên bắt đầu từ một hoạt động nền tảng nhưng thường bị bỏ qua: kiểm toán dữ liệu. Đây là một quá trình phải được ưu tiên, bởi sẽ giúp cho các cơ quan báo chí có thể kết nối ba nhóm: nhóm tạo ra dữ liệu, nhóm sử dụng dữ liệu và nhóm quyết định dữ liệu.
“Kiểm toán ở đây tức là chúng ta đang từng bước chuẩn hóa dữ liệu, dữ liệu nào đang tồn tại, ai đang giữ nó, nó đang được sử dụng để phục vụ mục đích gì. Và quan trọng hơn cả là chúng ta có dùng được dữ liệu đó để đưa ra quyết định cụ thể ở trong một phòng ban chuyên môn nào hay không”, ông Nam khuyến nghị.
Theo ông Nam, trong kỷ nguyên số, dữ liệu không còn đơn thuần là nguồn thông tin hỗ trợ hoạt động báo chí mà đã trở thành nguồn lực chiến lược quyết định năng lực cạnh tranh của tòa soạn.
Tự chủ dữ liệu không chỉ giúp các cơ quan báo chí giảm sự phụ thuộc vào các nguồn dữ liệu bên ngoài mà còn tạo nền tảng cho việc phát triển các sản phẩm truyền thông mới, nâng cao hiệu quả quản trị, tối ưu hoạt động kinh doanh và tăng cường khả năng phục vụ công chúng.
Quan trọng hơn, tự chủ dữ liệu cần được nhìn nhận như một năng lực cốt lõi, trong đó quản trị dữ liệu đóng vai trò trung tâm. Khi dữ liệu được chuẩn hóa, kết nối và đưa vào quy trình ra quyết định, những nguồn dữ liệu thô và phân tán sẽ được chuyển hóa thành tài sản chiến lược có giá trị lâu dài.