Báo chí dữ liệu góp phần định hình tương lai của báo chí trong kỷ nguyên số
(CLO) Trong kỷ nguyên số, dữ liệu trở thành "nguyên liệu" quan trọng cho mọi hoạt động báo chí. Việc người làm báo thành thạo trong việc thu thập dữ liệu từ nhiều nguồn, biết cách xử lý phân tích dữ liệu bằng các công cụ thống kê và trí tuệ nhân tạo (AI) sẽ là kỹ năng quan trọng để tòa soạn đó hướng tới phát triển bền vững trong kỷ nguyên số.
Số hóa dữ liệu để xây dựng mô hình dữ liệu lớn cho tòa soạn
Kỷ niệm 100 năm Ngày Báo chí cách mạng Việt Nam là dịp để cùng nhau nhìn lại hành trình một thế kỷ báo chí cách mạng phụng sự Tổ quốc, phục vụ nhân dân. Đây cũng là cơ hội để mỗi cơ quan báo chí xác định rõ về tầm quan trọng của việc đổi mới công nghệ với những giải pháp mang tính chiến lược, để báo chí bước vào kỷ nguyên mới.

Trong nhiều giải pháp về công nghệ, hiện đại hóa mô hình hoạt động, đổi mới báo điện tử tạo sự hấp dẫn cho bạn đọc, phát triển báo chí dữ liệu sẽ là một phần không thể thiếu trong mỗi tòa soạn.
Báo chí dữ liệu là một lĩnh vực mới mẻ nhưng là nguồn tài nguyên quý giá trong dòng chảy thông tin mà nhiều cơ quan báo chí thường vô tình lãng quên. Thông tin về các lĩnh vực, các sự kiện, hình ảnh, video… là những dữ liệu quý được các cơ quan báo chí sử dụng qua nhiều năm nhưng nếu không có hệ thống lưu giữ, không biết phân loại, phân tích, khai thác vận hành sẽ dễ bị lãng quên trong dòng chảy tin tức vô định.
Bằng cách khai thác sức mạnh của con số và thuật toán, báo chí dữ liệu sẽ mở ra góc nhìn mới mẻ, đa chiều, có sự biến động và giải mã những vấn đề phức tạp của xã hội, chính trị, kinh tế... Mọi thứ đều được thể hiện bằng những con số thống kê cụ thể thay vì chỉ đánh giá chung chung mang tính cảm tính, thiếu khách quan.
Ngoài ra, báo chí nhờ công nghệ AI và báo chí dữ liệu cũng mỗi cơ quan báo chí có nâng cao khả năng phân tích dữ liệu phản hồi từ công chúng, xu hướng ngành hoặc hành vi tiêu dùng để đề xuất các chiến dịch phù hợp – điều vốn đòi hỏi nhiều thời gian và nguồn lực khi con con người đảm nhiệm.
Thực tế đã có nhiều cơ quan báo chí đi tắt đón đầu, vận dụng linh hoạt những công nghệ tiên tiến vào hoạt động, một số cơ quan báo chí của trong nước đã phối hợp với những công ty công nghệ về dữ liệu của người Việt để xây dựng và hình thành nên hệ thống quản lý, khai thác, sử dụng dữ liệu của riêng tòa soạn mình. Rất nhiều đơn vị xác định trong chuyển đổi số và xây dựng tòa soạn thông minh, dữ liệu đóng vai trò rất quan trọng, là tài sản, tài nguyên và là điều kiện tiên quyết để thực hiện chuyển đổi số. Việc phát triển báo chí dữ liệu là điều kiện tiên quyết để hướng đến sự phát triển ổn định và bền vững cho mỗi tòa soạn.
PGS.TS Nguyễn Thành Lợi, Tổng Biên tập Báo Kinh tế & Đô thị cho biết, trong những năm gần đây chúng tôi đã tập trung đầu tư hệ thống lưu trữ cho hệ thống dữ liệu nội bộ, lưu trữ ảnh báo chí, xây dựng được cơ sở dữ liệu cho báo điện tử, báo in và các ấn phẩm phục vụ tốt cho mô hình tòa soạn hội tụ. Hiện báo đang tập trung đầu tư sản xuất các sản phẩm báo chí dữ liệu đồng thời đưa cơ sở dữ liệu lên các nền tảng số.
“Năm 2025, chúng tôi phát triển và xây dựng các sản phẩm báo chí số, nền tảng số, số hóa dữ liệu để xây dựng mô hình dữ liệu lớn, từ đó xây dựng và triển khai mô hình kinh tế số, triển khai dịch vụ thu phí đọc báo dựa trên các nền tảng ICT của báo. Đồng thời, xây dựng các công cụ thu thập dữ liệu, đánh giá, dự báo, theo dõi, giám sát chất lượng báo chí. Hình thành trung tâm dữ liệu Kinh tế & Đô thị, xây dựng các dịch vụ để chuyển hóa dữ liệu phục vụ phát triển kinh tế số” PGS,TS Nguyễn Thành Lợi chia sẻ thêm.
Ngoài Báo Kinh tế & Đô thị, nhiều cơ quan báo chí khác cũng xây dựng hệ thống dữ liệu vào hoạt động của tòa soạn. Gần đây nhân dịp kỷ niệm 50 năm Ngày Giải phóng miền Nam, thống nhất đất nước, Báo Sài Gòn Giải Phóng (SGGP) chính thức ra mắt công trình báo chí dữ liệu. Công trình sử dụng các công cụ AI để số hóa, phân tích và trình bày dữ liệu, từ chuyển văn bản thành âm thanh, khôi phục các trang báo bị hỏng, đến nhận diện đặc trưng hình ảnh và tìm kiếm nhanh thông tin. Công trình được trình bày dưới nhiều hình thức đa phương tiện như Longform, Infographic và video, giúp bạn đọc dễ dàng tiếp cận thông tin và trải nghiệm.
Báo chí dữ liệu xu hướng không thể đảo ngược
Không thể phủ nhận việc ứng dụng báo chí dữ liệu vào đời sống, tuy nhiên mọi thứ đều có tồn tại bên cạnh những mặt tích cực mà công nghệ mang lại. Nhờ dữ liệu, người làm báo có thể tạo bài viết nhanh chóng từ dữ liệu lớn, nhưng nội dung bài viết mà công cụ tạo ra thường khô cứng, thiếu chiều sâu phân tích, ngôn ngữ khuôn mẫu và không tạo được kết nối cảm xúc với độc giả.

Nhận định về việc này, ThS. Nguyễn Phương Anh – Học viện Báo chí và Tuyên truyền chia sẻ: Mặc dù AI có thể thay thế con người ở khâu trình bày dữ liệu, nhưng nó chưa đủ khả năng thay thế tư duy phản biện, cái nhìn nhân văn và đạo đức nghề nghiệp của nhà báo. Vấn đề đặt ra là làm sao để khai thác AI hiệu quả, mà vẫn giữ được bản lĩnh, trách nhiệm và đạo đức người làm báo trong kỷ nguyên số.
ThS. Nguyễn Phương Anh nhận định: “Về bản chất, AI chỉ có thể tạo ra phản hồi dựa trên kho dữ liệu đã được đưa vào, hoàn toàn thiếu cảm xúc con người hay nhận thức sâu sắc về bối cảnh lịch sử, kinh tế, văn hóa, xã hội cụ thể, không có lý tưởng báo chí, không có sự nhạy cảm chính trị, càng không mang trong mình các giá trị nhân văn hay ý thức trách nhiệm xã hội như nhà báo, những lao động sống gắn bó trực tiếp với thực tiễn đời sống”.
Thực tế cho thấy, các hệ thống AI có thể tự động tạo nội dung dựa trên dữ liệu đầu vào, nhưng lại không có khả năng thẩm định giá trị đạo đức, độ tin cậy của nguồn tin hay bối cảnh lịch sử, xã hội cụ thể. Điều này dễ dẫn đến việc lan truyền thông tin sai lệch, tin giả, tin giật gân hoặc nội dung phiến diện, phân biệt gây tổn thương đến tổ chức, cá nhân.
Có thể nói, việc sử dụng báo chí dữ liệu sẽ là xu hướng không thể đảo ngược với mỗi cơ quan báo chí. Tuy nhiên, điều quan trọng nhất là sử dụng như thế nào, việc đào tạo, hướng dẫn cho người làm báo xây dựng kho dữ liệu và khai thác bài bản, tạo ra hiệu quả cao ra sao.
Để giải quyết bài toán này, Tiến sĩ Lương Đông Sơn, giảng viên Viện Báo chí - Truyền thông, Học viện Báo chí và Tuyên truyền cho rằng: “Cần bổ sung các môn học, khóa học chuyên sâu về báo chí dữ liệu và phân tích dữ liệu lớn. Trong kỷ nguyên số, dữ liệu trở thành "nguyên liệu" quan trọng cho mọi hoạt động báo chí. Chương trình đào tạo bồi dưỡng sẽ giúp người làm báo, sinh viên báo chí thành thạo trong việc thu thập dữ liệu từ nhiều nguồn và xử lý dữ liệu, phân tích dữ liệu bằng các công cụ thống kê và trí tuệ nhân tạo. Có như vậy mới trực quan hóa dữ liệu thành biểu đồ và đồ họa thông tin và cuối cùng là kể chuyện bằng dữ liệu một cách hấp dẫn”.
Trong kỷ nguyên số, dữ liệu trở thành nguồn tài nguyên quý giá để phát hiện các xu hướng, các thông tin ẩn hoặc các mẫu hành vi của công chúng. Mỗi nhà báo cần có khả năng khai thác, xử lý và phân tích dữ liệu từ các nguồn khác nhau như mạng xã hội, cơ sở dữ liệu công khai, hoặc dữ liệu thu thập qua các hệ thống tự động.
Điều này đòi hỏi kiến thức về các phương pháp thống kê, phân tích dữ liệu, cũng như kỹ năng sử dụng các công cụ, phần mềm phân tích dữ liệu chuyên dụng. Chỉ như vậy các nhà báo, phóng viên mới có thể tạo ra các nội dung có chiều sâu, chính xác, phản ánh đúng các xu hướng đang diễn ra, giúp độc giả hiểu rõ hơn về các vấn đề phức tạp.