Đánh giá mức độ tin cậy của các công cụ AI trong báo chí

(CLO) Các công cụ AI được cho là có thể giúp nhà báo trong nhiều tác vụ, từ phiên âm, ghi chú, tóm tắt, đến nghiên cứu và phân tích dữ liệu. Nhưng liệu chúng có đủ đáng tin để sử dụng thường xuyên trong tòa soạn? Câu trả lời vẫn chưa rõ ràng.

Hầu hết các tòa soạn đều đã có chính sách về AI, nhưng chúng thường rất chung chung, không đi sâu vào chi tiết công việc hàng ngày của phóng viên. Điều này khiến các nhà báo phải tự tìm tòi, dựa vào "cảm giác" của mình để đánh giá công cụ nào hữu ích.

Jeremy Merrill, một phóng viên tại Washington Post, từng thử nghiệm các công cụ một cách ngẫu nhiên. Tuy nhiên, anh nhanh chóng nhận ra phương pháp này không đủ. Anh nói: "Cảm giác không thể nói lên tất cả. Bạn không thể biết nó chính xác 60%, 70% hay 95%". Florent Daudens, trưởng nhóm báo chí tại Hugging Face, đồng tình rằng cách tiếp cận này chỉ dựa trên "sở thích về phong cách" chứ không phải độ chính xác.

Nhận thấy nhu cầu cấp thiết về các tiêu chuẩn đánh giá nghiêm ngặt hơn, một nhóm các nhà báo, học giả và trợ lý nghiên cứu tại Khoa Báo chí Đại học New York, Đại học Virginia và MuckRock đã tiến hành một nghiên cứu sâu rộng. Họ tập trung vào hai loại công cụ AI có tiềm năng ứng dụng cao trong báo chí: chatbot tóm tắt cuộc họp và công cụ nghiên cứu khoa học.

untitled(1).png
Ảnh minh họa: Unsplash

Đánh giá công cụ AI tóm tắt cuộc họp

Các nhà báo thường phải đọc hàng đống báo cáo và biên bản cuộc họp dài. Một công cụ AI có thể tóm tắt lại nội dung sẽ tiết kiệm được rất nhiều thời gian. Nhóm nghiên cứu đã sử dụng 4 chatbot phổ biến để tóm tắt biên bản các cuộc họp chính quyền địa phương: ChatGPT-4o, Claude Opus 4, Perplexity Pro, và Gemini 2.5 Pro.

Mỗi công cụ được yêu cầu tạo ra cả bản tóm tắt ngắn (khoảng 200 từ) và dài (khoảng 500 từ) cho cùng một tài liệu, sử dụng các gợi ý khác nhau, từ đơn giản đến chi tiết. Kết quả được so sánh với một bản tóm tắt do con người viết, với trọng tâm đánh giá là độ chính xác, tính nhất quán và tình trạng "ảo giác" (hallucination).

Kết quả cho thấy, với bản tóm tắt ngắn, các mô hình AI (trừ Gemini 2.5 Pro) hoạt động xuất sắc, vượt trội hơn cả bản tóm tắt do con người viết. Chúng đưa ra nhiều sự kiện hơn và ít ảo giác. Điều đáng chú ý là gợi ý đơn giản "Hãy tóm tắt ngắn gọn tài liệu này" mang lại kết quả chính xác cao nhất.

Với bản tóm tắt dài, kết quả bất ngờ tệ. Các bản tóm tắt dài do AI tạo ra chỉ chứa khoảng 50% thông tin so với bản tóm tắt do con người viết và có nhiều ảo giác hơn.

Mặc dù một bản tóm tắt dài do AI tạo ra chỉ mất khoảng một phút, trong khi bản tóm tắt tương tự của con người mất 3 - 4 giờ, điều này cho thấy sự hy sinh đáng kể về độ chính xác.

Trong số các công cụ được thử nghiệm, ChatGPT-4o cho thấy hiệu suất đáng tin cậy và chính xác nhất, với tỷ lệ ảo giác dưới 1%. Nó cùng với Claude Opus 4 duy trì độ chính xác và tính nhất quán cao. Perplexity Pro và ChatGPT-4o được đánh giá cao về trải nghiệm người dùng.

Nhóm nghiên cứu kết luận, hiện các nhà báo nên sử dụng các công cụ này để tạo bản tóm tắt ngắn cho mục đích nghiên cứu ban đầu và luôn kiểm tra lại thông tin. Bản tóm tắt dài hơn chỉ nên dùng để nắm bắt ý chính và không nên dùng để xuất bản.

Đánh giá công cụ AI nghiên cứu khoa học

Đối với các nhà báo khoa học, việc xác định các nghiên cứu "đột phá" có thực sự đáng tin cậy hay không là một thách thức lớn. Các công cụ AI hứa hẹn sẽ tự động hóa việc tìm kiếm các bài báo liên quan và tóm tắt lại, một quá trình thường được gọi là "đánh giá tài liệu".

Nhóm nghiên cứu đã đánh giá 5 công cụ: Elicit, Semantic Scholar, ResearchRabbit, Inciteful và Consensus. Họ yêu cầu các công cụ này tạo danh sách các bài báo liên quan cho 4 bài báo học thuật đã đoạt giải thưởng. Các trích dẫn thực tế trong các bài báo này được dùng làm chuẩn mực so sánh.

Kết quả thử nghiệm cho thấy một thực tế đáng báo động. Các công cụ nghiên cứu AI thiếu độ chính xác một cách nghiêm trọng, với hầu hết chúng không thể tạo ra danh sách trích dẫn trùng khớp đáng kể so với chuẩn mực của con người. Trong 4 bài kiểm tra, đa số các công cụ chỉ tìm được chưa đến 6% số bài báo liên quan, và trong một số trường hợp thậm chí là 0%.

Đáng lo ngại hơn, sự thiếu nhất quán còn thể hiện rõ khi các công cụ không chỉ bỏ sót các trích dẫn mà con người đã tìm thấy, mà còn bất đồng với nhau. Khi chạy lại cùng một thử nghiệm, nhiều công cụ lại trả về các kết quả khác biệt, cho thấy sự thiếu tin cậy về lâu dài.

Điều này cho thấy các công cụ nghiên cứu AI hiện tại chỉ là "quảng cáo thổi phồng hơn là hỗ trợ thực sự". Dựa vào chúng để hiểu bối cảnh khoa học có thể dẫn đến việc hiểu sai và trình bày sai lệch thông tin. Eric Olson, CEO của Consensus, thừa nhận mục tiêu của họ là giúp các nhà nghiên cứu làm việc nhanh hơn, chứ không phải vượt trội hơn các công trình học thuật đã được thẩm định.

Dựa trên nghiên cứu, các công cụ AI không phải là giải pháp vạn năng cho mọi tác vụ báo chí. Mặc dù chúng có thể rất hữu ích trong việc tạo ra các bản tóm tắt ngắn và chính xác cho tài liệu dài, nhưng hiệu suất lại kém đi rõ rệt khi đối mặt với các nhiệm vụ phức tạp hơn như tóm tắt chi tiết hoặc nghiên cứu chuyên sâu.

Nhóm nghiên cứu khuyến nghị các nhà báo nên tiếp tục sử dụng AI như một công cụ hỗ trợ, nhưng phải luôn kiểm tra lại thông tin và không nên phụ thuộc hoàn toàn vào chúng. Hiện tại, các công cụ này chỉ thực sự hiệu quả khi sử dụng cho các mục đích nghiên cứu cơ bản, giúp tiết kiệm thời gian nhưng không thay thế được khả năng phân tích và thẩm định của con người.

Xem thêm

AI đang làm thay đổi công việc của các nhà báo tự do như thế nào?

AI đang làm thay đổi công việc của các nhà báo tự do như thế nào?

(NB&CL) Trí tuệ nhân tạo tạo sinh (GenAI) đang giúp các nhà báo tự do viết nhanh hơn, xử lý thông tin hiệu quả hơn và thích nghi với áp lực tin tức liên tục. Nhưng chính công nghệ này cũng khiến nhuận bút bị kéo xuống, niềm tin giữa biên tập viên và cộng tác viên rạn nứt, đồng thời đặt ra câu hỏi lớn: Khi AI có thể tạo ra nội dung chỉ trong vài giây, vị trí của các nhà báo tự do sẽ ở đâu?

Giao thoa Báo với Văn mãi trường tồn và phát triển

Giao thoa Báo với Văn mãi trường tồn và phát triển

(CLO) Làm báo và viết văn - hai phạm trù tưởng chừng riêng biệt nhưng luôn hòa quyện, bổ trợ cho nhau trong hành trình phản ánh hiện thực và tôn vinh cái đẹp, cái mới, cái hay. Điều đó khẳng định mối giao thoa bền chặt giữa báo chí và văn học sẽ mãi trường tồn cùng thời đại.

Bài học từ RTL News

Bài học từ RTL News

(NB&CL) Trong nhiều năm, các tòa soạn báo chí trên thế giới phải đối mặt với bài toán khó: Lượng thông tin cần xử lý ngày càng lớn trong khi doanh thu truyền thống liên tục suy giảm. Áp lực cắt giảm chi phí khiến nhiều cơ quan báo chí buộc phải tinh gọn bộ máy nhưng vẫn phải duy trì tốc độ cập nhật tin tức liên tục.

Tổng Biên tập Nguyễn Bá Kiên: Báo chí cần tạo giá trị cho cộng đồng, thay vì chỉ chạy đua lượt truy cập

Tổng Biên tập Nguyễn Bá Kiên: Báo chí cần tạo giá trị cho cộng đồng, thay vì chỉ chạy đua lượt truy cập

(CLO) Độc giả ngày nay không chỉ cần thông tin nhanh mà còn mong muốn được tiếp cận những câu chuyện tích cực, tử tế và có ích cho xã hội. Bởi vậy, các cơ quan báo chí cần đo lường hiệu quả nội dung dựa trên mục tiêu phục vụ cộng đồng và giá trị mang lại, thay vì chỉ nhìn vào lượng truy cập.

Viết về bộ máy, nhưng câu chuyện nằm ở sự phát triển

Viết về bộ máy, nhưng câu chuyện nằm ở sự phát triển

(NB&CL) Ngày 1/7/2025, 34 tỉnh, thành phố chính thức vận hành bộ máy mới và triển khai mô hình chính quyền địa phương hai cấp. Đằng sau sự kiện được xem là cuộc cải cách hành chính sâu rộng nhất trong nhiều thập kỷ là những câu hỏi lớn về tổ chức bộ máy, không gian phát triển và năng lực cạnh tranh quốc gia. Loạt bài “Sắp xếp giang sơn, kiến tạo động lực phát triển quốc gia” của Báo Nhân Dân lựa chọn tiếp cận những câu hỏi ấy từ cả chiều dài lịch sử, thực tiễn vận hành và tầm nhìn phát triển tương lai.

Khi mỗi tòa soạn trở thành... “siêu KOL”

Khi mỗi tòa soạn trở thành... “siêu KOL”

(NB&CL) Chỉ vài năm trước, nhiều tòa soạn vẫn còn xem TikTok là một “sân chơi phụ” dành cho video giải trí. Podcast bị coi là sản phẩm bên lề. Tin gửi qua email chỉ là công cụ kéo traffic. Nhà báo càng không được khuyến khích xây dựng thương hiệu cá nhân quá mạnh, bởi không ít tòa soạn lo ngại phóng viên sẽ nổi tiếng hơn chính tờ báo mình làm việc.

Hành trình 80 năm Công an nhân dân: Lý giải lịch sử bằng ngôn ngữ báo chí hiện đại

Hành trình 80 năm Công an nhân dân: Lý giải lịch sử bằng ngôn ngữ báo chí hiện đại

(NB&CL) Một cú vuốt màn hình - một đoạn video hiện ra - bức ảnh tư liệu của lực lượng Công an nhân dân xuất hiện giữa nền đồ họa chuyển động. Lại vuốt tiếp. Một cuộc đối thoại giữa các tướng lĩnh, chuyên gia và những người trong cuộc bắt đầu. Rồi những lớp dữ liệu, hình ảnh, trích dẫn, tư liệu lịch sử lần lượt nối tiếp nhau trên cùng một hành trình.

Báo chí thời AI: Sự độc đáo trở thành “vũ khí sinh tồn”

Báo chí thời AI: Sự độc đáo trở thành “vũ khí sinh tồn”

(NB&CL) Trong kỷ nguyên trí tuệ nhân tạo, các chatbot đã có thể tạo ra một bài báo hoàn chỉnh từ hàng chục nguồn dữ liệu khác nhau. Điều đó khiến ngành báo chí toàn cầu đối diện câu hỏi: Nếu AI có thể làm phần “thông tin cơ bản”, các tòa soạn sẽ cạnh tranh bằng điều gì?

Cạm bẫy từ các hợp đồng kỳ nghỉ: Vén màn những 'giấc mơ nghỉ dưỡng'

Cạm bẫy từ các hợp đồng kỳ nghỉ: Vén màn những 'giấc mơ nghỉ dưỡng'

(CLO) Những ngày qua, "Bẫy 2 - Cạm bẫy từ các hợp đồng kỳ nghỉ" trở thành tâm điểm chú ý trên nhiều diễn đàn và mạng xã hội. Bộ phim tài liệu điều tra của Đài Truyền hình Việt Nam không chỉ phản ánh những tranh chấp kéo dài liên quan đến mô hình sở hữu kỳ nghỉ, mà còn bóc tách cách nhiều khách hàng từng bị cuốn vào một "giấc mơ nghỉ dưỡng" được thiết kế rất bài bản.

Giữa cơn lốc công nghệ, nghề báo phải giữ lại điều gì

Giữa cơn lốc công nghệ, nghề báo phải giữ lại điều gì

(NB&CL) Chưa bao giờ báo chí nói nhiều về công nghệ như hôm nay. Hội thảo nào cũng nhắc đến trí tuệ nhân tạo, dữ liệu lớn, thuật toán, tòa soạn hội tụ, báo chí đa nền tảng, đa phương tiện. Các cơ quan báo chí chạy đua chuyển đổi số. Nhiều người tin rằng tương lai của báo chí nằm ở công nghệ.

Những tháng ngày băng rừng tìm sự thật

Những tháng ngày băng rừng tìm sự thật

(NB&CL) Có những đêm giữa rừng sâu Bình Gia, trong cái lạnh cắt da của miền núi phía Bắc, nhóm phóng viên phải nín thở quan sát những đoàn xe tải chở đầy gỗ lậu lặng lẽ rời rừng. Có những ngày băng qua những cánh rừng tự nhiên bị cưa hạ nham nhở, tận mắt chứng kiến những thân cây lớn nằm ngổn ngang giữa núi sâu. Và cũng có những tháng trời rong ruổi từ Lạng Sơn đến Thái Nguyên, Phú Thọ, Hà Nội để lần theo dấu vết của những tấm ván gỗ tưởng chừng vô tri nhưng lại ẩn chứa phía sau cả một đường dây khai thác, vận chuyển và hợp thức hóa lâm sản trái phép.

Đi tìm sự thật phía sau những luận điệu nhân danh tự do ngôn luận

Đi tìm sự thật phía sau những luận điệu nhân danh tự do ngôn luận

(NB&CL) Mỗi ngày, hàng triệu thông tin được tạo ra, chia sẻ và lan truyền trên không gian mạng. Giữa dòng chảy ấy, có những thông tin sai lệch không xuất hiện dưới dạng những lời công kích trực diện. Chúng được khoác lên những cái tên nghe có vẻ quen thuộc như “báo chí độc lập”, “tự do ngôn luận” hay “phản biện xã hội”.

Từ những vùng đất tan hoang đến niềm tin được dựng lại

Từ những vùng đất tan hoang đến niềm tin được dựng lại

(NB&CL) Từ những vùng đất còn ngổn ngang dấu tích bão lũ đến những mái nhà mới sáng đèn, bộ ảnh “Chiến dịch Quang Trung - Dấu ấn Bộ đội Cụ Hồ giữa vùng thiên tai” của Báo Quân đội nhân dân ghi lại một hành trình đặc biệt. Đó không chỉ là câu chuyện về tốc độ dựng nhà sau thiên tai, mà còn là câu chuyện về tình quân dân, về hình ảnh Bộ đội Cụ Hồ được khắc họa qua những việc làm cụ thể giữa lúc người dân cần điểm tựa nhất.

AI Tác nhân: Cuộc cách mạng “tự động hóa” ngành truyền thông

AI Tác nhân: Cuộc cách mạng “tự động hóa” ngành truyền thông

(NB&CL) Khi ngành truyền thông - báo chí vẫn còn chưa hết ngỡ ngàng trước khả năng xử lý ngôn ngữ tự nhiên (NLP) của chatbot hay các công cụ trợ lý AI, thì một bước ngoặt mới đã lại xảy ra trong thế giới công nghệ: Sự xuất hiện của AI Tác nhân (Agentic AI) - khái niệm chỉ các tác nhân AI (AI agents) có thể tự động làm báo!

Giải Báo chí Quốc gia trong giai đoạn phát triển mới

Giải Báo chí Quốc gia trong giai đoạn phát triển mới

(NB&CL) Giải Báo chí Quốc gia (GBCQG) lần thứ 20 năm nay được tổ chức trong lúc cả nước tập trung cao độ thực hiện các quyết sách của Đảng đưa đất nước bước vào giai đoạn phát triển mới, hiện thực hóa khát vọng phồn vinh, hùng cường của dân tộc thông qua cuộc cách mạng về thể chế, tinh gọn tổ chức bộ máy của hệ thống chính trị, sắp xếp lại giang sơn. Báo chí của chúng ta cũng vào cuộc với khí thế đó, tinh gọn bộ máy, giảm số lượng cơ quan báo chí, nâng cao chất lượng để giữ vững và nâng cao phẩm chất của nền Báo chí Cách mạng trong giai đoạn mới.

Cỡ chữ bài viết: