Câu chuyện được chia sẻ bởi Rune Ytreberg, biên tập viên dữ liệu tại phòng thí nghiệm dữ liệu của tờ iTromsø. Nhóm của ông phát triển các công cụ AI phục vụ báo chí không chỉ cho iTromsø mà còn cho khoảng 70 tờ báo địa phương thuộc tập đoàn Polaris Media.
Một ví dụ là cuộc điều tra gần đây về khủng hoảng nhà ở tại Tromsø. Đội ngũ 22 phóng viên đã phân tích dữ liệu trong hơn 10 năm của nền tảng cho thuê nhà Airbnb, đồng thời so sánh với các số liệu về tăng trưởng du lịch.
Theo Ytreberg, lượng dữ liệu quá lớn khiến một tòa soạn nhỏ khó có thể xử lý bằng phương pháp truyền thống. Vì vậy, họ đã thiết kế lại quy trình làm việc, trong đó AI đảm nhận phần lớn công việc kỹ thuật như xử lý và phân tích dữ liệu, còn nhà báo tập trung vào việc tìm câu chuyện và kiểm chứng thông tin.
Hệ thống AI của iTromsø được xây dựng theo nhiều lớp “tác nhân” (agents), mỗi lớp đảm nhận một nhiệm vụ khác nhau. Một số tác nhân kiểm tra và thu thập dữ liệu, số khác làm sạch dữ liệu, đánh giá độ tin cậy và sắp xếp dữ liệu thành các cơ sở dữ liệu có thể sử dụng. Sau đó, các tác nhân phân tích sẽ tìm xu hướng, điểm bất thường hoặc những dấu hiệu có thể dẫn tới câu chuyện báo chí.
Toàn bộ quá trình đều có sự giám sát của con người. Biên tập viên dữ liệu chịu trách nhiệm kiểm tra các kết quả phân tích và xác nhận các thống kê. Biên tập viên tin tức đánh giá mức độ quan trọng và tác động xã hội của câu chuyện. Biên tập viên trang nhất xem xét cách đặt tiêu đề và trình bày thông tin.
Theo Ytreberg, AI có thể đề xuất cách phân tích dữ liệu hoặc gợi ý câu hỏi cần đặt ra, nhưng quyết định cuối cùng vẫn thuộc về các nhà báo. Hệ thống cũng có thể giải thích các đề xuất của mình bằng ngôn ngữ đơn giản, giống như một đồng nghiệp trong tòa soạn.
Sau khi có kết quả phân tích dữ liệu, các phóng viên vẫn phải thực hiện những bước quen thuộc của nghề báo như ra hiện trường, phỏng vấn nhân vật, nói chuyện với chủ nhà cho thuê trên Airbnb, các gia đình địa phương, chính trị gia và nhà quản lý. Những cuộc gặp trực tiếp này giúp kiểm chứng dữ liệu và bổ sung bối cảnh cho câu chuyện.
Theo các nhà phân tích của iTromsø, một trong những lý do cần đến AI là vì dữ liệu phục vụ điều tra thường nằm rải rác ở nhiều nguồn khác nhau, không đồng nhất về định dạng và định nghĩa. AI giúp tổng hợp các nguồn dữ liệu đó thành những cơ sở dữ liệu có thể truy vấn, chia sẻ và tái sử dụng trong tòa soạn.
Dự án này cũng là sự phối hợp giữa nhiều bộ phận. Đội ngũ biên tập quyết định những câu hỏi điều tra quan trọng, còn đội ngũ kỹ thuật xây dựng hệ thống xử lý dữ liệu và duy trì cơ sở dữ liệu.
Ytreberg cho biết động lực đổi mới đến từ chính quy mô nhỏ của tòa soạn. iTromsø phải cạnh tranh với một tờ báo lớn hơn trong cùng thành phố, nơi có nhiều phóng viên và nguồn lực hơn. Vì vậy, họ lựa chọn hướng đi là khai thác dữ liệu để tạo ra các câu chuyện độc quyền.
Theo ông, chiến lược này đang mang lại kết quả. Số lượng người đăng ký báo của iTromsø đã tăng khoảng 5% mỗi năm trong vòng 5-6 năm gần đây. Điều đó cho thấy việc kết hợp AI với báo chí dữ liệu có thể giúp các tòa soạn nhỏ tạo ra lợi thế cạnh tranh.