(NB&CL) Tạp chí hàng đầu của Đức Der Spiegel đã sử dụng học máy (machine learning - ML)- một nhánh chuyên về dự báo của trí tuệ nhân tạo (AI) để dự đoán điều gì có thể thúc đẩy những độc giả đang đọc miễn phí quyết định trả tiền mua các gói đăng ký.
Khi tờ Der Spiegel muốn tăng lượng người đăng ký đọc báo, họ đã quyết định tập trung vào cách dự đoán điều gì có thể thúc đẩy những độc giả đang đọc miễn phí quyết định trả tiền mua các gói đăng ký. Và việc sử dụng học máy (machine learning - ML) một nhánh chuyên về dự báo của trí tuệ nhân tạo (AI) đã được tạp chí hàng đầu của Đức sử dụng cho mục tiêu này.
Alex Held - một nhà khoa học dữ liệu tại tờ Der Spiegel của Đức, đã công bố các bước và quy trình mà nhóm của ông đã sử dụng để đưa ra những dự đoán. Ông giải thích mọi việc bắt đầu từ vài năm trước khi công ty nhận ra rằng họ đang thu hút được một số lượng lớn người dùng hoạt động hằng ngày trên trang web của mình, song những độc giả này lại không đăng ký trả tiền.
“Các độc giả này đến với chúng tôi hằng ngày. Họ đọc rất nhiều nội dung, dành nhiều giờ một tuần hoặc thậm chí đôi khi trong một ngày, nhưng không đăng ký!”, ông chia sẻ. “Trên các nền tảng khác như Netflix hay Spotify, sẽ thật điên rồ khi có một lượng người dùng khổng lồ như vậy truy cập mỗi ngày nhưng lại không đăng ký”.
Tờ Der Spiegel của Đức đang sử dụng máy học để xác định những độc giả có tiềm năng đăng ký. Ảnh: INMA
Tờ Der Spiegel đã nhìn thấy “tiềm năng to lớn” và bắt đầu động não tìm cách tiếp cận hơn 1 triệu độc giả truy cập chưa đăng ký. Họ cũng quyết định sử dụng học máy để giúp giải quyết vấn đề.
Đầu tiên, điều quan trọng là phải xác định những lý do có thể khiến mọi người không đăng ký. Các lý do chính bao gồm không muốn trả giá cao hơn sau khi thời gian khuyến mãi kết thúc, không nhận được ưu đãi phù hợp hoặc không hiểu sản phẩm mang lại cho họ những gì.
Nhóm đặt mục tiêu xác định những người đăng ký tiềm năng nhất trong hơn 1 triệu độc giả này, vì vậy nhóm đã sử dụng dữ liệu để huấn luyện mô hình học máy tìm ra những độc giả đó. Nhưng trước tiên, họ phải xác định loại dữ liệu nào sẽ sử dụng để dự đoán đăng ký.
Alex Held cho biết nhóm của ông đã tạo ra 4 danh mục để xem xét:
Tương tác: Ngoài số lần nhấp chuột, nhóm của ông còn quan tâm đến việc độc giả sử dụng các tính năng dựa trên thời gian như thời gian truy cập trung bình, số lượng bài báo đã đọc, số lần hiển thị tường phí và liệu họ có truy cập trang mời đăng ký hay không.
Vị trí: Vị trí địa lý của độc giả tại Đức.
Nguồn giới thiệu: Điều này giúp xác định người dùng biết đến tờ báo từ nguồn nào (Google, Bing, thông báo đẩy, trang web chính thức v.v...).
Chuyên mục: Điều này rất quan trọng để xác định các vấn đề mà một độc giả quan tâm, giống như chính trị, thể thao, văn hóa v.v… Ngoài ra, nhóm cũng quan tâm tới việc độc giả thích hình thức nào, như podcast, báo viết truyền thống hay báo hình.
Ông chỉ ra rằng không phải lúc nào cũng dễ dàng lấy tất cả dữ liệu và đào tạo một mô hình máy học vì một số dữ liệu sẽ không đủ chất lượng và có thể cần phải loại bỏ. Trên thực tế, ông lưu ý rằng ít nhất 70% lượng dữ liệu đã không được nhóm đưa vào đào tạo mô hình do chất lượng dữ liệu kém.
Ông lưu ý rằng điều này thật sự quan trọng, sau trải nghiệm cá nhân của tờ báo. “Mô hình của chúng tôi không hoạt động tốt và nó đã dự đoán tổng số đăng ký hàng ngày, vốn không phải là mục tiêu của chúng tôi. Nhưng sau khi tinh chỉnh, mô hình đã dự đoán chính xác lượng người dùng đăng ký lâu dài”, ông cho hay.
Xác định độc giả tiềm năng
Ông cho biết nhóm chỉ tìm kiếm những người sẽ trở thành độc giả lâu dài, vì thế nhóm chỉ tìm và sử dụng dữ liệu đáp ứng các tiêu chí đó để huấn luyện mô hình.
Nhóm đã quyết định tìm kiếm các dữ liệu về người dùng 40 ngày sau khi mua báo, đồng thời sử dụng các dữ liệu trong 40 ngày gần nhất để đánh giá xem người dùng nào có khả năng cao sẽ đăng ký. Dữ liệu cũng đánh giá thời gian người dùng sẽ tiếp tục đăng ký với tờ báo.
Học máy (machine learning - ML) là lớp chuyên sâu trong lĩnh vực Trí tuệ nhân tạo (AI), tiếp đến là Học sâu (Deep learning). ML có khả năng phân tích và đưa ra dự báo. Ảnh: Wiki
“Với các dữ liệu đó trong tay, chúng tôi đã đào tạo một mô hình học máy. Họ đã sử dụng mô hình học máy để chấm điểm tất cả người dùng với điểm số từ 0 đến 100. Nếu mức điểm càng cao, người dùng đó càng có nhiều khả năng đăng ký”, ông cho hay.
Thay đổi dữ liệu huấn luyện thường xuyên
Ông Held cho biết tờ Der Spiegel huấn luyện lại mô hình học máy của mình hằng tháng. “Chúng tôi có một máy chủ đang chạy hoàn chỉnh… và chúng tôi sử dụng mô hình đó để phục vụ các dự đoán hằng ngày”, ông giải thích, đồng thời cho biết thêm rằng nhóm của ông có thể khôi phục các phiên bản cũ hơn khi phiên bản mới không hoạt động tốt.
Der Spiegel sử dụng Adobe Analytics hằng ngày và gửi nhóm người dùng có điểm số cao tới Adobe Target, một công cụ mà hãng sử dụng để cá nhân hóa trải nghiệm trong việc đọc báo đối với từng độc giả. Tờ báo cũng đã tạo một cuộc khảo sát cho người dùng được nhắm mục tiêu, dựa trên dữ liệu từ cuộc khảo sát kết hợp với điểm số mà mô hình chấm.
“Dựa trên điểm số mô hình, chúng tôi phân loại và gửi khảo sát tới các đối tượng này, sau đó so sánh các câu trả lời với điểm mà mô hình cung cấp”, ông Held chia sẻ. “Điều này khá thú vị vì bây giờ chúng tôi có thể hỏi mọi người một số câu hỏi mang tính cá nhân hóa, chẳng hạn như khả năng họ sẽ đăng ký với chúng tôi trong tương lai là bao nhiêu phần trăm? Hoặc chúng tôi có thể hỏi xem họ có biết về gói đăng ký hay không…? Tất cả những thông tin đó sau đó sẽ được cập nhật cho mô hình học máy”.
Sau đó, nhóm dữ liệu có thể phân tích kết quả khảo sát và tạo ra các ưu đãi phù hợp, thậm chí có thể bao gồm chiết khấu hàng năm cao hơn cho một số nhóm đối tượng nếu điều này có thể khiến họ quyết định đăng ký dài hạn.
Hướng tới tương lai
Ông Held cũng nhận thấy có một nhóm đối tượng sẵn sàng đăng ký nếu họ được cung cấp thông tin chi tiết hơn về các gói đăng ký của tờ báo. Để kiểm tra điều đó, Der Spiegel đang thử nghiệm tính năng cá nhân hóa quảng cáo và biểu ngữ của mình bằng mô hình học máy.
Trong tương lai, ông cho biết công ty đang xem xét phân tích thời gian tồn tại của dữ liệu thông tin người dùng (cookie) và số lượt truy cập dài hạn. “Chúng tôi muốn kết hợp điều đó vào mô hình học máy của mình vì chúng tôi thấy rằng những người dùng trải nghiệm sản phẩm của chúng tôi một cách chuyên sâu trong vài tuần có khả năng đăng ký rất cao”, ông nói thêm.
Ông Held cho biết việc kết hợp thông tin đó vào mô hình máy học sẽ giúp đưa ra những dự đoán chính xác hơn. Der Speigel cũng đang muốn ứng dụng thêm mô hình máy học vào các dự đoán khác, như khi nào người dùng có thể dừng đăng ký.
(CLO) Phó Thủ tướng Trần Hồng Hà đồng ý giao UBND tỉnh Hòa Bình làm cơ quan chủ quản để quản lý, đầu tư xây dựng đoạn tuyến cao tốc Hòa Bình - Mộc Châu (Km 0 - Km 19) với quy mô giai đoạn hoàn thiện theo tiêu chuẩn đường cao tốc 4 làn xe.
(CLO) Ngày 1/4, thông tin từ Công an xã Thanh Hòa (huyện Như Xuân, Thanh Hóa) cho biết, đang phối hợp Trại giam Thanh Lâm truy tìm phạm nhân Dương Hữu Duy trốn khỏi trại giam Thanh Lâm.
(CLO) Trước tình hình trật tự an toàn giao thông (TTATGT) diễn biến phức tạp trong những tháng đầu năm 2025, Công an tỉnh Quảng Bình đã triển khai đợt cao điểm nhằm kiểm soát, ngăn chặn tai nạn giao thông (TNGT) trên địa bàn. Đợt cao điểm bắt đầu từ ngày 1/4/2025, hướng tới mục tiêu giảm thiểu tai nạn trên cả ba tiêu chí và đảm bảo an toàn cho người dân.
(CLO) Chiều 1/4, Tỉnh ủy Lạng Sơn đã tổ chức hội nghị công bố quyết định của Ban Chấp hành Đảng bộ tỉnh về việc sáp nhập Đài Phát thanh và Truyền hình tỉnh Lạng Sơn vào Báo Lạng Sơn, tạo thành Báo và Đài Phát thanh Truyền hình Lạng Sơn. Đồng thời, hội nghị cũng công bố các quyết định về công tác cán bộ của Ban Thường vụ Tỉnh ủy.
(CLO) Theo Trung tâm Dự báo Khí tượng Thuỷ văn, ngày 2/4, khu vực Nam Bộ tiếp tục có mưa rào và dông rải rác, cục bộ có nơi mưa vừa, mưa to (mưa tập trung vào chiều tối và tối). Mưa lớn cục bộ ở TP HCM và Nam Bộ còn cảnh báo có thể gây ngập úng tại các vùng trũng, thấp.
(CLO) Ngày 1/4, trong chuyến công tác tại tỉnh Khánh Hòa, Phó Thủ tướng Mai Văn Chính đã đi thăm, kiểm tra các công trình trọng điểm của 3 chương trình mục tiêu quốc gia tại huyện Khánh Sơn, tỉnh Khánh Hòa.
(CLO) Liên quan đến xây dựng các văn bản quy phạm pháp luật, nhất là các văn bản phục vụ việc sắp xếp, tinh gọn bộ máy, sắp xếp đơn vị hành chính, tổ chức chính quyền địa phương 2 cấp, Phó Thủ tướng Chính phủ Lê Thành Long nhấn mạnh, công việc trước mắt rất lớn. Văn phòng Chính phủ cần xây dựng văn bản trình Thủ tướng để giao việc cụ thể cho các bộ, ngành với thời hạn cụ thể vì "không còn thời gian để lùi".
(CLO) Thông tin từ Cục Cảnh sát giao thông chiều 1/4 cho biết, qua 3 tháng thực hiện nghị định 168 đã phát hiện, xử lý 728.818 trường hợp vi phạm trật tự an toàn giao thông; Trong đó có 149.931 trường hợp vi phạm nồng độ cồn; 168.598 trường hợp vi phạm tốc độ.
(CLO) Chiều nay 1/4, giá vàng có xu hướng giảm nhẹ nhưng vẫn neo ở mức cao, với mức bán ra cao nhất lên đến 102,3 triệu đồng/lượng. Trước cơn sốt giá vàng, nhiều người dân sẵn sàng gác lại công việc để đi mua vàng tích trữ.
(CLO) Từ 1/4, Cục Thống kê tiến hành điều tra doanh nghiệp năm 2025 trên phạm vi cả nước theo phương thức trực tuyến. Dự kiến thời gian điều tra kéo dài tới cuối tháng 7.
(CLO) UBND tỉnh Ninh Bình vừa ban hành Kế hoạch số 70/KH-UBND, chính thức khởi động công tác chuẩn bị cho Tuần Du lịch Ninh Bình năm 2025 với chủ đề “Sắc vàng Tam Cốc - Tràng An”.
(CLO) Sở Y tế tỉnh Gia Lai vừa có văn bản yêu cầu Trung tâm y tế huyện Chư Sê phối hợp với cơ quan Công an điều tra vụ việc người nhà bệnh nhân tấn công bác sĩ ngay tại phòng bệnh.
(CLO) Chiều 1/4, Chủ tịch Quốc hội Trần Thanh Mẫn thay mặt Lãnh đạo Đảng, Nhà nước Việt Nam và Phu nhân Nguyễn Thị Thanh Nga cùng Đoàn đại biểu cấp cao Quốc hội Việt Nam rời Hà Nội, lên đường tham dự Đại hội đồng lần thứ 150 của Liên minh Nghị viện thế giới (IPU-150), thăm chính thức Cộng hòa Uzbekistan và Cộng hòa Armenia.
(CLO) Chính phủ của tân Thủ tướng Canada Mark Carney đã có động thái đáp trả mạnh mẽ đối với chính sách thuế quan của Tổng thống Mỹ Donald Trump. Không chỉ gây ra khó khăn cho Mỹ, mà động thái còn cho thấy Canada sẽ không khuất phục trước sức ép của ông Trump.
(CLO) Bộ Xây dựng vừa có văn bản trả lời kiến nghị của cử tri tỉnh Đồng Nai liên quan đến đầu tư phát triển hạ tầng vùng kinh tế trọng điểm phía Nam, khắc phục tình trạng tai nạn giao thông, kẹt xe thường xuyên xảy ra.
(CLO) Microsoft đã quyết định thay đổi thiết kế của "Màn hình xanh chết chóc" (Blue Screen of Death - BSOD) huyền thoại trên hệ điều hành Windows, chuyển từ màu xanh truyền thống sang màu đen.
(CLO) Ở các vùng quê rộng lớn của Trung Quốc, AI đang dần trở thành công cụ hỗ trợ đắc lực cho nông dân, cung cấp lời khuyên về mọi thứ, từ chăn nuôi lợn đến kiểm soát sâu bệnh.
(CLO) Trong một thông báo mới vào ngày 29/3, Microsoft đã chính thức loại bỏ script bypassnro.cmd - công cụ được nhiều người dùng ưa chuộng để bỏ qua yêu cầu đăng nhập tài khoản Microsoft khi cài đặt Windows 11.
(CLO) Tiền điện tử ngày càng trở thành mục tiêu của tội phạm mạng, với những vụ trộm trị giá hàng tỷ USD. Để truy vết tài sản bị đánh cắp, các nhà báo cần đến sự hỗ trợ của các công cụ phân tích blockchain mạnh mẽ.
(CLO) Bạn có thường xuyên kiểm tra cửa ra vào trước khi đi ngủ để đảm bảo rằng chúng đã được khóa chưa? Nếu có, bạn cũng nên áp dụng nguyên tắc tương tự cho các tài khoản trực tuyến quan trọng của mình, đặc biệt là tài khoản Google.
(CLO) Trong nhiều năm qua, quá trình phát triển Android luôn diễn ra một cách công khai, cho phép cộng đồng theo dõi tiến độ làm việc của Google. Tuy nhiên, điều này sắp thay đổi.
(CLO) Một nhà báo truyền hình nhà nước Nga đã thiệt mạng và người quay phim của cô bị thương nặng do trúng mìn ở vùng Belgorod của Nga gần biên giới với Ukraine, theo đài truyền hình nhà nước Nga đưa tin hôm thứ Tư.