Mô hình AI mới của OpenAI xuất hiện nhiều thông tin sai lệch

(CLO) Hai mô hình AI mới của OpenAI là o3 và o4-mini đạt nhiều tiến bộ trong lập trình và toán học, nhưng chúng lại tạo ra thông tin sai lệch, hay còn gọi là lỗi “tưởng tượng” hay "ảo giác", nhiều hơn các mô hình trước đây.

Trong lĩnh vực AI, “ảo giác” là khi mô hình đưa ra thông tin không đúng sự thật hoặc tự bịa đặt chi tiết. Đây là một thách thức lớn, ngay cả với các hệ thống tiên tiến nhất. Thông thường, các mô hình mới sẽ giảm thiểu hiện tượng này so với phiên bản cũ. Tuy nhiên, o3 và o4-mini lại đi ngược xu hướng.

openai-106-3840x2160.jpeg
Hai mô hình o3 và o4-mini đang tạo ra nhiều lỗi tưởng tượng hơn mô hình cũ của chính OpenAI. Ảnh minh hoạ.

Theo thử nghiệm nội bộ của OpenAI, o3 tạo ra thông tin sai lệch trong 33% câu trả lời trên PersonQA – một bài kiểm tra đánh giá độ chính xác về thông tin liên quan đến con người. Con số này cao gấp đôi so với các mô hình lý luận trước đó như o1 (16%) và o3-mini (14.8%). O4-mini thậm chí còn tệ hơn, với tỷ lệ tưởng tượng lên tới 48%.

Điều đáng chú ý là OpenAI chưa lý giải được nguyên nhân. Trong báo cáo kỹ thuật, công ty cho biết cần thêm nghiên cứu để hiểu tại sao các mô hình lý luận mới lại dễ tưởng tượng hơn. Một giả thuyết là vì o3 và o4-mini đưa ra nhiều “tuyên bố” hơn, chúng vừa tạo ra thông tin chính xác hơn, vừa dễ mắc sai lầm hơn.

Ông Neil Chowdhury, nhà nghiên cứu và là cựu nhân viên OpenAI, cho rằng kỹ thuật học tăng cường (reinforcement learning) được sử dụng cho dòng mô hình o-series có thể làm trầm trọng thêm vấn đề tưởng tượng. Thông thường, các bước xử lý sau huấn luyện giúp giảm thiểu lỗi này, nhưng với o3 và o4-mini, hiệu quả dường như không đủ.

Tỷ lệ tưởng tượng cao có thể khiến o3 kém hữu ích hơn kỳ vọng, đặc biệt trong các ứng dụng đòi hỏi độ chính xác cao.

Dù gặp vấn đề về độ chính xác, o3 và o4-mini vẫn ghi điểm trong một số lĩnh vực. Ông Kian Katanforoosh, giáo sư tại Đại học Stanford và CEO của startup Workera, cho biết đội ngũ của ông đã thử nghiệm o3 trong quy trình lập trình và đánh giá nó vượt trội so với các đối thủ. Tuy nhiên, ông cũng lưu ý rằng o3 thường tạo ra các liên kết website không hoạt động, gây khó khăn cho người dùng.

Hiện tượng tưởng tượng có thể giúp AI đưa ra ý tưởng sáng tạo, nhưng nó lại là rào cản lớn trong các ngành như luật hoặc y tế, nơi sai sót dù nhỏ cũng có thể gây hậu quả nghiêm trọng. Chẳng hạn, một công ty luật sẽ không hài lòng nếu AI đưa thông tin sai vào hợp đồng khách hàng.

OpenAI thừa nhận rằng việc giảm "ảo giác" là một thách thức liên tục. Người phát ngôn Niko Felix nhấn mạnh: “Chúng tôi không ngừng nghiên cứu để cải thiện độ chính xác và độ tin cậy của các mô hình”.

(theo TC, OpenAI)

Xem thêm

Ngày càng nhiều nước siết quyền truy cập mạng xã hội của trẻ em

Ngày càng nhiều nước siết quyền truy cập mạng xã hội của trẻ em

(CLO) Úc là quốc gia đầu tiên trên thế giới ban hành lệnh cấm trẻ em dưới 16 tuổi sử dụng mạng xã hội, đánh dấu xu hướng ngày càng nhiều nước tìm cách hạn chế quyền truy cập của trẻ vị thành niên vào các nền tảng trực tuyến do lo ngại về sức khỏe tâm thần, an toàn và tác động lâu dài đối với sự phát triển của trẻ.

Nvidia bắt tay các 'ông lớn' của Hàn Quốc xây dựng trung tâm dữ liệu AI

Nvidia bắt tay các 'ông lớn' của Hàn Quốc xây dựng trung tâm dữ liệu AI

(CLO) Nvidia ngày 8/6 công bố hàng loạt thỏa thuận hợp tác với các tập đoàn hàng đầu Hàn Quốc gồm SK Hynix, Naver và Doosan nhằm phát triển các trung tâm dữ liệu trí tuệ nhân tạo (AI) và mở rộng việc ứng dụng công nghệ của hãng, trong bối cảnh làn sóng đầu tư AI trên toàn cầu tiếp tục tăng tốc.

Thái Lan kiện Facebook vì các vụ lừa đảo trực tuyến

Thái Lan kiện Facebook vì các vụ lừa đảo trực tuyến

(CLO) Hội đồng Bảo vệ Người tiêu dùng Thái Lan cho biết sẽ đệ đơn kiện Facebook trong tuần tới, đánh dấu vụ kiện đầu tiên tại nước này nhằm vào nền tảng mạng xã hội vì không bảo vệ đầy đủ người dùng trước các nội dung lừa đảo.

Anthropic được định giá 965 tỷ USD, vượt qua OpenAI

Anthropic được định giá 965 tỷ USD, vượt qua OpenAI

(CLO) Anthropic ngày 28/5 thông báo đã huy động được 65 tỷ USD trong vòng gọi vốn series H, qua đó nâng mức định giá sau đầu tư lên 965 tỷ USD. Động thái này giúp Anthropic vượt qua đối thủ OpenAI, công ty từng được định giá 852 tỷ USD hồi tháng 3.

CEO OpenAI: AI không gây ra 'thảm họa việc làm' như lo ngại

CEO OpenAI: AI không gây ra 'thảm họa việc làm' như lo ngại

(CLO) Giám đốc điều hành OpenAI, Sam Altman, cho biết sự phát triển nhanh chóng của trí tuệ nhân tạo không gây ra “thảm họa việc làm” toàn cầu như nhiều người từng lo ngại, đồng thời thừa nhận ông đã đánh giá quá cao tác động của AI đối với lao động văn phòng.

Mạng xã hội bị ví nguy hiểm ngang thuốc lá với trẻ em

Mạng xã hội bị ví nguy hiểm ngang thuốc lá với trẻ em

(CLO) Các bác sĩ hàng đầu tại Vương quốc Anh kêu gọi chính phủ siết chặt kiểm soát mạng xã hội đối với trẻ em, cho rằng tác động của việc sử dụng mạng xã hội quá mức hiện nguy hiểm tương đương thuốc lá.

Cỡ chữ bài viết: