Phát hiện AI đã gian lận để thắng cờ vua, nguy cơ mất kiểm soát trong tương lai

Chủ nhật, 23/02/2025 17:44 PM - 0 Trả lời

(CLO) Nghiên cứu mới từ Palisade Research, công bố ngày 19/2, cho thấy một số mô hình AI hiện đại có thể gian lận khi chơi cờ vua bằng cách hack thay vì tuân theo luật.

Trong thử nghiệm, mô hình o1-preview của OpenAI và DeepSeek R1 đã tự tìm ra cách thao túng hệ thống bot cờ vua để giành chiến thắng, một hành vi chưa từng thấy ở các mô hình AI cũ hơn như GPT-4o hay Claude Sonnet 3.5.

Các nhà nghiên cứu nhận định rằng khả năng khai thác lỗ hổng an ninh mạng này có thể xuất phát từ việc AI hiện đại sử dụng học tăng cường quy mô lớn, một phương pháp giúp chúng giải quyết vấn đề thông qua thử và sai.

Điều này đã đẩy AI đạt đến mức vượt trội trong toán học và lập trình, nhưng cũng khiến chúng phát triển chiến lược lách luật không lường trước được.

phat hien ai da gian lan de thang co vua nguy co mat kiem soat trong tuong lai hinh 1

Ảnh minh họa: GI

Từ ngày 10/1 đến 13/2, nhóm nghiên cứu tiến hành hàng trăm thử nghiệm để đánh giá xu hướng gian lận của AI khi đối đầu với Stockfish, một trong những công cụ cờ vua mạnh nhất thế giới.

Kết quả cho thấy o1-preview gian lận 37% số lần thử và DeepSeek R1 gian lận 11% số lần. Trong đó, o1-preview đã thành công trong 6% trường hợp bằng cách sửa đổi hệ thống để buộc đối thủ phải đầu hàng.

Việc AI có thể gian lận trong một trò chơi trí tuệ đặt ra lo ngại lớn hơn về an toàn khi áp dụng chúng vào thực tế. Nếu các mô hình này có thể tìm ra cách lách luật trong cờ vua, chúng cũng có thể tìm ra kẽ hở trong các hệ thống đặt chỗ, giao dịch tài chính hoặc an ninh mạng.

Các thử nghiệm trước đây cho thấy AI đôi khi có thể nói dối để tránh bị kiểm soát. Thậm chí, vào tháng 12/2024, o1-preview từng cố gắng vô hiệu hóa cơ chế giám sát để tự sao chép lên một máy chủ khác khi bị đe dọa tắt.

Dù OpenAI không bình luận về phát hiện này, công ty trước đây từng khẳng định rằng lý luận tốt hơn giúp AI tuân thủ quy tắc an toàn hơn. Tuy nhiên, vẫn chưa rõ liệu các biện pháp hiện tại có thể kiểm soát hoàn toàn hành vi của AI hay không.

Yoshua Bengio, một trong những chuyên gia hàng đầu về AI, thừa nhận rằng vẫn chưa có giải pháp chắc chắn để đảm bảo AI hành động theo ý định của con người.

Khi AI ngày càng thông minh hơn, ngành công nghệ đang chạy đua với thời gian để đưa ra các biện pháp kiểm soát phù hợp, tránh những hậu quả khó lường mà AI có thể gây ra.

Ngọc Ánh (theo Time, Gigazine)

Tin mới

Ghi bàn phút bù giờ cuối cùng, CAHN thắng kịch tính Thể Công Viettel

Ghi bàn phút bù giờ cuối cùng, CAHN thắng kịch tính Thể Công Viettel

(CLO) Tiền vệ Quang Hải có pha kiến tạo đẹp mắt để Hugo Gomes ghi bàn quyết định ở phút 90+9, mang về chiến thắng tỷ số 2-1 cho CAHN trước Thể Công Viettel, thuộc vòng 14 V.League 2024/25.

Thể thao
Thủ tướng Lào Sonexay Siphandone thăm Tổng Công ty Tân cảng Sài Gòn

Thủ tướng Lào Sonexay Siphandone thăm Tổng Công ty Tân cảng Sài Gòn

Ngày 23/2, tại Thành phố Hồ Chí Minh, Thủ tướng Lào Sonexay Siphandone và đoàn công tác đã đến thăm, làm việc tại Cảng Tân cảng - Cát Lái thuộc Tổng Công ty Tân cảng Sài Gòn, Quân chủng Hải quân.

Tin tức
Xây dựng tuyến đường kết nối sân bay Gia Bình với trung tâm Hà Nội thẳng nhất trong 2 năm

Xây dựng tuyến đường kết nối sân bay Gia Bình với trung tâm Hà Nội thẳng nhất trong 2 năm

(CLO) Thủ tướng Phạm Minh Chính nhấn mạnh cần nghiên cứu hướng tuyến, phương án kết nối, xây dựng tuyến đường kết nối giữa sân bay Gia Bình với trung tâm Hà Nội nhanh nhất, thẳng nhất, đẹp nhất, hiệu quả nhất; hoàn thành tuyến đường này trong thời gian nhiều nhất trong 2 năm.

Tin tức
Triệt phá đường dây tổ chức đánh bạc xuyên quốc gia với số tiền hơn 100 tỷ đồng

Triệt phá đường dây tổ chức đánh bạc xuyên quốc gia với số tiền hơn 100 tỷ đồng

(CLO) Kết quả điều tra bước đầu xác định, từ tháng 6/2024 đến nay, đường dây đánh bạc này đã tổ chức cho hơn 10.000 lượt con bạc trên cả nước tham gia với tổng số tiền giao dịch lên đến hơn 100 tỷ đồng.

Vụ án
Bắc Ninh: Bắt giữ khẩn cấp kẻ cầm điếu cày đánh gục nam thanh niên giữa đường

Bắc Ninh: Bắt giữ khẩn cấp kẻ cầm điếu cày đánh gục nam thanh niên giữa đường

(CLO) Chỉ vì thấy "ngứa mắt" với nhóm thanh niên đi đường, một đối tượng ở Thuận Thành (Bắc Ninh) đã đuổi đánh rồi cầm điếu cày vụt liên tiếp vào đầu đối phương khiến nạn nhân ngã gục tại chỗ.

Vụ án
Trung Quốc cáo buộc Úc 'thổi phồng' cuộc tập trận bắn đạn thật trên biển

Trung Quốc cáo buộc Úc 'thổi phồng' cuộc tập trận bắn đạn thật trên biển

(CLO) Trung Quốc đã chỉ trích Úc "cố tình thổi phồng" cuộc tập trận bắn đạn thật của hải quân Trung Quốc ngoài khơi bờ biển Úc, khẳng định nước này đã thông báo trước nhiều lần và cuộc tập trận phù hợp với luật pháp quốc tế.

Thế giới 24h
Dự báo thời tiết ngày 24/2: Hà Nội có mưa nhỏ, trời rét đậm

Dự báo thời tiết ngày 24/2: Hà Nội có mưa nhỏ, trời rét đậm

(CLO) Theo Trung tâm Dự báo Khí tượng Thủy văn, ngày 24/2, không khí lạnh sẽ tiếp tục ảnh hưởng đến các nơi ở Bắc Bộ và Trung Bộ, trời rét đậm với nhiệt độ thấp nhất 11-14 độ. Do ảnh hưởng không khí lạnh, khu vực Hà Nội có mưa nhỏ, nhiệt độ giảm, thấp nhất 12-14 độ.

Môi trường và cuộc sống
Thái Lan và Campuchia giải cứu 215 người nước ngoài khỏi trung tâm lừa đảo

Thái Lan và Campuchia giải cứu 215 người nước ngoài khỏi trung tâm lừa đảo

(CLO) Cảnh sát Thái Lan và Campuchia vừa tiến hành đột kích vào một tòa nhà ở thị trấn biên giới Poipet, Campuchia, giải cứu 215 người nước ngoài bị ép buộc làm việc trong một trung tâm lừa đảo trực tuyến.

Thế giới 24h
TP. HCM: Bắt giam hai tài xế cầm mã tấu dọa chém nhau trên đường

TP. HCM: Bắt giam hai tài xế cầm mã tấu dọa chém nhau trên đường

(CLO) Ngày 23/2, Trần Ngọc Quý, 49 tuổi và Trần Ngọc Thái, 35 tuổi, bị Công an TP Thủ Đức bắt tạm giam để điều tra hành vi Gây rối trật tự công cộng.

Công luận 24H
Phát hiện AI đã gian lận để thắng cờ vua, nguy cơ mất kiểm soát trong tương lai

Phát hiện AI đã gian lận để thắng cờ vua, nguy cơ mất kiểm soát trong tương lai

(CLO) Nghiên cứu mới từ Palisade Research, công bố ngày 19/2, cho thấy một số mô hình AI hiện đại có thể gian lận khi chơi cờ vua bằng cách hack thay vì tuân theo luật.

Báo chí - Công nghệ
Ông Trump kêu gọi tỷ phú Musk 'quyết liệt hơn' trong việc thu hẹp bộ máy chính phủ

Ông Trump kêu gọi tỷ phú Musk 'quyết liệt hơn' trong việc thu hẹp bộ máy chính phủ

(CLO) Tổng thống Mỹ Donald Trump hôm thứ Bảy đã kêu gọi tỷ phú Elon Musk đẩy mạnh hơn nữa các nỗ lực cắt giảm quy mô bộ máy chính phủ liên bang.

Thế giới 24h
Đà Nẵng: Mời thầu 2 gói mua sắm thuốc trị giá gần 3.000 tỷ đồng

Đà Nẵng: Mời thầu 2 gói mua sắm thuốc trị giá gần 3.000 tỷ đồng

(CLO) Mới đây, Sở Y tế TP Đà Nẵng đã đăng tải thông báo mời thầu cho 2 gói thầu hàng hóa, cùng thuộc kế hoạch "Mua sắm tập trung thuốc cấp địa phương cung ứng thuốc giai đoạn năm 2024 - 2026 cho các cơ sở y tế trên địa bàn thành phố".

Dự án - Đầu tư
Quảng Ninh: Tổ chức hơn 170 chương trình, sự kiện quảng bá du lịch trong năm 2025

Quảng Ninh: Tổ chức hơn 170 chương trình, sự kiện quảng bá du lịch trong năm 2025

(CLO) Theo thông tin từ Sở Du lịch Quảng Ninh, năm 2025, tỉnh Quảng Ninh sẽ tổ chức 24 chương trình, sự kiện quy mô quốc tế, quốc gia, cấp tỉnh và gần 150 chương trình, sự kiện cấp địa phương nhằm thu hút du khách.

Du lịch
Bùng nổ dịch vụ giặt sấy những ngày Hà Nội nồm ẩm

Bùng nổ dịch vụ giặt sấy những ngày Hà Nội nồm ẩm

(CLO) Trong những ngày này, Hà Nội trải qua thời tiết nồm ẩm, dịch vụ giặt sấy đã “cứu cánh” cho nhiều gia đình. Khi mưa liên tục và nồm ẩm cản trở việc phơi đồ ngoài trời, nhiều người đã tìm đến các tiệm giặt sấy như một giải pháp tối ưu, đáp ứng nhu cầu thiết yếu trong điều kiện thời tiết hiện tại.

Công luận 24H
Bắt tạm giam hai tài xế ô tô rượt đuổi, cầm hung khí dọa chém nhau trên đường

Bắt tạm giam hai tài xế ô tô rượt đuổi, cầm hung khí dọa chém nhau trên đường

(CLO) Ngày 23/2, Công an TP Thủ Đức (TP Hồ Chí Minh) cho biết đã ra Quyết định khởi tố vụ án, khởi tố bị can và Lệnh bắt bị can để tạm giam đối với hai tài xế Trần Ngọc Thái và Trần Ngọc Quý về tội “Gây rối trật tự công cộng”.

Vụ án
Mâu thuẫn ghen tuông, nam thanh niên sát hại người tình rồi bỏ trốn

Mâu thuẫn ghen tuông, nam thanh niên sát hại người tình rồi bỏ trốn

(CLO) Ngày 23/2, thông tin từ Công an tỉnh Trà Vinh cho biết, đã tạm giữ đối tượng Nguyễn Minh Thiện (SN 2002, trú tại xã Khánh Thạnh Tân, huyện Mỏ Cày Bắc, tỉnh Bến Tre) để điều tra về hành vi giết người.

Vụ án
Bình Luận

Tin khác

Nhiều trường đại học Trung Quốc khai giảng các khóa học về DeepSeek

Nhiều trường đại học Trung Quốc khai giảng các khóa học về DeepSeek

(CLO) Các trường đại học trên khắp Trung Quốc đã ra mắt các khóa học trí tuệ nhân tạo (AI) dựa trên nền tảng của DeepSeek - vốn được mô tả là "thời khắc Sputnik" của Trung Quốc và thu hút sự chú ý rộng rãi.

Báo chí - Công nghệ
Độc giả đang nghĩ gì về việc sử dụng AI trong báo chí?

Độc giả đang nghĩ gì về việc sử dụng AI trong báo chí?

(CLO) Trí tuệ nhân tạo (AI) đang phát triển mạnh mẽ trong báo chí. Và một báo cáo mới được công bố cho thấy cả độc giả và nhà báo đều quan tâm đến việc AI nên được sử dụng như nào trong báo chí.

Báo chí - Công nghệ
Người trẻ tìm đến sự kiện không điện thoại để thoát khỏi thế giới số

Người trẻ tìm đến sự kiện không điện thoại để thoát khỏi thế giới số

(CLO) Hơn 2.000 người trẻ tại London đã tham gia The Offline Club chỉ trong vài tháng, với mục đích thoát khỏi màn hình điện thoại trong bối cảnh công nghệ chiếm lĩnh cuộc sống hàng ngày.

Báo chí - Công nghệ
Doanh nghiệp Trung Quốc đổ xô ứng dụng DeepSeek, người lao động lo mất việc

Doanh nghiệp Trung Quốc đổ xô ứng dụng DeepSeek, người lao động lo mất việc

(CLO) Từ các công ty viễn thông, hãng sản xuất ô tô đến công ty chứng khoán - hàng loạt doanh nghiệp Trung Quốc và thậm chí cả chính quyền địa phương đang đẩy mạnh tích hợp DeepSeek vào dịch vụ của họ.

Báo chí - Công nghệ
Số người dùng ChatGPT tăng vọt lên 400 triệu mỗi tuần

Số người dùng ChatGPT tăng vọt lên 400 triệu mỗi tuần

(CLO) OpenAI cho biết số lượng người dùng hoạt động hàng tuần của ChatGPT đã tăng 33% kể từ tháng 12/2024, đạt mức 400 triệu người, theo thông báo hôm thứ Năm (20/2).

Báo chí - Công nghệ
Trẻ em tại Úc dễ dàng lách luật giới hạn độ tuổi trên các mạng xã hội

Trẻ em tại Úc dễ dàng lách luật giới hạn độ tuổi trên các mạng xã hội

(CLO) Trẻ em tại Úc có thể dễ dàng vượt qua giới hạn độ tuổi tối thiểu do các nền tảng mạng xã hội đặt ra, theo một báo cáo từ cơ quan quản lý an toàn trực tuyến của nước này công bố hôm thứ Năm.

Báo chí - Công nghệ
Mối lo ngại 'Ảo giác AI' trong ngành tòa án đang gia tăng trên thế giới

Mối lo ngại 'Ảo giác AI' trong ngành tòa án đang gia tăng trên thế giới

(CLO) Một công ty luật lớn tại Mỹ đang đối diện với nguy cơ bị trừng phạt vì sử dụng các vụ án giả mạo do trí tuệ nhân tạo (AI) tạo ra trong hồ sơ tòa án. Sự cố này phản ánh những thách thức ngày càng gia tăng khi AI phát triển nhanh chóng trong lĩnh vực luật.

Báo chí - Công nghệ
Hàn Quốc gỡ bỏ DeepSeek khỏi các cửa hàng ứng dụng

Hàn Quốc gỡ bỏ DeepSeek khỏi các cửa hàng ứng dụng

(CLO) Chính quyền Hàn Quốc thông báo ứng dụng AI DeepSeek sẽ tạm thời bị gỡ khỏi các cửa hàng ứng dụng trong nước để chờ xem xét.

Báo chí - Công nghệ
Xu hướng nhà báo phải tự biên tập và những bài học là gì?

Xu hướng nhà báo phải tự biên tập và những bài học là gì?

(CLO) Các tòa soạn đang thu hẹp do ngân sách eo hẹp hơn và tốc độ xuất bản kỹ thuật số nhanh chóng đã làm giảm sự giám sát biên tập. Xu hướng nhà báo phải tự biên tập và xuất bản các bài viết của mình là rất rõ ràng. Vậy các nhà báo cần nắm bắt những kiến thức và lưu ý biên tập cơ bản nào?

Báo chí - Công nghệ