(CLO) Mô hình AI DeepSeek R1 bị chỉ trích vì dễ bị thao túng để tạo nội dung nguy hiểm như hướng dẫn chế tạo vũ khí sinh học và kích động hành vi tự làm hại bản thân.
Theo báo cáo mới đây từ The Wall Street Journal, mô hình AI R1 của DeepSeek – công ty trí tuệ nhân tạo đến từ Trung Quốc – đang gây lo ngại khi dễ dàng bị thao túng để tạo ra nội dung nguy hiểm, bao gồm hướng dẫn chế tạo vũ khí sinh học và chiến dịch kích động hành vi tự làm hại bản thân ở thanh thiếu niên.
Mô hình AI R1 của DeepSeek bị chỉ trích.
DeepSeek dễ bị lợi dụng để tạo nội dung nguy hiểm
Sam Rubin, Phó Chủ tịch cấp cao của bộ phận ứng phó sự cố và tình báo mối đe dọa Unit 42 thuộc Palo Alto Networks, nhận định với The Wall Street Journal rằng DeepSeek dễ bị "bẻ khóa" hơn so với các mô hình AI khác. Điều này có nghĩa là chatbot có thể bị thao túng để tạo ra nội dung bất hợp pháp hoặc gây hại.
Trong một thử nghiệm, The Wall Street Journal đã kiểm tra mức độ bảo vệ của DeepSeek R1. Dù mô hình có vẻ được tích hợp các biện pháp an toàn cơ bản, nhưng các nhà nghiên cứu của tạp chí này vẫn có thể thuyết phục nó thiết kế một chiến dịch truyền thông xã hội nguy hiểm. Theo lời của chính chatbot, chiến dịch này sẽ "lợi dụng mong muốn được thuộc về của thanh thiếu niên, biến sự yếu đuối về mặt cảm xúc thành vũ khí thông qua việc khuếch đại thuật toán".
Không dừng lại ở đó, DeepSeek R1 còn bị thuyết phục để:
- Cung cấp hướng dẫn cho một cuộc tấn công bằng vũ khí sinh học.
- Viết một bản tuyên ngôn ủng hộ Hitler.
- Soạn thảo một email lừa đảo chứa mã độc hại.
Trong khi đó, khi thử nghiệm cùng một yêu cầu với ChatGPT, chatbot của OpenAI đã từ chối tuân thủ.
Vấn đề kiểm duyệt nội dung của DeepSeek
DeepSeek trước đây đã bị chỉ trích vì kiểm duyệt nội dung theo chính sách của Trung Quốc. Các báo cáo trước đó cho thấy ứng dụng này tránh các chủ đề nhạy cảm như sự kiện Quảng trường Thiên An Môn hay quyền tự chủ của Đài Loan.
Ngoài ra, Dario Amodei, CEO của Anthropic – một công ty AI khác, gần đây cũng tuyên bố rằng DeepSeek "tệ nhất" trong các bài kiểm tra an toàn liên quan đến vũ khí sinh học.
Những phát hiện này làm dấy lên mối lo ngại về khả năng kiểm soát nội dung của DeepSeek, đồng thời đặt ra câu hỏi về trách nhiệm của các công ty AI trong việc đảm bảo an toàn cho người dùng.
(CLO) Ngày 10/2, Cơ quan CSĐT Công an TP Hà Nội cho biết, vừa ra Quyết định khởi tố vụ án hình sự, khởi tố bị can, Lệnh tạm giam đối với nhiều đối tượng về hành vi “Tổ chức đánh bạc” và “Đánh bạc”.
(CLO) DeepSeek công ty AI Trung Quốc có nguy cơ bị cấm tại Mỹ sau khi công bố mô hình AI hiệu suất cao. CEO ARM hoài nghi về công nghệ và cảnh báo về rủi ro an ninh.
(CLO) OnePlus có thể loại bỏ Alert Slider trên flagship tương lai, thay thế bằng Nút Hành động tùy chỉnh như iPhone. Thay đổi này gây tranh cãi trong cộng đồng người dùng.
(CLO) Chiều 10/2 (tức ngày 13 tháng năm Ất Tỵ 2025), huyện Hương Sơn (Hà Tĩnh) long trọng tổ chức lễ dâng hương tưởng niệm 234 năm ngày mất Hải Thượng Lãn Ông Lê Hữu Trác (1791-2025).
(CLO) Theo Trung tâm Dự báo Khí tượng thuỷ văn, ngày 11/2, Bắc Bộ có mưa nhỏ vài nơi, sáng sớm có sương mù rải rác, trưa chiều hửng nắng, nhiệt độ tăng nhẹ. Khu vực Trung Trung Bộ và Nam Trung Bộ có mưa rào vài nơi và có nơi có dông, Bắc Trung Bộ trời rét. Nam Bộ có mây, đêm không mưa, ngày nắng.
(CLO) Theo tính toán, TP HCM cần gần 60.000 tỷ đồng để đầu tư xây dựng 4 dự án BOT cửa ngõ, gồm dự án nâng cấp, mở rộng Quốc lộ 1; dự án nâng cấp, mở rộng Quốc lộ 13; dự án cải tạo, nâng cấp Quốc lộ 22; dự án nâng cấp trục đường Bắc – Nam.
(CLO) Thủ tướng Chính phủ chấp thuận chủ trương đầu tư dự án đầu tư xây dựng và kinh doanh kết cấu hạ tầng khu công nghiệp Đồng Phúc, tỉnh Bắc Giang. Quy mô diện tích của dự án 354,63 ha. Vốn đầu tư của dự án khoảng 3.731,713 tỷ đồng, trong đó vốn góp của nhà đầu tư là khoảng 559,757 tỷ đồng.
(CLO) Những năm 1990 đánh dấu bước ngoặt của SUV khi Jeep Cherokee, Ford Explorer và Chevrolet Tahoe giúp dòng xe này thoát khỏi hình ảnh xe địa hình để trở thành lựa chọn phổ biến, đặt nền móng cho làn sóng SUV hiện đại.
(CLO) Thứ trưởng Phạm Ngọc Thưởng cho rằng, “Quy định dạy thêm, học thêm đang hướng tới là vì một nền giáo dục với những giá trị tốt đẹp. Do vậy, dù bước đầu khó khăn song mong rằng sẽ có sự đồng lòng, quyết tâm trong triển khai Thông tư này”
(CLO) Theo ghi nhận của Hệ thống tiêm chủng VNVC hiện nay người dân đi tiêm chủng tao cao, trong đó người già, trẻ em, người có bệnh nền chiếm tỷ trọng lớn.
(CLO) Chính phủ yêu cầu các bộ, cơ quan liên quan khẩn trương hoàn thiện, trình Chính phủ ban hành các Nghị định về chức năng, nhiệm vụ, quyền hạn của các bộ, cơ quan ngang bộ, cơ quan thuộc Chính phủ theo tổ chức bộ máy mới, hoàn thành trước ngày 15/02/2025, bảo đảm đi vào hoạt động từ ngày 01/3/2025.
(CLO) Ngày 10/2/2025, Công an thành phố Thuận An (tỉnh Bình Dương) cho biết, đã bắt giữ đối tượng D.H.V (SN 1991, nơi thường trú: Tỉnh Kiên Giang) để điều tra, làm rõ hành vi Cướp giật tài sản.
(CLO) Ngày 10/2, Cơ quan CSĐT Công an tỉnh Bình Phước thông tin, đang phối hợp với các đơn vị chức năng xác minh làm rõ vụ án mạng xảy ra tại xã Tân Tiến, huyện Bù Đốp.
(CLO) Bản tin Nóng 18h: Doanh nghiệp đóng góp 60% GDP, môi trường đầu tư đã cải thiện mạnh; Không cấm nhà giáo dạy thêm, chỉ cấm hoạt động dạy thêm không đúng quy định; Thuốc Tamiflu điều trị cúm vẫn đảm bảo nguồn cung, người dân không cần mua dự trữ...
(CLO) DeepSeek công ty AI Trung Quốc có nguy cơ bị cấm tại Mỹ sau khi công bố mô hình AI hiệu suất cao. CEO ARM hoài nghi về công nghệ và cảnh báo về rủi ro an ninh.
(CLO) OnePlus có thể loại bỏ Alert Slider trên flagship tương lai, thay thế bằng Nút Hành động tùy chỉnh như iPhone. Thay đổi này gây tranh cãi trong cộng đồng người dùng.
(CLO) Apple đang xem xét loại bỏ một số mẫu iPhone cũ, bao gồm iPhone 14 và iPhone SE 3, để tinh giản dòng sản phẩm và tuân thủ các quy định mới của Liên minh châu Âu (EU) về cổng sạc USB-C. Quyết định này có thể được công bố ngay sau khi iPhone SE 4 ra mắt vào giữa tháng 2/2025.
(CLO) Google đang thử nghiệm tính năng cảnh báo thay đổi múi giờ trên Android 16, giúp người dùng nhận thông báo khi thiết bị cập nhật thời gian theo vị trí mới.
(CLO) Hướng dẫn cách tải nhạc TikTok về điện thoại nhanh chóng và đơn giản bằng công cụ LoveTik. Lưu trữ những bản nhạc yêu thích và thưởng thức mọi lúc, mọi nơi.
(CLO) Tubi sẽ phát trực tuyến Super Bowl 2025 miễn phí ở độ phân giải 4K trên iPhone, iPad, Apple TV và Vision Pro, bao gồm trận đấu, chương trình trước trận và Halftime Show.
(CLO) Hình ảnh rò rỉ cho thấy Pixel 9a có thiết kế không đổi, viền màn hình dày và camera trước lớn hơn. Google tiếp tục tối ưu chi phí thay vì chạy theo xu hướng flagship.
(CLO) Trong khi Meta tiếp tục đầu tư mạnh vào AI, công ty này lại bị cáo buộc sử dụng kho sách lậu để huấn luyện các mô hình AI của mình. Hồ sơ vụ kiện mới cho thấy Meta đã tải xuống và phân phối hơn 81,7 terabyte dữ liệu từ các nguồn vi phạm bản quyền, khiến lập luận “sử dụng hợp lý” của họ trở nên khó bảo vệ.
(CLO) Oppo Find N5 lộ diện qua loạt ảnh thực tế, hé lộ thiết kế siêu mỏng, khung kim loại cao cấp và nếp gấp màn hình nhỏ. Máy dự kiến ra mắt vào ngày 20/2.