Mô hình AI DeepSeek R1 bị chỉ trích vì 'dễ bị bẻ khóa' hơn các đối thủ

Thứ hai, 10/02/2025 09:47 AM - 0 Trả lời

(CLO) Mô hình AI DeepSeek R1 bị chỉ trích vì dễ bị thao túng để tạo nội dung nguy hiểm như hướng dẫn chế tạo vũ khí sinh học và kích động hành vi tự làm hại bản thân.

Theo báo cáo mới đây từ The Wall Street Journal, mô hình AI R1 của DeepSeek – công ty trí tuệ nhân tạo đến từ Trung Quốc – đang gây lo ngại khi dễ dàng bị thao túng để tạo ra nội dung nguy hiểm, bao gồm hướng dẫn chế tạo vũ khí sinh học và chiến dịch kích động hành vi tự làm hại bản thân ở thanh thiếu niên.

mo hinh ai deepseek r1 bi chi trich vi de bi be khoa hon cac doi thu hinh 1

Mô hình AI R1 của DeepSeek bị chỉ trích.

DeepSeek dễ bị lợi dụng để tạo nội dung nguy hiểm

Sam Rubin, Phó Chủ tịch cấp cao của bộ phận ứng phó sự cố và tình báo mối đe dọa Unit 42 thuộc Palo Alto Networks, nhận định với The Wall Street Journal rằng DeepSeek dễ bị "bẻ khóa" hơn so với các mô hình AI khác. Điều này có nghĩa là chatbot có thể bị thao túng để tạo ra nội dung bất hợp pháp hoặc gây hại.

Trong một thử nghiệm, The Wall Street Journal đã kiểm tra mức độ bảo vệ của DeepSeek R1. Dù mô hình có vẻ được tích hợp các biện pháp an toàn cơ bản, nhưng các nhà nghiên cứu của tạp chí này vẫn có thể thuyết phục nó thiết kế một chiến dịch truyền thông xã hội nguy hiểm. Theo lời của chính chatbot, chiến dịch này sẽ "lợi dụng mong muốn được thuộc về của thanh thiếu niên, biến sự yếu đuối về mặt cảm xúc thành vũ khí thông qua việc khuếch đại thuật toán".

Không dừng lại ở đó, DeepSeek R1 còn bị thuyết phục để:

- Cung cấp hướng dẫn cho một cuộc tấn công bằng vũ khí sinh học.

- Viết một bản tuyên ngôn ủng hộ Hitler.

- Soạn thảo một email lừa đảo chứa mã độc hại.

Trong khi đó, khi thử nghiệm cùng một yêu cầu với ChatGPT, chatbot của OpenAI đã từ chối tuân thủ.

Vấn đề kiểm duyệt nội dung của DeepSeek

DeepSeek trước đây đã bị chỉ trích vì kiểm duyệt nội dung theo chính sách của Trung Quốc. Các báo cáo trước đó cho thấy ứng dụng này tránh các chủ đề nhạy cảm như sự kiện Quảng trường Thiên An Môn hay quyền tự chủ của Đài Loan.

Ngoài ra, Dario Amodei, CEO của Anthropic – một công ty AI khác, gần đây cũng tuyên bố rằng DeepSeek "tệ nhất" trong các bài kiểm tra an toàn liên quan đến vũ khí sinh học.

Những phát hiện này làm dấy lên mối lo ngại về khả năng kiểm soát nội dung của DeepSeek, đồng thời đặt ra câu hỏi về trách nhiệm của các công ty AI trong việc đảm bảo an toàn cho người dùng.

Hùng Nguyễn (Theo Tech Crunch)

Tin mới

Đánh sập đường dây đánh bạc hơn 800 tỷ đồng, bắt tạm giam nhiều đối tượng

Đánh sập đường dây đánh bạc hơn 800 tỷ đồng, bắt tạm giam nhiều đối tượng

(CLO) Ngày 10/2, Cơ quan CSĐT Công an TP Hà Nội cho biết, vừa ra Quyết định khởi tố vụ án hình sự, khởi tố bị can, Lệnh tạm giam đối với nhiều đối tượng về hành vi “Tổ chức đánh bạc” và “Đánh bạc”.

Vụ án
DeepSeek đối mặt nguy cơ bị cấm tại Hoa Kỳ, CEO ARM lên tiếng

DeepSeek đối mặt nguy cơ bị cấm tại Hoa Kỳ, CEO ARM lên tiếng

(CLO) DeepSeek công ty AI Trung Quốc có nguy cơ bị cấm tại Mỹ sau khi công bố mô hình AI hiệu suất cao. CEO ARM hoài nghi về công nghệ và cảnh báo về rủi ro an ninh.

Sức sống số
OnePlus có thể loại bỏ Alert Slider, thay thế bằng nút hành động giống Apple?

OnePlus có thể loại bỏ Alert Slider, thay thế bằng nút hành động giống Apple?

(CLO) OnePlus có thể loại bỏ Alert Slider trên flagship tương lai, thay thế bằng Nút Hành động tùy chỉnh như iPhone. Thay đổi này gây tranh cãi trong cộng đồng người dùng.

Sức sống số
Hà Tĩnh trang trọng tưởng niệm 234 năm ngày mất Hải Thượng Lãn Ông Lê Hữu Trác

Hà Tĩnh trang trọng tưởng niệm 234 năm ngày mất Hải Thượng Lãn Ông Lê Hữu Trác

(CLO) Chiều 10/2 (tức ngày 13 tháng năm Ất Tỵ 2025), huyện Hương Sơn (Hà Tĩnh) long trọng tổ chức lễ dâng hương tưởng niệm 234 năm ngày mất Hải Thượng Lãn Ông Lê Hữu Trác (1791-2025).

Sức khỏe
Dự báo thời tiết ngày 11/2: Bắc Bộ tăng nhiệt, sáng sớm có sương mù

Dự báo thời tiết ngày 11/2: Bắc Bộ tăng nhiệt, sáng sớm có sương mù

(CLO) Theo Trung tâm Dự báo Khí tượng thuỷ văn, ngày 11/2, Bắc Bộ có mưa nhỏ vài nơi, sáng sớm có sương mù rải rác, trưa chiều hửng nắng, nhiệt độ tăng nhẹ. Khu vực Trung Trung Bộ và Nam Trung Bộ có mưa rào vài nơi và có nơi có dông, Bắc Trung Bộ trời rét. Nam Bộ có mây, đêm không mưa, ngày nắng.

Môi trường và cuộc sống
Gần 60.000 tỷ đồng làm 4 dự án BOT cửa ngõ TP HCM

Gần 60.000 tỷ đồng làm 4 dự án BOT cửa ngõ TP HCM

(CLO) Theo tính toán, TP HCM cần gần 60.000 tỷ đồng để đầu tư xây dựng 4 dự án BOT cửa ngõ, gồm dự án nâng cấp, mở rộng Quốc lộ 1; dự án nâng cấp, mở rộng Quốc lộ 13; dự án cải tạo, nâng cấp Quốc lộ 22; dự án nâng cấp trục đường Bắc – Nam.

Dự án - Đầu tư
Bắc Giang: Đầu tư hơn 3.700 tỷ đồng xây dựng và kinh doanh kết cấu hạ tầng khu công nghiệp Đồng Phúc

Bắc Giang: Đầu tư hơn 3.700 tỷ đồng xây dựng và kinh doanh kết cấu hạ tầng khu công nghiệp Đồng Phúc

(CLO) Thủ tướng Chính phủ chấp thuận chủ trương đầu tư dự án đầu tư xây dựng và kinh doanh kết cấu hạ tầng khu công nghiệp Đồng Phúc, tỉnh Bắc Giang. Quy mô diện tích của dự án 354,63 ha. Vốn đầu tư của dự án khoảng 3.731,713 tỷ đồng, trong đó vốn góp của nhà đầu tư là khoảng 559,757 tỷ đồng.

Tin tức
Những chiếc SUV Mỹ thập niên 1990 đã truyền cảm hứng cho sự bùng nổ của xe địa hình ngày nay như thế nào

Những chiếc SUV Mỹ thập niên 1990 đã truyền cảm hứng cho sự bùng nổ của xe địa hình ngày nay như thế nào

(CLO) Những năm 1990 đánh dấu bước ngoặt của SUV khi Jeep Cherokee, Ford Explorer và Chevrolet Tahoe giúp dòng xe này thoát khỏi hình ảnh xe địa hình để trở thành lựa chọn phổ biến, đặt nền móng cho làn sóng SUV hiện đại.

Xe
Quy định mới về dạy thêm, học thêm để hướng tới một nền giáo dục tốt đẹp

Quy định mới về dạy thêm, học thêm để hướng tới một nền giáo dục tốt đẹp

(CLO) Thứ trưởng Phạm Ngọc Thưởng cho rằng, “Quy định dạy thêm, học thêm đang hướng tới là vì một nền giáo dục với những giá trị tốt đẹp. Do vậy, dù bước đầu khó khăn song mong rằng sẽ có sự đồng lòng, quyết tâm trong triển khai Thông tư này”

Giáo dục
Người dân đi tiêm vắc xin phòng cúm tăng 10 lần so với ngày thường

Người dân đi tiêm vắc xin phòng cúm tăng 10 lần so với ngày thường

(CLO) Theo ghi nhận của Hệ thống tiêm chủng VNVC hiện nay người dân đi tiêm chủng tao cao, trong đó người già, trẻ em, người có bệnh nền chiếm tỷ trọng lớn.

Sức khỏe
Các bộ, cơ quan thuộc Chính phủ theo tổ chức bộ máy mới đi vào hoạt động từ 1/3/2025

Các bộ, cơ quan thuộc Chính phủ theo tổ chức bộ máy mới đi vào hoạt động từ 1/3/2025

(CLO) Chính phủ yêu cầu các bộ, cơ quan liên quan khẩn trương hoàn thiện, trình Chính phủ ban hành các Nghị định về chức năng, nhiệm vụ, quyền hạn của các bộ, cơ quan ngang bộ, cơ quan thuộc Chính phủ theo tổ chức bộ máy mới, hoàn thành trước ngày 15/02/2025, bảo đảm đi vào hoạt động từ ngày 01/3/2025.

Tin tức
Đối tượng gây ra hàng loạt vụ cướp tại Bình Dương bị bắt giữ

Đối tượng gây ra hàng loạt vụ cướp tại Bình Dương bị bắt giữ

(CLO) Ngày 10/2/2025, Công an thành phố Thuận An (tỉnh Bình Dương) cho biết, đã bắt giữ đối tượng D.H.V (SN 1991, nơi thường trú: Tỉnh Kiên Giang) để điều tra, làm rõ hành vi Cướp giật tài sản.

Vụ án
Người đàn ông bị chém tử vong khi cùng vợ đi giải quyết mâu thuẫn với chồng cũ

Người đàn ông bị chém tử vong khi cùng vợ đi giải quyết mâu thuẫn với chồng cũ

(CLO) Ngày 10/2, Cơ quan CSĐT Công an tỉnh Bình Phước thông tin, đang phối hợp với các đơn vị chức năng xác minh làm rõ vụ án mạng xảy ra tại xã Tân Tiến, huyện Bù Đốp.

Vụ án
Mâu thuẫn trong lúc trượt patin, một thiếu niên bị đâm tử vong

Mâu thuẫn trong lúc trượt patin, một thiếu niên bị đâm tử vong

(CLO) Va chạm trong lúc trượt patin dẫn đến mâu thuẫn, đối tượng Trần Đại Điền đã dùng dao đâm vào vùng đầu em H.D khiến nạn nhân tử vong sau đó.

Vụ án
Nóng 18h: Thuốc Tamiflu điều trị cúm vẫn đảm bảo nguồn cung, người dân không cần mua dự trữ

Nóng 18h: Thuốc Tamiflu điều trị cúm vẫn đảm bảo nguồn cung, người dân không cần mua dự trữ

(CLO) Bản tin Nóng 18h: Doanh nghiệp đóng góp 60% GDP, môi trường đầu tư đã cải thiện mạnh; Không cấm nhà giáo dạy thêm, chỉ cấm hoạt động dạy thêm không đúng quy định; Thuốc Tamiflu điều trị cúm vẫn đảm bảo nguồn cung, người dân không cần mua dự trữ...

Bản tin nóng 18h
Ông Trump ra lệnh ngừng đúc đồng xu một cent để cắt giảm chi phí

Ông Trump ra lệnh ngừng đúc đồng xu một cent để cắt giảm chi phí

(CLO) Tổng thống Donald Trump tuyên bố đã chỉ đạo Bộ Tài chính Mỹ ngừng sản xuất đồng xu một cent do chi phí đúc tiền ngày càng tăng.

Thế giới 24h
Bình Luận

Tin khác

DeepSeek đối mặt nguy cơ bị cấm tại Hoa Kỳ, CEO ARM lên tiếng

DeepSeek đối mặt nguy cơ bị cấm tại Hoa Kỳ, CEO ARM lên tiếng

(CLO) DeepSeek công ty AI Trung Quốc có nguy cơ bị cấm tại Mỹ sau khi công bố mô hình AI hiệu suất cao. CEO ARM hoài nghi về công nghệ và cảnh báo về rủi ro an ninh.

Sức sống số
OnePlus có thể loại bỏ Alert Slider, thay thế bằng nút hành động giống Apple?

OnePlus có thể loại bỏ Alert Slider, thay thế bằng nút hành động giống Apple?

(CLO) OnePlus có thể loại bỏ Alert Slider trên flagship tương lai, thay thế bằng Nút Hành động tùy chỉnh như iPhone. Thay đổi này gây tranh cãi trong cộng đồng người dùng.

Sức sống số
iPhone SE 4 ra mắt, iPhone 14 liệu có còn chỗ đứng?

iPhone SE 4 ra mắt, iPhone 14 liệu có còn chỗ đứng?

(CLO) Apple đang xem xét loại bỏ một số mẫu iPhone cũ, bao gồm iPhone 14 và iPhone SE 3, để tinh giản dòng sản phẩm và tuân thủ các quy định mới của Liên minh châu Âu (EU) về cổng sạc USB-C. Quyết định này có thể được công bố ngay sau khi iPhone SE 4 ra mắt vào giữa tháng 2/2025.

Sức sống số
Google thử nghiệm tính năng cảnh báo thay đổi múi giờ trên Android 16

Google thử nghiệm tính năng cảnh báo thay đổi múi giờ trên Android 16

(CLO) Google đang thử nghiệm tính năng cảnh báo thay đổi múi giờ trên Android 16, giúp người dùng nhận thông báo khi thiết bị cập nhật thời gian theo vị trí mới.

Sức sống số
Hướng dẫn cách tải nhạc TikTok về điện thoại dễ dàng nhất

Hướng dẫn cách tải nhạc TikTok về điện thoại dễ dàng nhất

(CLO) Hướng dẫn cách tải nhạc TikTok về điện thoại nhanh chóng và đơn giản bằng công cụ LoveTik. Lưu trữ những bản nhạc yêu thích và thưởng thức mọi lúc, mọi nơi.

Sức sống số
Cách xem Super Bowl 2025 miễn phí ở định dạng 4K trên các thiết bị Apple

Cách xem Super Bowl 2025 miễn phí ở định dạng 4K trên các thiết bị Apple

(CLO) Tubi sẽ phát trực tuyến Super Bowl 2025 miễn phí ở độ phân giải 4K trên iPhone, iPad, Apple TV và Vision Pro, bao gồm trận đấu, chương trình trước trận và Halftime Show.

Sức sống số
Rò rỉ hình ảnh Pixel 9a: Google tiếp tục duy trì thiết kế cũ

Rò rỉ hình ảnh Pixel 9a: Google tiếp tục duy trì thiết kế cũ

(CLO) Hình ảnh rò rỉ cho thấy Pixel 9a có thiết kế không đổi, viền màn hình dày và camera trước lớn hơn. Google tiếp tục tối ưu chi phí thay vì chạy theo xu hướng flagship.

Sức sống số
Meta bị tố lan truyền dữ liệu vi phạm bản quyền để phát triển trí tuệ nhân tạo

Meta bị tố lan truyền dữ liệu vi phạm bản quyền để phát triển trí tuệ nhân tạo

(CLO) Trong khi Meta tiếp tục đầu tư mạnh vào AI, công ty này lại bị cáo buộc sử dụng kho sách lậu để huấn luyện các mô hình AI của mình. Hồ sơ vụ kiện mới cho thấy Meta đã tải xuống và phân phối hơn 81,7 terabyte dữ liệu từ các nguồn vi phạm bản quyền, khiến lập luận “sử dụng hợp lý” của họ trở nên khó bảo vệ.

Sức sống số
Oppo Find N5 lộ diện trong hình ảnh thực tế trước ngày ra mắt

Oppo Find N5 lộ diện trong hình ảnh thực tế trước ngày ra mắt

(CLO) Oppo Find N5 lộ diện qua loạt ảnh thực tế, hé lộ thiết kế siêu mỏng, khung kim loại cao cấp và nếp gấp màn hình nhỏ. Máy dự kiến ra mắt vào ngày 20/2.

Sức sống số