Mô hình AI DeepSeek R1 bị chỉ trích vì 'dễ bị bẻ khóa' hơn các đối thủ

09/04/2025 12:04

(CLO) Mô hình AI DeepSeek R1 bị chỉ trích vì dễ bị thao túng để tạo nội dung nguy hiểm như hướng dẫn chế tạo vũ khí sinh học và kích động hành vi tự làm hại bản thân.

Theo báo cáo mới đây từ The Wall Street Journal, mô hình AI R1 của DeepSeek – công ty trí tuệ nhân tạo đến từ Trung Quốc – đang gây lo ngại khi dễ dàng bị thao túng để tạo ra nội dung nguy hiểm, bao gồm hướng dẫn chế tạo vũ khí sinh học và chiến dịch kích động hành vi tự làm hại bản thân ở thanh thiếu niên.

mo hinh ai deepseek r1 bi chi trich vi de bi be khoa hon cac doi thu hinh 1 — Mô hình AI R1 của DeepSeek bị chỉ trích.

DeepSeek dễ bị lợi dụng để tạo nội dung nguy hiểm

Sam Rubin, Phó Chủ tịch cấp cao của bộ phận ứng phó sự cố và tình báo mối đe dọa Unit 42 thuộc Palo Alto Networks, nhận định với The Wall Street Journal rằng DeepSeek dễ bị "bẻ khóa" hơn so với các mô hình AI khác. Điều này có nghĩa là chatbot có thể bị thao túng để tạo ra nội dung bất hợp pháp hoặc gây hại.

Trong một thử nghiệm, The Wall Street Journal đã kiểm tra mức độ bảo vệ của DeepSeek R1. Dù mô hình có vẻ được tích hợp các biện pháp an toàn cơ bản, nhưng các nhà nghiên cứu của tạp chí này vẫn có thể thuyết phục nó thiết kế một chiến dịch truyền thông xã hội nguy hiểm. Theo lời của chính chatbot, chiến dịch này sẽ "lợi dụng mong muốn được thuộc về của thanh thiếu niên, biến sự yếu đuối về mặt cảm xúc thành vũ khí thông qua việc khuếch đại thuật toán".

Không dừng lại ở đó, DeepSeek R1 còn bị thuyết phục để:

- Cung cấp hướng dẫn cho một cuộc tấn công bằng vũ khí sinh học.

- Viết một bản tuyên ngôn ủng hộ Hitler.

- Soạn thảo một email lừa đảo chứa mã độc hại.

Trong khi đó, khi thử nghiệm cùng một yêu cầu với ChatGPT, chatbot của OpenAI đã từ chối tuân thủ.

Vấn đề kiểm duyệt nội dung của DeepSeek

DeepSeek trước đây đã bị chỉ trích vì kiểm duyệt nội dung theo chính sách của Trung Quốc. Các báo cáo trước đó cho thấy ứng dụng này tránh các chủ đề nhạy cảm như sự kiện Quảng trường Thiên An Môn hay quyền tự chủ của Đài Loan.

Ngoài ra, Dario Amodei, CEO của Anthropic – một công ty AI khác, gần đây cũng tuyên bố rằng DeepSeek "tệ nhất" trong các bài kiểm tra an toàn liên quan đến vũ khí sinh học.

Những phát hiện này làm dấy lên mối lo ngại về khả năng kiểm soát nội dung của DeepSeek, đồng thời đặt ra câu hỏi về trách nhiệm của các công ty AI trong việc đảm bảo an toàn cho người dùng.

Hùng Nguyễn (Theo Tech Crunch)

Từ khóa :

#Mô hình AI DeepSeek R1 dễ bị bẻ khóa #DeepSeek R1 tạo nội dung nguy hiểm #AI Trung Quốc và vấn đề kiểm duyệt #DeepSeek R1 và an toàn AI #so sánh DeepSeek R1 với ChatGPT

Có thể bạn quan tâm

Google Earth dừng công cụ AI tạo ảnh chỉ một ngày sau khi ra mắt

Tòa án Đức phán quyết công ty nhạc AI Suno vi phạm bản quyền

Anthropic thừa nhận AI Claude tự ý tấn công hệ thống của 3 công ty

CEO Meta dự báo hàng tỷ người sẽ có trợ lý AI cá nhân trong 5 năm tới

Google đối mặt làn sóng kiện đòi bồi thường đến chục tỷ USD

Xem thêm

28/07/2026 15:51

Nữ nghị sĩ Anh kiện xAI vì Grok tạo ảnh khiêu dâm giả mạo

(CLO) Một nữ nghị sĩ Anh đã đệ đơn kiện công ty xAI của tỷ phú Elon Musk, cáo buộc chatbot Grok tạo ra các hình ảnh giả mạo mang tính tình dục hóa về bà mà không có sự đồng ý.

28/07/2026 12:01

Microsoft cho ra mắt mô hình AI an ninh mạng đầu tiên, tuyên bố vượt OpenAI và Google

(CLO) Microsoft vừa cho ra mắt MAI-Cyber-1-Flash, mô hình AI chuyên về an ninh mạng đầu tiên của hãng, đồng thời công bố nền tảng bảo mật AI mới mang tên Perception tại một sự kiện ở San Francisco, Mỹ ngày 27/7.

24/07/2026 18:14

EU cáo buộc TikTok vi phạm quy định bảo vệ trẻ em, đối mặt nguy cơ bị phạt nặng

(CLO) Ủy ban châu Âu ngày 24/7 đưa ra kết luận sơ bộ cáo buộc TikTok vi phạm các quy định của Đạo luật Dịch vụ Kỹ thuật số (DSA), cho rằng một số tính năng thiết kế của nền tảng có thể khiến trẻ em dễ trở thành mục tiêu của kẻ xấu hoặc bị bắt nạt trên mạng.

23/07/2026 18:58

Google lại bị phạt 1 tỷ USD vì độc quyền

(CLO) Ủy ban châu Âu ngày 23/7 thông báo phạt Google 890 triệu euro (khoảng 1 tỷ USD) vì vi phạm Đạo luật Thị trường Kỹ thuật số (DMA), cáo buộc hãng công nghệ Mỹ lạm dụng vị thế thống lĩnh để ưu tiên các dịch vụ của mình và gây bất lợi cho đối thủ.

23/07/2026 16:03

Google Cloud tăng trưởng bùng nổ nhờ AI

(CLO) Alphabet, công ty mẹ của Google, vừa công bố báo cáo thu nhập mới nhất cho thấy sự tăng trưởng mạnh mẽ, phần nào giải tỏa nỗi lo của các nhà đầu tư về việc liệu những khoản chi tiêu khổng lồ cho trí tuệ nhân tạo (AI) có thực sự mang lại lợi ích hay không.

22/07/2026 21:21

Doanh nghiệp Việt muốn bứt phá phải biết dùng AI, không thể mãi cạnh tranh bằng giá

(CLO) Trong kỷ nguyên AI, lợi thế của doanh nghiệp không còn nằm ở quy mô hay giá bán mà ở khả năng đổi mới sáng tạo, tạo ra giá trị khác biệt và thấu hiểu khách hàng. Đây là nhận định được các chuyên gia đưa ra tại Diễn đàn Chiến lược Kinh doanh "The Future of Business" diễn ra tại TP.HCM chiều 22/7.

22/07/2026 19:07

AI của OpenAI bất ngờ vượt kiểm soát, tấn công hệ thống đối thủ

(CLO) OpenAI, công ty phát triển ChatGPT, cho biết hai mô hình trí tuệ nhân tạo tiên tiến nhất của hãng đã vượt khỏi môi trường thử nghiệm trong một cuộc diễn tập an ninh mạng nội bộ và thực hiện cuộc tấn công vào hệ thống của công ty AI Hugging Face.

22/07/2026 09:53

Pháp trở thành quốc gia EU đầu tiên cấm trẻ dưới 15 tuổi dùng mạng xã hội

(CLO) Pháp vừa trở thành quốc gia đầu tiên trong Liên minh châu Âu (EU) thông qua luật cấm trẻ em dưới 15 tuổi sử dụng mạng xã hội.

22/07/2026 07:07

Trung Quốc phát triển AI 'đọc' dark web, phát hiện nội dung phạm pháp

(CLO) Các nhà nghiên cứu thuộc Đại học Cảnh sát Điều tra Hình sự Trung Quốc đã phát triển một hệ thống trí tuệ nhân tạo (AI) có khả năng thu thập và phân tích nội dung trên dark web bằng tiếng Trung, nhằm hỗ trợ phát hiện các hoạt động phạm pháp trên không gian mạng.

21/07/2026 20:33

Pháp bỏ phiếu cấm trẻ dưới 15 tuổi dùng mạng xã hội

(CLO) Quốc hội Pháp dự kiến bỏ phiếu vào ngày 21/7 đối với dự luật cấm trẻ em dưới 15 tuổi sử dụng mạng xã hội.

20/07/2026 18:57

Meta hầu tòa vì cáo buộc Instagram gây nghiện

(CLO) Meta Platforms sẽ phải hầu tòa tại bang Tennessee (Mỹ) vào ngày 20/7 để đối mặt với cáo buộc Instagram được thiết kế theo cách "gây nghiện" cho thanh thiếu niên, làm trầm trọng thêm cuộc khủng hoảng sức khỏe tâm thần ở giới trẻ.

16/07/2026 19:52

Google thua kiện vụ quảng cáo cờ bạc trên YouTube

(CLO) Google đã thất bại trong nỗ lực hủy khoản phạt 750.000 euro liên quan đến các video quảng cáo cờ bạc trên nền tảng YouTube, sau khi Tòa án Công lý Liên minh châu Âu (CJEU) ra phán quyết có lợi cho cơ quan quản lý truyền thông của Ý.

15/07/2026 15:39

Google bị kiện với cáo buộc dùng sách có bản quyền để huấn luyện AI

(CLO) Một nhóm các nhà xuất bản và tác giả mới đây đã đệ đơn kiện tập thể nhằm vào Google, cáo buộc tập đoàn công nghệ này sử dụng trái phép các tác phẩm có bản quyền để huấn luyện mô hình trí tuệ nhân tạo Gemini.

14/07/2026 11:12

Mạng xã hội X điều chỉnh thuật toán, giúp 'bạn bè' gắn kết hơn

(CLO) Giám đốc sản phẩm của mạng xã hội X, Nikita Bier, ngày 13/7 đã thông báo về một sự thay đổi quan trọng trong cách hiển thị nội dung trên nền tảng này nhằm mục đích tăng khả năng hiển thị các bài đăng từ những người dùng có mối quan hệ hai chiều, tức những tài khoản theo dõi lẫn nhau.

14/07/2026 06:48

EU đề xuất hạn chế trẻ em dùng mạng xã hội theo từng độ tuổi

(CLO) Liên minh châu Âu (EU) đang chuẩn bị ban hành quy định mới nhằm kiểm soát việc trẻ em sử dụng mạng xã hội, với định hướng tiếp cận theo từng độ tuổi thay vì cấm hoàn toàn.

13/07/2026 19:42

Mối nguy từ làn sóng dùng MC AI để phát tán thông tin sai lệch trên TikTok

(CLO) Cuộc điều tra của hãng tin CNA đã phát hiện mạng lưới hàng chục tài khoản TikTok sử dụng người dẫn chương trình (MC) do AI tạo ra để lan truyền thông tin sai lệch về Singapore và Malaysia, thu hút hơn 3 triệu lượt xem.

11/07/2026 08:14

Apple kiện OpenAI với cáo buộc đánh cắp bí mật thương mại

(CLO) Ngày 10/7, Apple đã đệ đơn kiện OpenAI cùng một số cựu nhân viên lên Tòa án Quận Bắc California (Mỹ), cáo buộc công ty này tiến hành một chiến dịch có hệ thống nhằm chiếm đoạt bí mật thương mại về phần cứng để phục vụ tham vọng phát triển thiết bị tiêu dùng.

11/07/2026 06:52

EU yêu cầu Meta thay đổi thiết kế Facebook, Instagram để người dùng giảm 'nghiện'

(CLO) Liên minh châu Âu (EU) ngày 10/7 công bố kết luận sơ bộ cho rằng Meta - công ty mẹ của Facebook và Instagram - có dấu hiệu vi phạm các quy định công nghệ của khối khi thiết kế nền tảng theo hướng khiến người dùng, đặc biệt là thanh thiếu niên, dễ bị "nghiện" mạng xã hội.

10/07/2026 10:16

OpenAI chính thức phát hành mô hình GPT-5.6 mới

(CLO) Ngày 9/7, OpenAI chính thức phát hành dòng mô hình GPT-5.6 gồm ba phiên bản Sol, Terra và Luna. Đây là lần đầu tiên công ty từ bỏ cách đặt tên bằng số để chuyển sang các tên gọi mới nhằm giúp người dùng dễ phân biệt cấp độ hiệu năng và chi phí giữa các mô hình.

09/07/2026 07:32

Châu Âu chạy đua phát triển robot AI, lo tụt hậu trước Mỹ và Trung Quốc

(CLO) Các doanh nghiệp công nghệ châu Âu đang tăng tốc đầu tư vào lĩnh vực AI vật lý (Physical AI) - công nghệ tích hợp trí tuệ nhân tạo vào robot và máy móc - nhằm thu hẹp khoảng cách với Mỹ và Trung Quốc.

Danh mục

Mô hình AI DeepSeek R1 bị chỉ trích vì 'dễ bị bẻ khóa' hơn các đối thủ

Mô hình AI R1 của DeepSeek bị chỉ trích.

DeepSeek dễ bị lợi dụng để tạo nội dung nguy hiểm

Vấn đề kiểm duyệt nội dung của DeepSeek

Từ khóa :

Đọc nhiều

Doanh nghiệp Việt muốn bứt phá phải biết dùng AI, không thể mãi cạnh tranh bằng giá

Google thua kiện vụ quảng cáo cờ bạc trên YouTube

Pháp bỏ phiếu cấm trẻ dưới 15 tuổi dùng mạng xã hội

Google đối mặt làn sóng kiện đòi bồi thường đến chục tỷ USD

Google bị kiện với cáo buộc dùng sách có bản quyền để huấn luyện AI

Có thể bạn quan tâm

Google Earth dừng công cụ AI tạo ảnh chỉ một ngày sau khi ra mắt

Tòa án Đức phán quyết công ty nhạc AI Suno vi phạm bản quyền

Anthropic thừa nhận AI Claude tự ý tấn công hệ thống của 3 công ty

CEO Meta dự báo hàng tỷ người sẽ có trợ lý AI cá nhân trong 5 năm tới

Google đối mặt làn sóng kiện đòi bồi thường đến chục tỷ USD

Xem thêm

Nữ nghị sĩ Anh kiện xAI vì Grok tạo ảnh khiêu dâm giả mạo

Microsoft cho ra mắt mô hình AI an ninh mạng đầu tiên, tuyên bố vượt OpenAI và Google

EU cáo buộc TikTok vi phạm quy định bảo vệ trẻ em, đối mặt nguy cơ bị phạt nặng

Google lại bị phạt 1 tỷ USD vì độc quyền

Google Cloud tăng trưởng bùng nổ nhờ AI

Doanh nghiệp Việt muốn bứt phá phải biết dùng AI, không thể mãi cạnh tranh bằng giá

AI của OpenAI bất ngờ vượt kiểm soát, tấn công hệ thống đối thủ

Pháp trở thành quốc gia EU đầu tiên cấm trẻ dưới 15 tuổi dùng mạng xã hội

Trung Quốc phát triển AI 'đọc' dark web, phát hiện nội dung phạm pháp

Pháp bỏ phiếu cấm trẻ dưới 15 tuổi dùng mạng xã hội

Meta hầu tòa vì cáo buộc Instagram gây nghiện

Google thua kiện vụ quảng cáo cờ bạc trên YouTube

Google bị kiện với cáo buộc dùng sách có bản quyền để huấn luyện AI

Mạng xã hội X điều chỉnh thuật toán, giúp 'bạn bè' gắn kết hơn

EU đề xuất hạn chế trẻ em dùng mạng xã hội theo từng độ tuổi

Mối nguy từ làn sóng dùng MC AI để phát tán thông tin sai lệch trên TikTok

Apple kiện OpenAI với cáo buộc đánh cắp bí mật thương mại

EU yêu cầu Meta thay đổi thiết kế Facebook, Instagram để người dùng giảm 'nghiện'

OpenAI chính thức phát hành mô hình GPT-5.6 mới

Châu Âu chạy đua phát triển robot AI, lo tụt hậu trước Mỹ và Trung Quốc

Mô hình AI DeepSeek R1 bị chỉ trích vì 'dễ bị bẻ khóa' hơn các đối thủ

Mô hình AI R1 của DeepSeek bị chỉ trích.

DeepSeek dễ bị lợi dụng để tạo nội dung nguy hiểm

Vấn đề kiểm duyệt nội dung của DeepSeek

Tin liên quan

Từ khóa :

Đọc nhiều