DeepSeek nâng cấp mô hình AI suy luận R1

(CLO) Startup AI DeepSeek của Trung Quốc đã công bố phiên bản cập nhật của mô hình suy luận R1 (R1-0528) vào ngày 28/5.

Đây là một bản nâng cấp “nhỏ” nhưng được kỳ vọng sẽ nâng cao hiệu suất của mô hình, vốn đã tạo tiếng vang lớn trong cộng đồng công nghệ toàn cầu.

Mô hình R1 cập nhật được phát hành dưới giấy phép MIT, cho phép sử dụng thương mại một cách linh hoạt. Tuy nhiên, kho lưu trữ trên Hugging Face hiện chỉ cung cấp các tệp cấu hình và tham số, chưa có mô tả chi tiết về những thay đổi cụ thể.

Screenshot 2025-05-29 at 10.55.18
Ứng dụng DeepSeek trên điện thoại.

Với quy mô lên đến 685 tỷ tham số, R1 là một mô hình “nặng ký”, đòi hỏi phần cứng mạnh mẽ và khó chạy trên các thiết bị thông thường nếu không được tối ưu hóa.

DeepSeek nổi lên từ đầu năm 2025 với phiên bản R1 ban đầu, được đánh giá là đối thủ cạnh tranh trực tiếp với các mô hình của OpenAI nhờ hiệu suất cao và chi phí phát triển thấp hơn đáng kể.

Theo các bài kiểm tra điểm chuẩn, R1-0528 đứng ngay sau các mô hình như o4 mini và o3 của OpenAI về khả năng lập trình, đồng thời vượt qua một số đối thủ như Grok 3 mini của xAI và Qwen 3 của Alibaba. Tuy nhiên, thông tin chi tiết về cải tiến của phiên bản mới vẫn còn hạn chế.

DeepSeek cũng được cho là đang phát triển mô hình R2, với tin đồn về kiến trúc hỗn hợp MoE và quy mô lên đến 1,2 nghìn tỷ tham số, hứa hẹn tiếp tục cạnh tranh với các gã khổng lồ như OpenAI, Alibaba và Tencent.

Xem thêm

Ngày càng nhiều nước siết quyền truy cập mạng xã hội của trẻ em

Ngày càng nhiều nước siết quyền truy cập mạng xã hội của trẻ em

(CLO) Úc là quốc gia đầu tiên trên thế giới ban hành lệnh cấm trẻ em dưới 16 tuổi sử dụng mạng xã hội, đánh dấu xu hướng ngày càng nhiều nước tìm cách hạn chế quyền truy cập của trẻ vị thành niên vào các nền tảng trực tuyến do lo ngại về sức khỏe tâm thần, an toàn và tác động lâu dài đối với sự phát triển của trẻ.

Nvidia bắt tay các 'ông lớn' của Hàn Quốc xây dựng trung tâm dữ liệu AI

Nvidia bắt tay các 'ông lớn' của Hàn Quốc xây dựng trung tâm dữ liệu AI

(CLO) Nvidia ngày 8/6 công bố hàng loạt thỏa thuận hợp tác với các tập đoàn hàng đầu Hàn Quốc gồm SK Hynix, Naver và Doosan nhằm phát triển các trung tâm dữ liệu trí tuệ nhân tạo (AI) và mở rộng việc ứng dụng công nghệ của hãng, trong bối cảnh làn sóng đầu tư AI trên toàn cầu tiếp tục tăng tốc.

Thái Lan kiện Facebook vì các vụ lừa đảo trực tuyến

Thái Lan kiện Facebook vì các vụ lừa đảo trực tuyến

(CLO) Hội đồng Bảo vệ Người tiêu dùng Thái Lan cho biết sẽ đệ đơn kiện Facebook trong tuần tới, đánh dấu vụ kiện đầu tiên tại nước này nhằm vào nền tảng mạng xã hội vì không bảo vệ đầy đủ người dùng trước các nội dung lừa đảo.

Anthropic được định giá 965 tỷ USD, vượt qua OpenAI

Anthropic được định giá 965 tỷ USD, vượt qua OpenAI

(CLO) Anthropic ngày 28/5 thông báo đã huy động được 65 tỷ USD trong vòng gọi vốn series H, qua đó nâng mức định giá sau đầu tư lên 965 tỷ USD. Động thái này giúp Anthropic vượt qua đối thủ OpenAI, công ty từng được định giá 852 tỷ USD hồi tháng 3.

CEO OpenAI: AI không gây ra 'thảm họa việc làm' như lo ngại

CEO OpenAI: AI không gây ra 'thảm họa việc làm' như lo ngại

(CLO) Giám đốc điều hành OpenAI, Sam Altman, cho biết sự phát triển nhanh chóng của trí tuệ nhân tạo không gây ra “thảm họa việc làm” toàn cầu như nhiều người từng lo ngại, đồng thời thừa nhận ông đã đánh giá quá cao tác động của AI đối với lao động văn phòng.

Mạng xã hội bị ví nguy hiểm ngang thuốc lá với trẻ em

Mạng xã hội bị ví nguy hiểm ngang thuốc lá với trẻ em

(CLO) Các bác sĩ hàng đầu tại Vương quốc Anh kêu gọi chính phủ siết chặt kiểm soát mạng xã hội đối với trẻ em, cho rằng tác động của việc sử dụng mạng xã hội quá mức hiện nguy hiểm tương đương thuốc lá.

Cỡ chữ bài viết: