DeepSeek nâng cấp mô hình AI suy luận R1
(CLO) Startup AI DeepSeek của Trung Quốc đã công bố phiên bản cập nhật của mô hình suy luận R1 (R1-0528) vào ngày 28/5.
Đây là một bản nâng cấp “nhỏ” nhưng được kỳ vọng sẽ nâng cao hiệu suất của mô hình, vốn đã tạo tiếng vang lớn trong cộng đồng công nghệ toàn cầu.
Mô hình R1 cập nhật được phát hành dưới giấy phép MIT, cho phép sử dụng thương mại một cách linh hoạt. Tuy nhiên, kho lưu trữ trên Hugging Face hiện chỉ cung cấp các tệp cấu hình và tham số, chưa có mô tả chi tiết về những thay đổi cụ thể.

Với quy mô lên đến 685 tỷ tham số, R1 là một mô hình “nặng ký”, đòi hỏi phần cứng mạnh mẽ và khó chạy trên các thiết bị thông thường nếu không được tối ưu hóa.
DeepSeek nổi lên từ đầu năm 2025 với phiên bản R1 ban đầu, được đánh giá là đối thủ cạnh tranh trực tiếp với các mô hình của OpenAI nhờ hiệu suất cao và chi phí phát triển thấp hơn đáng kể.
Theo các bài kiểm tra điểm chuẩn, R1-0528 đứng ngay sau các mô hình như o4 mini và o3 của OpenAI về khả năng lập trình, đồng thời vượt qua một số đối thủ như Grok 3 mini của xAI và Qwen 3 của Alibaba. Tuy nhiên, thông tin chi tiết về cải tiến của phiên bản mới vẫn còn hạn chế.
DeepSeek cũng được cho là đang phát triển mô hình R2, với tin đồn về kiến trúc hỗn hợp MoE và quy mô lên đến 1,2 nghìn tỷ tham số, hứa hẹn tiếp tục cạnh tranh với các gã khổng lồ như OpenAI, Alibaba và Tencent.