Báo chí - Công nghệ

Tiểu Hồng Thư tuyên bố vượt qua DeepSeek

Ngọc Ánh (theo Bloomberg, SCMP) • 09/06/2025 19:53

(CLO) Tiểu Hồng Thư (Xiaohongshu - RedNote) vừa công bố mô hình ngôn ngữ lớn đầu tiên dots.llm1 của mình, khẳng định vượt trội so với các đối thủ nguồn mở hàng đầu tại Trung Quốc như DeepSeek hay Qwen2.5 của Alibaba.

Mô hình được công bố hôm 6/6, mang cấu trúc "hỗn hợp các chuyên gia" với tổng 142 tỷ tham số, trong đó chỉ kích hoạt 14 tỷ tham số mỗi lần suy luận – thiết kế giúp tiết kiệm chi phí mà vẫn đạt hiệu suất cao.

Tiểu Hồng Thư cho biết mô hình này do Humane Intelligence Lab (hi lab) – phòng nghiên cứu nội bộ của công ty – phát triển.

Tiểu Hồng Thư đã tham gia cuộc đua AI với mô hình nguồn mở của riêng mình. Ảnh: CFP

Tiểu Hồng Thư hiện có khoảng 300 triệu người dùng hoạt động hàng tháng, được định giá lên tới 26 tỷ USD. Sau khi mở văn phòng đầu tiên ngoài Trung Quốc đại lục tại Hồng Kông vào ngày 7/6, công ty được cho là đang chuẩn bị cho một đợt IPO trong năm nay, trong bối cảnh nỗ lực mở rộng quốc tế khi TikTok của ByteDance đứng trước nguy cơ bị cấm tại Mỹ.

Việc ra mắt dots.llm1 đánh dấu bước đi mới của Tiểu Hồng Thư trong cuộc đua AI đang nóng lên tại Trung Quốc, nơi mà các gã khổng lồ như Alibaba, Tencent hay ByteDance đều đã tung ra các mô hình nền tảng riêng.

Khác với các mô hình thương mại khép kín, dots.llm1 được mở mã nguồn, và RedNote tuyên bố sẽ công bố các điểm kiểm tra trung gian sau mỗi nghìn tỷ token được huấn luyện, nhằm thúc đẩy minh bạch và nghiên cứu học thuật.

Công ty cũng nhấn mạnh mô hình này không sử dụng dữ liệu tổng hợp, mà được huấn luyện trên 11,2 nghìn tỷ token chất lượng cao, với đội ngũ nghiên cứu được chọn lọc kỹ lưỡng. Riêng Humane Intelligence Lab của Tiểu Hồng Thư năm nay đã tuyển dụng nhiều nhà nghiên cứu xuất thân từ lĩnh vực nhân văn – động thái cho thấy công ty đang đặt ưu tiên vào việc xây dựng các mô hình thể hiện tư duy giống con người và phản ánh các giá trị xã hội.

Theo Tiểu Hồng Thư, dots.llm1 vượt trội hơn các mô hình mã nguồn mở hàng đầu hiện nay trong việc xử lý tiếng Trung, bao gồm cả Qwen2.5-72B-Instruct và DeepSeek-V3 của Alibaba.

Trong nội bộ nền tảng RedNote, công ty đã thử nghiệm một trợ lý nghiên cứu AI tên Diandian, dựa trên mô hình nội bộ chưa được đặt tên rõ ràng. Trợ lý này cho phép người dùng khởi động tính năng "nghiên cứu chuyên sâu" thông qua một hộp thoại trên ứng dụng.

Ngọc Ánh (theo Bloomberg, SCMP)