Trung Quốc lại ra mắt mô hình AI mới, mạnh hơn cả DeepSeek

(CLO) Tập đoàn công nghệ Trung Quốc Alibaba vừa ra mắt phiên bản mới của mô hình trí tuệ nhân tạo (AI) Qwen 2.5 và tuyên bố rằng nó mạnh hơn cả DeepSeek - mô hình AI nổi bật nhất thời gian qua.

Việc Alibaba công bố Qwen 2.5-Max đúng vào ngày đầu tiên của Tết Nguyên đán – khi hầu hết người dân Trung Quốc đang nghỉ lễ – cho thấy áp lực từ sự trỗi dậy mạnh mẽ của DeepSeek trong ba tuần qua. 

trung quoc lai ra mat mo hinh ai moi manh hon ca deepseek hinh 1

Bảng so sánh khả năng của Qwen 2.5-VL với các AI khác. Ảnh: Alibaba

Thành công nhanh chóng của startup AI này không chỉ gây thách thức cho các đối thủ quốc tế mà còn khiến các công ty công nghệ lớn trong nước phải gấp rút nâng cấp mô hình của mình.

Trong một thông báo trên WeChat chính thức, Alibaba Cloud tuyên bố: "Qwen 2.5-Max vượt trội gần như trên mọi phương diện so với GPT-4o, DeepSeek-V3 và Llama-3.1-405B", ám chỉ đến các mô hình AI tiên tiến nhất của OpenAI và Meta.

Ngày 10/1/2025, DeepSeek ra mắt trợ lý AI sử dụng mô hình DeepSeek-V3, tiếp đó là DeepSeek-R1 vào ngày 20/1. Hai sản phẩm này đã gây chấn động giới công nghệ, thậm chí làm giá cổ phiếu các công ty AI hàng đầu tại Mỹ lao dốc.

DeepSeek tuyên bố có thể phát triển mô hình AI với chi phí thấp hơn nhiều so với các tập đoàn công nghệ lớn của Mỹ, khiến giới đầu tư đặt dấu hỏi về các kế hoạch chi tiêu khổng lồ của OpenAI, Google hay Microsoft.

Không chỉ đe dọa thị trường toàn cầu, DeepSeek còn tạo ra một cuộc chạy đua nâng cấp AI trong nước.

Chỉ hai ngày sau khi DeepSeek-R1 xuất hiện, ByteDance – công ty mẹ của TikTok – đã cập nhật mô hình AI chủ lực của mình và tuyên bố nó vượt qua o1 của OpenAI trong bài kiểm tra AIME, một tiêu chuẩn đo khả năng xử lý và phản hồi các chỉ dẫn phức tạp của AI.

DeepSeek trước đó cũng tuyên bố rằng R1 có thể cạnh tranh với o1 của OpenAI trên nhiều chỉ số hiệu suất. Mô hình DeepSeek-V2, tiền nhiệm của V3, từng châm ngòi cho "cuộc chiến giá AI" tại Trung Quốc khi ra mắt vào tháng 5/2024.

DeepSeek-V2 được cung cấp mã nguồn mở với chi phí cực thấp – chỉ 1 nhân dân tệ (0,14 USD) cho mỗi 1 triệu tokens (đơn vị xử lý dữ liệu của AI). Điều này khiến Alibaba Cloud ngay lập tức giảm giá tới 97% cho một loạt mô hình AI của mình. Các công ty công nghệ lớn khác cũng phải điều chỉnh chiến lược, bao gồm Baidu và Tencent.

Tuy nhiên, người sáng lập bí ẩn của DeepSeek, Liang Wenfeng, lại tỏ ra không mấy quan tâm đến cuộc chiến giá cả. Trong một cuộc phỏng vấn hiếm hoi với trang Waves vào tháng 7/2024, ông khẳng định mục tiêu chính của DeepSeek là đạt được AGI (trí tuệ nhân tạo tổng quát) – một cấp độ AI có khả năng vượt trội con người trong hầu hết các công việc kinh tế quan trọng.

Theo định nghĩa của OpenAI, AGI là hệ thống tự động có thể thực hiện nhiều nhiệm vụ phức tạp hơn con người.

Trong khi các công ty công nghệ lớn như Alibaba có hàng trăm nghìn nhân viên, DeepSeek hoạt động như một phòng thí nghiệm nghiên cứu, chủ yếu gồm các sinh viên tốt nghiệp và nghiên cứu sinh tiến sĩ từ những trường đại học hàng đầu Trung Quốc.

Liang từng nhận định rằng mô hình quản lý của các tập đoàn lớn có thể không phù hợp với tương lai của ngành AI, bởi chi phí cao và cấu trúc quản lý tập trung có thể cản trở sự đổi mới liên tục.

"Các mô hình AI cỡ lớn đòi hỏi sự sáng tạo không ngừng, và khả năng của các tập đoàn công nghệ lớn vẫn có giới hạn", Liang nói.

Cao Phong (theo CNN, BBC, Reuters)

Xem thêm

Ngày càng nhiều nước siết quyền truy cập mạng xã hội của trẻ em

Ngày càng nhiều nước siết quyền truy cập mạng xã hội của trẻ em

(CLO) Úc là quốc gia đầu tiên trên thế giới ban hành lệnh cấm trẻ em dưới 16 tuổi sử dụng mạng xã hội, đánh dấu xu hướng ngày càng nhiều nước tìm cách hạn chế quyền truy cập của trẻ vị thành niên vào các nền tảng trực tuyến do lo ngại về sức khỏe tâm thần, an toàn và tác động lâu dài đối với sự phát triển của trẻ.

Nvidia bắt tay các 'ông lớn' của Hàn Quốc xây dựng trung tâm dữ liệu AI

Nvidia bắt tay các 'ông lớn' của Hàn Quốc xây dựng trung tâm dữ liệu AI

(CLO) Nvidia ngày 8/6 công bố hàng loạt thỏa thuận hợp tác với các tập đoàn hàng đầu Hàn Quốc gồm SK Hynix, Naver và Doosan nhằm phát triển các trung tâm dữ liệu trí tuệ nhân tạo (AI) và mở rộng việc ứng dụng công nghệ của hãng, trong bối cảnh làn sóng đầu tư AI trên toàn cầu tiếp tục tăng tốc.

Thái Lan kiện Facebook vì các vụ lừa đảo trực tuyến

Thái Lan kiện Facebook vì các vụ lừa đảo trực tuyến

(CLO) Hội đồng Bảo vệ Người tiêu dùng Thái Lan cho biết sẽ đệ đơn kiện Facebook trong tuần tới, đánh dấu vụ kiện đầu tiên tại nước này nhằm vào nền tảng mạng xã hội vì không bảo vệ đầy đủ người dùng trước các nội dung lừa đảo.

Anthropic được định giá 965 tỷ USD, vượt qua OpenAI

Anthropic được định giá 965 tỷ USD, vượt qua OpenAI

(CLO) Anthropic ngày 28/5 thông báo đã huy động được 65 tỷ USD trong vòng gọi vốn series H, qua đó nâng mức định giá sau đầu tư lên 965 tỷ USD. Động thái này giúp Anthropic vượt qua đối thủ OpenAI, công ty từng được định giá 852 tỷ USD hồi tháng 3.

CEO OpenAI: AI không gây ra 'thảm họa việc làm' như lo ngại

CEO OpenAI: AI không gây ra 'thảm họa việc làm' như lo ngại

(CLO) Giám đốc điều hành OpenAI, Sam Altman, cho biết sự phát triển nhanh chóng của trí tuệ nhân tạo không gây ra “thảm họa việc làm” toàn cầu như nhiều người từng lo ngại, đồng thời thừa nhận ông đã đánh giá quá cao tác động của AI đối với lao động văn phòng.

Mạng xã hội bị ví nguy hiểm ngang thuốc lá với trẻ em

Mạng xã hội bị ví nguy hiểm ngang thuốc lá với trẻ em

(CLO) Các bác sĩ hàng đầu tại Vương quốc Anh kêu gọi chính phủ siết chặt kiểm soát mạng xã hội đối với trẻ em, cho rằng tác động của việc sử dụng mạng xã hội quá mức hiện nguy hiểm tương đương thuốc lá.

Cỡ chữ bài viết: