(CLO) DeepSeek công ty AI Trung Quốc đang thay đổi cuộc chơi với các mô hình mạnh mẽ, chi phí thấp, thách thức OpenAI và thúc đẩy cuộc đua AI toàn cầu lên một tầm cao mới.
Sự trỗi dậy của DeepSeek
Trong năm 2025, ngành trí tuệ nhân tạo (AI) chứng kiến những thay đổi đáng kể. Một trong những sự kiện nổi bật nhất là Dự án Stargate của OpenAI, công bố vào ngày 21 tháng 1, với kế hoạch đầu tư 500 tỷ USD vào cơ sở hạ tầng AI nhằm củng cố vị thế của Hoa Kỳ. Nhưng chỉ một ngày trước đó, một công ty AI ít được biết đến của Trung Quốc – DeepSeek – đã phát hành mô hình ngôn ngữ lớn (LLM) mới nhất của mình. Ban đầu, nó không thu hút quá nhiều sự chú ý, nhưng chỉ trong vài tuần, DeepSeek đã làm thay đổi bối cảnh AI, buộc những gã khổng lồ như OpenAI phải đánh giá lại chiến lược của họ.
DeepSeek.
DeepSeek là gì?
DeepSeek là một công ty AI của Trung Quốc do Liang Wenfang sáng lập. Liang không phải là người xa lạ với AI; ông từng đồng sáng lập một quỹ đầu cơ định lượng sử dụng AI để đưa ra quyết định đầu tư. Ban đầu, DeepSeek được thành lập như một dự án phụ để nghiên cứu trí tuệ nhân tạo tổng quát (AGI), nhưng nhanh chóng trở thành một thế lực đáng gờm.
Nguồn ảnh: tv.CCTV.com.
Hành trình của Liang với AI không bắt đầu từ DeepSeek. Từ năm 2015, ông đã xây dựng trung tâm dữ liệu của riêng mình, sử dụng 100 card đồ họa. Đến năm 2019, ông ra mắt Fire-Flyer 1 với 1.100 card, đầu tư 30 triệu USD. Năm 2021, ông tiếp tục đầu tư 140 triệu USD để xây dựng Fire-Flyer 2 với 10.000 card đồ họa Nvidia A100. Sau khi sở hữu nền tảng hạ tầng mạnh mẽ, Liang quyết định nghiêm túc tham gia vào cuộc đua AI với DeepSeek.
Những thành tựu của DeepSeek
Dù mới ra đời từ năm 2023, DeepSeek đã nhanh chóng tạo ra những dấu ấn đáng kể. Trong vòng sáu tháng, công ty đã phát hành DeepSeek-Coder và DeepSeek-LLM vào tháng 11/2023. Tiếp đó, vào tháng 1/2024, họ ra mắt DeepSeek-MoE, sử dụng kiến trúc "hỗn hợp các chuyên gia" (Mixture of Experts - MoE), giúp mô hình trở nên mạnh mẽ hơn.
Đến tháng 5/2024, DeepSeek đã gây ra một "cơn bão" trong ngành AI Trung Quốc khi tung ra phiên bản V2 với chi phí token cực thấp, buộc các đối thủ như Alibaba, ByteDance và Tencent phải giảm giá để theo kịp. Đến ngày 26/12/2024, công ty tiếp tục phát hành DeepSeek-V3, đánh dấu một bước ngoặt lớn.
DeepSeek-V3 và DeepSeek-R1 – Vì sao chúng quan trọng?
DeepSeek-V3 là một mô hình LLM đa năng, có hiệu suất ngang ngửa hoặc nhỉnh hơn GPT-4o của OpenAI trên hầu hết các điểm chuẩn. Dù điều này có vẻ không quá đột phá trong bối cảnh ngành AI liên tục phát triển, nhưng yếu tố bất ngờ chính là chi phí đào tạo của V3.
Nguồn: DeepSeek/GitHub.
DeepSeek tuyên bố đã đào tạo mô hình 671 tỷ tham số này chỉ với 6 triệu USD, so với mức hơn 100 triệu USD của GPT-4 theo lời của CEO OpenAI Sam Altman. Ngoài ra, nhờ kiến trúc MoE, V3 chỉ kích hoạt khoảng 37 tỷ tham số mỗi truy vấn, giúp tăng tốc độ phản hồi và giảm chi phí vận hành. Điều này cho phép DeepSeek cung cấp dịch vụ với mức giá rẻ hơn nhiều so với OpenAI:
GPT-4o của OpenAI: 2,50 USD cho 1 triệu token đầu vào, 10 USD cho 1 triệu token đầu ra.
DeepSeek-V3: 0,14 USD cho 1 triệu token đầu vào, 0,28 USD cho 1 triệu token đầu ra.
DeepSeek-R1 là một mô hình lý luận (reasoning model), phát triển dựa trên V3 và tập trung vào "chuỗi suy nghĩ" (chain of thought). Điều đặc biệt ở R1 là nó được đào tạo chủ yếu bằng học tăng cường mà không cần học có giám sát. Ban đầu, R1-Zero – phiên bản thử nghiệm của R1 – tự động phát triển khả năng suy luận mà không cần gán nhãn dữ liệu. Sau khi tinh chỉnh thêm với một lượng nhỏ dữ liệu có giám sát, R1 đạt được khả năng lý luận ngang với OpenAI o1 trên nhiều bài kiểm tra, nhưng với chi phí thấp hơn đáng kể.
DeepSeek có đánh bại OpenAI?
Sự ra mắt của R1 không ngay lập tức làm rung chuyển thị trường, nhưng chỉ sau vài ngày, Nasdaq mất 1.000 tỷ USD vốn hóa, trong đó Nvidia thiệt hại 600 tỷ USD. Lý do là DeepSeek đã chứng minh rằng các mô hình AI không cần đến các trung tâm dữ liệu khổng lồ hay chip đắt tiền để đạt hiệu suất cao.
Nguồn: DeepSeek/GitHub.
Tuy nhiên, điều này không có nghĩa là OpenAI hay các gã khổng lồ AI khác sẽ bị loại bỏ. Thị trường đã phục hồi nhanh chóng sau cú sốc ban đầu, và các công ty lớn như OpenAI, Google DeepMind, và Anthropic vẫn đang tiếp tục đổi mới. Nhưng một điều chắc chắn là DeepSeek đã mở ra một hướng đi mới: AI có thể mạnh mẽ hơn với chi phí thấp hơn.
Tương lai của AI – Cuộc chạy đua mới
Không dừng lại ở việc chứng minh sự hiệu quả của mình, DeepSeek đã mã nguồn mở các phương pháp huấn luyện của họ. Điều này đã dẫn đến một làn sóng thử nghiệm mới: một nhóm từ Đại học Berkeley đã sử dụng thuật toán của DeepSeek để đào tạo mô hình Qwen 3B giải toán, chỉ với 30 USD thời gian xử lý. Điều này cho thấy rằng các phương pháp của DeepSeek thực sự có giá trị và có thể được áp dụng rộng rãi.
Thay vì làm lu mờ các công ty lớn, DeepSeek đã thúc đẩy sự đổi mới trong toàn ngành. Nó chứng minh rằng không chỉ các tập đoàn công nghệ khổng lồ mới có thể tạo ra đột phá, mà ngay cả những công ty nhỏ hơn cũng có thể thay đổi cuộc chơi bằng những cách tiếp cận mới.
Năm 2024 đã là một năm bùng nổ của AI, nhưng với những gì DeepSeek vừa làm được, năm 2025 hứa hẹn sẽ còn kịch tính hơn nữa.
(CLO) Dù sử dụng 8 ngoại binh vào thi đấu, nhưng câu lạc bộ Thép Xanh Nam Định vẫn thất bại đáng tiếc với tỷ số 0-3 trước Sanfrecce Hiroshima (Nhật Bản) trong trận lượt đi vòng 1/8 AFC Champions League 2 (Cúp C2 châu Á), diễn ra tối 12/2.
(CLO) Ngày 12/2/2025, tại trụ sở Hội Nhà báo Việt Nam, Phó Chủ tịch Thường trực Hội Nhà báo Việt Nam Nguyễn Đức Lợi đã tiếp xã giao đoàn Đại sứ Cuba do ông Rogelio Polanco Fuentes, Đại sứ đặc mệnh toàn quyền của Cuba tại Việt Nam làm trưởng đoàn.
(CLO) Ngày 12/2, thông tin từ Công an tỉnh An Giang cho biết, Giám đốc Công an tỉnh An Giang đã ký Quyết định thi hành kỷ luật đối với Trung tá Trần Tấn Tài, Phó trưởng Công an TX Tân Châu, An Giang bằng hình thức cách chức
(CLO) Bộ trưởng Bộ Tư pháp Nguyễn Hải Ninh cho biết, việc ban hành Nghị quyết của Quốc hội nhằm xử lý kịp thời các vấn đề phát sinh khi thực hiện sắp xếp tổ chức bộ máy nhà nước, tránh khoảng trống pháp luật, bảo đảm hoạt động bình thường, liên tục, thông suốt của bộ máy nhà nước và toàn xã hội.
(CLO) Chiều 12/2, dưới sự điều hành của Phó Chủ tịch Quốc hội Nguyễn Khắc Định, Quốc hội đã nghe Tờ trình và Báo cáo thẩm tra về dự án Luật Tổ chức Chính phủ (sửa đổi).
(CLO) Cục Du lịch Quốc gia Việt Nam vừa có công văn về việc phòng ngừa, ngăn chặn, xử lý hoạt động lừa đảo chiếm đoạt tài sản trên không gian mạng trong lĩnh vực du lịch.
(CLO) Lễ diễu hành Tết Nguyên tiêu diễn ra vào chiều tối 12/2 (nhằm ngày 15 tháng Giêng Ất Tỵ) tại nhiều tuyến đường trên địa bàn quận 5, TP HCM thu hút sự quan tâm của đông đảo người dân.
(CLO) Gần hai năm sau thảm kịch tàu ngầm Titan, Cảnh sát biển Mỹ đã công bố một bản ghi âm dài 20 giây, được cho là ghi lại âm thanh của vụ nổ đã cướp đi sinh mạng của 5 người trên tàu.
(CLO) Thủ tướng Chính phủ Phạm Minh Chính đề nghị Tập đoàn Samsung hỗ trợ Việt Nam nâng cao hơn nữa năng lực doanh nghiệp trong nước để có thể tham gia có hiệu quả hơn chuỗi sản xuất, chuỗi cung ứng toàn cầu của Tập đoàn; đẩy mạnh hợp tác để đưa các doanh nghiệp công nghệ số của Việt Nam trở thành đối tác trong hệ sinh thái của Samsung.
(CLO) Theo số liệu báo cáo của Ban Chỉ đạo về phát triển nhà ở xã hội và thực hiện các chính sách hỗ trợ về nhà ở cho các đối tượng chính sách trên địa bàn tỉnh Thanh Hóa, đến nay đã hoàn thành đưa vào sử dụng khoảng 2.197 căn hộ (với 4 dự án đã hoàn thành và 4 dự án đang triển khai đã đưa vào sử dụng một phần dự án).
(CLO) Theo thông tin mới nhất, cả nhà em gái Từ Hy Viên sẽ nhảy vào cuộc chiến tranh quyền thừa kế dẫn đến việc phân chia tài sản được dự đoán sẽ rất phức tạp và vô cùng căng thẳng.
(CLO) DeepSeek công ty AI Trung Quốc đang thay đổi cuộc chơi với các mô hình mạnh mẽ, chi phí thấp, thách thức OpenAI và thúc đẩy cuộc đua AI toàn cầu lên một tầm cao mới.
(CLO) Giới chức Nga cho biết toàn bộ 139 ngư dân bị mắc kẹt trên một tảng băng trôi ngoài khơi đảo Sakhalin, Viễn Đông Nga, đã được giải cứu an toàn vào ngày 12/2.
Nga lao đao khi 265 tàu dầu bị trừng phạt, đẩy chi phí vận chuyển tăng 48% chỉ trong một tháng, khiến xuất khẩu đình trệ và doanh thu sụt giảm nghiêm trọng.
(CLO) Google Photos sắp làm mới giao diện Memories với chế độ toàn màn hình, mang đến trải nghiệm sống động hơn. Cùng khám phá những thay đổi thú vị trong bản cập nhật này!
(CLO) Galaxy S25+ và S25 Ultra được nâng cấp sạc nhanh 45W tiện lợi hơn, cho phép sử dụng cáp 3A đi kèm mà không cần mua thêm cáp 5A, giúp tiết kiệm thời gian và chi phí.
(CLO) Người dùng Hoa Kỳ giờ đây xem YouTube trên TV nhiều hơn điện thoại. YouTube đang cải tiến nền tảng để tối ưu trải nghiệm và mở rộng dịch vụ đăng ký như YouTube Premium.
(CLO) Google Maps đã đổi tên Vịnh Mexico thành 'Vịnh Châu Mỹ' theo quyết định của chính quyền Trump, gây tranh cãi và ảnh hưởng đến cách hiển thị bản đồ tại Hoa Kỳ và thế giới.
(CLO) Hướng dẫn cách hợp nhất Cài đặt nhanh và thông báo trên One UI 7, giúp bạn truy cập nhanh hơn và tùy chỉnh giao diện dễ dàng trên thiết bị Samsung Galaxy.
(CLO) WhatsApp sắp cho phép người dùng liên kết tài khoản mạng xã hội vào hồ sơ cá nhân, giúp tăng khả năng kết nối và tương tác. Tính năng này hiện đang được thử nghiệm.
(CLO) Lừa đảo qua Gmail ngày càng tinh vi với sự hỗ trợ của AI. Bài viết hướng dẫn cách nhận diện email lừa đảo, bảo vệ tài khoản và ngăn chặn tấn công phishing hiệu quả.
(CLO) YouTube đẩy mạnh AI với các tính năng mới như lồng tiếng tự động, nhận dạng độ tuổi và kiểm soát nội dung AI, giúp sáng tạo video dễ dàng và nâng cao trải nghiệm người dùng.
(CLO) Pixel 9a lộ diện với thiết kế mới loại bỏ thanh camera biểu tượng bổ sung cụm camera kép và bốn màu sắc độc đáo, hứa hẹn nâng tầm trải nghiệm smartphone tầm trung.