Alibaba giảm tới 82% số lượng chip Nvidia trong vận hành mô hình AI

Cao Phong (theo Reuters, SCMP)

18/10/2025 12:14

(CLO) Alibaba Group Holding vừa giới thiệu một giải pháp giúp cắt giảm 82% số lượng chip xử lý đồ họa (GPU) của Nvidia để vận hành các mô hình trí tuệ nhân tạo.

Hệ thống này, có tên là Aegaeon, đã được thử nghiệm bản beta trên chợ mô hình của Alibaba Cloud trong hơn ba tháng. Theo một bài nghiên cứu được trình bày tại Hội nghị chuyên đề lần thứ 31 về Nguyên tắc Hệ điều hành (SOSP) ở Hàn Quốc hệ thống đã giảm số lượng GPU Nvidia H20 cần thiết để vận hành hàng chục mô hình lên đến 72 tỷ tham số từ 1.192 xuống còn 213 chip.

"Công trình Aegai là nghiên cứu đầu tiên chỉ ra chi phí quá mức liên quan đến việc cùng lúc vận hành nhiều khối lượng công việc LLM trên thị trường", nhóm nghiên cứu từ Đại học Bắc Kinh và Alibaba Cloud cho biết.

Các nhà nghiên cứu phát hiện rằng, 17,7% số GPU được cấp phát chỉ để phục vụ cho 1,35% số yêu cầu trên chợ của Alibaba Cloud.

Screenshot 2025-10-18 at 10.46.54 — Ảnh đồ hoạ cờ Mỹ, Trung Quốc cạnh chipset. Ảnh: SCMP

Các nhà nghiên cứu trên toàn cầu đã tìm cách cải thiện hiệu suất bằng phương pháp gộp chung sức mạnh GPU, cho phép một GPU có thể phục vụ nhiều mô hình.

Với Aegaeon, các nhà nghiên cứu đã thiết kế một giải pháp thực hiện "tự động mở rộng thu hẹp" (auto-scaling) ở cấp độ token, nghĩa là một GPU có thể chuyển đổi giữa việc phục vụ các mô hình khác nhau ngay trong lúc đang tạo ra token - đơn vị dữ liệu cơ bản được xử lý bởi các hệ thống AI.

Giải pháp này cho phép một GPU duy nhất hỗ trợ tối đa bảy mô hình, so với mức tối đa hai hoặc ba mô hình trong các hệ thống thay thế khác, và cắt giảm 97% độ trễ (latency) liên quan đến việc chuyển đổi giữa các mô hình.

Tập đoàn sản xuất chip khổng lồ của Mỹ, Nvidia, từng phát triển GPU H20, một loại chip đặc biệt phù hợp cho suy luận mô hình, dành riêng cho thị trường Trung Quốc để đáp ứng các lệnh kiểm soát xuất khẩu từ thời chính quyền Tổng thống Biden.

Tuy nhiên, con chip này sau đó đã bị các cơ quan quản lý Trung Quốc điều tra về những cáo buộc liên quan đến rủi ro bảo mật "cửa hậu" (backdoor).

Đồng thời, các nhà thiết kế chip lớn của Trung Quốc, như Huawei Technologies và Cambricon Technologies, cũng đã tăng cường nỗ lực phát triển GPU nội địa để đáp ứng chiến lược tự chủ của chính phủ.

Đầu tháng này, nhà sáng lập kiêm Giám đốc điều hành của Nvidia, ông Jensen Huang, cho biết vị thế của công ty trên thị trường chip cao cấp ở Trung Quốc đã giảm xuống mức "0".

Từ khóa :

#Alibaba Cloud #GPU #Nvidia #trí tuệ nhân tạo

Có thể bạn quan tâm

Google Earth dừng công cụ AI tạo ảnh chỉ một ngày sau khi ra mắt

Tòa án Đức phán quyết công ty nhạc AI Suno vi phạm bản quyền

Anthropic thừa nhận AI Claude tự ý tấn công hệ thống của 3 công ty

CEO Meta dự báo hàng tỷ người sẽ có trợ lý AI cá nhân trong 5 năm tới

Google đối mặt làn sóng kiện đòi bồi thường đến chục tỷ USD

Xem thêm

28/07/2026 15:51

Nữ nghị sĩ Anh kiện xAI vì Grok tạo ảnh khiêu dâm giả mạo

(CLO) Một nữ nghị sĩ Anh đã đệ đơn kiện công ty xAI của tỷ phú Elon Musk, cáo buộc chatbot Grok tạo ra các hình ảnh giả mạo mang tính tình dục hóa về bà mà không có sự đồng ý.

28/07/2026 12:01

Microsoft cho ra mắt mô hình AI an ninh mạng đầu tiên, tuyên bố vượt OpenAI và Google

(CLO) Microsoft vừa cho ra mắt MAI-Cyber-1-Flash, mô hình AI chuyên về an ninh mạng đầu tiên của hãng, đồng thời công bố nền tảng bảo mật AI mới mang tên Perception tại một sự kiện ở San Francisco, Mỹ ngày 27/7.

24/07/2026 18:14

EU cáo buộc TikTok vi phạm quy định bảo vệ trẻ em, đối mặt nguy cơ bị phạt nặng

(CLO) Ủy ban châu Âu ngày 24/7 đưa ra kết luận sơ bộ cáo buộc TikTok vi phạm các quy định của Đạo luật Dịch vụ Kỹ thuật số (DSA), cho rằng một số tính năng thiết kế của nền tảng có thể khiến trẻ em dễ trở thành mục tiêu của kẻ xấu hoặc bị bắt nạt trên mạng.

23/07/2026 18:58

Google lại bị phạt 1 tỷ USD vì độc quyền

(CLO) Ủy ban châu Âu ngày 23/7 thông báo phạt Google 890 triệu euro (khoảng 1 tỷ USD) vì vi phạm Đạo luật Thị trường Kỹ thuật số (DMA), cáo buộc hãng công nghệ Mỹ lạm dụng vị thế thống lĩnh để ưu tiên các dịch vụ của mình và gây bất lợi cho đối thủ.

23/07/2026 16:03

Google Cloud tăng trưởng bùng nổ nhờ AI

(CLO) Alphabet, công ty mẹ của Google, vừa công bố báo cáo thu nhập mới nhất cho thấy sự tăng trưởng mạnh mẽ, phần nào giải tỏa nỗi lo của các nhà đầu tư về việc liệu những khoản chi tiêu khổng lồ cho trí tuệ nhân tạo (AI) có thực sự mang lại lợi ích hay không.

22/07/2026 21:21

Doanh nghiệp Việt muốn bứt phá phải biết dùng AI, không thể mãi cạnh tranh bằng giá

(CLO) Trong kỷ nguyên AI, lợi thế của doanh nghiệp không còn nằm ở quy mô hay giá bán mà ở khả năng đổi mới sáng tạo, tạo ra giá trị khác biệt và thấu hiểu khách hàng. Đây là nhận định được các chuyên gia đưa ra tại Diễn đàn Chiến lược Kinh doanh "The Future of Business" diễn ra tại TP.HCM chiều 22/7.

22/07/2026 19:07

AI của OpenAI bất ngờ vượt kiểm soát, tấn công hệ thống đối thủ

(CLO) OpenAI, công ty phát triển ChatGPT, cho biết hai mô hình trí tuệ nhân tạo tiên tiến nhất của hãng đã vượt khỏi môi trường thử nghiệm trong một cuộc diễn tập an ninh mạng nội bộ và thực hiện cuộc tấn công vào hệ thống của công ty AI Hugging Face.

22/07/2026 09:53

Pháp trở thành quốc gia EU đầu tiên cấm trẻ dưới 15 tuổi dùng mạng xã hội

(CLO) Pháp vừa trở thành quốc gia đầu tiên trong Liên minh châu Âu (EU) thông qua luật cấm trẻ em dưới 15 tuổi sử dụng mạng xã hội.

22/07/2026 07:07

Trung Quốc phát triển AI 'đọc' dark web, phát hiện nội dung phạm pháp

(CLO) Các nhà nghiên cứu thuộc Đại học Cảnh sát Điều tra Hình sự Trung Quốc đã phát triển một hệ thống trí tuệ nhân tạo (AI) có khả năng thu thập và phân tích nội dung trên dark web bằng tiếng Trung, nhằm hỗ trợ phát hiện các hoạt động phạm pháp trên không gian mạng.

21/07/2026 20:33

Pháp bỏ phiếu cấm trẻ dưới 15 tuổi dùng mạng xã hội

(CLO) Quốc hội Pháp dự kiến bỏ phiếu vào ngày 21/7 đối với dự luật cấm trẻ em dưới 15 tuổi sử dụng mạng xã hội.

20/07/2026 18:57

Meta hầu tòa vì cáo buộc Instagram gây nghiện

(CLO) Meta Platforms sẽ phải hầu tòa tại bang Tennessee (Mỹ) vào ngày 20/7 để đối mặt với cáo buộc Instagram được thiết kế theo cách "gây nghiện" cho thanh thiếu niên, làm trầm trọng thêm cuộc khủng hoảng sức khỏe tâm thần ở giới trẻ.

16/07/2026 19:52

Google thua kiện vụ quảng cáo cờ bạc trên YouTube

(CLO) Google đã thất bại trong nỗ lực hủy khoản phạt 750.000 euro liên quan đến các video quảng cáo cờ bạc trên nền tảng YouTube, sau khi Tòa án Công lý Liên minh châu Âu (CJEU) ra phán quyết có lợi cho cơ quan quản lý truyền thông của Ý.

15/07/2026 15:39

Google bị kiện với cáo buộc dùng sách có bản quyền để huấn luyện AI

(CLO) Một nhóm các nhà xuất bản và tác giả mới đây đã đệ đơn kiện tập thể nhằm vào Google, cáo buộc tập đoàn công nghệ này sử dụng trái phép các tác phẩm có bản quyền để huấn luyện mô hình trí tuệ nhân tạo Gemini.

14/07/2026 11:12

Mạng xã hội X điều chỉnh thuật toán, giúp 'bạn bè' gắn kết hơn

(CLO) Giám đốc sản phẩm của mạng xã hội X, Nikita Bier, ngày 13/7 đã thông báo về một sự thay đổi quan trọng trong cách hiển thị nội dung trên nền tảng này nhằm mục đích tăng khả năng hiển thị các bài đăng từ những người dùng có mối quan hệ hai chiều, tức những tài khoản theo dõi lẫn nhau.

14/07/2026 06:48

EU đề xuất hạn chế trẻ em dùng mạng xã hội theo từng độ tuổi

(CLO) Liên minh châu Âu (EU) đang chuẩn bị ban hành quy định mới nhằm kiểm soát việc trẻ em sử dụng mạng xã hội, với định hướng tiếp cận theo từng độ tuổi thay vì cấm hoàn toàn.

13/07/2026 19:42

Mối nguy từ làn sóng dùng MC AI để phát tán thông tin sai lệch trên TikTok

(CLO) Cuộc điều tra của hãng tin CNA đã phát hiện mạng lưới hàng chục tài khoản TikTok sử dụng người dẫn chương trình (MC) do AI tạo ra để lan truyền thông tin sai lệch về Singapore và Malaysia, thu hút hơn 3 triệu lượt xem.

11/07/2026 08:14

Apple kiện OpenAI với cáo buộc đánh cắp bí mật thương mại

(CLO) Ngày 10/7, Apple đã đệ đơn kiện OpenAI cùng một số cựu nhân viên lên Tòa án Quận Bắc California (Mỹ), cáo buộc công ty này tiến hành một chiến dịch có hệ thống nhằm chiếm đoạt bí mật thương mại về phần cứng để phục vụ tham vọng phát triển thiết bị tiêu dùng.

11/07/2026 06:52

EU yêu cầu Meta thay đổi thiết kế Facebook, Instagram để người dùng giảm 'nghiện'

(CLO) Liên minh châu Âu (EU) ngày 10/7 công bố kết luận sơ bộ cho rằng Meta - công ty mẹ của Facebook và Instagram - có dấu hiệu vi phạm các quy định công nghệ của khối khi thiết kế nền tảng theo hướng khiến người dùng, đặc biệt là thanh thiếu niên, dễ bị "nghiện" mạng xã hội.

10/07/2026 10:16

OpenAI chính thức phát hành mô hình GPT-5.6 mới

(CLO) Ngày 9/7, OpenAI chính thức phát hành dòng mô hình GPT-5.6 gồm ba phiên bản Sol, Terra và Luna. Đây là lần đầu tiên công ty từ bỏ cách đặt tên bằng số để chuyển sang các tên gọi mới nhằm giúp người dùng dễ phân biệt cấp độ hiệu năng và chi phí giữa các mô hình.

09/07/2026 07:32

Châu Âu chạy đua phát triển robot AI, lo tụt hậu trước Mỹ và Trung Quốc

(CLO) Các doanh nghiệp công nghệ châu Âu đang tăng tốc đầu tư vào lĩnh vực AI vật lý (Physical AI) - công nghệ tích hợp trí tuệ nhân tạo vào robot và máy móc - nhằm thu hẹp khoảng cách với Mỹ và Trung Quốc.

Danh mục

Alibaba giảm tới 82% số lượng chip Nvidia trong vận hành mô hình AI

Từ khóa :

Đọc nhiều

Doanh nghiệp Việt muốn bứt phá phải biết dùng AI, không thể mãi cạnh tranh bằng giá

Google thua kiện vụ quảng cáo cờ bạc trên YouTube

Pháp bỏ phiếu cấm trẻ dưới 15 tuổi dùng mạng xã hội

Google đối mặt làn sóng kiện đòi bồi thường đến chục tỷ USD

Google bị kiện với cáo buộc dùng sách có bản quyền để huấn luyện AI

Có thể bạn quan tâm

Google Earth dừng công cụ AI tạo ảnh chỉ một ngày sau khi ra mắt

Tòa án Đức phán quyết công ty nhạc AI Suno vi phạm bản quyền

Anthropic thừa nhận AI Claude tự ý tấn công hệ thống của 3 công ty

CEO Meta dự báo hàng tỷ người sẽ có trợ lý AI cá nhân trong 5 năm tới

Google đối mặt làn sóng kiện đòi bồi thường đến chục tỷ USD

Xem thêm

Nữ nghị sĩ Anh kiện xAI vì Grok tạo ảnh khiêu dâm giả mạo

Microsoft cho ra mắt mô hình AI an ninh mạng đầu tiên, tuyên bố vượt OpenAI và Google

EU cáo buộc TikTok vi phạm quy định bảo vệ trẻ em, đối mặt nguy cơ bị phạt nặng

Google lại bị phạt 1 tỷ USD vì độc quyền

Google Cloud tăng trưởng bùng nổ nhờ AI

Doanh nghiệp Việt muốn bứt phá phải biết dùng AI, không thể mãi cạnh tranh bằng giá

AI của OpenAI bất ngờ vượt kiểm soát, tấn công hệ thống đối thủ

Pháp trở thành quốc gia EU đầu tiên cấm trẻ dưới 15 tuổi dùng mạng xã hội

Trung Quốc phát triển AI 'đọc' dark web, phát hiện nội dung phạm pháp

Pháp bỏ phiếu cấm trẻ dưới 15 tuổi dùng mạng xã hội

Meta hầu tòa vì cáo buộc Instagram gây nghiện

Google thua kiện vụ quảng cáo cờ bạc trên YouTube

Google bị kiện với cáo buộc dùng sách có bản quyền để huấn luyện AI

Mạng xã hội X điều chỉnh thuật toán, giúp 'bạn bè' gắn kết hơn

EU đề xuất hạn chế trẻ em dùng mạng xã hội theo từng độ tuổi

Mối nguy từ làn sóng dùng MC AI để phát tán thông tin sai lệch trên TikTok

Apple kiện OpenAI với cáo buộc đánh cắp bí mật thương mại

EU yêu cầu Meta thay đổi thiết kế Facebook, Instagram để người dùng giảm 'nghiện'

OpenAI chính thức phát hành mô hình GPT-5.6 mới

Châu Âu chạy đua phát triển robot AI, lo tụt hậu trước Mỹ và Trung Quốc

Alibaba giảm tới 82% số lượng chip Nvidia trong vận hành mô hình AI

Tin liên quan

Từ khóa :

Đọc nhiều