Alibaba giảm tới 82% số lượng chip Nvidia trong vận hành mô hình AI

(CLO) Alibaba Group Holding vừa giới thiệu một giải pháp giúp cắt giảm 82% số lượng chip xử lý đồ họa (GPU) của Nvidia để vận hành các mô hình trí tuệ nhân tạo.

Hệ thống này, có tên là Aegaeon, đã được thử nghiệm bản beta trên chợ mô hình của Alibaba Cloud trong hơn ba tháng. Theo một bài nghiên cứu được trình bày tại Hội nghị chuyên đề lần thứ 31 về Nguyên tắc Hệ điều hành (SOSP) ở Hàn Quốc hệ thống đã giảm số lượng GPU Nvidia H20 cần thiết để vận hành hàng chục mô hình lên đến 72 tỷ tham số từ 1.192 xuống còn 213 chip.

"Công trình Aegai là nghiên cứu đầu tiên chỉ ra chi phí quá mức liên quan đến việc cùng lúc vận hành nhiều khối lượng công việc LLM trên thị trường", nhóm nghiên cứu từ Đại học Bắc Kinh và Alibaba Cloud cho biết.

Các nhà nghiên cứu phát hiện rằng, 17,7% số GPU được cấp phát chỉ để phục vụ cho 1,35% số yêu cầu trên chợ của Alibaba Cloud.

Screenshot 2025-10-18 at 10.46.54
Ảnh đồ hoạ cờ Mỹ, Trung Quốc cạnh chipset. Ảnh: SCMP

Các nhà nghiên cứu trên toàn cầu đã tìm cách cải thiện hiệu suất bằng phương pháp gộp chung sức mạnh GPU, cho phép một GPU có thể phục vụ nhiều mô hình.

Với Aegaeon, các nhà nghiên cứu đã thiết kế một giải pháp thực hiện "tự động mở rộng thu hẹp" (auto-scaling) ở cấp độ token, nghĩa là một GPU có thể chuyển đổi giữa việc phục vụ các mô hình khác nhau ngay trong lúc đang tạo ra token - đơn vị dữ liệu cơ bản được xử lý bởi các hệ thống AI.

Giải pháp này cho phép một GPU duy nhất hỗ trợ tối đa bảy mô hình, so với mức tối đa hai hoặc ba mô hình trong các hệ thống thay thế khác, và cắt giảm 97% độ trễ (latency) liên quan đến việc chuyển đổi giữa các mô hình.

Tập đoàn sản xuất chip khổng lồ của Mỹ, Nvidia, từng phát triển GPU H20, một loại chip đặc biệt phù hợp cho suy luận mô hình, dành riêng cho thị trường Trung Quốc để đáp ứng các lệnh kiểm soát xuất khẩu từ thời chính quyền Tổng thống Biden.

Tuy nhiên, con chip này sau đó đã bị các cơ quan quản lý Trung Quốc điều tra về những cáo buộc liên quan đến rủi ro bảo mật "cửa hậu" (backdoor).

Đồng thời, các nhà thiết kế chip lớn của Trung Quốc, như Huawei Technologies và Cambricon Technologies, cũng đã tăng cường nỗ lực phát triển GPU nội địa để đáp ứng chiến lược tự chủ của chính phủ.

Đầu tháng này, nhà sáng lập kiêm Giám đốc điều hành của Nvidia, ông Jensen Huang, cho biết vị thế của công ty trên thị trường chip cao cấp ở Trung Quốc đã giảm xuống mức "0".

Xem thêm

Ngày càng nhiều nước siết quyền truy cập mạng xã hội của trẻ em

Ngày càng nhiều nước siết quyền truy cập mạng xã hội của trẻ em

(CLO) Úc là quốc gia đầu tiên trên thế giới ban hành lệnh cấm trẻ em dưới 16 tuổi sử dụng mạng xã hội, đánh dấu xu hướng ngày càng nhiều nước tìm cách hạn chế quyền truy cập của trẻ vị thành niên vào các nền tảng trực tuyến do lo ngại về sức khỏe tâm thần, an toàn và tác động lâu dài đối với sự phát triển của trẻ.

Nvidia bắt tay các 'ông lớn' của Hàn Quốc xây dựng trung tâm dữ liệu AI

Nvidia bắt tay các 'ông lớn' của Hàn Quốc xây dựng trung tâm dữ liệu AI

(CLO) Nvidia ngày 8/6 công bố hàng loạt thỏa thuận hợp tác với các tập đoàn hàng đầu Hàn Quốc gồm SK Hynix, Naver và Doosan nhằm phát triển các trung tâm dữ liệu trí tuệ nhân tạo (AI) và mở rộng việc ứng dụng công nghệ của hãng, trong bối cảnh làn sóng đầu tư AI trên toàn cầu tiếp tục tăng tốc.

Thái Lan kiện Facebook vì các vụ lừa đảo trực tuyến

Thái Lan kiện Facebook vì các vụ lừa đảo trực tuyến

(CLO) Hội đồng Bảo vệ Người tiêu dùng Thái Lan cho biết sẽ đệ đơn kiện Facebook trong tuần tới, đánh dấu vụ kiện đầu tiên tại nước này nhằm vào nền tảng mạng xã hội vì không bảo vệ đầy đủ người dùng trước các nội dung lừa đảo.

Anthropic được định giá 965 tỷ USD, vượt qua OpenAI

Anthropic được định giá 965 tỷ USD, vượt qua OpenAI

(CLO) Anthropic ngày 28/5 thông báo đã huy động được 65 tỷ USD trong vòng gọi vốn series H, qua đó nâng mức định giá sau đầu tư lên 965 tỷ USD. Động thái này giúp Anthropic vượt qua đối thủ OpenAI, công ty từng được định giá 852 tỷ USD hồi tháng 3.

CEO OpenAI: AI không gây ra 'thảm họa việc làm' như lo ngại

CEO OpenAI: AI không gây ra 'thảm họa việc làm' như lo ngại

(CLO) Giám đốc điều hành OpenAI, Sam Altman, cho biết sự phát triển nhanh chóng của trí tuệ nhân tạo không gây ra “thảm họa việc làm” toàn cầu như nhiều người từng lo ngại, đồng thời thừa nhận ông đã đánh giá quá cao tác động của AI đối với lao động văn phòng.

Mạng xã hội bị ví nguy hiểm ngang thuốc lá với trẻ em

Mạng xã hội bị ví nguy hiểm ngang thuốc lá với trẻ em

(CLO) Các bác sĩ hàng đầu tại Vương quốc Anh kêu gọi chính phủ siết chặt kiểm soát mạng xã hội đối với trẻ em, cho rằng tác động của việc sử dụng mạng xã hội quá mức hiện nguy hiểm tương đương thuốc lá.

Cỡ chữ bài viết: