Google ra mắt phiên bản cập nhật mô hình thử nghiệm Flash Thinking Gemini 2.0

(CLO) Google vừa phát hành phiên bản thử nghiệm Gemini 2.0 Flash Thinking với nhiều cải tiến, bao gồm cửa sổ ngữ cảnh 1 triệu mã thông báo, hỗ trợ mã gốc và hiệu suất vượt trội.

Vào tháng 12 năm ngoái, Google đã công bố mô hình lý luận đầu tiên của mình, Gemini 2.0 Flash Thinking. Mới đây, phiên bản thử nghiệm cập nhật của mô hình này đã chính thức được phát hành và hiện đã có sẵn để người dùng thử nghiệm.

google ra mat phien ban cap nhat mo hinh thu nghiem flash thinking gemini 20 hinh 1

Gemini 2.0 Flash Thinking.

Mô hình Gemini 2.0 Flash Thinking được xây dựng trên nền tảng của Gemini 2.0 Flash, đã được công bố vào đầu tháng 12. Phiên bản này được thiết kế nhằm "hiển thị rõ ràng suy nghĩ của nó", tương tự như trong AI Studio, với mục tiêu cải thiện hiệu suất suy luận và khả năng giải quyết các vấn đề phức tạp hơn. Nó kết hợp giữa hai mô hình: gemini-2.0-flash-exp và gemini-exp-1206.

google ra mat phien ban cap nhat mo hinh thu nghiem flash thinking gemini 20 hinh 2

Ngày 21 tháng 1, Google chính thức phát hành Gemini 2.0 Flash Thinking Experimental phiên bản 01-21. Điều đáng chú ý trong phiên bản mới này là cách đặt tên mô hình của Google, với dấu gạch nối giữa tháng và ngày là một điểm nhấn mới trong hệ thống đặt tên. Các tính năng nổi bật của phiên bản cập nhật bao gồm:

Cửa sổ ngữ cảnh 1 triệu mã thông báo (từ 32k): Tính năng này giúp người dùng có thể dễ dàng "cắm vào cơ sở mã hoặc truy vấn một tập hợp các bài báo có lý luận phức tạp hơn."Hỗ trợ thực thi mã gốc: Cải thiện việc sử dụng công cụ và tích hợp mã gốc.Tạo mã thông báo đầu ra dài hơn: Mô hình có khả năng tạo ra các chuỗi văn bản dài hơn, phục vụ cho các ứng dụng phức tạp.Mâu thuẫn mô hình ít hơn: Phiên bản mới giảm thiểu khả năng xảy ra mâu thuẫn giữa suy nghĩ và câu trả lời, giúp tăng tính chính xác và hiệu quả của mô hình.So với phiên bản thử nghiệm Exp 1219, Gemini 2.0 Flash Thinking Experimental 01-21 có hiệu suất vượt trội hơn trong các chuẩn mực toán học, khoa học và lý luận đa phương thức. Cụ thể, mô hình đạt 73,3% trong chuẩn mực AIME2024 (Toán học) và 74,2% trong chuẩn mực GPQA Diamond (Khoa học).

google ra mat phien ban cap nhat mo hinh thu nghiem flash thinking gemini 20 hinh 3

Demis Hassabis, Tổng giám đốc điều hành DeepMind, đã chia sẻ: “Điều này thể hiện sự tiến triển cực nhanh kể từ bản phát hành đầu tiên của chúng tôi vào tháng 12 vừa qua.” Ông cũng nhấn mạnh: “Chúng tôi đã tiên phong trong các hệ thống lập kế hoạch kiểu này trong hơn một thập kỷ, bắt đầu với các chương trình như AlphaGo, và thật thú vị khi thấy sự kết hợp mạnh mẽ của những ý tưởng này với các mô hình nền tảng có khả năng nhất.”

google ra mat phien ban cap nhat mo hinh thu nghiem flash thinking gemini 20 hinh 4

Phiên bản thử nghiệm Gemini 2.0 Flash Thinking Experimental hiện có sẵn miễn phí để thử nghiệm trong Google AI Studio và thông qua API. Sundar Pichai, CEO của Google, cho biết: “Tiến trình mở rộng tư duy là đáng kinh ngạc và sẽ tiếp tục lặp lại, với nhiều điều hơn nữa sẽ đến trong tương lai.”

Ngoài ra, vào đầu tháng này, Google cũng đã cập nhật giao diện người dùng di động cho AI Studio, mang đến trải nghiệm người dùng mượt mà và thuận tiện hơn.

Hùng Nguyễn (Theo 9to5google)

Xem thêm

Ngày càng nhiều nước siết quyền truy cập mạng xã hội của trẻ em

Ngày càng nhiều nước siết quyền truy cập mạng xã hội của trẻ em

(CLO) Úc là quốc gia đầu tiên trên thế giới ban hành lệnh cấm trẻ em dưới 16 tuổi sử dụng mạng xã hội, đánh dấu xu hướng ngày càng nhiều nước tìm cách hạn chế quyền truy cập của trẻ vị thành niên vào các nền tảng trực tuyến do lo ngại về sức khỏe tâm thần, an toàn và tác động lâu dài đối với sự phát triển của trẻ.

Nvidia bắt tay các 'ông lớn' của Hàn Quốc xây dựng trung tâm dữ liệu AI

Nvidia bắt tay các 'ông lớn' của Hàn Quốc xây dựng trung tâm dữ liệu AI

(CLO) Nvidia ngày 8/6 công bố hàng loạt thỏa thuận hợp tác với các tập đoàn hàng đầu Hàn Quốc gồm SK Hynix, Naver và Doosan nhằm phát triển các trung tâm dữ liệu trí tuệ nhân tạo (AI) và mở rộng việc ứng dụng công nghệ của hãng, trong bối cảnh làn sóng đầu tư AI trên toàn cầu tiếp tục tăng tốc.

Thái Lan kiện Facebook vì các vụ lừa đảo trực tuyến

Thái Lan kiện Facebook vì các vụ lừa đảo trực tuyến

(CLO) Hội đồng Bảo vệ Người tiêu dùng Thái Lan cho biết sẽ đệ đơn kiện Facebook trong tuần tới, đánh dấu vụ kiện đầu tiên tại nước này nhằm vào nền tảng mạng xã hội vì không bảo vệ đầy đủ người dùng trước các nội dung lừa đảo.

Anthropic được định giá 965 tỷ USD, vượt qua OpenAI

Anthropic được định giá 965 tỷ USD, vượt qua OpenAI

(CLO) Anthropic ngày 28/5 thông báo đã huy động được 65 tỷ USD trong vòng gọi vốn series H, qua đó nâng mức định giá sau đầu tư lên 965 tỷ USD. Động thái này giúp Anthropic vượt qua đối thủ OpenAI, công ty từng được định giá 852 tỷ USD hồi tháng 3.

CEO OpenAI: AI không gây ra 'thảm họa việc làm' như lo ngại

CEO OpenAI: AI không gây ra 'thảm họa việc làm' như lo ngại

(CLO) Giám đốc điều hành OpenAI, Sam Altman, cho biết sự phát triển nhanh chóng của trí tuệ nhân tạo không gây ra “thảm họa việc làm” toàn cầu như nhiều người từng lo ngại, đồng thời thừa nhận ông đã đánh giá quá cao tác động của AI đối với lao động văn phòng.

Mạng xã hội bị ví nguy hiểm ngang thuốc lá với trẻ em

Mạng xã hội bị ví nguy hiểm ngang thuốc lá với trẻ em

(CLO) Các bác sĩ hàng đầu tại Vương quốc Anh kêu gọi chính phủ siết chặt kiểm soát mạng xã hội đối với trẻ em, cho rằng tác động của việc sử dụng mạng xã hội quá mức hiện nguy hiểm tương đương thuốc lá.

Cỡ chữ bài viết: