Mô hình AI Gemini triển khai tính năng quay camera và trả lời trực tiếp

(CLO) Google đã bắt đầu triển khai các tính năng AI mới cho Gemini Live, cho phép công nghệ này "nhìn" màn hình hoặc môi trường xung quanh thông qua camera điện thoại và đưa ra câu trả lời theo thời gian thực.

Alex Joseph, phát ngôn viên của Google, đã xác nhận thông tin này. Những tính năng này xuất hiện gần một năm sau khi Google lần đầu tiên giới thiệu dự án Project Astra, nền tảng công nghệ AI đứng sau sự phát triển của Gemini Live.

mo hinh ai gemini trien khai tinh nang quay camera va tra loi truc tiep hinh 1

Tính năng video AI thời gian thực của Gemini. Ảnh: chromeunboxed

Một người dùng Reddit cho biết tính năng mới đã xuất hiện trên điện thoại Xiaomi của mình. Trong một video đăng tải hôm nay, người dùng này đã trình diễn khả năng đọc màn hình mới của Gemini, một trong hai tính năng quan trọng mà Google thông báo sẽ triển khai vào cuối tháng 3 cho người đăng ký Gemini Advanced trong gói Google One AI Premium.

Tính năng quan trọng còn lại là video trực tiếp, cho phép Gemini phân tích luồng hình ảnh từ camera điện thoại và trả lời câu hỏi của người dùng theo thời gian thực. Trong một video demo mà Google công bố đầu tháng 3, một người dùng đã thử nghiệm tính năng này bằng cách yêu cầu Gemini tư vấn về màu sơn phù hợp cho sản phẩm gốm mới tráng men của họ.

Việc ra mắt các tính năng AI này cho thấy Google đang dẫn đầu trong cuộc đua phát triển trợ lý ảo thông minh.

Amazon đang chuẩn bị ra mắt Alexa Plus, nhưng hiện vẫn chỉ ở giai đoạn thử nghiệm sớm. Apple đã trì hoãn việc nâng cấp Siri, khiến trợ lý ảo này chưa thể cạnh tranh với Gemini. Samsung vẫn duy trì Bixby, nhưng trên thực tế, Gemini hiện là trợ lý mặc định trên các điện thoại Samsung mới nhất.

Tại sự kiện MWC 2025, Google đã cam kết tích hợp Project Astra vào Gemini Live và hiện đang triển khai theo từng giai đoạn. Trang tin 9to5Google cho biết đã phát hiện tính năng chia sẻ màn hình và camera bắt đầu xuất hiện trên một số thiết bị Android riêng lẻ.

Cùng với đó, khả năng phân tích video trực tiếp cũng được mở rộng. Người dùng có thể mở giao diện Gemini Live, khởi động luồng video trực tiếp, sau đó nhấn vào nút chuyển đổi camera ở góc phải để cho phép Gemini tương tác trực tiếp với môi trường xung quanh.

"Về cơ bản, tính năng này đang giúp Gemini có thể 'nhìn thấy' thế giới theo thời gian thực", một chuyên gia công nghệ nhận định.

Mặc dù Google chưa công bố danh sách thiết bị hỗ trợ cụ thể, nhưng trong tuyên bố hồi tháng 1, công ty cho biết các dòng Pixel và Galaxy S25 sẽ là những thiết bị ưu tiên nhận bản cập nhật Project Astra trước. Tuy nhiên, hiện không có giới hạn kỹ thuật nào khiến Astra phải bị giới hạn trên một số dòng máy cụ thể.

Trong thời gian tới, Google có thể mở rộng Gemini Live lên các thiết bị iOS, nhưng trước mắt, đây vẫn là tính năng độc quyền trên Android. Các chuyên gia đánh giá rằng Project Astra có thể thay đổi hoàn toàn cách con người tương tác với AI, mở ra một kỷ nguyên AI thời gian thực mạnh mẽ hơn.

Cao Phong (theo TheVerge, Google, 9to5Google)

Xem thêm

Ngày càng nhiều nước siết quyền truy cập mạng xã hội của trẻ em

Ngày càng nhiều nước siết quyền truy cập mạng xã hội của trẻ em

(CLO) Úc là quốc gia đầu tiên trên thế giới ban hành lệnh cấm trẻ em dưới 16 tuổi sử dụng mạng xã hội, đánh dấu xu hướng ngày càng nhiều nước tìm cách hạn chế quyền truy cập của trẻ vị thành niên vào các nền tảng trực tuyến do lo ngại về sức khỏe tâm thần, an toàn và tác động lâu dài đối với sự phát triển của trẻ.

Nvidia bắt tay các 'ông lớn' của Hàn Quốc xây dựng trung tâm dữ liệu AI

Nvidia bắt tay các 'ông lớn' của Hàn Quốc xây dựng trung tâm dữ liệu AI

(CLO) Nvidia ngày 8/6 công bố hàng loạt thỏa thuận hợp tác với các tập đoàn hàng đầu Hàn Quốc gồm SK Hynix, Naver và Doosan nhằm phát triển các trung tâm dữ liệu trí tuệ nhân tạo (AI) và mở rộng việc ứng dụng công nghệ của hãng, trong bối cảnh làn sóng đầu tư AI trên toàn cầu tiếp tục tăng tốc.

Thái Lan kiện Facebook vì các vụ lừa đảo trực tuyến

Thái Lan kiện Facebook vì các vụ lừa đảo trực tuyến

(CLO) Hội đồng Bảo vệ Người tiêu dùng Thái Lan cho biết sẽ đệ đơn kiện Facebook trong tuần tới, đánh dấu vụ kiện đầu tiên tại nước này nhằm vào nền tảng mạng xã hội vì không bảo vệ đầy đủ người dùng trước các nội dung lừa đảo.

Anthropic được định giá 965 tỷ USD, vượt qua OpenAI

Anthropic được định giá 965 tỷ USD, vượt qua OpenAI

(CLO) Anthropic ngày 28/5 thông báo đã huy động được 65 tỷ USD trong vòng gọi vốn series H, qua đó nâng mức định giá sau đầu tư lên 965 tỷ USD. Động thái này giúp Anthropic vượt qua đối thủ OpenAI, công ty từng được định giá 852 tỷ USD hồi tháng 3.

CEO OpenAI: AI không gây ra 'thảm họa việc làm' như lo ngại

CEO OpenAI: AI không gây ra 'thảm họa việc làm' như lo ngại

(CLO) Giám đốc điều hành OpenAI, Sam Altman, cho biết sự phát triển nhanh chóng của trí tuệ nhân tạo không gây ra “thảm họa việc làm” toàn cầu như nhiều người từng lo ngại, đồng thời thừa nhận ông đã đánh giá quá cao tác động của AI đối với lao động văn phòng.

Mạng xã hội bị ví nguy hiểm ngang thuốc lá với trẻ em

Mạng xã hội bị ví nguy hiểm ngang thuốc lá với trẻ em

(CLO) Các bác sĩ hàng đầu tại Vương quốc Anh kêu gọi chính phủ siết chặt kiểm soát mạng xã hội đối với trẻ em, cho rằng tác động của việc sử dụng mạng xã hội quá mức hiện nguy hiểm tương đương thuốc lá.

Cỡ chữ bài viết: