(CLO) Google vừa ra mắt công cụ trí tuệ nhân tạo (AI) mới mang tên "Whisk", cho phép người dùng tải ảnh lên để lấy lại hình ảnh kết hợp do AI tạo ra, ngay cả khi người dùng không nhập bất kỳ văn bản nào.
Whisk sử dụng AI để kết hợp chủ thể, bối cảnh và phong cách của bức ảnh được tải lên, từ đó tạo ra một hình ảnh mới lạ và độc đáo hơn.
Whisk được Google mô tả là một "công cụ sáng tạo", giúp người dùng nhanh chóng tạo ra những ý tưởng hình ảnh mới mà không yêu cầu kỹ năng chỉnh sửa ảnh chuyên nghiệp. Theo Google, công cụ này không phải là một trình chỉnh sửa hình ảnh truyền thống, mà là một công cụ AI thú vị nhằm khơi dậy sự sáng tạo và khám phá nhanh chóng.
Khi người dùng tải lên một bức ảnh, Whisk sẽ sử dụng kết hợp dịch vụ AI của Google, Gemini, với công nghệ Imagen 3 – một công cụ tạo hình ảnh từ văn bản mà Google mua lại từ DeepMind.
Gemini sẽ phân tích bức ảnh và tạo ra một chú thích, sau đó Imagen 3 sẽ kết hợp các yếu tố của bức ảnh đó theo cách sáng tạo, giữ lại "bản chất" của chủ thể thay vì sao chép chính xác.
Giao diện công cụ Whisk. Ảnh chụp màn hình
Điều này có nghĩa là kết quả cuối cùng có thể không giống 100% với hình ảnh gốc. Ví dụ, chiều cao, kiểu tóc hoặc tông màu da của các đối tượng trong hình ảnh mới có thể khác với bản gốc. Mặc dù vậy, người dùng vẫn có thể điều chỉnh các thông tin đầu vào, thay đổi bối cảnh, phong cách hoặc phối hợp nhiều chủ đề để tạo ra những hình ảnh khác nhau.
Whisk có thể tạo ra những hình ảnh không chỉ từ văn bản mà còn từ hình ảnh gốc, mở rộng khả năng sáng tạo mà không yêu cầu người dùng phải có kinh nghiệm chỉnh sửa ảnh. Thomas Iljic, giám đốc quản lý sản phẩm tại Google Labs, cho biết: "Whisk được thiết kế để giúp người dùng phối lại chủ thể, bối cảnh và phong cách theo cách sáng tạo, giúp họ khám phá trực quan thay vì chỉnh sửa từng pixel một cách tỉ mỉ".
Mặc dù Whisk đang trong giai đoạn phát triển ban đầu, công cụ này đã được ra mắt dưới dạng trang web trên Google Labs và hiện có sẵn cho người dùng ở Mỹ.
Dan Ives, giám đốc điều hành và nhà phân tích cấp cao tại Wedbush Securities, cho biết Whisk đánh dấu "khoảnh khắc phô trương sức mạnh" khác của Google trong cuộc đua công nghệ.
Ives cũng lưu ý rằng DeepMind, phòng thí nghiệm AI mà Google mua lại vào năm 2014, là một tài sản quan trọng giúp Google duy trì vị thế trong lĩnh vực AI. Các sản phẩm AI, bao gồm Whisk, là một phần quan trọng trong chiến lược phát triển sản phẩm của Google trong những năm tới, với nhiều sản phẩm mới dự kiến ra mắt vào năm 2025.
Công cụ Whisk mở ra hướng đi mới trong việc sử dụng AI để tạo ra những sản phẩm sáng tạo mà không cần nhiều can thiệp từ người dùng. Điều này cho thấy sự tiến bộ của AI trong việc hiểu và phối hợp các yếu tố hình ảnh một cách sáng tạo.
Whisk là một phần trong xu hướng mạnh mẽ của các công ty công nghệ lớn, bao gồm Google và OpenAI, trong việc phát triển các công cụ AI phục vụ cho người tiêu dùng. Những công cụ này nhằm mang lại trải nghiệm sáng tạo mới mẻ, từ việc tạo hình ảnh, văn bản, cho đến video. Mới đây, OpenAI cũng đã giới thiệu một công cụ tạo video từ văn bản có tên là Sora, cạnh tranh trực tiếp với Whisk.
(CLO) Công an tỉnh Bạc Liêu vừa ra quyết định xử phạt hành chính đối với Võ Minh Trung (sinh năm 1990, trú tại xã Long Hòa, huyện Bình Đại, tỉnh Bến Tre) vì hành vi sử dụng mạng xã hội đăng tải thông tin sai sự thật, xúc phạm uy tín khu di tích lịch sử – văn hóa Nhà công tử Bạc Liêu.
(CLO) Ngày 4/4 tại Hà Nội, Bộ Văn hóa, Thể thao và Du lịch đã tổ chức Hội thảo lấy ý kiến góp ý cho Dự thảo Nghị định quy định về khuyến khích phát triển văn học Việt Nam.
(CLO) Liên minh Tự do Dân sự Mới (NCLA) - một nhóm luật sư bảo thủ tại Mỹ - đã đệ đơn kiện nhằm ngăn chặn việc Tổng thống Donald Trump áp thuế đối với hàng nhập khẩu, với lý do ông đã vượt quá thẩm quyền của mình.
(CLO) Taliban đang điều tra lời khẳng định của một cụ ông người Afghanistan rằng cụ đã… 140 tuổi. Nếu được xác minh, cụ sẽ trở thành người già nhất thế giới.
(CLO) Việt Nam vẫn chưa có chính sách bảo vệ người thuê nhà. Đa số các hợp đồng thuê ở Việt Nam đều có thời hạn ngắn (6-12 tháng) và không có ràng buộc về điều kiện và mức tăng giá.
(CLO) Dragon Capital cho rằng: Việc các mức thuế 46% có được duy trì hay không có thể phụ thuộc vào khả năng của Việt Nam trong việc giảm thiểu hiệu quả các vấn đề trung chuyển hàng hoá.
(CLO) Một YouTuber người Mỹ vừa bị bắt ở Ấn Độ vì cố tình đột nhập để quay video về nơi sinh sống của một trong những bộ tộc biệt lập nhất thế giới trên đảo Bắc Sentinel.
(CLO) Sau 90 phút thi đấu đầy kịch tính và hấp dẫn, đội tuyển U17 Việt Nam có kết quả hoà với tỷ số 1-1 trước U17 Australia ở trận ra quân tại vòng chung kết (VCK) U17 châu Á 2025.
(CLO) Dịp nghỉ lễ 30/4 và 1/5 năm nay nghỉ dài 5 ngày nên tỉnh Lào Cai đã chỉ đạo tổ chức nhiều hoạt động văn hóa nghệ thuật và vui chơi giải trí phục vụ du khách tới thăm địa phương trong dịp này.
(CLO) Quang Linh Vlogs, Hằng Du Mục và 3 người khác đã bị Cơ quan Cảnh sát điều tra Bộ Công an khởi tố, bắt tạm giam do có dấu hiệu tội phạm sản xuất hàng giả là thực phẩm và lừa dối khách hàng. Vậy khung hình phạt tối đa mà các đối tượng có thể đối diện là gì?
(CLO) Ngày 4/4, Ban Thường trực Ủy ban Trung ương Mặt trận Tổ quốc Việt Nam đã ban hành Quyết định về việc cho thôi Ủy viên Ủy ban Trung ương Mặt trận Tổ quốc Việt Nam khóa X, nhiệm kỳ 2024 - 2029 đối với ông Phạm Quang Linh (Quang Linh Vlogs), người Việt Nam ở Angola.
(CLO) Các đơn vị kinh doanh vận tải, bến xe thực hiện công khai, minh bạch và đúng quy định về giá cước vận tải; phục vụ tốt nhu cầu đi lại của người dân dịp nghỉ lễ Giỗ Tổ Hùng Vương và 30/4 - 1/5.
(CLO) Một YouTuber người Mỹ vừa bị bắt ở Ấn Độ vì cố tình đột nhập để quay video về nơi sinh sống của một trong những bộ tộc biệt lập nhất thế giới trên đảo Bắc Sentinel.
(CLO) Trong một bước ngoặt làm chấn động giới công nghệ, hai mô hình AI hàng đầu thế giới là GPT-4.5 của OpenAI và Llama-3.1 của Meta đã chính thức vượt qua bài kiểm tra Turing - thử thách kinh điển được nhà toán học Alan Turing đề xuất từ năm 1950.
(CLO) Tổng thống Mỹ Donald Trump vừa công bố một loạt thuế quan mới, gây ra nhiều tranh cãi về công thức tính toán và mục tiêu kinh tế đằng sau quyết định này.
(CLO) Giữa những đồn điền cọ bạt ngàn tại vùng nông thôn Malaysia, những tòa nhà khổng lồ phủ đầy tấm pin mặt trời, hoạt động không ngừng nghỉ để phục vụ cho cuộc cách mạng trí tuệ nhân tạo toàn cầu.
(CLO) Hôm 3/4, cổ phiếu các công ty công nghệ như Apple đã giảm mạnh sau khi Tổng thống Mỹ Donald Trump công bố các mức thuế mới đối với các nước được ví như "công xưởng thế giới".
(CLO) Báo chí trên mạng xã hội không chỉ là xu hướng mà đã trở thành điều tất yếu, đòi hỏi cách đưa tin ngắn gọn, trực quan và phù hợp với thói quen người dùng.
(CLO) Cơn sốt tạo ảnh nghệ thuật theo phong cách Ghibli bằng công cụ tạo ảnh của ChatGPT đã dẫn đến sự gia tăng kỷ lục số lượng người dùng chatbot của OpenAI vào tuần trước, gây áp lực lên máy chủ và làm dấy lên quan ngại về vi phạm bản quyền.