Google ra mắt công cụ tạo hình ảnh AI từ hình ảnh thật

(CLO) Google vừa ra mắt công cụ trí tuệ nhân tạo (AI) mới mang tên "Whisk", cho phép người dùng tải ảnh lên để lấy lại hình ảnh kết hợp do AI tạo ra, ngay cả khi người dùng không nhập bất kỳ văn bản nào.

Whisk sử dụng AI để kết hợp chủ thể, bối cảnh và phong cách của bức ảnh được tải lên, từ đó tạo ra một hình ảnh mới lạ và độc đáo hơn.

Whisk được Google mô tả là một "công cụ sáng tạo", giúp người dùng nhanh chóng tạo ra những ý tưởng hình ảnh mới mà không yêu cầu kỹ năng chỉnh sửa ảnh chuyên nghiệp. Theo Google, công cụ này không phải là một trình chỉnh sửa hình ảnh truyền thống, mà là một công cụ AI thú vị nhằm khơi dậy sự sáng tạo và khám phá nhanh chóng.

Khi người dùng tải lên một bức ảnh, Whisk sẽ sử dụng kết hợp dịch vụ AI của Google, Gemini, với công nghệ Imagen 3 – một công cụ tạo hình ảnh từ văn bản mà Google mua lại từ DeepMind.

Gemini sẽ phân tích bức ảnh và tạo ra một chú thích, sau đó Imagen 3 sẽ kết hợp các yếu tố của bức ảnh đó theo cách sáng tạo, giữ lại "bản chất" của chủ thể thay vì sao chép chính xác.

google ra mat cong cu tao hinh anh ai tu hinh anh that hinh 1

Giao diện công cụ Whisk. Ảnh chụp màn hình

Điều này có nghĩa là kết quả cuối cùng có thể không giống 100% với hình ảnh gốc. Ví dụ, chiều cao, kiểu tóc hoặc tông màu da của các đối tượng trong hình ảnh mới có thể khác với bản gốc. Mặc dù vậy, người dùng vẫn có thể điều chỉnh các thông tin đầu vào, thay đổi bối cảnh, phong cách hoặc phối hợp nhiều chủ đề để tạo ra những hình ảnh khác nhau.

Whisk có thể tạo ra những hình ảnh không chỉ từ văn bản mà còn từ hình ảnh gốc, mở rộng khả năng sáng tạo mà không yêu cầu người dùng phải có kinh nghiệm chỉnh sửa ảnh. Thomas Iljic, giám đốc quản lý sản phẩm tại Google Labs, cho biết: "Whisk được thiết kế để giúp người dùng phối lại chủ thể, bối cảnh và phong cách theo cách sáng tạo, giúp họ khám phá trực quan thay vì chỉnh sửa từng pixel một cách tỉ mỉ".

Mặc dù Whisk đang trong giai đoạn phát triển ban đầu, công cụ này đã được ra mắt dưới dạng trang web trên Google Labs và hiện có sẵn cho người dùng ở Mỹ.

Dan Ives, giám đốc điều hành và nhà phân tích cấp cao tại Wedbush Securities, cho biết Whisk đánh dấu "khoảnh khắc phô trương sức mạnh" khác của Google trong cuộc đua công nghệ.

Ives cũng lưu ý rằng DeepMind, phòng thí nghiệm AI mà Google mua lại vào năm 2014, là một tài sản quan trọng giúp Google duy trì vị thế trong lĩnh vực AI. Các sản phẩm AI, bao gồm Whisk, là một phần quan trọng trong chiến lược phát triển sản phẩm của Google trong những năm tới, với nhiều sản phẩm mới dự kiến ra mắt vào năm 2025.

Công cụ Whisk mở ra hướng đi mới trong việc sử dụng AI để tạo ra những sản phẩm sáng tạo mà không cần nhiều can thiệp từ người dùng. Điều này cho thấy sự tiến bộ của AI trong việc hiểu và phối hợp các yếu tố hình ảnh một cách sáng tạo. 

Whisk là một phần trong xu hướng mạnh mẽ của các công ty công nghệ lớn, bao gồm Google và OpenAI, trong việc phát triển các công cụ AI phục vụ cho người tiêu dùng. Những công cụ này nhằm mang lại trải nghiệm sáng tạo mới mẻ, từ việc tạo hình ảnh, văn bản, cho đến video. Mới đây, OpenAI cũng đã giới thiệu một công cụ tạo video từ văn bản có tên là Sora, cạnh tranh trực tiếp với Whisk.

Ngọc Ánh (theo CNN, The Verge, ZDNET)

Xem thêm

Ngày càng nhiều nước siết quyền truy cập mạng xã hội của trẻ em

Ngày càng nhiều nước siết quyền truy cập mạng xã hội của trẻ em

(CLO) Úc là quốc gia đầu tiên trên thế giới ban hành lệnh cấm trẻ em dưới 16 tuổi sử dụng mạng xã hội, đánh dấu xu hướng ngày càng nhiều nước tìm cách hạn chế quyền truy cập của trẻ vị thành niên vào các nền tảng trực tuyến do lo ngại về sức khỏe tâm thần, an toàn và tác động lâu dài đối với sự phát triển của trẻ.

Nvidia bắt tay các 'ông lớn' của Hàn Quốc xây dựng trung tâm dữ liệu AI

Nvidia bắt tay các 'ông lớn' của Hàn Quốc xây dựng trung tâm dữ liệu AI

(CLO) Nvidia ngày 8/6 công bố hàng loạt thỏa thuận hợp tác với các tập đoàn hàng đầu Hàn Quốc gồm SK Hynix, Naver và Doosan nhằm phát triển các trung tâm dữ liệu trí tuệ nhân tạo (AI) và mở rộng việc ứng dụng công nghệ của hãng, trong bối cảnh làn sóng đầu tư AI trên toàn cầu tiếp tục tăng tốc.

Thái Lan kiện Facebook vì các vụ lừa đảo trực tuyến

Thái Lan kiện Facebook vì các vụ lừa đảo trực tuyến

(CLO) Hội đồng Bảo vệ Người tiêu dùng Thái Lan cho biết sẽ đệ đơn kiện Facebook trong tuần tới, đánh dấu vụ kiện đầu tiên tại nước này nhằm vào nền tảng mạng xã hội vì không bảo vệ đầy đủ người dùng trước các nội dung lừa đảo.

Anthropic được định giá 965 tỷ USD, vượt qua OpenAI

Anthropic được định giá 965 tỷ USD, vượt qua OpenAI

(CLO) Anthropic ngày 28/5 thông báo đã huy động được 65 tỷ USD trong vòng gọi vốn series H, qua đó nâng mức định giá sau đầu tư lên 965 tỷ USD. Động thái này giúp Anthropic vượt qua đối thủ OpenAI, công ty từng được định giá 852 tỷ USD hồi tháng 3.

CEO OpenAI: AI không gây ra 'thảm họa việc làm' như lo ngại

CEO OpenAI: AI không gây ra 'thảm họa việc làm' như lo ngại

(CLO) Giám đốc điều hành OpenAI, Sam Altman, cho biết sự phát triển nhanh chóng của trí tuệ nhân tạo không gây ra “thảm họa việc làm” toàn cầu như nhiều người từng lo ngại, đồng thời thừa nhận ông đã đánh giá quá cao tác động của AI đối với lao động văn phòng.

Mạng xã hội bị ví nguy hiểm ngang thuốc lá với trẻ em

Mạng xã hội bị ví nguy hiểm ngang thuốc lá với trẻ em

(CLO) Các bác sĩ hàng đầu tại Vương quốc Anh kêu gọi chính phủ siết chặt kiểm soát mạng xã hội đối với trẻ em, cho rằng tác động của việc sử dụng mạng xã hội quá mức hiện nguy hiểm tương đương thuốc lá.

Cỡ chữ bài viết: