OpenAI ra mắt 'Operator' – AI Agent mới để tự động hóa tác vụ dựa trên web

26/01/2025 08:47

(CLO) OpenAI ra mắt Operator, AI Agent tự động hóa tác vụ web, giúp tiết kiệm thời gian bằng cách điền biểu mẫu, đặt hàng, và thực hiện nhiều tác vụ lặp lại.

Mới đây, OpenAI đã giới thiệu một công cụ mới mang tên Operator, một tác nhân hỗ trợ AI mạnh mẽ được thiết kế để tự động hóa các tác vụ dựa trên web. Với khả năng tương tác trực tiếp với các trang web thông qua trình duyệt tích hợp, Operator có thể thực hiện các thao tác như nhập liệu, nhấp chuột và cuộn trang, giúp người dùng tiết kiệm thời gian và tối ưu hóa công việc lặp đi lặp lại.

openai ra mat operator ai agent moi de tu dong hoa tac vu dua tren web hinh 1

Operator - Nguồn ảnh: Fone Arena.

Operator là gì?

Operator là một trong những “tác nhân” đầu tiên mà OpenAI phát triển, mang đến khả năng tự động thực hiện các tác vụ trên web theo chỉ dẫn của người dùng. Hiện tại, Operator đang trong giai đoạn xem trước nghiên cứu, và được kỳ vọng sẽ phát triển mạnh mẽ thông qua phản hồi từ người dùng. Theo OpenAI, công cụ này có thể xử lý các tác vụ phổ biến như điền biểu mẫu, đặt hàng tạp hóa hay thậm chí tạo meme, mang lại sự tiện lợi tối đa cho người sử dụng.

openai ra mat operator ai agent moi de tu dong hoa tac vu dua tren web hinh 2

“Operator có thể hoạt động trong giao diện mà người dùng thường xuyên tương tác, giúp tiết kiệm thời gian và tạo ra cơ hội tương tác kỹ thuật số hiệu quả hơn,” OpenAI cho biết.

Cách thức hoạt động của Operator

Được hỗ trợ bởi một mô hình mới mang tên Computer-Using Agent (CUA), Operator kết hợp khả năng thị giác của GPT-4 với khả năng suy luận nâng cao nhờ học tăng cường. Mô hình này giúp Operator có thể tương tác với các giao diện người dùng đồ họa (GUI), như các nút, menu và trường văn bản, bằng cách phân tích ảnh chụp màn hình và thực hiện các hành động giống như người dùng thực sự.

Trong trường hợp gặp phải thách thức, Operator sử dụng lý luận để tự sửa lỗi. Đối với những tác vụ phức tạp hơn, nó sẽ chuyển quyền kiểm soát lại cho người dùng, cho phép sự tương tác và hỗ trợ cộng tác. Theo các bài kiểm tra hiệu suất quan trọng như WebArena và WebVoyager, Operator đã đạt được các kết quả vượt trội trong việc hoàn thành các tác vụ trên web.

Các tính năng chính của Operator

1. Tự động hóa tác vụ: Tự động thực hiện các tác vụ lặp đi lặp lại như đặt hàng tạp hóa, điền biểu mẫu, và đặt dịch vụ.

2. Đa nhiệm: Operator có thể xử lý nhiều tác vụ cùng lúc, ví dụ như đặt vé máy bay trong khi mua sắm trực tuyến.

3. Tùy chỉnh: Cho phép người dùng cá nhân hóa hướng dẫn và quy trình công việc cho các trang web hoặc tác vụ cụ thể.

4. Lưu lời nhắc: Người dùng có thể lưu các lời nhắc thường dùng để dễ dàng truy cập lại sau này.

5. Chế độ tiếp quản: Cho phép người dùng tạm dừng và tiếp quản quyền kiểm soát đối với các tác vụ nhạy cảm, như nhập thông tin thanh toán hoặc mật khẩu.Tính an toàn và quyền riêng tư

openai ra mat operator ai agent moi de tu dong hoa tac vu dua tren web hinh 3

OpenAI đã đặc biệt chú trọng đến tính an toàn và bảo mật thông tin trong việc phát triển Operator. Công cụ này bao gồm các biện pháp bảo vệ nghiêm ngặt để đảm bảo sự an toàn khi sử dụng:

- Giám sát tác vụ: Người dùng phải xác nhận trước khi hoàn tất các hành động quan trọng.

- Xử lý dữ liệu nhạy cảm: Người dùng sẽ được nhắc nhở để tiếp quản các tác vụ liên quan đến thông tin nhạy cảm.

- Quản lý quyền riêng tư dữ liệu: Người dùng có thể dễ dàng xóa dữ liệu duyệt web và điều chỉnh cài đặt quyền riêng tư chỉ bằng một cú nhấp chuột.

- Phát hiện mối đe dọa: Operator được trang bị khả năng phát hiện và tránh các nỗ lực lừa đảo và mã độc.

Dù đã có các biện pháp bảo vệ mạnh mẽ, OpenAI cũng thừa nhận rằng phiên bản hiện tại vẫn còn trong giai đoạn thử nghiệm và có thể gặp một số hạn chế.

Những hạn chế và kế hoạch tương lai

Operator hiện tại vẫn đang trong giai đoạn phát triển và có thể gặp khó khăn với các tác vụ liên quan đến giao diện phức tạp, như tạo trình chiếu hoặc quản lý lịch. Tuy nhiên, OpenAI đã lên kế hoạch để cải thiện công cụ này:

- API mô hình CUA: OpenAI dự định phát hành mô hình CUA qua API, giúp các nhà phát triển tạo ra các tác nhân AI của riêng họ.

- Xử lý quy trình công việc nâng cao: Công ty đang làm việc để cải thiện khả năng của Operator trong việc xử lý các quy trình công việc phức tạp hơn.

- Khả năng sử dụng rộng rãi hơn: Sau khi được tinh chỉnh, Operator sẽ khả dụng cho người dùng Plus, Team và Enterprise, với kế hoạch tích hợp hoàn toàn vào ChatGPT.

Hợp tác và ứng dụng thực tế

OpenAI đang hợp tác với các công ty lớn như DoorDash, Instacart, OpenTable, Priceline và nhiều công ty khác để tối ưu hóa Operator cho các ứng dụng thực tế. Công ty cũng đang thử nghiệm với các tổ chức công cộng như Thành phố Stockton để đơn giản hóa việc tiếp cận các dịch vụ chính phủ.

Thông qua các quan hệ đối tác này, OpenAI hy vọng có thể đảm bảo rằng Operator sẽ mang lại giá trị thực tế trong nhiều ngành công nghiệp và đồng thời cải thiện chức năng của nó qua phản hồi của người dùng.

Sử dụng và khả dụng

Từ ngày 23 tháng 1 năm 2025, Operator đã có sẵn cho người dùng Pro tại Hoa Kỳ qua operator.chatgpt.com. Người dùng có thể bắt đầu sử dụng bằng cách mô tả các tác vụ cần thực hiện, và có thể tiếp quản quyền kiểm soát bất kỳ lúc nào khi cần thiết.

OpenAI sẽ triển khai Operator dần dần cho các nhóm người dùng bổ sung, bao gồm Plus, Team và Enterprise, sau khi công cụ này được hoàn thiện và đảm bảo tính an toàn và khả năng sử dụng.

Với những tính năng mạnh mẽ và khả năng tự động hóa linh hoạt, Operator hứa hẹn sẽ mang đến một trải nghiệm sử dụng web nhanh chóng và hiệu quả hơn bao giờ hết.

Hùng Nguyễn (Theo Fone Arena)

    Nổi bật
        Mới nhất
        OpenAI ra mắt 'Operator' – AI Agent mới để tự động hóa tác vụ dựa trên web
        • Mặc định

        POWERED BY ONECMS - A PRODUCT OF NEKO