Meta phát hành mô hình AI có thể 'tự học' và 'tự phát triển'

(CLO) Meta, công ty mẹ của Facebook, thông báo hôm thứ Sáu rằng họ đang ra mắt một loạt mô hình AI mới, bao gồm một "Bộ Đánh Giá Tự Học" có khả năng giảm bớt sự can thiệp của con người trong quá trình phát triển AI.

Thông báo này được đưa ra sau khi Meta giới thiệu công cụ này trong một bài nghiên cứu vào tháng 8, trong đó mô tả cách công cụ này sử dụng kỹ thuật "chuỗi tư duy" tương tự như các mô hình mới của OpenAI để đưa ra những đánh giá chính xác về phản hồi của mô hình AI. Kỹ thuật này chia nhỏ các vấn đề phức tạp thành các bước logic đơn giản hơn, giúp cải thiện độ chính xác trong các lĩnh vực như khoa học, lập trình và toán học.

Các nhà nghiên cứu của Meta đã sử dụng hoàn toàn dữ liệu do AI tạo ra để huấn luyện mô hình đánh giá này, loại bỏ hoàn toàn sự can thiệp của con người trong giai đoạn đó.

Khả năng sử dụng AI để đánh giá chính AI cho thấy tiềm năng phát triển các tác nhân AI tự động, có khả năng học hỏi từ những sai lầm của chính mình, theo hai nhà nghiên cứu của Meta chia sẻ.

Nhiều chuyên gia trong lĩnh vực AI hình dung về các tác nhân số thông minh này như những trợ lý kỹ thuật số có khả năng thực hiện một loạt các nhiệm vụ mà không cần sự can thiệp của con người.

Các mô hình có khả năng tự cải thiện có thể loại bỏ nhu cầu về quy trình 'Học Tăng Cường Từ Phản Hồi Của Con Người', vốn yêu cầu các chuyên gia có chuyên môn cao để gán nhãn dữ liệu và xác minh tính chính xác của các câu trả lời về toán học và viết lách phức tạp. Quy trình này hiện tại thường rất tốn kém và không hiệu quả.

Jason Weston, một trong các nhà nghiên cứu của dự án, cho biết: "Chúng tôi hy vọng rằng khi AI trở nên ngày càng siêu việt hơn con người, nó sẽ tự kiểm tra công việc của mình tốt hơn, thậm chí vượt qua trình độ của con người".

Ông cũng nói thêm rằng: "Khả năng tự học và tự đánh giá là yếu tố then chốt để phát triển AI đạt đến mức độ siêu nhân".

Ngoài Meta, các công ty khác như Google và Anthropic cũng đã công bố nghiên cứu về khái niệm RLAIF, hay "Học Tăng Cường Từ Phản Hồi Của AI". Tuy nhiên, không giống như Meta, các công ty này ít khi công bố các mô hình của mình để công chúng sử dụng.

Cao Phong (theo Reuters)

Xem thêm

OPPO Find X9s lên kệ: Thiết kế thanh lịch, pin 7025 mAh, ưu đãi lớn

OPPO Find X9s lên kệ: Thiết kế thanh lịch, pin 7025 mAh, ưu đãi lớn

Trình làng vào ngày 21/04/2026, OPPO Find X9s nhanh chóng thu hút sự chú ý nhờ sự kết hợp hài hòa giữa thiết kế mỏng nhẹ, vi xử lý Dimensity 9500S hiệu suất cao cùng viên pin công nghệ mới lên tới 7025 mAh. Với mức giá định vị hợp lý đi kèm hàng loạt chương trình khuyến mãi thiết thực, thiết bị được đánh giá là một lựa chọn đáng cân nhắc cho người dùng.

Giới trẻ Trung Quốc đổ xô xem bói bằng AI

Giới trẻ Trung Quốc đổ xô xem bói bằng AI

(CLO) Ngày càng nhiều người trẻ tại Trung Quốc đang tìm đến AI để xem bói, khi các công cụ này được cho là rẻ hơn, nhanh hơn và thậm chí “chuẩn” không kém các thầy bói truyền thống.

ChatGPT cho ra mắt tính năng ngăn chặn hành vi tự hại bản thân

ChatGPT cho ra mắt tính năng ngăn chặn hành vi tự hại bản thân

(CLO) OpenAI mới đây công bố tính năng mới mang tên “Trusted Contact” (Liên hệ tin cậy), được thiết kế để cảnh báo một bên thứ ba đáng tin cậy nếu hệ thống phát hiện nội dung liên quan đến hành vi tự hại bản thân trong cuộc trò chuyện với ChatGPT.

Oscar 2027 siết chặt việc sử dụng AI

Oscar 2027 siết chặt việc sử dụng AI

(CLO) Viện Hàn lâm Khoa học và Nghệ thuật Điện ảnh Mỹ (AMPAS), tổ chức đứng sau giải thưởng Oscar danh giá, vừa công bố các quy định mới liên quan tới trí tuệ nhân tạo (AI) cho mùa giải sau.
Cỡ chữ bài viết: