Báo chí - Công nghệ

'Rác AI' đe dọa tính toàn vẹn và phát triển của môi trường số

Ngọc Ánh (theo Futurism, WPN) 24/06/2025 16:47

(CLO) ChatGPT và các công cụ AI đang làm ngập Internet bằng nội dung kém chất lượng, gây nguy cơ ô nhiễm dữ liệu, kìm hãm chính sự phát triển của trí tuệ nhân tạo trong tương lai.

Sự bùng nổ của trí tuệ nhân tạo, đặc biệt là các công cụ tạo nội dung như ChatGPT, đang định hình lại cách con người giao tiếp, sáng tạo và tiếp cận thông tin. Những mặt trái của cuộc cách mạng đó chính là làn sóng ô nhiễm kỹ thuật số do AI tạo ra, đe dọa sự phát triển bền vững của chính ngành công nghiệp này.

Việc ChatGPT và các mô hình ngôn ngữ lớn được sử dụng ồ ạt để sản xuất nội dung đang khiến Internet ngập tràn thông tin kém chất lượng – từ bài blog vô hồn, bài luận học thuật sao chép cho đến các bài đăng mạng xã hội thiếu chiều sâu. Hiện tượng này được gọi là "AI slop" – rác thải do AI tạo ra, có thể len lỏi khắp nơi và trở thành dữ liệu đào tạo cho các mô hình tương lai.

Nguy cơ nằm ở vòng lặp tự hủy: AI học từ chính những gì AI từng tạo ra – một môi trường dữ liệu ngày càng suy thoái, dẫn đến chất lượng đầu ra giảm dần theo thời gian. Các chuyên gia lo ngại rằng, một khi Internet bị "ô nhiễm" ở cấp độ lớn, việc làm sạch hoặc phục hồi có thể là điều bất khả thi.

untitled(2).png
Ảnh cắt từ một quảng cáo tạo bằng AI của Coca-Cola, cho thấy logo Coca-Cola bị viết sai thành "Coca-Coola".

Sự lan rộng của nội dung do AI tạo ra đang đặt ra thách thức cho các nhà phát triển và doanh nghiệp AI. Các mô hình học máy vốn dựa vào dữ liệu huấn luyện đa dạng và chất lượng cao từ Internet. Nhưng nếu nền tảng dữ liệu đã bị nhiễm "rác" AI, khả năng tạo ra những đột phá công nghệ sẽ bị cản trở.

Hơn thế, mối nguy còn vượt ra khỏi phạm vi kỹ thuật. Khi nội dung kém chất lượng, lệch lạc hoặc thiên vị được lặp lại, sao chép và khuếch đại bởi các hệ thống tự động, xã hội có thể phải đối mặt với hậu quả sâu rộng: từ thông tin sai lệch, các chiến dịch thao túng dư luận, đến những sai lệch trong hệ thống tự động ra quyết định ở các lĩnh vực nhạy cảm như y tế, tài chính hay pháp luật.

Giới chuyên gia cho rằng việc khắc phục ô nhiễm kỹ thuật số do AI gây ra không thể phụ thuộc vào một bên duy nhất. Các công ty công nghệ, nhà nghiên cứu và nhà hoạch định chính sách cần phối hợp hành động để bảo vệ không gian dữ liệu chung.

Một số giải pháp đã được đề xuất, như phát triển bộ lọc dữ liệu huấn luyện “sạch”, dán nhãn rõ ràng các nội dung do AI tạo ra, hoặc áp dụng công nghệ dấu mờ để truy xuất nguồn gốc nội dung. Tuy nhiên, hiệu quả của các biện pháp này vẫn là dấu hỏi, do khối lượng dữ liệu khổng lồ và tốc độ phát tán thông tin trên Internet.

Cuộc khủng hoảng này là lời cảnh tỉnh cho toàn ngành AI. Công nghệ như ChatGPT có tiềm năng rất lớn, nhưng nếu để phát triển tự do không kiểm soát, nó có thể trở thành "con rắn tự cắn đuôi mình", phá hủy chính môi trường kỹ thuật số mà nó cần để tồn tại.

Muốn đi xa, AI không chỉ cần sức mạnh tính toán hay những thuật toán tiên tiến, mà còn cần một hệ sinh thái dữ liệu minh bạch, đáng tin cậy và nhân văn. Bằng không, giấc mơ trí tuệ nhân tạo có thể bị chôn vùi trong chính đống hỗn loạn mà nó tạo ra.

    Nổi bật
        Mới nhất
        'Rác AI' đe dọa tính toàn vẹn và phát triển của môi trường số
        • Mặc định

        POWERED BY ONECMS - A PRODUCT OF NEKO