(CLO) Điều gì sẽ xảy ra nếu ChatGPT được đào tạo về tin tức và dữ liệu tài chính? Hãng tin Bloomberg đang đặt mục tiêu trở thành AI đầu tiên được sử dụng để đưa tin về kinh tế.
Gã khổng lồ về tin tức và dữ liệu đã xây dựng một AI tổng quát mà theo họ là vượt trội so với đối thủ, chuyên về nhu cầu thông tin cụ thể của mình.
Nếu bạn định dự đoán công ty tin tức nào sẽ là công ty đầu tiên ra mắt mô hình AI khổng lồ của riêng mình, thì Bloomberg sẽ là một lựa chọn tốt. Bloomberg về cơ bản là một công ty dữ liệu.
Vào thứ Sáu, công ty đã thông báo rằng họ đã xây dựng nên BloombergGPT. AI này được xây dựng dựa trên những dữ liệu mà Bloomberg đã thu thập được trong rất nhiều năm qua.
BloombergGPT lớn cỡ nào? Công ty cho biết AI của họ đã được đào tạo trên một kho dữ liệu gồm hơn 700 tỷ mã thông báo (hoặc các đoạn từ). Để so sánh, chatGPT-3, được phát hành vào năm 2020, đã được đào tạo trên khoảng 500 tỷ mã.
Có gì trong tất cả dữ liệu đào tạo đó? Trong số hơn 700 tỷ mã thông báo, 363 tỷ được lấy từ dữ liệu tài chính của chính Bloomberg. 345 tỷ mã thông báo khác đến từ “bộ dữ liệu mục đích chung” được lấy từ nơi khác.
Dữ liệu dành riêng cho công ty, có tên là FinPile, bao gồm “một loạt các tài liệu tài chính bằng tiếng Anh bao gồm tin tức, hồ sơ, thông cáo báo chí, tài liệu tài chính, được lấy từ kho lưu trữ của Bloomberg”.
Các hồ sơ của SEC, bảng điểm của Bloomberg TV, dữ liệu của Fed và “dữ liệu khác liên quan đến thị trường tài chính” cũng vậy. Nó cũng được đào tạo trên các nguồn tin tức không phải của Bloomberg:
Dữ liệu phi tài chính cụ thể bao gồm một kho dữ liệu khổng lồ mang tên The Pile. Nó cũng có một bản sao hoàn chỉnh của Wikipedia vào tháng 7 năm ngoái, kèm theo đó là rất rất nhiều thông tin, từ phụ đề Youtube tới Dự án Gutenberg, tới cache của Enron email thường xuất hiện trong việc đào tạo AI.
Nhưng BloombergGPT có thể làm gì? BloombergGPT có thể thực hiện những điều mà chúng ta mong đợi từ ChatGPT và các mô hình tương tự. Nhưng nó cũng có thể thực hiện các tác vụ được kết nối chặt chẽ hơn với nhu cầu của Bloomberg. Nó có thể dịch các yêu cầu ngôn ngữ tự nhiên sang ngôn ngữ truy vấn Bloomberg.
Ví dụ, nếu chúng ta đặt câu hỏi bằng văn bản, "giá trị vốn hóa thị trường của Apple và IBM và EPS”, BloombergGPT sẽ chuyển đối nó thành một đoạn mã như thế này: "get(cur_mkt_cap,is_eps) for(['AAPL US Equity','IBM US Equity']).
AI này cũng có thể đề xuất các tiêu đề kiểu Bloomberg cho các câu chuyện tin tức.
Những nhà phát triển nói rằng AI cũng được điều chỉnh tốt hơn để trả lời các câu hỏi cụ thể liên quan đến kinh doanh, từ việc đưa ra đánh giá tới trích xuất dữ liệu.
Khi so sánh BloombergGPT với các mô hình ngôn ngữ khác có kích cỡ tương đồng, kết quả cho thấy BloombergGPT hoạt động tốt hơn trên nhiều mô hình cụ thể về tài chính.
Về lâu dài, dự kiến sẽ có cơ hội cho các nhà xuất bản nhỏ hơn, đặc biệt là những nhà xuất bản có kho lưu trữ số hóa lớn.
Hãy tưởng tượng các hãng tin lớn như Anytown Gazette đào tạo AI dựa trên 100 năm lưu trữ báo chí của mình, cộng với một bộ sưu tập lớn các tài liệu của thành phố/quận/tiểu bang và bất kỳ nguồn dữ liệu địa phương nào khác mà nó có thể có được.
Tất nhiên, đó là một quy mô hoàn toàn khác so với những gì Bloomberg có thể đạt được, và nó có thể hữu ích như một công cụ nội bộ hơn.
(CLO) Ngày 22/11, tại Nhà Thái Học thuộc Văn Miếu - Quốc Tử Giám (Hà Nội) đã diễn ra Vòng Chung kết Giải thưởng Hành động vì Cộng đồng - Human Act Prize 2024 với chủ đề “Cộng đồng kiến tạo”.
(CLO) Ngày 22/11, Hội môi giới Bất động sản Việt Nam (VARS) đã công bố Bộ Quy tắc đạo đức, ứng xử nghề nghiệp mới nhằm nâng cao uy tín, chất lượng và trách nhiệm của môi giới.
(CLO) Phó Chủ tịch UBND TP Hà Nội Nguyễn Mạnh Quyền vừa ký ban hành Quyết định số 6068/QĐ-UBND ngày 22/11/2024 về việc công bố tình huống khẩn cấp các sạt lở trên các tuyến đê hữu Bùi, Bùi 2, Gò Khoăm, sạt lở bờ sông Bùi trên địa bàn huyện Chương Mỹ.
(CLO) Tỉnh Lai Châu cam kết tạo mọi thuận lợi để hỗ trợ các doanh nghiệp khai thác du lịch với mục tiêu "doanh nghiệp phát tài - Lai Châu phát triển''.
(CLO) Ngày 22/11, Phó Chủ tịch UBND thành phố Hà Nội Nguyễn Trọng Đông và lãnh đạo các sở, ngành thành phố đi kiểm tra tiến độ thi công và thực hiện Dự án hệ thống xử lý nước thải Yên Xá.
(CLO) UBND TP Hà Nội vừa ban hành Quyết định số 6015/QĐ-UBND về việc phê duyệt Dự án đầu tư xây dựng các tuyến đường giao thông khu vực tiếp cận Bệnh viện Phụ sản Trung ương cơ sở 2, Bệnh viện Nhi Trung ương cơ sở 2, huyện Quốc Oai.
(CLO) Theo Trung tâm Dự báo Khí tượng thủy văn, ngày 23/11, Bắc Bộ có mưa vài nơi, trưa chiều trời nắng. Khu vực Trung Bộ có mưa vừa, mưa to, cục bộ có nơi mưa rất to và dông. Các khu vực khác có mưa rào và dông vài nơi; riêng khu vực Tây Nguyên ngày 23/11 có mưa, mưa rào rải rác và có nơi có dông.
(CLO) Chiều ngày 22/11, Hội Nhà báo tỉnh Sóc Trăng đã tổ chức Hội thảo nghiệp vụ báo chí “Nâng cao chất lượng thông tin thời sự trên báo chí địa phương”.
(CLO) Bản tin Nóng 18h: Đề xuất áp thuế theo hàm lượng đường với nước ngọt; Hàng không tăng thêm 3.000 chuyến bay, bổ sung lượng vé Tết; Bước đầu xác định niên đại gần 150 bộ hài cốt tại phố Tây Sơn…
(CLO) Ngày 22/11, Báo Giáo dục và Thời đại đã tổ chức trao giải cuộc thi viết Những kỷ niệm sâu sắc về thầy cô và mái trường. Cuộc thi do Bộ Giáo dục và Đào tạo tổ chức, Báo Giáo dục và Thời đại là đơn vị thường trực.
(CLO) Việc thực hiện các thủ tục hành chính liên quan đến giấy chứng nhận quyền sử dụng đất của người dân và tổ chức như chuyển mục đích sử dụng đất; chia tách, hợp thửa... nếu phù hợp quy định thì vẫn được thực hiện theo quy định.
(CLO) Ngày 22/11, Công an huyện Đức Thọ (Hà Tĩnh) cho biết, vừa phối hợp với Phòng An ninh mạng và phòng chống tội phạm Công nghệ cao Công an Hà Tĩnh, Công an TP Hà Nội, Quãng Ngãi, Gia Lai phá thành công Chuyên án buôn bán, vận chuyển hàng cấm (pháo) với quy mô lớn, bắt giữ 06 đối tượng, thu giữ trên 2.200kg pháo các loại cùng nhiều tang vật liên quan.
(CLO) Ngày 22/11, Cơ quan CSĐT Công an huyện Tiên Yên (Quảng Ninh) vừa ra Quyết định khởi tố vụ án, khởi tố bị can 4 đối tượng về tội Tổ chức cho người khác xuất cảnh trái phép.
(CLO) Sáng 22/11, tại khu nghỉ dưỡng Hoiana (huyện Duy Xuyên), Bộ Văn hóa, Thể thao và Du lịch (VH-TT&DL) phối hợp với UBND tỉnh Quảng Nam tổ chức họp báo công bố việc đăng cai Hội nghị Quốc tế về Du lịch Nông thôn lần đầu tiên của UN Tourism (tổ chức du lịch thế giới), diễn ra vào năm 2024 tại Quảng Nam.
(CLO) Những trích đoạn từ cuốn hồi ký sắp xuất bản của cựu Thủ tướng Đức Angela Merkel đề cập đến mọi thứ, từ cuộc xung đột ở Ukraine cho đến Tổng thống Nga Vladimir Putin và Tổng thống đắc cử Mỹ Donald Trump.
(CLO) Tỷ phú Elon Musk, chủ sở hữu mạng xã hội X, đã chỉ trích dự luật của Úc, trong đó cấm trẻ em dưới 16 tuổi sử dụng mạng xã hội và phạt các mạng xã hội lên tới 49,5 triệu AUD (32 triệu USD) đối với các vi phạm.
(CLO) Sau khi bị tòa án Mỹ tuyên vi phạm luật chống độc quyền trong thị trường tìm kiếm trực tuyến, Google đang đối mặt với yêu cầu từ Bộ Tư pháp Mỹ (DoJ) buộc phải bán trình duyệt Chrome.
(CLO) Meta đã bị EU phạt gần 800 triệu euro với cáo buộc cạnh tranh không lành mạnh bằng cách liên kết dịch vụ 'rao vặt' Marketplace với mạng xã hội Facebook.
(CLO) Việc tỷ phú Elon Musk ủng hộ ông Donald Trump dự kiến sẽ giúp mạng xã hội X (trước đây là Twitter) khôi phục kinh doanh, khi một số thương hiệu bắt đầu quay lại quảng cáo trên nền tảng này để tranh thủ sự ủng hộ từ chính quyền mới.
(CLO) Ngày 12/11, các tờ báo lớn của Pháp, bao gồm Le Monde, Le Figaro và Le Parisien, cho biết họ đang có hành động pháp lý chống lại mạng hội X, cáo buộc nền tảng này sử dụng nội dung của họ mà không trả tiền.
(CLO) Các nhà quảng cáo dự kiến sẽ chi số tiền kỷ lục là 10,5 tỷ bảng cho quảng cáo Giáng sinh tại Vương quốc Anh trong mùa này, song không ưu tiên cho truyền hình truyền thông.
(CLO) Vào đầu thế kỷ 19, thủ đô London của Vương quốc Anh có hàng chục tờ báo in hàng ngày. Nhưng ngày nay, việc các tờ báo thay đổi định dạng đã đánh dấu sự kết thúc của tin tức địa phương hàng ngày trên báo in.
(CLO) Espresso, ứng dụng tin tức ngắn gọn của The Economist, sử dụng AI để dịch nội dung video sang nhiều ngôn ngữ nhằm tiếp cận đối tượng độc giả trẻ trên toàn cầu.