OpenAI ra mắt AI mới có khả năng lập luận
OpenAI ra mắt AI mới có khả năng lập luận
OpenAI vừa ra mắt một mô hình trí tuệ nhân tạo mới với tên gọi Open AI o1 (có mã nội bộ là "Strawberry"). Đáng chú ý, mô hình này có khả năng lập luận giống con người.
"Tôi rất vui mừng chia sẻ với mọi người thành quả của đội ngũ đã làm việc thời gian qua trong việc tạo ra mô hình AI có khả năng lập luận thực sự", OpenAI hào hứng chia sẻ trên blog công ty. Được biết đến với mã nội bộ "Strawberry", o1 là mô hình ngôn ngữ lớn được đào tạo bằng phương pháp học tăng cường, nhằm thực hiện các suy luận phức tạp.
Điểm đột phá của o1 nằm ở khả năng "suy nghĩ" trước khi đưa ra câu trả lời. Mô hình này có thể tạo ra một chuỗi suy nghĩ nội bộ dài trước khi phản hồi tới người dùng, giúp nâng cao chất lượng và độ chính xác của các câu trả lời. OpenAI cho biết, với mô hình này, các công cụ của họ sẽ có khả năng giải quyết các vấn đề đa bước, bao gồm các câu hỏi toán học và lập trình phức tạp.
Tuy nhiên, OpenAI cũng thẳng thắn thừa nhận những hạn chế ban đầu của o1: "Là một mô hình ban đầu, nó chưa có nhiều tính năng làm cho ChatGPT hữu ích, như duyệt web để tìm thông tin và tải lên tệp và hình ảnh". Dù vậy, công ty vẫn tự tin khẳng định đây là "một bước tiến đáng kể và đại diện cho một cấp độ mới của khả năng AI".
Hiệu suất của o1 cũng ấn tượng. OpenAI tiết lộ mô hình này vượt qua 83% bài thi tuyển chọn cho Olympic Toán quốc tế, đứng trong top 500 thí sinh giỏi nhất. Con số này vượt trội so với mức 13% của GPT-4. Không chỉ vậy, o1 còn xếp hạng đạt 89% với các câu hỏi lập trình cạnh tranh (Codeforces), cũng như vượt qua độ chính xác ở cấp độ tiến sĩ về điểm chuẩn của các bài vật lý, sinh học, hóa học (GPQA).
Trải nghiệm sử dụng o1 sẽ có đôi chút khác biệt so với ChatGPT mà người dùng đã quen thuộc. Trước khi phản hồi, o1 sẽ tạm dừng trong vài giây để xem xét một số đoạn prompt có liên quan và sau đó tóm tắt những gì có vẻ là phản hồi tốt nhất. Kỹ thuật này, được gọi là "chuỗi suy nghĩ", giúp o1 đưa ra câu trả lời chính xác và sâu sắc hơn.
Noam Brown, nhà khoa học nghiên cứu tại OpenAI, chia sẻ trên nền tảng X (trước đây là Twitter) rằng việc phát hành phiên bản xem trước của o1 là một phần trong chiến lược thu thập phản hồi từ người dùng. Điều này cho thấy OpenAI đang rất cẩn trọng trong việc phát triển và hoàn thiện sản phẩm của mình.
Sự ra đời của o1 đánh dấu một bước ngoặt quan trọng trong cuộc đua AI đang ngày càng trở nên gay cấn. Không chỉ có OpenAI, các đối thủ cạnh tranh như Anthropic và Google cũng đang tích cực phát triển các mô hình AI với khả năng "lập luận" tương tự. Hiện OpenAI đang phải đối mặt với áp lực huy động hàng tỷ USD để duy trì vị thế dẫn đầu trong lĩnh vực AI.
OpenAI đã nỗ lực để giúp máy tính thực hiện nhiều hành động cùng một lúc. Ví dụ, vào tháng 5/2023, công ty đã phát hành một bài đăng trên blog và một bài báo nghiên cứu kèm theo về nỗ lực cải thiện khả năng giải quyết các bài toán của hệ thống AI. Theo bài báo, công ty đã huấn luyện một mô hình bằng cách thưởng cho nó cho mỗi bước đúng trong quá trình đi đến câu trả lời cho một vấn đề, thay vì chỉ thưởng cho nó vì tạo ra một câu trả lời chính xác.