Alibaba đã ra mắt Marco-o1 giúp cải thiện khả năng giải quyết vấn đề phức tạp với độ chính xác tăng 6,17% trong kiểm tra ngôn ngữ.

Theo AI News, Alibaba mới đây đã công bố Marco-o1, một mô hình ngôn ngữ lớn (LLM) hứa hẹn cải thiện đáng kể khả năng giải quyết các vấn đề phức tạp trong nhiều lĩnh vực như toán học, vật lý, lập trình và các tình huống không có chuẩn mực rõ ràng. Được phát triển bởi đội ngũ MarcoPolo, Marco-o1 đánh dấu bước tiến mới trong việc nâng cao khả năng lý luận và cải thiện độ chính xác trong các tác vụ xử lý ngôn ngữ tự nhiên của AI.

Mô hình này kết hợp nhiều kỹ thuật tiên tiến, bao gồm Chain-of-Thought (CoT), Tìm kiếm Cây Monte Carlo (MCTS) và cơ chế phản hồi mới, giúp mô hình giải quyết các vấn đề theo cách thức từng bước, đồng thời tự đánh giá lại lý luận của mình, từ đó đạt được kết quả chính xác hơn. Sự tích hợp MCTS trong Marco-o1 cũng mang lại khả năng tìm kiếm và điều chỉnh các chiến lược giải quyết vấn đề một cách linh hoạt, từ tổng quát đến chi tiết, giúp mô hình phát triển linh hoạt hơn với những tình huống phức tạp.

Kết quả thử nghiệm cho thấy Marco-o1 vượt trội so với các mô hình hiện tại trong các tác vụ xử lý ngôn ngữ tự nhiên. Cụ thể, mô hình này cải thiện độ chính xác lên 6.17% trên bộ dữ liệu MGSM tiếng Anh và 5.60% trên phiên bản tiếng Trung, đặc biệt trong các nhiệm vụ như dịch thuật và xử lý ngôn ngữ với các sắc thái văn hóa phức tạp.

Kết quả thử nghiệm trên bộ dữ liệu MGSM ở cả tiếng anh và tiếng trung. Nguồn: AI News.

Dù Marco-o1 đã đạt được những kết quả ấn tượng, nhóm phát triển tại Alibaba thừa nhận rằng mô hình này vẫn đang trong quá trình cải tiến và chưa hoàn thiện như những mô hình lý luận tiên tiến khác, chẳng hạn như o1 của OpenAI. Tuy nhiên, sự cải tiến liên tục của Marco-o1 đang mở ra triển vọng lớn trong nghiên cứu AI.

Trong tương lai, Alibaba dự định tích hợp thêm các mô hình thưởng như Mô hình Thưởng Kết Quả (ORM) và Mô hình Thưởng Quy Trình (PRM) để tối ưu hóa khả năng ra quyết định của mô hình, đồng thời nghiên cứu thêm các phương pháp học tăng cường để nâng cao hiệu quả giải quyết vấn đề.

Marco-o1 cùng các bộ dữ liệu liên quan đã được Alibaba phát hành trên GitHub, mở ra cơ hội cho cộng đồng nghiên cứu và phát triển AI tiếp tục khai thác và cải tiến mô hình này.

Với khả năng tự cải tiến và tích hợp các kỹ thuật tiên tiến, Marco-o1 hứa hẹn sẽ là một công cụ quan trọng trong nghiên cứu và phát triển AI trong tương lai gần. Tác động của mô hình này có thể giúp các công ty công nghệ và các nhà nghiên cứu tạo ra những sản phẩm và giải pháp AI ngày càng mạnh mẽ, hiệu quả hơn.