Khi cuộc cạnh tranh trong lĩnh vực AI trở nên gay gắt, gã khổng lồ bán lẻ Trung Quốc Alibaba đã công bố QwQ-32B-Preview, được cho là vượt trội hơn so với loạt o1 của OpenAI.
Mô hình mới nhất được cho là vượt trội hơn các mô hình o1-preview và o1-mini của OpenAI trên một số tiêu chí cụ thể, chẳng hạn như các bài kiểm tra AIME và MATH, đánh giá hiệu suất của các mô hình AI trong các câu đố logic và bài toán toán học.
Alibaba đã phát hành QwQ-32B-Preview để tải xuống.
Theo gã khổng lồ bán lẻ, mô hình mới của Alibaba có khả năng giải quyết những vấn đề phức tạp và tinh vi hơn so với các mô hình ngôn ngữ lớn thông thường (LLMs) như ChatGPT-4 và Claude 3.5.
Một bài viết của Benzinga chỉ ra rằng QwQ-32B-Preview là một trong số ít mô hình có sẵn dưới giấy phép cho phép, cho phép người dùng tải xuống và sử dụng. Mô hình hiện có sẵn trên nền tảng phát triển AI Hugging Face.
Tuy nhiên, Alibaba đã phát hành một số thành phần của mô hình để hạn chế việc sao chép hoàn toàn mô hình hoặc hiểu biết về cách thức hoạt động của nó.
Mô hình mới nhất của Alibaba có 32,5 tỷ tham số, cho phép nó xử lý các yêu cầu lên đến 32.000 từ. Với khả năng đáng kể của mô hình và tính khả dụng bán mở, sự xuất hiện mới của Alibaba đã tạo ra một bước nhảy vọt trong công nghệ lý luận AI.
Thông báo minh bạch của Alibaba, nhấn mạnh sự tinh vi của mô hình, trong khi OpenAI vẫn giữ bí mật về số lượng tham số.
Sự xuất hiện của mô hình này diễn ra vào thời điểm OpenAI đang có những bước tiến đáng kể trong lĩnh vực AI. Vào tháng Mười, định giá của OpenAI đã tăng lên 157 tỷ đô la sau một vòng huy động vốn thành công.
Vào đầu tuần này, SoftBank Group SFTBF được cho là đã tăng cường cổ phần của mình trong công ty sản xuất ChatGPT thông qua một thỏa thuận mua lại cổ phần nhân viên trị giá 1,5 tỷ đô la.
OpenAI cũng được cho là đang khám phá việc phát triển trình duyệt web riêng của mình để thách thức trình duyệt Google Chrome thuộc sở hữu của Alphabet sau khi bị áp lực từ Bộ Tư pháp Hoa Kỳ yêu cầu tách rời.
Alibaba thừa nhận mô hình cũng có những thiếu sót.
Mặc dù nó sở hữu một số điểm mạnh độc đáo, mô hình mới cũng có những hạn chế. Theo nhóm, QwQ-32B-Preview gặp phải các vấn đề như chuyển đổi ngôn ngữ bất ngờ, điều này có thể gây nhầm lẫn cho người dùng. Mô hình cũng hoạt động kém trong các nhiệm vụ yêu cầu lý luận thường thức, điều này phổ biến với nhiều hệ thống AI.
Theo AutoGPT, mô hình có thể bị mắc kẹt trong các vòng lặp logic, làm chậm phản hồi.
Mặc dù còn nhiều thiếu sót, khả năng lý luận của nó cho phép nó tự kiểm tra thông tin, do đó giảm thiểu lỗi nhưng tăng thời gian giải quyết.
Bằng cách suy luận qua các nhiệm vụ và lập kế hoạch các bước, mô hình của Alibaba tránh được một số cạm bẫy mà các hệ thống AI truyền thống gặp phải. Nhưng phương pháp này đòi hỏi thêm thời gian, điều này có thể hạn chế ứng dụng thời gian thực.
Theo Benzinga, phản hồi của QwQ-32B-Preview phù hợp với tiêu chuẩn quy định của Trung Quốc, tránh các chủ đề nhạy cảm về chính trị.
Ví dụ, các chủ đề nhạy cảm về chính trị như Đài Loan sẽ đưa ra phản hồi phù hợp với lập trường của chính phủ Trung Quốc.
Ngoài ra, các yêu cầu về các sự kiện như Quảng trường Thiên An Môn không có phản hồi nào xuất hiện, cho thấy thiết kế thận trọng của mô hình.
Mặc dù điều này có thể lý tưởng cho thị trường Trung Quốc, nhưng nó cũng có thể hạn chế sức hấp dẫn của nó trên thị trường toàn cầu. Tuy nhiên, mô hình là một bước tiến đáng kể vào thế giới AI lý luận. Mặc dù những hạn chế của nó có thể thu hẹp sức hấp dẫn toàn cầu của nó, nhưng các thành phần khác của nó như logic và tính chất bán mở khiến nó trở thành một đối thủ lớn cho OpenAI.
Theo AutoGPT, QwQ-32B-Preview nêu bật tiềm năng và thách thức của lĩnh vực thú vị này, nơi các phòng thí nghiệm AI trên toàn thế giới đang làm việc để tinh chỉnh công nghệ lý luận.
Từ Zero đến Web3 Pro: Kế hoạch Khởi động Nghề nghiệp 90 ngày của bạn