Mistral AI, công ty AI của Pháp được thành lập bởi các cựu nhân viên Google và Meta, vừa cải cách nền tảng AI đa phương thức miễn phí của mình—và nó gần như có thể so sánh, và đôi khi thậm chí vượt qua, các dịch vụ trả phí từ OpenAI hoặc Anthropic.


Bộ công cụ AI từ startup có trụ sở tại Paris giờ đây có khả năng tìm kiếm web và tạo hình ảnh bên cạnh một mô hình hình ảnh mới vượt trội hơn các đối thủ lớn hơn trong các chỉ số chính.


Công ty đã phát hành một bản cập nhật để phân tích tài liệu, một Mô hình Ngôn ngữ Lớn được cập nhật và Codestral, một LLM tập trung vào các nhiệm vụ lập trình.


Nhưng điểm nổi bật là việc sử dụng Flux Pro để tạo ra hình ảnh, có nghĩa là nó là chatbot đa phương thức với khả năng tạo hình ảnh tốt nhất hiện có. Giao diện Canvas mới cho phép chỉnh sửa nội dung trực tiếp, định vị Le Chat—tên lựa chọn của Mistral cho giao diện chatbot của mình—như một công cụ làm việc sẵn sàng cho doanh nghiệp.


"Chúng tôi không theo đuổi AGI bằng mọi giá; sứ mệnh của chúng tôi là thay vào đó đặt AI tiên tiến vào tay bạn," Mistral cho biết trong một tuyên bố, tách mình khỏi những tham vọng trí tuệ nhân tạo tổng quát rộng lớn hơn của các đối thủ đã gây ra lo ngại trong giới chuyên môn.


Công ty đã được định giá 2 tỷ đô la trong vòng gọi vốn tháng 12.


Pixtral Large, một mô hình hình ảnh 124 tỷ tham số, đã vượt trội hơn GPT-4 và Gemini 1.5 Pro của Google với độ chính xác 69.4% trên MathVista và 93.3% trên DocVQA. Nó có khả năng xử lý tối đa 30 hình ảnh độ phân giải cao trong một cửa sổ ngữ cảnh 128.000 token.


Flux Pro, trong khi đó, vượt trội hơn tất cả các máy tạo hình ảnh khác về chất lượng và tốc độ suy diễn, như đã được báo cáo trước đó bởi Decrypt.


ChatGPT sử dụng DALL-E, mà so với nó thì còn nguyên thủy. Vì vậy, việc tích hợp Flux vào Le Chat là một bước đi đáng hoan nghênh.


Các tính năng đó đã được giới thiệu như là "các dịch vụ beta miễn phí," cho phép người dùng truy cập các công cụ AI tạo sinh mới nhất mà không tốn phí. Mistral không cho biết khi nào họ dự định bắt đầu tính phí cho các công cụ của mình.


ChatGPT so với LeChat của Mistral: Chúng xếp hạng như thế nào

Chúng tôi đã thử nghiệm cả hai phiên bản miễn phí của chatbot Mistral và ChatGPT. Có rất nhiều sự tương đồng—chủ yếu là về phong cách viết—nhưng những khác biệt đủ để tạo ra một số phân biệt giữa hai bên.


GPT-4o của ChatGPT vẫn là viên ngọc quý của các mô hình ngôn ngữ, thể hiện sự tinh tế không thể sánh bằng trong lý luận phức tạp, viết sáng tạo và phân tích kỹ thuật.


Khả năng hiểu ngữ cảnh và duy trì các cuộc hội thoại dài mạch lạc đã xác định tiêu chuẩn ngành. Trong các thử nghiệm mở rộng, GPT-4o đã thể hiện khả năng nổi bật trong các nhiệm vụ từ phân tích văn học đến các thách thức lập trình nâng cao.


Mistral Large 2.5 của Le Chat, mặc dù ấn tượng, hoạt động ở một cấp độ dưới GPT-4o trong các nhiệm vụ lý luận phức tạp. Tuy nhiên, nó xuất sắc trong các ứng dụng thực tiễn, cung cấp phản hồi nhanh chóng và hiệu suất công việc hàng ngày mạnh mẽ. Mặc dù mô hình có khả năng đa ngôn ngữ, nhưng nó có xu hướng kém sáng tạo hơn GPT-4o.


Tích hợp Tìm kiếm Web


Le Chat cung cấp một tính năng tìm kiếm web miễn phí—người dùng có thể truy cập thông tin hiện tại với các liên kết trích dẫn trực tiếp, tương tự như cách bạn sử dụng một công cụ tìm kiếm truyền thống nhưng với sự tổng hợp được hỗ trợ bởi AI. Việc tích hợp cảm thấy tự nhiên và không gây cản trở, làm cho quy trình kiểm tra sự thật và nghiên cứu trở nên hiệu quả đáng kể. Việc truy cập miễn phí vào tính năng này đại diện cho một giá trị đáng kể.




SearchGPT của ChatGPT, mặc dù tinh vi hơn trong cách tiếp cận, vẫn nằm sau một bức tường thanh toán. Nó có góc nhìn độc đáo về tích hợp web, thường cung cấp phân tích ngữ cảnh nhiều hơn (đến mức thậm chí tạo ra một số phản hồi không chính xác). Plugin Chrome cung cấp sự tích hợp sâu hơn với khả năng mô hình ngôn ngữ của OpenAI, mặc dù nhiều người dùng có thể thấy cách tiếp cận đơn giản của Le Chat thực tế hơn cho việc sử dụng hàng ngày.




Khả năng Tạo hình ảnh


Việc tích hợp Flux Pro của Le Chat là một lợi thế lớn trong lĩnh vực tạo hình ảnh. Hệ thống sản xuất hình ảnh rất chi tiết với sự tuân thủ tuyệt vời đối với các gợi ý, đặc biệt xuất sắc trong các phong cách nghệ thuật, hình thể con người chính xác, và bố cục cảnh phức tạp. Các chỉ số gần đây đặt Flux Pro ở vị trí hàng đầu trong công nghệ tạo hình ảnh, với hiệu suất tốt hơn đáng kể trong các lĩnh vực như chi tiết kết cấu và sự nhất quán không gian.




DALL-E 3 của ChatGPT, mặc dù đột phá khi ra mắt, giờ đây cho thấy sự lạc hậu so với các mô hình mới hơn. Mặc dù có khả năng tạo ra những hình ảnh có thể sử dụng, nhưng nó thường gặp khó khăn với các gợi ý phức tạp, kết cấu chi tiết, và duy trì phong cách nhất quán – những lĩnh vực mà Flux Pro thể hiện sự vượt trội rõ rệt. Sự chênh lệch đặc biệt rõ ràng trong các nhiệm vụ tạo hình ảnh chuyên nghiệp.




Tác nhân AI Tùy chỉnh


Cách tiếp cận dân chủ của Le Chat đối với các tác nhân AI đại diện cho một sự chuyển mình đáng kể trong khả năng tiếp cận. Người dùng có thể tạo, tùy chỉnh và triển khai các tác nhân chuyên biệt cho các nhiệm vụ từ phân tích dữ liệu đến viết sáng tạo miễn phí.


ChatGPT, mặt khác, duy trì một hệ thống hai cấp. Trong khi người dùng miễn phí có thể truy cập các GPT đã được tạo sẵn, khả năng tạo ra các GPT tùy chỉnh vẫn là một tính năng cao cấp.


Chất lượng của các GPT này rất xuất sắc, và khả năng cấu hình chúng thông qua các gợi ý bằng ngôn ngữ tự nhiên là một điểm cộng; nhưng sự hạn chế về các công cụ tạo ra và bức tường giá cả hạn chế tiềm năng tối ưu hóa quy trình làm việc cá nhân hóa.


Khả năng Phân tích Tầm nhìn


Cái này có vẻ như là một sự hòa nhau—ít nhất là trong các thử nghiệm nhanh đầu tiên của chúng tôi. GPT-4V và Pixtral Large thể hiện khả năng rất tương tự trong các ứng dụng thực tế.


Cả hai đều xuất sắc trong việc diễn giải sơ đồ, hiểu hình ảnh, ký hiệu toán học và nhận thức không gian.


Phán quyết

Trong khi các số liệu chuẩn cho thấy sự biến động nhẹ cho các LLM, Mô hình Tầm nhìn và Mô hình Tạo hình ảnh, sự khác biệt thực tế trong các trường hợp sử dụng hàng ngày không đáng kể.


Cả hai hệ thống đều xử lý mọi thứ từ viết sáng tạo đến sơ đồ kỹ thuật với độ chính xác ấn tượng, khiến sự lựa chọn giữa chúng trở nên nhiều hơn về sở thích hệ sinh thái hơn là sự khác biệt về khả năng.


Sự lựa chọn giữa các nền tảng này ngày càng phụ thuộc vào các trường hợp sử dụng cụ thể


ChatGPT vẫn vượt trội hơn trong:



  • Viết học thuật


  • Tài liệu kỹ thuật phức tạp


  • Viết sáng tạo tinh tế


  • Các thách thức lập trình nâng cao



Le Chat cung cấp giá trị tốt hơn cho:



  • Tạo nội dung hình ảnh


  • Nghiên cứu web


  • Phân tích tài liệu


  • Nhiệm vụ năng suất hàng ngày


  • Tự động hóa quy trình làm việc



Các tác động tài chính là yếu tố quyết định: Le Chat cung cấp khoảng 80-90% chức năng của ChatGPT Plus mà không tốn phí, khiến nó trở thành một lựa chọn ngày càng hấp dẫn cho cả người dùng cá nhân và các doanh nghiệp nhỏ hoạt động trong giới hạn ngân sách.


Tổng thể, Mistral hiện tại cung cấp một giá trị tốt hơn, và các mô hình của họ có thể phục vụ người dùng đủ để biện minh cho việc hủy bỏ một gói đăng ký—ít nhất là trong khi thời gian thử nghiệm beta vẫn còn.


Biên tập bởi Josh Quittner và Sebastian Sinclair