Mistral AI, francouzská AI společnost založená bývalými zaměstnanci Google a Meta, právě přepracovala svou bezplatnou, multimodální AI platformu— a blíží se k vyrovnání, a někdy dokonce i překonání, placených nabídek od OpenAI nebo Anthropic.


Sada AI nástrojů z pařížského startupu nyní zahrnuje funkce webového vyhledávání a generování obrázků spolu s novým vizuálním modelem, který překonává větší konkurenty v klíčových benchmarkech.


Společnost vydala aktualizaci pro analýzu dokumentů, aktualizovaný velký jazykový model a Codestral, LLM zaměřený na úkoly programování.


Ale třešničkou na dortu je jeho využití Flux Pro k generování obrázků, což znamená, že je to multimodální chatbot s nejlepšími schopnostmi generování obrázků, které jsou aktuálně k dispozici. Nové rozhraní Canvas umožňuje přímou editaci obsahu, čímž umisťuje Le Chat—Mistralovo jméno pro jeho chatbot UI—jako nástroj připravený pro podnikání.


"Nehoníme AGI za každou cenu; naším posláním je místo toho umístit přední AI do vašich rukou," uvedl Mistral ve svém prohlášení, distancující se od širších ambic konkurentů v oblasti umělé obecné inteligence, které vyvolaly obavy mezi odborníky.


Společnost byla oceněna na 2 miliardy dolarů v prosincovém financování.


Pixtral Large, vizuální model o 124 miliardách parametrech, překonal GPT-4 a Google Gemini 1.5 Pro s 69,4% přesností na MathVista a 93,3% na DocVQA. Zvládá až 30 obrazů s vysokým rozlišením v rámci kontextového okna 128 000 tokenů.


Flux Pro mezitím překonává všechny ostatní generátory obrázků z hlediska kvality a rychlosti inference, jak již dříve uvedl Decrypt.


ChatGPT používá DALL-E, který je ve srovnání primitivní. Integrace Fluxu do Le Chat je tedy vítaným krokem.


Tyto funkce byly zavedeny jako "bezplatné beta nabídky,“ což uživatelům dává přístup k nejnovějším generativním AI nástrojům bez nákladů. Mistral neoznámil, kdy má v úmyslu začít účtovat za své nástroje.


ChatGPT vs. Mistral’s LeChat: Jak se srovnávají

Obě bezplatné verze chatbotů Mistral a ChatGPT jsme podrobili testu. Bylo zde mnoho podobností—většinou co se týče stylu psaní—ale rozdíly byly dostatečné k tomu, aby se objevily určité odlišnosti mezi oběma.


ChatGPT's GPT-4o zůstává korunovačním klenotem jazykových modelů, vykazuje bezkonkurenční nuanci v komplexním uvažování, kreativním psaní a technické analýze.


Jeho schopnost chápat kontext a udržovat koherentní, dlouhé konverzace určila standard v oboru. Během rozsáhlého testování ukázal GPT-4o pozoruhodnou schopnost v úkolech sahajících od literární analýzy po pokročilé programovací výzvy.


Mistral Large 2.5 od Le Chat, i když impozantní, funguje na úrovni pod GPT-4o v úlohách sofistikovaného uvažování. Nicméně v praktických aplikacích vyniká, nabízí rychlé odpovědi a robustní výkon pro každodenní úkoly. Ačkoli model má vícejazyčné schopnosti, obvykle je méně kreativní než GPT-4o.


Integrace webového vyhledávání


Le Chat nabízí bezplatnou funkci webového vyhledávání–uživatelé mohou přistupovat k aktuálním informacím s přímými odkazy na citace, podobně jako byste používali tradiční vyhledávač, ale s AI poháněnou syntézou. Integrace se zdá být přirozená a nenápadná, což činí ověřování faktů a pracovní postupy výzkumu výrazně efektivními. Bezplatný přístup k této funkci představuje významnou hodnotovou nabídku.




ChatGPT's SearchGPT, i když je sofistikovanější ve svém přístupu, je za paywallem. Přistupuje k webové integraci unikátním způsobem, často poskytuje více kontextové analýzy (až do bodu, kdy dokonce halucinuje některé odpovědi). Chrome plugin nabízí hlubší integraci s jazykovými modelovými schopnostmi OpenAI, i když mnoho uživatelů může považovat přímý přístup Le Chat za praktičtější pro každodenní použití.




Schopnosti generování obrázků


Integrace Flux Pro do Le Chat je velkou výhodou v oblasti generování obrázků. Systém produkuje velmi detailní vizuály s velkým dodržením pokynů, zejména vyniká v uměleckých stylech, přesné lidské anatomii a složité kompozici scén. Nedávné benchmarky umístily Flux Pro na špičku technologie generování obrázků, s výrazně lepšími výkony v oblastech jako je detail textury a prostorová koherence.




DALL-E 3 od ChatGPT, i když byl revoluční při spuštění, nyní ukazuje svůj věk vůči novějším modelům. Ačkoli je schopný produkovat použitelné obrázky, často se potýká s komplexními pokyny, podrobnými texturami a udržováním konzistentního stylu – oblastmi, kde Flux Pro vykazuje jasnou nadřazenost. Rozdíl je zvlášť patrný v úlohách generování obrázků profesionální kvality.




Vlastní AI agenti


Demokratický přístup Le Chat k AI agentům představuje významnou změnu v dostupnosti. Uživatelé mohou zdarma vytvářet, přizpůsobovat a nasazovat specializované agenty pro úkoly sahající od analýzy dat po kreativní psaní.


ChatGPT, na druhé straně, udržuje dvoustupňový systém. Zatímco bezplatní uživatelé mají přístup k předpřipraveným GPT, schopnost vytvářet vlastní zůstává prémiovou funkcí.


Kvalita těchto GPT je vynikající, a schopnost je konfigurovat pomocí pokynů v přirozeném jazyce je výhodou; ale omezení na nástroje pro vytváření a cenová bariéra omezuje potenciál pro personalizovanou optimalizaci pracovního postupu.


Schopnosti analýzy obrazu


Tento se zdá být remízou—alespoň v našich prvních rychlých testech. GPT-4V a Pixtral Large vykazují pozoruhodně podobné schopnosti v reálných aplikacích.


Oba vynikají v interpretaci diagramů, porozumění obrazům, matematické notaci a prostorovém uvědomění.


Verdikt

Zatímco benchmarkové čísla ukazují drobné variace pro LLM, Vision Models a modely generování obrázků, praktický rozdíl v každodenních případech použití není tak významný.


Oba systémy zvládají vše od kreativního psaní po technické diagramy s impozantní přesností, což činí volbu mezi nimi více o preferencích ekosystému než o rozdílech v schopnostech.


Volba mezi těmito platformami stále více závisí na specifických případech použití


ChatGPT zůstává nadřazený pro:



  • Akademické psaní


  • Složité technické dokumentace


  • Nuancované kreativní psaní


  • Pokročilé programovací výzvy



Le Chat nabízí lepší hodnotu pro:



  • Tvorba vizuálního obsahu


  • Webový výzkum


  • Analýza dokumentů


  • Úkoly každodenní produktivity


  • Automatizace pracovního postupu



Finanční důsledky jsou rozhodujícím faktorem: Le Chat nabízí přibližně 80-90 % funkcionality ChatGPT Plus zdarma, což z něj činí stále atraktivnější volbu pro jednotlivé uživatele a malé podniky působící pod rozpočtovými omezeními.


Celkově Mistral nyní nabízí lepší hodnotu, a jejich modely mohou uživatelům stačit natolik, aby ospravedlnily zrušení předplatného—alespoň dokud trvá zkušební období.


Upraveno Joshem Quittnerem a Sebastianem Sinclair.