Mistral AI, francouzská AI společnost založená bývalými zaměstnanci Google a Meta, právě přepracovala svou bezplatnou, multimodální AI platformu— a blíží se k vyrovnání, a někdy dokonce i překonání, placených nabídek od OpenAI nebo Anthropic.
Sada AI nástrojů z pařížského startupu nyní zahrnuje funkce webového vyhledávání a generování obrázků spolu s novým vizuálním modelem, který překonává větší konkurenty v klíčových benchmarkech.
Společnost vydala aktualizaci pro analýzu dokumentů, aktualizovaný velký jazykový model a Codestral, LLM zaměřený na úkoly programování.
Ale třešničkou na dortu je jeho využití Flux Pro k generování obrázků, což znamená, že je to multimodální chatbot s nejlepšími schopnostmi generování obrázků, které jsou aktuálně k dispozici. Nové rozhraní Canvas umožňuje přímou editaci obsahu, čímž umisťuje Le Chat—Mistralovo jméno pro jeho chatbot UI—jako nástroj připravený pro podnikání.
"Nehoníme AGI za každou cenu; naším posláním je místo toho umístit přední AI do vašich rukou," uvedl Mistral ve svém prohlášení, distancující se od širších ambic konkurentů v oblasti umělé obecné inteligence, které vyvolaly obavy mezi odborníky.
Společnost byla oceněna na 2 miliardy dolarů v prosincovém financování.
Pixtral Large, vizuální model o 124 miliardách parametrech, překonal GPT-4 a Google Gemini 1.5 Pro s 69,4% přesností na MathVista a 93,3% na DocVQA. Zvládá až 30 obrazů s vysokým rozlišením v rámci kontextového okna 128 000 tokenů.
Flux Pro mezitím překonává všechny ostatní generátory obrázků z hlediska kvality a rychlosti inference, jak již dříve uvedl Decrypt.
ChatGPT používá DALL-E, který je ve srovnání primitivní. Integrace Fluxu do Le Chat je tedy vítaným krokem.
Tyto funkce byly zavedeny jako "bezplatné beta nabídky,“ což uživatelům dává přístup k nejnovějším generativním AI nástrojům bez nákladů. Mistral neoznámil, kdy má v úmyslu začít účtovat za své nástroje.
ChatGPT vs. Mistral’s LeChat: Jak se srovnávají
Obě bezplatné verze chatbotů Mistral a ChatGPT jsme podrobili testu. Bylo zde mnoho podobností—většinou co se týče stylu psaní—ale rozdíly byly dostatečné k tomu, aby se objevily určité odlišnosti mezi oběma.
ChatGPT's GPT-4o zůstává korunovačním klenotem jazykových modelů, vykazuje bezkonkurenční nuanci v komplexním uvažování, kreativním psaní a technické analýze.
Jeho schopnost chápat kontext a udržovat koherentní, dlouhé konverzace určila standard v oboru. Během rozsáhlého testování ukázal GPT-4o pozoruhodnou schopnost v úkolech sahajících od literární analýzy po pokročilé programovací výzvy.
Mistral Large 2.5 od Le Chat, i když impozantní, funguje na úrovni pod GPT-4o v úlohách sofistikovaného uvažování. Nicméně v praktických aplikacích vyniká, nabízí rychlé odpovědi a robustní výkon pro každodenní úkoly. Ačkoli model má vícejazyčné schopnosti, obvykle je méně kreativní než GPT-4o.
Integrace webového vyhledávání
Le Chat nabízí bezplatnou funkci webového vyhledávání–uživatelé mohou přistupovat k aktuálním informacím s přímými odkazy na citace, podobně jako byste používali tradiční vyhledávač, ale s AI poháněnou syntézou. Integrace se zdá být přirozená a nenápadná, což činí ověřování faktů a pracovní postupy výzkumu výrazně efektivními. Bezplatný přístup k této funkci představuje významnou hodnotovou nabídku.
ChatGPT's SearchGPT, i když je sofistikovanější ve svém přístupu, je za paywallem. Přistupuje k webové integraci unikátním způsobem, často poskytuje více kontextové analýzy (až do bodu, kdy dokonce halucinuje některé odpovědi). Chrome plugin nabízí hlubší integraci s jazykovými modelovými schopnostmi OpenAI, i když mnoho uživatelů může považovat přímý přístup Le Chat za praktičtější pro každodenní použití.
Schopnosti generování obrázků
Integrace Flux Pro do Le Chat je velkou výhodou v oblasti generování obrázků. Systém produkuje velmi detailní vizuály s velkým dodržením pokynů, zejména vyniká v uměleckých stylech, přesné lidské anatomii a složité kompozici scén. Nedávné benchmarky umístily Flux Pro na špičku technologie generování obrázků, s výrazně lepšími výkony v oblastech jako je detail textury a prostorová koherence.
DALL-E 3 od ChatGPT, i když byl revoluční při spuštění, nyní ukazuje svůj věk vůči novějším modelům. Ačkoli je schopný produkovat použitelné obrázky, často se potýká s komplexními pokyny, podrobnými texturami a udržováním konzistentního stylu – oblastmi, kde Flux Pro vykazuje jasnou nadřazenost. Rozdíl je zvlášť patrný v úlohách generování obrázků profesionální kvality.
Vlastní AI agenti
Demokratický přístup Le Chat k AI agentům představuje významnou změnu v dostupnosti. Uživatelé mohou zdarma vytvářet, přizpůsobovat a nasazovat specializované agenty pro úkoly sahající od analýzy dat po kreativní psaní.
ChatGPT, na druhé straně, udržuje dvoustupňový systém. Zatímco bezplatní uživatelé mají přístup k předpřipraveným GPT, schopnost vytvářet vlastní zůstává prémiovou funkcí.
Kvalita těchto GPT je vynikající, a schopnost je konfigurovat pomocí pokynů v přirozeném jazyce je výhodou; ale omezení na nástroje pro vytváření a cenová bariéra omezuje potenciál pro personalizovanou optimalizaci pracovního postupu.
Schopnosti analýzy obrazu
Tento se zdá být remízou—alespoň v našich prvních rychlých testech. GPT-4V a Pixtral Large vykazují pozoruhodně podobné schopnosti v reálných aplikacích.
Oba vynikají v interpretaci diagramů, porozumění obrazům, matematické notaci a prostorovém uvědomění.
Verdikt
Zatímco benchmarkové čísla ukazují drobné variace pro LLM, Vision Models a modely generování obrázků, praktický rozdíl v každodenních případech použití není tak významný.
Oba systémy zvládají vše od kreativního psaní po technické diagramy s impozantní přesností, což činí volbu mezi nimi více o preferencích ekosystému než o rozdílech v schopnostech.
Volba mezi těmito platformami stále více závisí na specifických případech použití
ChatGPT zůstává nadřazený pro:
Akademické psaní
Složité technické dokumentace
Nuancované kreativní psaní
Pokročilé programovací výzvy
Le Chat nabízí lepší hodnotu pro:
Tvorba vizuálního obsahu
Webový výzkum
Analýza dokumentů
Úkoly každodenní produktivity
Automatizace pracovního postupu
Finanční důsledky jsou rozhodujícím faktorem: Le Chat nabízí přibližně 80-90 % funkcionality ChatGPT Plus zdarma, což z něj činí stále atraktivnější volbu pro jednotlivé uživatele a malé podniky působící pod rozpočtovými omezeními.
Celkově Mistral nyní nabízí lepší hodnotu, a jejich modely mohou uživatelům stačit natolik, aby ospravedlnily zrušení předplatného—alespoň dokud trvá zkušební období.
Upraveno Joshem Quittnerem a Sebastianem Sinclair.