Proč se technologické společnosti snaží vyvíjet menší a levnější modely umělé inteligence?

Společnosti s umělou inteligencí se dlouho chlubily masivní velikostí a schopnostmi svých produktů, ale v poslední době se začaly zaměřovat na menší a efektivnější modely, které podle společností pomohou snížit náklady a spotřebu energie.
Programy jako ChatGPT jsou založeny na algoritmech známých jako „velké jazykové modely“ a tvůrci chatbota se loni chlubili, že model GPT-4 obsahuje téměř dva biliony „parametrů“, stavebních kamenů těchto modelů.
Obrovská velikost modelu GPT-4 umožňuje ChatGPT odpovídat na dotazy v různých oblastech od astrofyziky po zoologii, ale pokud společnost potřebuje software, který zná něco konkrétního, jako jsou krokodýli, může být algoritmus mnohem menší.
Jak říká Laurent Felix z poradenské společnosti Equimetrics: „Nepotřebujete znát podmínky Versailleské smlouvy, abyste odpověděli na otázku týkající se konkrétního prvku inženýrství.“
Jděte k menším modelům
Společnosti jako Google, Microsoft, Meta a OpenAI začínají nabízet menší formuláře a Amazon také zpřístupňuje všechny velikosti formulářů na své cloudové platformě.
Na nedávné akci v Paříži Cara Hirst, ředitelka Amazonu pro udržitelnost, řekla, že tento posun ukazuje, že technologický průmysl směřuje k „umírněnosti a šetrnosti“.
Požadavky na napájení malých modelů
Malé formuláře jsou vhodnější pro jednoduché úkoly, jako je sumarizace nebo indexování dokumentů nebo prohledávání interní databáze.
Například americká farmaceutická společnost Merck vyvíjí model ve spolupráci s Boston Consulting Group, aby pochopila vliv některých nemocí na geny „Bude to velmi malý model, v rozmezí od stovek milionů do několika milionů,“ řekla Nicola de Bellefon, šéf umělé inteligence v Boston Consulting Group Miliardy transakcí.
Laurent Daudet, prezident francouzského startupu LightOn, který se specializuje na malé modely, uvedl, že tyto modely mají ve srovnání s jejich většími modely mnoho výhod a dodal: „Často jsou rychlejší a dokážou reagovat na více dotazů a uživatelů zároveň Poukázal také na to, že jsou méně Spotřebovává více energie, čímž je ekologičtější, což je jeden z hlavních problémů spojených s umělou inteligencí.
Velké modely vyžadují obrovské shluky serverů pro „trénování“ programů umělé inteligence a zpracování dotazů Tyto servery, složené z velmi pokročilých čipů, vyžadují k provozu a chlazení obrovské množství elektřiny. Malé modely potřebují mnohem méně čipů, což je činí levnější a energeticky účinnější.
Malé modely nepotřebují datová centra
Zdůrazňuje také, že malé modely mohou fungovat bez potřeby datových center, protože je lze instalovat přímo na zařízení „Toto je jeden způsob, jak snížit uhlíkovou stopu našich modelů,“ řekl Arthur Mensch, prezident francouzského startupu Mistral AI. .
Laurent Felix poukázal na to, že používání modelů přímo na zařízeních také znamená větší „zabezpečení a důvěrnost dat“, protože programy lze trénovat pomocí soukromých dat bez obav z jejich úniku.
Větší modely však mají stále výhodu při řešení složitých problémů a přístupu k široké škále dat a de Bellefon řekl, že budoucnost bude pravděpodobně zahrnovat různé modely, které spolu komunikují.
Dodal: "Bude malý model, který porozumí otázce a poté odešle tyto informace několika modelům různých velikostí v závislosti na složitosti otázky. Jinak budeme čelit řešením, která jsou buď velmi drahá, nebo velmi pomalá, nebo obojí. ."