Sursa retipăririi articolului: Brain Body

O imagine numită „Abisul modelelor mari” a devenit foarte populară anul trecut. Mâncătorii de pepeni au fost surprinși să constate că marea majoritate a modelelor mari erau înghesuite în niveluri fără fund. Ei „pretindeau că sunt pe cale să aterizeze”, „așteaptă să decidă când vor ateriza”, „ce a aterizat, dar nu a aterizat. „ și „de ce” Există atât de multe modele mari de care nu am auzit niciodată”…

Astăzi, numărul modelelor mari produse pe plan intern a ajuns la peste 200, iar „abisul” este și mai adânc.

Printre acestea, multe modele la scară mare la nivel scăzut, care reinventează în mod repetat roata, nu pot satisface nevoile persoanelor și industriilor, după ce sunt lansate, nimănui nu-i pasă de ele și este imposibil să facă valuri în industrie. Iar acele modele mari care au cu adevărat valoare tehnică și comercială sunt ca „dragonii ascunși în abis” și dau treptat semne de „zburare spre cer”.

În ultimul val de antreprenoriat AI care a început în jurul anului 2015, printre start-up-urile conduse de tehnologia CV computer vision, au fost cunoscute și SenseTime, Megvii Technology, Yuncong Technology și Yitu Technology, cunoscute sub numele de „Patru mici lebede ale CV-ului”. în calitate de „Four Little Dragons AI” din China, a devenit o întreprindere inovatoare iconică în acel ciclu de boom AI.

Apoi, în noul ciclu de prosperitate început de modelele mari, vor exista în mod natural „dragi ascunși care pândesc în abis”. Cine va deveni un potențial stoc precum „Patru mici dragoni ai inteligenței artificiale”? Răspunsul este practic ascuns în aceste trei eșaloane.

O gheară pe scară și jumătate a modelului mare „Patru mici dragoni”

Există o vorbă care circulă în industrie: inovațiile mici se bazează pe fabrici mari, în timp ce inovațiile mari se bazează pe fabrici mici. De la DeepMind în trecut până la OpenAI anul trecut, aceste echipe tehnice tinere și de ultimă oră s-au întors la rădăcinile lor de inovare, aducând schimbări perturbatoare în industrie în mod repetat, devenind „stocuri potențiale” în ochii practicienilor și investitorilor.

Așa-numitul „dragon ascuns” al modelelor mari are două condiții de bază:

Primul este „latent”, în comparație cu giganții tehnologici precum Google, Microsoft, Nvidia, Baidu, Tencent și Alibaba, a fost înființat pentru o perioadă mai scurtă de timp, are o echipă mai tânără și are o eficiență și flexibilitate organizațională mai ridicate.

Al doilea este „Dragon”, care are inovație tehnologică care nu este inferioară celei a marilor producători, sau chiar le depășește. Modelul de bază este auto-dezvoltat și este un model mare de uz general de nivel L0, care poate oferi o bază. pentru modele mari din industrie și modele mari verticale, are potențialul de a se transforma în mai multe industrii și este de așteptat să aducă o creștere mare și un randament ridicat al investiției.

Deși companiile de viziune artificială au lansat și modele mari cu capacități tehnice bune, acestea nu sunt considerate noi fețe ale AI. Deși Zero One Wish, care folosește arhitectura open source LLaMA, și Light Years Beyond, care a fost achiziționată de un producător important și nu mai concurează independent, este suficient de „nouă”, dezvoltarea sa a întâlnit un punct de cotitură major. Prin urmare, nu vom include aceste întreprinderi și modelele lor mari în această discuție.

În general, există trei tipuri de companii model mari, care sunt susținute în prezent de instituții de investiții bine-cunoscute sau de clienți din industrie din țară și din străinătate. Acestea au o recunoaștere înaltă a tehnologiei și un potențial de transformare comercială și pot fi considerate rezerve ale celor „Patru Big Model Little Dragons”.

1. Star Party

Echipa fondatoare a vedetei are popularitate și influență în industrie sau mediul academic De îndată ce va fi lansat modelul mare creat, va atrage atenția industriei datorită „efectului de vedetă”.

Inclusiv, Baichuan Intelligence fondată de fostul CEO al Sogou Wang Xiaochuan (în martie 2023, modele mari din seria Baichuan cu diverși parametri, fondată de Yan Junjie, fost director adjunct al Institutului de Cercetare SenseTime (în decembrie 2021, Owns ABAB Langboat); Lanzhou Technology (în iunie 2021, deține modelul universal mare Mencius) fondată de Dr. Zhou Ming, unul dintre cei mai timpurii cercetători în domeniul traducerii automate chineză-engleză din China și 2023 ACL Fellow.

2. Fluxul tehnic

În comparație cu „efectul de stea”, fluxul de tehnologie subliniază puterea tehnică, iar reprezentantul tipic este Zhipu AI. Fiind o companie start-up cu sediul în Tsinghua, Zhipu AI a luat OpenAI ca punct de referință când a fost înființată în 2019 și și-a stabilit obiectivul de a obține informații generale AGI. A fost una dintre primele companii de tehnologie din China care a lansat cercetarea și dezvoltarea a modelelor de pre-antrenament. Performanța GLM-4, cel mai recent model de bază la scară largă lansat de Zhipu AI, este, de asemenea, considerată a fi apropiată de GPT-4 OpenAI într-o serie de evaluări.

3.Pragmatic

Școala vedetă și fluxul de tehnologie care au mari speranțe sunt toate „de sus”, iar modelul pragmatic care a apărut din terenul de afaceri/comercial poate, de asemenea, să-și creeze o cale, bazându-se pe aplicații practice. De exemplu, modelul mare „Tiangong”, care va fi lansat în 2023, a fost dezvoltat independent de Kunlun Worldwide. Combinația dintre modelul mare AIGC și activitățile de căutare, jocuri, rețele sociale, divertisment și alte companii Kunlun Worldwide a intrat rapid în aplicație. ciclu, făcând din Kunlun Worldwide un cal întunecat care pătrunde în domeniul modelelor mari.

De remarcat că cele trei categorii se bazează pe „cea mai lungă placă”, ceea ce nu înseamnă că abilitatea altor piese nu este mare.

Performanța unui model mare cu o echipă fondatoare de stele poate să nu fie inferioară celei a unui flux tehnic cu un model de bază puternic poate, de asemenea, să conducă o echipă de operare puternică pentru a conduce produsul la sol, în timp ce școala pragmatică; construiește un ciocan pe baza unui cui”, dar dacă ciocanul nu este suficient de puternic, nu va putea lovi nimic, așa că și capacitatea tehnică trebuie să fie excelentă.

Privind în abisul „comercializării” modelelor mari

Vizarea celor „Patru Tigri AI” poate să nu facă mari companii de modele foarte fericite, dar le va face și mai îngrijorați.

„Cei patru tigri AI” cu viziunea computerizată ca nucleu au capacități puternice de finanțare în stadiu incipient, dar întâmpină, în general, dificultăți în comercializare și se confruntă cu dificultăți în ceea ce privește profitabilitatea și valoarea de piață în scădere. În spatele „abisului” aterizării modelelor mari se află un drum mai lung spre comercializare.

Cu toate acestea, sustragerea și păstrarea secretelor nu pot înlătura preocupările investitorilor, piețelor și utilizatorilor. Indiferent dacă marile companii de modele sunt dispuse să privească în abis sau nu, abisul a privit marile modele.

În fața abisului „comercializării” modelelor mari, în comparație cu runda anterioară de IA, există trei noi și unul vechi:

Trei noi: mediu nou, scară nouă și cerințe noi.

Pentru a spune simplu, marile companii de model se confruntă cu un mediu de finanțare mai riguros Pe măsură ce lichiditatea globală scade, este dificil pentru companiile de tehnologie să mențină evaluări ridicate, cum ar fi Google, concediază angajați pentru a „reduce costurile și crește eficiența”. făcând finanțarea mai dificilă De exemplu, nivelul de finanțare al Zhipu AI este în mod evident mai mic decât cel al SenseTime.

În același timp, modelele mari sunt o industrie care necesită investiții mari. Concurența tehnică pentru modelele de bază este departe de a fi încheiată. Investitorii care au învățat din runda anterioară de experiență în investiții și finanțare AI sunt deosebit de calmi atunci când se confruntă cu modele mari și au propus cerințe mai mari pentru profitabilitatea autogenerată a companiilor înființate.

Yiji: Este încă dificil să standardizezi AI.

Nan Ju și Bei Zhi, atunci când fac AI în China, este absolut imposibil să copiem OpenAI este dificil de făcut, dacă se realizează cu adevărat, investiția în echiparea unei echipe mari pentru a asigura siguranța și conformitatea nu este mică.

Piața toB este, de asemenea, foarte diferită. Majoritatea companiilor autohtone nu au încredere în modelul SaaS și preferă implementarea privatizată inginerii de algoritmi să meargă în prima linie pentru a lucra la proiecte de sute de mii.

În ceea ce privește piața toG, concurența în proiectele inteligente este acerbă, iar profiturile sunt mici pentru multă muncă. și toți au făcut bani câștigați cu greu. În general, costul proiectelor CV computer vision este mai mare decât cel al procesării limbajului natural NLP. Prin urmare, este foarte dificil pentru modelele de limbaj mari să obțină prețuri unitare mari pe baza sistemului de proiect.

Motivul este că majoritatea proiectelor AI de pe piața ToB/ToG sunt implementate ca soluții, instituțiile guvernamentale și ale întreprinderilor preferă să introducă software și hardware, cum ar fi AI, cloud și IoT, pentru a crea soluții personalizate pentru ele înșiși să fie standardizate și modulare. Livrarea rapidă într-o formă standardizată necesită o investiție inițială mare.

Din această perspectivă, investiția totală este mai mare, beneficiile unui singur proiect sunt mai mici, iar provocările de comercializare ale modelelor mari sunt mai severe decât valul anterior de companii de viziune artificială.

Deci, „Marele Model Patru Dragoni Mici” va face din nou aceeași greșeală?

Dragonul sare în abis, unde este profitul pentru modelele mari?

Dacă înțelegi trecutul, nu ar trebui să reproșezi, dar dacă știi ce urmează, poți să-l urmărești. Nu este nevoie să fim pesimiști atunci când ne confruntăm cu problema comercializării AI. De fapt, am văzut că majoritatea jucătorilor de rezervă ai „Patru mici dragoni” ai modelului mare pot începe să învețe din experiență și să deschidă jocuri noi. De asemenea, am găsit câteva puncte comune:

Un lucru în comun: reducerea costurilor, dar nu „creșterea râsului”.

Pe plan intern, vom „restrânge cheltuielile” și vom îmbunătăți eficiența umană. În comparație cu „algoritmii/oamenii de știință foarte plătiți” din ultima rundă de boom antreprenorial AI, acești modele mari de „dragon ascunși” se vor concentra de la început pe „raportul eficienței umane”.

Lichiditatea ridicată și evaluarea ridicată a industriei tehnologiei au dat naștere anterior expansiunii aleatorii a „unicornilor”, care, la rândul lor, a dus la un număr mare de ineficiențe. De exemplu, „lucrătorii minuni” din Silicon Valley erau pricepuți în diferite limbaje de programare și inițial și-au externalizat munca Mai multor ingineri chinezi, aceasta a rămas nedetectată timp de câțiva ani. Acest mediu a dus, de asemenea, la o contracție semnificativă a inovației și la costuri extrem de mari de recrutare pentru companiile nou-înființate.

În acest val de antreprenoriat cu modele mari, companiile sunt mai precaute cu privire la extinderea personalului. Zhou Ming a spus odată presei că, atunci când a început afacerea, echipa a fost compusă doar din el însuși. Mai târziu, s-a extins la 5 persoane și a început încet să antreneze modelul Mencius construit cu o echipă „ușoară”. o scară de 100 de oameni în viitor. Baichuan Intelligence și Zhipu AI au idei similare.

Reduceți costurile externe și creșteți potențialul de profit al companiilor mari model. Ajută întreprinderile și utilizatorii să „economisească” și să reducă costul aplicării modelelor mari. Problema multor clienți este că presiunea costurilor pentru utilizarea modelelor mari este foarte mare și speră să combine modele mari și mici pentru a îmbunătăți raportul intrare-ieșire. De exemplu, Baichuan și Zhipu AI au lansat modele mari cu parametri multipli pentru a integra nevoi diferite.

Punctul comun doi: concentrați-vă pe toB și acordați atenție fluxului de numerar.

Aceste companii model mari s-au concentrat pe piața toB încă de la început, Zhang Peng, CEO al Zhipu AI, și Zhou Ming, fondatorul Lanzhou Technology, au precizat că acordă prioritate dezvoltării afacerii de servicii pentru întreprinderi.

De la digitalizare la inteligență, producătorii tradiționali de AI trebuie să educe utilizatorii de la zero pentru a explica valoarea tehnologiei AI în reducerea costurilor și creșterea eficienței. În comparație, gradul de conștientizare și acceptarea modelelor mari sunt foarte mari. Toate categoriile sociale au o dorință puternică de productivitate și un consens cu privire la aplicarea IA. Acest lucru oferă companiilor model mari o bază foarte bună pentru creștere.

„Large Model Bidding Demand Analysis Briefing (ianuarie-noiembrie 2023)” publicat de Bailian Intelligence arată că începând cu luna iulie, odată cu apariția a 130 de modele mari interne, cererea de licitare pentru modele mari a început să prezinte o tendință ascendentă semnificativă. Noiembrie a marcat un vârf de creștere, cererea aproape triplat față de luna precedentă. Printre acestea, majoritatea companiilor aleg să investească 100.000-500.000 de bugete pentru încercări la scară mică. În același timp, multe companii reprezentate de întreprinderile de stat au început să elibereze bugete de proiecte de milioane.

După cum am menționat anterior, banii lui toB s-ar putea să nu fie ușor de câștigat. Deși clienții corporativi sunt mai dispuși să plătească decât utilizatorii C-end, aplicațiile toC pot fi standardizate și pot atrage utilizatorii să plătească la scară largă, în timp ce proiectele inteligente toB necesită personalizare și necesită investiții mai mari. Anterior, companiile de viziune artificială doreau, de asemenea, să aplice modele AI în diferite scenarii și să le generalizeze, dar au descoperit că modelul de afaceri din lumea reală era încă puternic personalizat și costul rămânea ridicat.

Această problemă are un consens relativ larg în rândul marilor antreprenori model și toți explorează în mod activ soluții. CEO-ul Baichuan Intelligence, Wang Xiaochuan, a dezvăluit odată mass-media că este necesar să depășim problema personalizării toB, să îmbunătățim baza de cunoștințe prin căutare configurabilă și ajustabilă și să rezolvăm nevoile personalizate ale clienților într-o manieră productivă prin diferite combinații de produse.

Trei lucruri în comun: fă-ți prieteni și open source activ.

Unul dintre principalele motive pentru care „personalizarea” a devenit o nevoie naturală pentru întreprinderi este că implementarea AI în scenariile de afaceri începe de la zero pentru a fi eficiente. Inteligența este o afacere lentă pe termen lung și nu poate fi separată de partenerii ecologici pentru a pătrunde adânc în industrie și pentru a face multă muncă personalizată.

De-a lungul anilor, echipa noastră a vizitat multe fabrici de AI+, creșterea porcilor AI+, inspecții AI+, mine de cărbune AI+, docuri AI+ și alte proiecte inteligente. manageri și alți oameni de tot felul, unii au stat în câmpuri, docuri și depozite câteva luni pentru a înțelege nevoile de lucru ale personalului de bază și pentru a proiecta procesul de operare de la zero.

Iar inteligența este adesea însoțită de „dezumanizare”, uneori personalul din prima linie nu va înțelege și nu va coopera, ceea ce întârzie foarte mult progresul proiectului. Într-o iarnă, când echipa inteligentă a unei mine de cărbune efectua cercetări la o anumită stație din nordul Shaanxi, personalul nu a vrut să vorbească cu ei, așa că în mod deliberat nu au pornit încălzitorul, sperând că se vor retrage pe vremea rece. Altă dată, la o fermă de porci, conducerea a sperat să folosească camere inteligente pentru a detecta temperatura corporală a porcilor în timp real pentru a preveni bolile infecțioase, cum ar fi pesta porcină. Cu toate acestea, performanța algoritmului nu a putut fi îmbunătățită investigații repetate la fața locului și au constatat că motivul a fost că porcii Pielea este prea groasă, ceea ce reduce acuratețea recunoașterii temperaturii corpului...

Nu este greu de observat că prețul unitar al acestor proiecte mici, mijlocii și microîntreprinderi de sute de mii sau sute de mii poate să nu fie la fel de mare ca cel al marilor clienți B/guvernamentali, dar sunt mari ca număr și mari. la scară și să folosească modele mari de bază ca bază pentru dezvoltarea personalizată. Poate crește foarte mult rata de utilizare a producătorilor de modele de bază și poate atrage mai mulți parteneri/furnizori de servicii ISV pentru a construi versiuni comerciale.

Pentru a atrage parteneri din industrie, Baichuan Intelligence, Zhipu AI, Kunlun Wanwei și Lanzhou Technology au toate modele open source.

Dar știm cu toții că open source este ușor, dar ecologia este dificilă. După ce un model mare este open source, ecosistemul nu poate prospera Fără dezvoltatorii să continue să contribuie și să creeze o versiune comercială, nu se poate forma un ciclu pozitiv.

Pentru a atrage dezvoltatori, în primul rând, capacitățile modelului de bază trebuie să fie excelente și nu trebuie să existe defecte în înțelegerea logicii analizei. Altman a spus odată că multe probleme ale GPT-4 vor fi rezolvate în GPT-5 și speră că dezvoltatorii pot proiecta afaceri bazate pe inteligența artificială generală AGI. Cu alte cuvinte, un nou model mai puternic poate șterge valoarea comercială a vechiului model, lăsând dezvoltatorii să lucreze complet în zadar. Prin urmare, dezvoltatorii vor alege cu siguranță să-și concentreze timpul și energia pe acele modele de bază cele mai avansate, pentru a evita apariția prea repede.

În plus, este necesară o stivă de instrumente bună și completă. Modelele mari trebuie să fie bine folosite, iar software-ul trebuie să sufere, de asemenea, anumite adaptări și transformări. Există multe companii start-up printre cei „Patru mici dragoni”, iar echipa de ingineri poate fi diferită de companiile mature precum BAT în ceea ce privește scara, talentul, experiența și acumularea. De exemplu, programarea sarcinilor, citirea codului, documentația tehnică, seturile standard de date etc. pot reduce sarcina dezvoltatorilor și partenerilor și pot folosi împreună modelele mari.

Fie că este vorba de „Patru mici dragoni AI” cândva splendidi sau de „Patru Big Model Little Dragons” în curs de dezvoltare, aceste companii au folosit tehnologii ascuțite și idealuri pline de spirit pentru a ridica „tavanul” inovației din nou și din nou, ceea ce este de netrecut pentru tehnologia chineză.

China inteligentă deschide o lume mai largă. Aceste modele mari de „stocuri potențiale” vor avea cu siguranță dragoni sărind peste abis și călătorind prin cele nouă ceruri.