Джерело передруку статті: Brain Body
Картина під назвою «Безодня великих моделей» набула великої популярності минулого року. Диньоїди з подивом виявили, що переважна більшість великих моделей скупчилися на бездонних рівнях.Вони «стверджували, що збираються приземлитися», «чекали, щоб вирішити, коли вони приземляться», «що приземлилися, але не приземлилися». " і "чому" Є так багато великих моделей, про які я ніколи не чув"…
Сьогодні кількість великогабаритних моделей вітчизняного виробництва перевищила 200, а «прірва» ще глибша.
Серед них багато низькорівневих великомасштабних моделей, які постійно винаходять колесо, не можуть задовольнити потреби окремих людей і галузей. Після їх випуску ніхто про них не піклується, і неможливо викликати хвилі в галузі. А ті великі моделі, які справді мають технічну та комерційну цінність, схожі на «захованих драконів у безодні» і поступово демонструють ознаки «зльоту в небо».
Під час останньої хвилі підприємництва штучного інтелекту, яка почалася приблизно в 2015 році, серед стартапів, очолюваних технологією комп’ютерного зору CV, SenseTime, Megvii Technology, Yuncong Technology і Yitu Technology, відомі як «CV Four Little Swans», також були відомі як Китайські «Чотири маленьких дракона ШІ» стали культовим інноваційним підприємством у цьому циклі буму ШІ.
Потім у новому циклі процвітання, розпочатому великими моделями, природним чином з’являться «приховані дракони, що ховаються в безодні». Хто стане потенційною акцією, як «Чотири маленькі дракони ШІ»? Відповідь, в основному, прихована в цих трьох ешелонах.
Полуторний кіготь великої моделі "Чотири дракончика"
У промисловості поширена приказка: малі інновації залежать від великих фабрик, тоді як великі інновації залежать від маленьких фабрик. Від DeepMind у минулому до OpenAI минулого року, ці молоді та передові технічні команди повернулися до своїх витоків інновацій, знову і знову вносячи руйнівні зміни в галузь, стаючи «потенційними акціями» в очах практиків та інвесторів.
Так званий «прихований дракон» великих моделей має дві основні умови:
Перший — «латентний». Порівняно з технологічними гігантами, такими як Google, Microsoft, Nvidia, Baidu, Tencent і Alibaba, він був створений за короткий період часу, має молодшу команду та має вищу організаційну ефективність і гнучкість.
Другий — «Dragon», який має технологічні інновації, які не поступаються великим виробникам або навіть перевершують їх. Базова модель — це велика модель загального призначення рівня L0, яка може стати основою для. великих галузевих моделей і вертикальних великих моделей, має потенціал для трансформації в кілька галузей і, як очікується, принесе швидке зростання та високу віддачу від інвестицій.
Хоча компанії з машинного зору також випустили великі моделі з хорошими технічними можливостями, вони не вважаються новими обличчями ШІ. Що стосується Zero One Wanwan, який використовує архітектуру LLaMA з відкритим вихідним кодом, і Light Years Beyond, який був придбаний великим виробником і більше не конкурує незалежно, хоча він досить «новий», його розвиток зіткнувся з великим поворотним моментом. Тому ми не будемо включати ці підприємства та їх великі моделі в це обговорення.
Загалом, існує три типи великих модельних компаній, які наразі підтримуються відомими інвестиційними установами або галузевими клієнтами в країні та за кордоном. Вони мають високий потенціал визнання технологій та комерційної трансформації та можуть розглядатися як резерви «четвірки». Велика модель маленьких драконів».
1. Зіркова вечірка
Команда зірок-засновників має популярність і вплив у промисловості чи академічних колах. Щойно створена велика модель буде випущена, вона приверне увагу індустрії завдяки своєму «ефекту зірки».
Включно з Baichuan Intelligence, заснованим колишнім генеральним директором Sogou Ван Сяочуанем (у березні 2023 року, серія Baichuan з декількома параметрами); Компанію Lanzhou Technology заснував доктор Чжоу Мін, один із перших дослідників у галузі китайсько-англійського машинного перекладу в Китаї та член ACL 2023 року (у червні 2021 року володіє універсальною великою моделлю Mencius).
2.Технічний потік
У порівнянні з «ефектом зірки», технологічний потік підкреслює технічну силу, і типовим представником є Zhipu AI. Будучи стартап-компанією з Цинхуа, Zhipu AI взяла OpenAI за еталон під час свого створення в 2019 році та поставила за мету досягнення загального інтелектуального розвитку AGI. Це була одна з перших технологічних компаній у Китаї, яка запустила дослідження та розробки моделей попереднього навчання. Продуктивність GLM-4, останньої великомасштабної базової моделі, випущеної Zhipu AI, також вважається близькою до GPT-4 OpenAI у ряді оцінок.
3.Прагматичний
Зіркова школа та технологічний напрямок, які покладають великі надії, — це все «вище», і прагматична модель, яка виросла з бізнес-/комерційного ґрунту, також може зробити собі шлях, покладаючись на практичне застосування. Наприклад, велика модель «Tiangong», яка буде випущена в 2023 році, була незалежно розроблена компанією Kunlun Worldwide. Поєднання великої моделі AIGC і компаній Kunlun Worldwide, які займаються пошуком, іграми, розвагами та іншими компаніями, швидко ввійшли в додаток. циклу, що робить Kunlun Worldwide темною конячкою, яка вривається в область великих моделей.
Слід зазначити, що три категорії базуються на «найдовшій дошці», що не означає, що здатність інших треків не є високою.
Продуктивність великої моделі із зірковою командою-засновником може бути не гіршою за технічну групу з сильною базовою моделлю; будує молоток на основі цвяха» , але якщо молоток недостатньо міцний, він не зможе ні про що вдарити, тому технічне вміння також має бути відмінним.
Вдивляючись у безодню «комерціалізації» великих моделей
Орієнтація на «Чотири тигри штучного інтелекту» може не дуже порадувати великі модельні компанії, але змусить їх більше хвилюватися.
«Чотири тигри штучного інтелекту», в основі яких лежить комп’ютерне бачення, мають потужні фінансові можливості на ранніх стадіях, але вони зазвичай стикаються з труднощами в комерціалізації та такими труднощами, як прибутковість і зниження ринкової вартості. За «прірвою» посадки великих моделей лежить довший шлях до комерціалізації.
Однак уникнення та збереження таємниць не може розвіяти занепокоєння інвесторів, ринків і користувачів. Незалежно від того, чи хочуть великі модельні компанії дивитися в безодню, чи ні, безодня дивиться на великих моделей.
Перед прірвою «комерціалізації» великих моделей, порівняно з попереднім раундом ШІ, є три нових і одна стара:
Три нових: нове середовище, новий масштаб і нові вимоги.
Простіше кажучи, великі модельні компанії стикаються з більш жорстким фінансовим середовищем, тому технологічним компаніям важко підтримувати високі оцінки. Такі великі компанії, як Google, звільняють працівників, щоб «зменшити витрати та підвищити ефективність». що ускладнює фінансування, наприклад, рівень фінансування Zhipu AI явно нижчий, ніж у SenseTime.
У той же час, великі моделі потребують серйозних інвестицій у базові моделі. Постійне дослідження вгору означає спалювання грошей у довгостроковій перспективі. Інвестори, які засвоїли досвід попереднього раунду інвестування та фінансування штучного інтелекту, особливо спокійні перед великими моделями та висунули більш високі вимоги до прибутковості компаній-початківців.
Їдзі: Все ще важко стандартизувати ШІ.
Нань Джу та Бей Чжі, абсолютно неможливо скопіювати OpenAI у Китаї. Ми повинні бачити суворі факти: китайський ринок toC не дуже хоче платити за штучний інтелект та інші програмні продукти Навіть якщо ми дійсно хочемо це зробити, ми повинні Інвестиції в оснащення великої команди для забезпечення безпеки та відповідності не малі.
Ринок toB також дуже відрізняється. Більшість вітчизняних компаній не довіряють моделі SaaS і віддають перевагу приватизованому розгортанню інженерів-алгоритмів для роботи над проектами вартістю в сотні тисяч.
Що стосується ринку toG, конкуренція в інтелектуальних проектах є жорсткою, а прибутки невеликі за велику кількість роботи. В останньому раунді компаній машинного бачення вони в основному займалися автономним водінням, розумними містами, безпекою та іншими видами діяльності. і всі вони заробили важко зароблені гроші. Загалом вартість проектів CV з комп’ютерним баченням вища, ніж обробка природної мови NLP, тому для великих мовних моделей дуже важко отримати високі одиничні ціни на основі системи проекту.
Причина полягає в тому, що більшість проектів ШІ на ринку ToB/ToG реалізуються як рішення Урядові та корпоративні установи віддають перевагу впровадженню програмного та апаратного забезпечення, такого як ШІ, хмара та Інтернет речей, для створення індивідуальних рішень для себе бути стандартизованим і модульним. Швидка доставка в стандартизованій формі вимагає великих початкових інвестицій.
З цієї точки зору загальні інвестиції більші, вигоди від окремого проекту менші, а проблеми комерціалізації великих моделей більш серйозні, ніж у попередній хвилі компаній машинного зору.
Отже, чи "Велика модель, чотири маленькі дракони" повторить ту саму помилку?
Дракон стрибає в прірву, де ж вихід прибутку для великих моделей?
Якщо ви розумієте минуле, ви не можете застерігати його, але якщо ви знаєте, що прийде, ви можете переслідувати це. Немає потреби бути песимістом, стикаючись з проблемою комерціалізації штучного інтелекту. Фактично, ми побачили, що більшість резервних гравців «Чотирьох маленьких драконів» великої моделі можуть почати вчитися на досвіді та відкривати нові ігри. Ми також знайшли деякі спільні риси:
Одне спільне: зниження витрат, але не «збільшення сміху».
Внутрішньо ми «обмежимо витрати» та підвищимо ефективність роботи людей. Порівняно з «високооплачуваними алгоритмами/вченими» в останньому раунді підприємницького буму ШІ, ці великі моделі «прихованих драконів» з самого початку зосереджуватимуться на «коефіцієнті ефективності людини».
Висока ліквідність і висока оцінка технологічної індустрії раніше призвели до випадкового розширення «єдинорогів», що, в свою чергу, призвело до великої кількості неефективності. Наприклад, «чудотворці» Силіконової долини добре володіли різними мовами програмування і спочатку передали свою роботу багатьом китайським інженерам, але це залишалося непоміченим протягом кількох років. Це середовище також призвело до значного скорочення інновацій і надзвичайно високих витрат на наймання для компаній-початківців.
У цій хвилі великого підприємництва компанії більш обережні щодо збільшення персоналу. Чжоу Мін одного разу розповів ЗМІ, що команда складалася лише з 5 осіб, і повільно почали тренувати модель «легкої» команди масштабі 100 осіб у майбутньому. Baichuan Intelligence та Zhipu AI мають схожі ідеї.
Зменшити зовнішні витрати та збільшити потенціал прибутку великих модельних компаній. Допомогти підприємствам і користувачам «економити» і знизити витрати на застосування великих моделей. Проблема багатьох клієнтів полягає в тому, що витрати на використання великих моделей є дуже високими, і вони сподіваються поєднати великі та малі моделі, щоб покращити співвідношення витрат і випуску. Наприклад, Baichuan і Zhipu AI запустили великі моделі з кількома параметрами для інтеграції різних потреб.
Загальний момент другий: зосередьтеся на ToB і зверніть увагу на грошовий потік.
Ці великі модельні компанії з самого початку зосередилися на ринку toB Чжан Пен, генеральний директор Zhipu AI, і Чжоу Мін, засновник Lanzhou Technology, чітко дали зрозуміти, що вони надають пріоритет розвитку бізнесу корпоративних послуг.
Від цифровізації до інтелекту, традиційні виробники штучного інтелекту повинні навчати користувачів з нуля, щоб пояснити цінність технології штучного інтелекту для зниження витрат і підвищення ефективності. Для порівняння, обізнаність і прийняття великих моделей дуже високі. У всіх сферах життя є сильне бажання продуктивності та консенсус щодо застосування ШІ. Це дає великим модельним компаніям дуже хорошу основу для зростання.
«Брифінг аналізу попиту на ставки великих моделей (січень-листопад 2023 року)», опублікований Bailian Intelligence, показує, що, починаючи з липня, з появою 130 великих вітчизняних моделей, попит на ставки великих моделей почав демонструвати значну тенденцію до зростання. У листопаді відбувся пік зростання, коли попит зріс майже втричі порівняно з попереднім місяцем. Серед них більшість компаній обирають інвестувати бюджет від 100 000 до 500 000 для невеликих спроб. У той же час багато компаній, представлених державними підприємствами, почали випускати мільйонні бюджети проектів.
Як згадувалося раніше, гроші toB може бути непросто заробити. Хоча корпоративні клієнти більш готові платити, ніж кінцеві користувачі C, додатки toC можна стандартизувати та залучати користувачів до оплати у великих масштабах, тоді як інтелектуальні проекти toB вимагають налаштування та більших інвестицій. Раніше компанії, що займаються машинним баченням, також хотіли застосувати моделі штучного інтелекту в різних сценаріях і узагальнити їх, але виявили, що бізнес-модель реального світу все ще сильно налаштована, а вартість залишається високою.
Ця проблема має відносно широкий консенсус серед великих модельних підприємців, і всі вони активно шукають шляхи вирішення. Генеральний директор Baichuan Intelligence Ван Сяочуань одного разу заявив ЗМІ, що необхідно вирішити проблему налаштування ToB, розширити базу знань за допомогою настроюваного та регульованого пошуку та вирішувати індивідуальні потреби клієнтів продуктивним способом за допомогою різних комбінацій продуктів.
Три спільні речі: заводити друзів і активно відкривати код.
Однією з головних причин, чому «налаштування» стало природною потребою для підприємств, є те, що впровадження штучного інтелекту в бізнес-сценарії має бути інтегровано з бізнесом, щоб бути ефективним. Розвідка — це довготривалий повільний бізнес, і його неможливо відокремити від екологічних партнерів, щоб заглибитися в галузь і виконати багато індивідуальної роботи.
За ці роки наша команда відвідала багато заводів AI+, свинарство AI+, інспекції AI+, вугільні шахти AI+, доки AI+ та інші інтелектуальні проекти: вчені, інженери-алгоритми, оператори продуктів компаній AI, Project менеджери та інші люди різного роду, деякі залишалися на полях, доках і складах протягом кількох місяців, щоб зрозуміти робочі потреби низового персоналу та спроектувати робочий процес з нуля.
А розвідка часто супроводжується «дегуманізацією». Іноді передовий персонал не розуміє й не співпрацює, що значно затримує хід проекту. Одного разу взимку, коли інтелектуальна команда вугільної шахти проводила дослідження на певній станції в північній частині Шеньсі, персонал не хотів з ними розмовляти, тому вони навмисно не вмикали обігрівач, сподіваючись, що вони відступлять у холодну погоду. Іншого разу на свинофермі керівництво сподівалося використовувати розумні камери для вимірювання температури тіла свиней у режимі реального часу, щоб запобігти інфекційним захворюванням, таким як свиняча чума, однак, нарешті, техніки не змогли покращити роботу алгоритму повторні дослідження на місці та виявили, що причина полягала в тому, що шкіра свиней занадто товста, що знижує точність розпізнавання температури тіла...
Неважко помітити, що ціна одиниці цих проектів малого, середнього та мікропідприємства в сотні тисяч чи сотень тисяч може бути не такою високою, як ціна великих B/урядових клієнтів, але їх кількість велика і велика. у масштабі та використовувати базові великі моделі як основу для індивідуальної розробки. Це може значно збільшити рівень використання виробниками базових моделей і залучити більше партнерів/постачальників послуг ISV для створення комерційних версій.
Щоб залучити галузевих партнерів, Baichuan Intelligence, Zhipu AI, Kunlun Wanwei і Lanzhou Technology відкрили кілька моделей з відкритим кодом.
Але всі ми знаємо, що з відкритим вихідним кодом легко, а от з екологією складно. Після відкритого вихідного коду великої моделі екосистема не може процвітати, якщо розробники продовжуватимуть робити свій внесок і створювати комерційну версію.
Щоб залучити розробників, по-перше, можливості базової моделі повинні бути відмінними, і не повинно бути недоліків у розумінні логіки аналізу. Альтман якось сказав, що багато проблем GPT-4 будуть вирішені в GPT-5, і він сподівається, що розробники зможуть проектувати бізнес на основі загального штучного інтелекту AGI. Іншими словами, більш потужна нова модель може знищити комерційну цінність старої моделі, залишивши розробників працювати абсолютно марно. Тому розробники, безперечно, вирішать зосередити свій час і енергію на найдосконаліших базових моделях, щоб уникнути надто швидкого згортання.
Крім того, потрібен хороший і повний комплект інструментів. Великі моделі повинні використовуватися належним чином, і програмне забезпечення також має пройти певні адаптації та трансформації. Буде перевірено інженерні можливості виробників великих моделей і чи є програмне забезпечення зручним для розробників. Серед «Чотирьох маленьких драконів» є багато компаній-початківців, і команда інженерів може відрізнятися від зрілих компаній, таких як BAT, з точки зору масштабу, таланту, досвіду та накопичення. Наприклад, планування завдань, читабельність коду, технічна документація, стандартні набори даних тощо можуть зменшити навантаження на розробників і партнерів і спільно ефективно використовувати великі моделі.
Незалежно від того, чи це колись чудові «Чотири маленьких дракона штучного інтелекту» чи нові «Чотири великі модельні маленькі дракони», ці компанії використовували гострі технології та життєрадісні ідеали, щоб знову і знову піднімати «стелю» інновацій, що є непереборною для китайської техніки.
Розумний Китай відкриває ширший світ. Ці великі модельні «потенційні запаси» напевно змусять драконів стрибати через безодню та подорожувати дев’ятьма небесами.