Наприкінці липня Марк Цукерберг написав листа, пояснюючи, чому «відкритий код необхідний для позитивного майбутнього штучного інтелекту», де він поетично говорить про необхідність розробки штучного інтелекту з відкритим кодом. Колись засновник-підліток-ботанік, який тепер став кататися на вейкборді, носити золоті ланцюжки та битися з джиу-джитсу «Цуком», був названий месією розробки моделей з відкритим кодом.
Але поки що він і команда Meta не сформулювали багато про те, як розгортаються ці моделі. Оскільки складність моделі підвищує вимоги до обчислень, якщо розгортання моделі контролюється невеликою кількістю учасників, то чи не піддалися ми подібній формі централізації? Децентралізований штучний інтелект обіцяє вирішити цю проблему, але ця технологія вимагає вдосконалення провідних у галузі криптографічних методів і унікальних гібридних рішень.
Ця стаття є частиною нової версії DePIN від CoinDesk, яка охоплює індустрію децентралізованої фізичної інфраструктури, що розвивається.
На відміну від централізованих хмарних провайдерів, децентралізований ШІ (DAI) розподіляє обчислювальні процеси для висновків ШІ та навчання між кількома системами, мережами та місцями. У разі правильного впровадження ці мережі, тип децентралізованої мережі фізичної інфраструктури (DePIN), приносять переваги в стійкості до цензури, доступі до комп’ютера та вартості.
DAI стикається з проблемами у двох основних сферах: середовище ШІ та сама децентралізована інфраструктура. Порівняно з централізованими системами, DAI вимагає додаткових заходів захисту, щоб запобігти несанкціонованому доступу до деталей моделі або крадіжці та тиражуванню конфіденційної інформації. З цієї причини існує недостатньо вивчена можливість для команд, які зосереджуються на моделях із відкритим вихідним кодом, але визнають потенційний недолік продуктивності моделей із відкритим вихідним кодом порівняно з їх аналогами із закритим кодом.
Децентралізовані системи особливо стикаються з перешкодами в цілісності мережі та накладними ресурсами. Розподіл клієнтських даних між окремими вузлами, наприклад, відкриває більше векторів атак. Зловмисники можуть розкрутити вузол і проаналізувати його обчислення, спробувати перехопити передачу даних між вузлами або навіть внести упередження, які погіршать продуктивність системи. Навіть у захищеній децентралізованій моделі висновку повинні бути механізми для аудиту обчислювальних процесів. Вузли стимулюються економити кошти на ресурсах, представляючи неповні обчислення, а перевірка ускладнюється відсутністю довіреного централізованого учасника.
Докази з нульовим знанням
Докази з нульовим знанням (ZKPs), хоча наразі занадто дорогі з точки зору обчислень, є одним із потенційних рішень деяких проблем DAI. ZKP — це криптографічний механізм, який дозволяє одній стороні (доказу) переконати іншу сторону (верифікатор) у правдивості твердження, не розголошуючи жодних деталей про саме твердження, окрім його дійсності. Перевірка цього доказу є швидкою для інших вузлів і пропонує кожному вузлу спосіб довести, що він діяв відповідно до протоколу. Технічні відмінності між системами перевірки та їх реалізаціями (про це пізніше) важливі для інвесторів у космос.
Централізовані обчислення дозволяють тренуватися моделям виключно для кількох добре позиціонованих і забезпечених ресурсами гравців. ZKP можуть бути частиною розблокування неактивних обчислень на споживацькому обладнанні; MacBook, наприклад, може використовувати свою додаткову пропускну здатність обчислень, щоб допомогти навчити широкомовну модель, заробляючи маркери для користувача.
Розгортання децентралізованого навчання або висновків із споживчим апаратним забезпеченням є центром уваги таких команд, як Gensyn і Inference Labs; на відміну від децентралізованих обчислювальних мереж, таких як Akash або Render, шардинг обчислень додає складності, а саме проблема з плаваючою комою. Використання неактивних розподілених обчислювальних ресурсів відкриває двері для невеликих розробників для тестування та навчання власних мереж — за умови, що вони мають доступ до інструментів, які вирішують відповідні проблеми.
На даний момент системи ZKP на чотири-шість порядків дорожчі, ніж власне виконання обчислень, а для завдань, які вимагають великих обчислень (наприклад, навчання моделі) або низької затримки (як модельний висновок), використання ZKP є непомірно повільним. Для порівняння, падіння на шість порядків означає, що передова система (наприклад, Jolt від a16z), що працює на чіпі M3 Max, може довести, що програма в 150 разів повільніша, ніж її виконання на графічному калькуляторі TI-84.
Здатність штучного інтелекту обробляти великі обсяги даних робить його сумісним із доказами з нульовим знанням (ZKP), але для широкого використання ZKP потрібен більший прогрес у криптографії. Робота, яку виконують такі команди, як Irreducible (яка розробила систему доказів Binius і схему зобов’язань), Gensyn, TensorOpera, Hellas і Inference Labs, серед інших, стане важливим кроком у досягненні цього бачення. Тим не менш, терміни залишаються надто оптимістичними, оскільки справжні інновації потребують часу та математичного прогресу.
А поки варто звернути увагу на інші можливості та гібридні рішення. HellasAI та інші розробляють нові методи представлення моделей і обчислень, які можуть увімкнути оптимістичну гру викликів, дозволяючи лише підмножину обчислень, які потрібно обробляти з нульовим знанням. Оптимістичні докази працюють лише тоді, коли є ставка, можливість довести неправомірні дії та загроза того, що обчислення перевіряються іншими вузлами системи. Інший метод, розроблений Inference Labs, перевіряє підмножину запитів, де вузол бере на себе зобов’язання створити ZKP із зв’язком, але надає доказ лише в тому випадку, якщо вперше запитує клієнт.
У сумі
Децентралізоване навчання штучного інтелекту та його висновки слугуватимуть запобіжником від консолідації влади кількома основними учасниками, одночасно розблоковуючи раніше недоступні обчислення. ЗКП стануть невід’ємною частиною реалізації цього бачення. Ваш комп’ютер зможе непомітно заробляти реальні гроші, використовуючи додаткову обчислювальну потужність у фоновому режимі. Короткі докази того, що обчислення було виконано правильно, зроблять непотрібною довіру найбільших хмарних провайдерів, дозволяючи обчислювальним мережам з меншими провайдерами залучати корпоративну клієнтуру.
Хоча докази з нульовим знанням уможливлять таке майбутнє і стануть невід’ємною частиною не лише обчислювальних мереж (як-от бачення Ethereum для єдиного слота), їхні обчислювальні витрати залишаються перешкодою. Гібридні рішення, які поєднують теорію ігор у оптимістичних іграх із вибірковим використанням доказів із нульовим знанням, є кращим рішенням і, ймовірно, стануть повсюдними як сполучна точка, доки ZKP не стануть набагато швидшими.
Для місцевих і немісцевих криптоінвесторів розуміння цінності та проблем децентралізованих систем штучного інтелекту буде мати вирішальне значення для ефективного розміщення капіталу. Команди повинні мати відповіді на запитання щодо доказів обчислення вузла та резервування мережі. Крім того, як ми спостерігали в багатьох проектах DePIN, децентралізація відбувається з часом, і чіткий план команд щодо цього бачення є важливим. Вирішення проблем, пов’язаних із обчисленням DePIN, має важливе значення для повернення контролю окремим особам і невеликим розробникам — важливої складової підтримки відкритості, безкоштовності та стійкості наших систем до цензури.
Примітка: погляди, висловлені в цій колонці, належать автору та не обов’язково відображають погляди CoinDesk, Inc. або її власників і афілійованих осіб.