В конце июля Марк Цукерберг написал письмо, в котором объяснил, почему «открытый исходный код необходим для позитивного будущего ИИ», где он поэтично отзывается о необходимости разработки ИИ с открытым исходным кодом. Некогда занудный подросток-основатель, а теперь превратившийся в вейкбордиста, щеголяющего в золотой цепочке и занимающегося джиу-джитсу «Цука», был назван мессией разработки модели с открытым исходным кодом.
Но до сих пор он и команда Meta не особо говорили о том, как эти модели развертываются. Поскольку сложность модели повышает требования к вычислениям, если развертывание модели контролируется горсткой участников, то разве мы не поддались подобной форме централизации? Децентрализованный ИИ обещает решить эту проблему, но технология требует усовершенствований в ведущих в отрасли криптографических методах и уникальных гибридных решениях.
Эта статья является частью новой рубрики DePIN Vertical на CoinDesk, посвященной развивающейся отрасли децентрализованной физической инфраструктуры.
В отличие от централизованных облачных провайдеров, децентрализованный ИИ (DAI) распределяет вычислительные процессы для вывода и обучения ИИ по нескольким системам, сетям и локациям. При правильной реализации эти сети, тип децентрализованной сети физической инфраструктуры (DePIN), приносят преимущества в сопротивлении цензуре, доступе к вычислениям и стоимости.
DAI сталкивается с проблемами в двух основных областях: среда ИИ и сама децентрализованная инфраструктура. По сравнению с централизованными системами, DAI требует дополнительных мер безопасности для предотвращения несанкционированного доступа к деталям модели или кражи и копирования конфиденциальной информации. По этой причине существует недостаточно изученная возможность для команд, которые сосредоточены на моделях с открытым исходным кодом, но признают потенциальный недостаток производительности моделей с открытым исходным кодом по сравнению с их аналогами с закрытым исходным кодом.
Децентрализованные системы в частности сталкиваются с препятствиями в целостности сети и накладных расходах ресурсов. Например, распределение клиентских данных по отдельным узлам раскрывает больше векторов атак. Злоумышленники могут раскрутить узел и проанализировать его вычисления, попытаться перехватить передачу данных между узлами или даже внести предубеждения, которые ухудшают производительность системы. Даже в безопасной децентрализованной модели вывода должны быть механизмы аудита вычислительных процессов. Узлы мотивированы экономить затраты на ресурсы, представляя неполные вычисления, а проверка осложняется отсутствием доверенного централизованного субъекта.
Доказательства с нулевым разглашением
Доказательства с нулевым разглашением (ZKP), хотя в настоящее время они слишком дороги в вычислительном отношении, являются одним из потенциальных решений некоторых проблем DAI. ZKP — это криптографический механизм, который позволяет одной стороне (доказывающей) убедить другую сторону (проверяющей) в истинности утверждения, не разглашая никаких подробностей о самом утверждении, кроме его действительности. Проверка этого доказательства выполняется быстро для других узлов и дает возможность каждому узлу доказать, что он действовал в соответствии с протоколом. Технические различия между системами доказательств и их реализациями (подробнее об этом позже) важны для инвесторов в этой области.
Централизованные вычисления делают обучение модели эксклюзивным для нескольких игроков с хорошими позициями и ресурсами. ZKP могут стать частью разблокировки простаивающих вычислений на потребительском оборудовании; например, MacBook может использовать свою дополнительную пропускную способность вычислений для обучения большой языковой модели, зарабатывая токены для пользователя.
Развертывание децентрализованного обучения или вывода с помощью потребительского оборудования находится в центре внимания таких команд, как Gensyn и Inference Labs; в отличие от децентрализованной вычислительной сети, такой как Akash или Render, шардинг вычислений добавляет сложности, а именно проблемы с плавающей точкой. Использование простаивающих распределенных вычислительных ресурсов открывает двери для небольших разработчиков для тестирования и обучения собственных сетей — при условии, что у них есть доступ к инструментам, которые решают сопутствующие проблемы.
В настоящее время системы ZKP, по-видимому, на четыре-шесть порядков дороже, чем запуск вычислений изначально, и для задач, требующих высокой вычислительной мощности (например, обучения модели) или низкой задержки (например, вывода модели), использование ZKP является непозволительно медленным. Для сравнения, падение на шесть порядков означает, что передовая система (например, Jolt от a16z), работающая на чипе M3 Max, может выполнить программу в 150 раз медленнее, чем запуск ее на графическом калькуляторе TI-84.
Способность ИИ обрабатывать большие объемы данных делает его совместимым с доказательствами с нулевым разглашением (ZKP), но необходим больший прогресс в криптографии, прежде чем ZKP смогут широко использоваться. Работа, проводимая такими командами, как Irreducible (разработавшими систему доказательств Binius и схему обязательств), Gensyn, TensorOpera, Hellas и Inference Labs, среди прочих, станет важным шагом на пути к достижению этого видения. Однако сроки остаются чрезмерно оптимистичными, поскольку настоящие инновации требуют времени и математического прогресса.
В то же время стоит отметить другие возможности и гибридные решения. HellasAI и другие разрабатывают новые методы представления моделей и вычислений, которые могут обеспечить оптимистичную игру с вызовом, допуская только подмножество вычислений, которые должны обрабатываться с нулевым разглашением. Оптимистичные доказательства работают только при наличии ставок, возможности доказать неправомерность и реальной угрозы того, что вычисление проверяется другими узлами в системе. Другой метод, разработанный Inference Labs, проверяет подмножество запросов, где узел обязуется сгенерировать ZKP с облигацией, но представляет доказательство только в том случае, если оно сначала оспорено клиентом.
В сумме
Децентрализованное обучение и вывод ИИ будут служить защитой от консолидации власти несколькими крупными игроками, одновременно разблокируя ранее недоступные вычисления. ZKP будут неотъемлемой частью реализации этого видения. Ваш компьютер сможет зарабатывать вам реальные деньги незаметно, используя дополнительную вычислительную мощность в фоновом режиме. Кратчайшие доказательства того, что вычисления были выполнены правильно, сделают доверие, которое используют крупнейшие поставщики облачных услуг, ненужным, позволяя вычислительным сетям с более мелкими поставщиками привлекать корпоративных клиентов.
Хотя доказательства с нулевым разглашением сделают возможным это будущее и станут неотъемлемой частью не только вычислительных сетей (как видение Ethereum для окончательности одного слота), их вычислительные издержки остаются препятствием. Гибридные решения, которые сочетают игровую механику оптимистичных игр с выборочным использованием доказательств с нулевым разглашением, являются лучшим решением и, вероятно, станут повсеместными в качестве связующего звена, пока ZKP не станут намного быстрее.
Для местных и неместных криптоинвесторов понимание ценности и проблем децентрализованных систем ИИ будет иметь решающее значение для эффективного размещения капитала. Команды должны иметь ответы на вопросы, касающиеся доказательств вычислений узлов и избыточности сетей. Кроме того, как мы наблюдали во многих проектах DePIN, децентрализация происходит со временем, и четкий план команд относительно этого видения имеет важное значение. Решение проблем, связанных с вычислениями DePIN, имеет важное значение для передачи контроля обратно отдельным лицам и мелким разработчикам — жизненно важная часть сохранения наших систем открытыми, свободными и устойчивыми к цензуре.
Примечание: Мнения, выраженные в этой колонке, принадлежат автору и не обязательно отражают точку зрения CoinDesk, Inc. или ее владельцев и аффилированных лиц.