Autor: Mahesh Ramakrishnan, Vinayak Kurup, CoinDesk Compilador: Tao Zhu, Golden Finance;
No final de julho, Mark Zuckerberg escreveu uma carta explicando por que “o código aberto é essencial para um futuro positivo da IA”, na qual elogiou a necessidade do desenvolvimento da IA de código aberto. O outrora adolescente nerd fundador agora se tornou “Zuckerberg”, que pratica esqui aquático, usa correntes de ouro e pratica jiu-jitsu, e é conhecido como o salvador do desenvolvimento de modelos de código aberto.
Mas até agora, ele e a equipe Meta não detalharam como esses modelos serão implantados. À medida que a complexidade do modelo aumenta nos requisitos computacionais, estaremos sucumbindo a uma forma semelhante de centralização se a implantação do modelo for controlada por um pequeno número de atores? A IA descentralizada promete resolver este desafio, mas a tecnologia requer avanços na criptografia líder do setor e soluções híbridas exclusivas.
Ao contrário dos provedores de nuvem centralizados, a IA descentralizada (DAI) distribui os processos computacionais de inferência e treinamento de IA em vários sistemas, redes e locais. Se implementadas corretamente, estas redes – uma rede de infraestrutura física descentralizada (DePIN) – trarão benefícios em termos de resistência à censura, acesso computacional e custo.
A DAI enfrenta desafios em duas áreas principais: o ambiente de IA e a própria infraestrutura descentralizada. Comparado aos sistemas centralizados, o DAI exige salvaguardas adicionais para evitar o acesso não autorizado aos detalhes do modelo ou o roubo e cópia de informações proprietárias. Portanto, há uma oportunidade subexplorada para equipes focadas em modelos de código aberto, mas que reconhecem as potenciais desvantagens de desempenho dos modelos de código aberto em comparação com modelos de código fechado.
Os sistemas descentralizados enfrentam particularmente obstáculos relacionados à integridade da rede e à sobrecarga de recursos. Por exemplo, a distribuição de dados de clientes em diferentes nós expõe mais vetores de ataque. Um invasor pode ativar um nó e analisar seus cálculos, tentar interceptar transferências de dados entre nós ou até mesmo introduzir vieses que degradam o desempenho do sistema. Mesmo em modelos de inferência descentralizados seguros, deve haver mecanismos para auditar o processo computacional. Os nós economizam custos de recursos ao renderizar cálculos incompletos, e a verificação é complicada pela falta de um participante centralizado confiável.
Prova de conhecimento zero
As provas de conhecimento zero (ZKPs), embora atualmente computacionalmente proibitivas, são uma solução potencial para alguns dos desafios da DAI. ZKP é um mecanismo criptográfico que permite a uma parte (o provador) convencer outra parte (o verificador) da veracidade de uma afirmação sem revelar quaisquer detalhes sobre a afirmação em si, exceto quanto à sua validade. Esta prova pode ser rapidamente verificada por outros nós e fornece a cada nó uma forma de provar que agiu de acordo com o protocolo. Demonstrar as diferenças técnicas entre o sistema e a sua implementação (mais sobre isto mais tarde) é importante para os investidores neste espaço.
A computação centralizada limita o treinamento de modelos a alguns participantes bem posicionados e ricos em recursos. O ZKP poderia fazer parte do desbloqueio da computação ociosa no hardware do consumidor; por exemplo, um MacBook poderia usar sua largura de banda de computação extra para ajudar a treinar grandes modelos de linguagem enquanto ganhava tokens para os usuários.
A implantação de treinamento ou inferência descentralizada usando hardware de consumo é o foco de equipes como Gensyn e Inference Labs, ao contrário de redes de computação descentralizadas como Akash ou Render, a fragmentação de computação adiciona complexidade, principalmente problemas de ponto flutuante; Aproveitar recursos de computação distribuídos ociosos abre a porta para pequenos desenvolvedores testarem e treinarem suas próprias redes, desde que tenham acesso a ferramentas que resolvam os desafios relevantes.
Atualmente, os sistemas ZKP parecem ser de quatro a seis ordens de magnitude mais caros do que executar a computação localmente, tornando o uso do ZKP muito lento para tarefas que exigem alta computação (como treinamento de modelo) ou baixa latência (como inferência de modelo). Em comparação, uma queda de seis ordens de magnitude significa que sistemas de ponta (como o Jolt do a16z) executados em um chip M3 Max demonstram programas que são 150 vezes mais lentos do que executados em uma calculadora gráfica TI-84.
A capacidade da IA de processar grandes quantidades de dados a torna compatível com provas de conhecimento zero (ZKPs), mas é necessário mais progresso na criptografia antes que as ZKPs possam ser amplamente utilizadas. O trabalho contínuo de equipes como Irredutible (que projetou o sistema de prova e esquema de compromisso Binius), Gensyn, TensorOpera, Hellas e Inference Labs será um passo importante para concretizar essa visão. No entanto, o cronograma ainda é demasiado optimista, uma vez que a verdadeira inovação requer tempo e avanços matemáticos.
Ao mesmo tempo, vale destacar outras possibilidades e soluções híbridas. HellasAI e outras empresas estão desenvolvendo novas formas de representar modelos e cálculos que permitem jogos de desafio otimistas, permitindo apenas o subconjunto de cálculos que precisam ser processados com conhecimento zero. As provas otimistas só funcionam se houver uma ameaça credível de piquetagem, a capacidade de provar irregularidades e outros nós do sistema verificando o cálculo. Outro método desenvolvido pela Inference Labs valida um subconjunto de consultas, onde um nó se compromete a produzir um ZKP com um depósito, mas só fornece prova se o cliente o contestar primeiro.
Resumir
O treinamento e a inferência descentralizados de IA servirão como uma salvaguarda contra alguns dos principais participantes que consolidam o poder e, ao mesmo tempo, desbloqueiam uma computação anteriormente inacessível. O ZKP será essencial para concretizar esta visão. Seu computador será capaz de ganhar dinheiro de verdade, mesmo sem perceber, utilizando o poder de processamento extra em segundo plano. Uma prova concisa de que os cálculos foram realizados corretamente tornaria desnecessária a confiança explorada pelos maiores provedores de nuvem, permitindo que redes de computação com provedores menores atraíssem clientes empresariais.
Embora as provas de conhecimento zero permitam este futuro e se tornem uma parte importante de mais do que apenas redes computacionais (como a visão da Ethereum de finalidade de slot único), a sua sobrecarga computacional continua a ser um obstáculo. Uma solução híbrida que combina a mecânica da teoria dos jogos de jogos otimistas com o uso seletivo de provas de conhecimento zero é uma solução melhor e provavelmente se tornará o ponto de ligação onipresente até que o ZKP se torne mais rápido.
Para investidores nativos e não nativos em criptomoedas, compreender o valor e os desafios dos sistemas descentralizados de IA é fundamental para a implementação eficaz do capital. A equipe deve ter respostas para perguntas sobre provas computacionais de nós e redundância de rede. Além disso, como observámos em muitos projectos DePIN, a descentralização acontece ao longo do tempo e é fundamental que a equipa tenha um plano claro para alcançar esta visão. Resolver os desafios associados à computação DePIN é fundamental para devolver o controle a indivíduos e pequenos desenvolvedores – uma parte essencial para manter nossos sistemas abertos, livres e resistentes à censura.