No final de julho, Mark Zuckerberg escreveu uma carta explicando por que “o código aberto é necessário para um futuro positivo de IA”, onde ele fala poeticamente sobre a necessidade do desenvolvimento de IA de código aberto. O fundador adolescente, antes nerd, agora transformado no “Zuck” praticante de wakeboard, usando correntes de ouro e lutador de jiu-jitsu, foi rotulado como o messias do desenvolvimento de modelos de código aberto.

Mas até agora, ele e a equipe Meta não articularam muito sobre como esses modelos estão sendo implantados. À medida que a complexidade do modelo aumenta os requisitos de computação, se a implantação do modelo for controlada por um punhado de atores, então não sucumbimos a uma forma semelhante de centralização? A IA descentralizada promete resolver esse desafio, mas a tecnologia requer avanços em técnicas criptográficas líderes do setor e soluções híbridas exclusivas.

Este artigo de opinião faz parte do novo DePIN Vertical da CoinDesk, que abrange o setor emergente de infraestrutura física descentralizada.

Diferentemente de provedores de nuvem centralizados, a IA descentralizada (DAI) distribui os processos computacionais para inferência e treinamento de IA em vários sistemas, redes e locais. Se implementadas corretamente, essas redes, um tipo de rede de infraestrutura física descentralizada (DePIN), trazem benefícios em resistência à censura, acesso à computação e custo.

O DAI enfrenta desafios em duas áreas principais: o ambiente de IA e a infraestrutura descentralizada em si. Comparado a sistemas centralizados, o DAI requer salvaguardas adicionais para evitar acesso não autorizado a detalhes do modelo ou roubo e replicação de informações proprietárias. Por esse motivo, há uma oportunidade pouco explorada para equipes que se concentram em modelos de código aberto, mas reconhecem a potencial desvantagem de desempenho dos modelos de código aberto em comparação com suas contrapartes de código fechado.

Sistemas descentralizados enfrentam obstáculos específicos na integridade da rede e sobrecarga de recursos. A distribuição de dados do cliente em nós separados, por exemplo, expõe mais vetores de ataque. Os invasores podem girar um nó e analisar seus cálculos, tentar interceptar transmissões de dados entre nós ou até mesmo introduzir vieses que degradam o desempenho do sistema. Mesmo em um modelo de inferência descentralizado seguro, deve haver mecanismos para auditar processos de computação. Os nós são incentivados a economizar custos em recursos apresentando cálculos incompletos, e a verificação é complicada pela falta de um ator centralizado e confiável.

Provas de Conhecimento Zero

Provas de conhecimento zero (ZKPs), embora atualmente muito caras computacionalmente, são uma solução potencial para alguns desafios de DAI. ZKP é um mecanismo criptográfico que permite que uma parte (o provador) convença outra parte (o verificador) da verdade de uma declaração sem divulgar nenhum detalhe sobre a declaração em si, exceto sua validade. A verificação dessa prova é rápida para outros nós executarem e oferece uma maneira para cada nó provar que agiu de acordo com o protocolo. As diferenças técnicas entre sistemas de prova e suas implementações (mergulho profundo sobre isso mais tarde) são importantes para investidores no espaço.

A computação centralizada torna o treinamento de modelos exclusivo para um punhado de jogadores bem posicionados e com recursos. Os ZKPs podem ser uma parte do desbloqueio da computação ociosa no hardware do consumidor; um MacBook, por exemplo, pode usar sua largura de banda de computação extra para ajudar a treinar um modelo de linguagem grande enquanto ganha tokens para o usuário.

Implantar treinamento descentralizado ou inferência com hardware do consumidor é o foco de equipes como Gensyn e Inference Labs; diferentemente de uma rede de computação descentralizada como Akash ou Render, fragmentar as computações adiciona complexidade, ou seja, o problema do ponto flutuante. Fazer uso de recursos de computação distribuída ociosos abre a porta para desenvolvedores menores testarem e treinarem suas próprias redes — desde que tenham acesso a ferramentas que resolvam os desafios associados.

Atualmente, os sistemas ZKP são aparentemente quatro a seis ordens de magnitude mais caros do que executar a computação nativamente, e para tarefas que exigem alta computação (como treinamento de modelo) ou baixa latência (como inferência de modelo), usar um ZKP é proibitivamente lento. Para comparação, uma queda de seis ordens de magnitude significa que um sistema de ponta (como o Jolt da a16z) em execução em um chip M3 Max pode provar um programa 150 vezes mais lento do que executá-lo em uma calculadora gráfica TI-84.

A capacidade da IA ​​de processar grandes quantidades de dados a torna compatível com provas de conhecimento zero (ZKPs), mas mais progresso em criptografia é necessário antes que as ZKPs possam ser amplamente utilizadas. O trabalho sendo feito por equipes como Irreducible (que projetou o sistema de provas e o esquema de comprometimento Binius), Gensyn, TensorOpera, Hellas e Inference Labs, entre outros, será um passo importante para atingir essa visão. Os cronogramas, no entanto, permanecem excessivamente otimistas, pois a verdadeira inovação leva tempo e avanço matemático.

Enquanto isso, vale a pena observar outras possibilidades e soluções híbridas. A HellasAI e outras estão desenvolvendo novos métodos de representação de modelos e computações que podem permitir um jogo de desafio otimista, permitindo apenas um subconjunto de computação que precisa ser manipulado em conhecimento zero. Provas otimistas só funcionam quando há staking, a capacidade de provar irregularidades e uma ameaça crível de que a computação está sendo verificada por outros nós no sistema. Outro método, desenvolvido pela Inference Labs, valida um subconjunto de consultas em que um nó se compromete a gerar um ZKP com um vínculo, mas só apresenta a prova se for desafiado primeiro pelo cliente.

Em suma

O treinamento e a inferência de IA descentralizada servirão como uma salvaguarda contra a consolidação de poder por alguns atores principais, ao mesmo tempo em que desbloqueiam computação anteriormente inacessível. Os ZKPs serão parte integrante da viabilização dessa visão. Seu computador poderá lhe render dinheiro real imperceptivelmente, utilizando poder de processamento extra em segundo plano. Provas sucintas de que uma computação foi realizada corretamente tornarão desnecessária a confiança que os maiores provedores de nuvem alavancam, permitindo que redes de computação com provedores menores atraiam clientela empresarial.

Embora as provas de conhecimento zero habilitem esse futuro e sejam uma parte essencial de mais do que apenas redes de computação (como a visão do Ethereum para finalidade de slot único), sua sobrecarga computacional continua sendo um obstáculo. Soluções híbridas que combinam mecânicas de teoria de jogos de jogos otimistas com uso seletivo de provas de conhecimento zero são uma solução melhor e provavelmente se tornarão onipresentes como um ponto de ligação até que os ZKPs se tornem muito mais rápidos.

Para investidores nativos e não nativos de criptomoedas, entender o valor e os desafios dos sistemas de IA descentralizados será crucial para implementar capital de forma eficaz. As equipes devem ter respostas para perguntas sobre provas de computação de nós e redundâncias de rede. Além disso, como observamos em muitos projetos DePIN, a descentralização ocorre ao longo do tempo, e o plano claro das equipes em relação a essa visão é essencial. Resolver os desafios associados à computação DePIN é essencial para devolver o controle a indivíduos e pequenos desenvolvedores — uma parte vital para manter nossos sistemas abertos, livres e resistentes à censura.

Observação: as opiniões expressas nesta coluna são do autor e não refletem necessariamente as da CoinDesk, Inc. ou de seus proprietários e afiliados.