Atualmente, a fase de computação e treinamento na indústria de IA é principalmente dominada por gigantes centralizados do Web2. Essas empresas, com seu forte poder de capital, equipamentos de hardware de ponta e vastos recursos de dados, ocupam uma posição dominante. Embora essa situação possa persistir ao desenvolver os modelos de aprendizado de máquina (ML) mais poderosos, para modelos de médio porte ou personalizados, as redes Web3 podem gradualmente se tornar uma fonte de recursos computacionais mais econômica e acessível.
Da mesma forma, quando a demanda por inferência ultrapassa a capacidade dos dispositivos de borda pessoais, alguns consumidores podem optar por redes Web3 para obter saídas com menos censura e mais diversidade. Em vez de tentar desmantelar totalmente toda a pilha de tecnologia de IA, os participantes do Web3 devem se concentrar nesses cenários específicos e aproveitar ao máximo suas vantagens únicas em resistência à censura, transparência e verificabilidade social.
Os recursos de hardware necessários para treinar a próxima geração de modelos fundamentais (como GPT ou BERT) são escassos e caros, e a demanda por chips de alto desempenho continuará a superar a oferta. Essa escassez de recursos resulta na concentração de hardware em poucas empresas de ponta com financiamento adequado, que utilizam esse hardware para treinar e comercializar os modelos fundamentais com melhor desempenho e maior complexidade.
No entanto, a velocidade de atualização do hardware é extremamente rápida. Então, como o hardware de médio ou baixo desempenho, que está obsoleto, será utilizado?
Esse hardware provavelmente será utilizado para treinar modelos mais simples ou mais direcionados. Ao combinar diferentes categorias de modelos com hardware de diferentes desempenhos, é possível otimizar a alocação de recursos. Nesse caso, os protocolos Web3 podem desempenhar um papel crucial ao coordenar o acesso a recursos computacionais diversificados e de baixo custo. Por exemplo, os consumidores podem usar modelos simples de médio porte treinados com conjuntos de dados pessoais e escolher modelos de alto desempenho, treinados e hospedados por empresas centralizadas, apenas ao lidar com tarefas mais complexas, garantindo que a identidade do usuário seja oculta e os dados de entrada sejam criptografados.
Além das questões de eficiência, as preocupações com preconceitos e potenciais censuras em modelos centralizados estão crescendo. O ambiente Web3 é conhecido por sua transparência e verificabilidade, sendo capaz de oferecer suporte ao treinamento de modelos que foram ignorados ou considerados excessivamente sensíveis pelo Web2. Embora esses modelos possam não ser competitivos em desempenho e inovação, ainda têm um valor significativo para certos grupos na sociedade. Portanto, os protocolos Web3 podem abrir um mercado único nesta área, oferecendo serviços de treinamento de modelos mais abertos, confiáveis e resistentes à censura.
Inicialmente, as abordagens centralizadas e descentralizadas podem coexistir, atendendo a diferentes casos de uso. No entanto, à medida que o Web3 continua a melhorar a experiência do desenvolvedor e a compatibilidade da plataforma, e os efeitos de rede da IA de código aberto começam a se tornar evidentes, o Web3 pode, eventualmente, competir no núcleo das empresas centralizadas. Especialmente quando os consumidores se tornam cada vez mais conscientes das limitações dos modelos centralizados, as vantagens do Web3 se tornarão ainda mais evidentes.
Além do treinamento de modelos de médio porte ou de nicho, os participantes do Web3 também têm a vantagem de fornecer soluções de inferência mais transparentes e flexíveis. Serviços de inferência descentralizados podem trazer uma variedade de benefícios, como zero tempo de inatividade, combinações modulares de modelos, avaliações de desempenho de modelos públicas e saídas mais diversificadas e sem censura. Esses serviços também podem evitar efetivamente o problema de 'aprisionamento de fornecedor' que os consumidores enfrentam ao depender de alguns poucos provedores centralizados. Assim como o treinamento de modelos, a vantagem competitiva da camada de inferência descentralizada não reside na capacidade computacional em si, mas na resolução de problemas de longa data, como a transparência dos parâmetros de ajuste de código fechado, a falta de verificabilidade e os altos custos.
Dan Olshansky propôs uma ideia promissora, que é criar mais oportunidades para pesquisadores e engenheiros de IA através da rede de roteamento de inferência de IA do POKT, permitindo que eles coloquem seus resultados de pesquisa em prática e obtenham receita adicional por meio de modelos de aprendizado de máquina (ML) ou inteligência artificial (AI) personalizados. Mais importante ainda, essa rede pode promover uma concorrência mais justa no mercado de serviços de inferência ao integrar resultados de inferência de diferentes fontes, incluindo provedores descentralizados e centralizados.
Embora previsões otimistas sugiram que toda a pilha de tecnologia de IA pode eventualmente migrar completamente para a blockchain, atualmente, esse objetivo ainda enfrenta enormes desafios devido à centralização dos dados e recursos computacionais, pois esses recursos oferecem uma vantagem competitiva significativa para os gigantes existentes. No entanto, a coordenação descentralizada e as redes computacionais demonstram um valor único ao fornecer serviços de IA mais personalizados, econômicos, competitivos e resistentes à censura. Ao se concentrar nesses mercados de nicho onde esses valores são mais críticos, o Web3 pode estabelecer suas próprias barreiras competitivas, garantindo que as tecnologias mais impactantes desta era possam evoluir em várias direções, beneficiando um espectro mais amplo de partes interessadas, em vez de serem monopolizadas por alguns poucos gigantes tradicionais.
Por fim, gostaria de agradecer especialmente a todos os membros da equipe da Placeholder Investment, bem como a Kyle Samani da Multicoin Capital, Anand Iyer da Canonical VC, Keccak Wong da Nectar AI, Alpin Yukseloglu da Osmosis Labs e Cameron Dennis da NEAR Foundation, que forneceram revisões e valiosos comentários durante a redação deste artigo.