Autor original | @cebillhsu

Compilar |

O progresso das tecnologias de IA, como GPT-4, Gemini 1.5 e Microsoft AI PC, é impressionante, mas o desenvolvimento atual da IA ​​ainda enfrenta alguns problemas. Bill, pesquisador da Web3 na AppWorks, estudou os problemas em profundidade e discutiu como a criptografia pode. ajude 7 direções de capacitação de IA.

Tokenização de dados

O treinamento tradicional em IA depende principalmente de dados públicos disponíveis na Internet ou, mais precisamente, de dados de tráfego de domínio público. Exceto por algumas empresas que fornecem APIs abertas, a maioria dos dados permanece inexplorada. Como permitir que mais detentores de dados contribuam ou autorizem os seus dados para formação em IA e, ao mesmo tempo, garantir que a privacidade é protegida é uma orientação fundamental.

No entanto, o maior desafio enfrentado neste campo é que os dados são difíceis de padronizar, assim como o poder da computação. Embora o poder da computação distribuída possa ser quantificado por tipo de GPU, a quantidade, a qualidade e o uso de dados privados são difíceis de medir. Se o poder de computação distribuído for como o ERC 20, então a tokenização do conjunto de dados é como o ERC 721, o que torna a liquidez e a formação de mercado mais desafiadoras do que o ERC 20.

O recurso Compute-to-Data do Ocean Protocol permite que os proprietários de dados vendam dados privados enquanto protegem a privacidade. Vana oferece aos usuários do Reddit uma maneira de agregar dados e vendê-los para empresas que treinam grandes modelos de IA.

Alocação de recursos

Atualmente, existe uma enorme lacuna entre a oferta e a demanda de poder de computação da GPU, e as grandes empresas monopolizam a maior parte dos recursos da GPU, o que torna muito alto o custo dos modelos de treinamento para as pequenas empresas. Muitas equipes estão trabalhando arduamente para reduzir custos, concentrando recursos de GPU de pequena escala e de alto uso por meio de redes descentralizadas, mas ainda enfrentam grandes desafios para garantir poder de computação estável e largura de banda suficiente.

RLHF motivacional

RLHF (aprendizado por reforço baseado em feedback humano) é crucial para melhorar modelos grandes, mas requer treinamento especializado. À medida que aumenta a concorrência no mercado, aumenta também o custo de contratação desses profissionais. Para reduzir custos e ao mesmo tempo manter a anotação de alta qualidade, um sistema de piquetagem e corte pode ser usado. Um dos maiores gastos com anotação de dados é a necessidade de supervisores verificarem a qualidade. No entanto, ao longo dos anos, a blockchain utilizou com sucesso mecanismos de incentivo económico para garantir a qualidade do trabalho (PoW, PoS), e acredita-se que a criação de um bom sistema económico simbólico pode efetivamente reduzir o custo do RLHF.

Por exemplo, Sapien AI introduziu o Tag 2 Earn e cooperou com várias guildas de gamefi; Hivemapper tem 2 milhões de quilômetros de dados de treinamento rodoviário por meio de um mecanismo de incentivo simbólico. A QuillAudits planeja lançar um agente de auditoria de contrato inteligente de código aberto, permitindo que todos os auditores treinem em conjunto; o agente e seja recompensado.

Verificabilidade

Como verificar se o provedor de poder computacional executa tarefas de inferência de acordo com requisitos ou modelos específicos? Os usuários não podem verificar a autenticidade e precisão do modelo de IA e seus resultados. Esta falta de verificabilidade pode levar à desconfiança, erros e até danos em áreas como finanças, saúde e direito.

Ao usar sistemas de verificação criptográfica como ZKP, OP e TEE, os provedores de serviços de inferência podem provar que os resultados foram executados por um modelo específico. Os benefícios do uso da verificação criptográfica incluem que os provedores de modelos podem manter a confidencialidade do modelo, os usuários podem verificar se a execução do modelo está correta e a integração da criptografia de prova em contratos inteligentes pode contornar as limitações do poder de computação do blockchain. Ao mesmo tempo, você também pode considerar a execução de IA diretamente no lado do dispositivo para resolver problemas de desempenho, mas até agora não vimos uma resposta satisfatória. Os projetos construídos neste campo incluem Ritual, ORA e Aizel Network.

deepfake

Com o surgimento da IA ​​de produção, as pessoas estão prestando cada vez mais atenção à questão dos deep fakes (DeepFake). No entanto, a tecnologia deepfake está a avançar mais rapidamente do que a tecnologia de deteção, pelo que a deteção de deepfakes está a tornar-se cada vez mais difícil. Embora as tecnologias de marca d'água digital (como C 2 PA) possam ajudar a identificar deep fakes, elas também têm limitações porque a imagem processada foi modificada e o público não pode verificar a assinatura na imagem original. Apenas com a imagem processada, a verificação se tornará It. foi muito difícil.

A tecnologia Blockchain pode resolver o problema dos deepfakes de várias maneiras. A autenticação de hardware pode usar câmeras com chip à prova de violação para incorporar prova criptográfica em cada foto original para verificar a autenticidade da imagem. Blockchain é imutável, permitindo que imagens com metadados sejam adicionadas a blocos com carimbo de data/hora, evitando adulterações e verificando a fonte original. Além disso, as carteiras podem ser usadas para anexar assinaturas criptográficas a postagens publicadas para verificar a autoria do conteúdo publicado, e a infraestrutura KYC baseada na tecnologia zk pode vincular carteiras a identidades verificadas, protegendo ao mesmo tempo a privacidade do usuário. Do ponto de vista dos incentivos económicos, os autores devem ser punidos pela publicação de informações falsas e os utilizadores podem ser recompensados ​​pela identificação de informações falsas.

O Numbers Protocol trabalha neste espaço há anos; a ferramenta de verificação da Fox News é baseada no blockchain Polygon, permitindo aos usuários encontrar artigos e recuperar dados relacionados do blockchain.

privacidade

Quando os modelos de IA são alimentados com informações confidenciais em áreas como finanças, saúde e direito, é extremamente importante proteger a privacidade dos dados durante o uso. A criptografia homomórfica (FHE) pode processar dados sem descriptografá-los, protegendo assim a privacidade ao usar modelos LLM.

  1. O usuário inicia o processo de inferência no dispositivo local e para após completar a camada inicial. Esta camada inicial não está incluída no modelo compartilhado com o servidor;

  2. O cliente criptografa as operações intermediárias e as encaminha ao servidor;

  3. O servidor executa o processamento do mecanismo de atenção parcial nesses dados criptografados e envia o resultado de volta ao cliente;

  4. O cliente descriptografa os resultados e continua a inferência localmente. Desta forma, a FHE garante que a privacidade dos dados dos utilizadores é protegida durante todo o processo de tratamento.

A Zama está construindo uma solução de criptografia totalmente homomórfica (FHE) e recentemente arrecadou US$ 73 milhões em financiamento para apoiar o desenvolvimento.

Agente de IA

A ideia dos agentes de IA é muito futurista. Como será o futuro se os agentes de IA puderem possuir ativos e realizar transações? Pode haver uma mudança do uso de grandes modelos de uso geral para auxiliar na tomada de decisões para a atribuição de tarefas a agentes especializados.

Estes agentes colaborarão entre si e, tal como relações económicas sólidas podem melhorar a colaboração humana, adicionar relações económicas aos agentes de IA também pode melhorar a sua eficiência. Blockchain pode ser um campo de testes para esse conceito. Por exemplo, a Colony está experimentando essa ideia por meio de jogos, fornecendo carteiras para agentes de IA realizarem transações com outros agentes ou jogadores reais para atingir objetivos específicos.

Conclusão

A maioria das perguntas está relacionada à IA de código aberto. Para garantir que uma tecnologia tão importante não será monopolizada por algumas empresas na próxima década, um sistema económico simbólico pode utilizar rapidamente recursos computacionais descentralizados e conjuntos de dados de formação, reduzindo a lacuna de recursos entre a IA de código aberto e a IA de código fechado. O Blockchain pode rastrear o treinamento e a inferência da IA ​​para uma melhor governança de dados, enquanto a criptografia pode garantir a confiança na era pós-IA e resolver problemas de deepfakes e proteção de privacidade.

Leitura Relacionada

Um artigo que faz um balanço das instruções e protocolos de implementação de criptografia com IA