Autor: 0XNATALIE

Desde o segundo semestre deste ano, o tópico dos agentes de IA tem aumentado continuamente em popularidade. Inicialmente, o chatbot de IA terminal of truths chamou bastante atenção por suas postagens e respostas humorísticas no X (semelhante ao 'Robert' no Weibo) e recebeu um financiamento de 50 mil dólares do fundador da a16z, Marc Andreessen. Inspirados pelo conteúdo que ele publicou, alguém criou o token GOAT, que teve um aumento de mais de 10000% em apenas 24 horas. O tópico dos agentes de IA, então, chamou a atenção da comunidade Web3. Depois disso, o primeiro fundo de negociação de IA descentralizado baseado em Solana, ai16z, foi lançado, apresentando a estrutura de desenvolvimento de agentes de IA Eliza e gerando uma disputa de tokens maiúsculas e minúsculas. No entanto, a comunidade ainda não tem clareza sobre o conceito de agente de IA: qual é o núcleo do agente de IA? Em que difere dos robôs de negociação do Telegram?

Princípio de funcionamento: percepção, raciocínio e tomada de decisão autônoma.

O agente de IA é um sistema de agente inteligente baseado em modelos de linguagem de grande escala (LLM), capaz de perceber o ambiente, tomar decisões de raciocínio e completar tarefas complexas através da chamada de ferramentas ou execução de operações. Fluxo de trabalho: módulo de percepção (obtenção de entrada) → LLM (compreensão, raciocínio e planejamento) → chamada de ferramentas (execução de tarefas) → feedback e otimização (validação e ajuste).

Especificamente, o agente de IA primeiro obtém dados do ambiente externo através de um módulo de percepção (como texto, áudio, imagem, etc.) e os transforma em informações estruturadas que podem ser processadas. O LLM, como componente central, fornece poderosas capacidades de compreensão e geração de linguagem natural, atuando como o 'cérebro' do sistema. Com base nos dados de entrada e no conhecimento existente, o LLM realiza raciocínio lógico, gerando possíveis soluções ou elaborando um plano de ação. Em seguida, o agente de IA completa tarefas específicas chamando ferramentas externas, plugins ou APIs, e valida e ajusta os resultados com base no feedback, formando uma otimização em ciclo fechado.

No cenário de aplicação da Web3, qual é a diferença entre o agente de IA e robôs de negociação do Telegram ou scripts automatizados? Tomando a arbitragem como exemplo, os usuários desejam realizar negociações de arbitragem sob a condição de lucro maior que 1%. Nos robôs de negociação do Telegram que suportam arbitragem, os usuários configuram uma estratégia de negociação que garante lucro maior que 1%, e o bot começa a executar. No entanto, quando o mercado está volátil e as oportunidades de arbitragem mudam constantemente, esses bots carecem de capacidade de avaliação de risco e executam arbitragem assim que a condição de lucro maior que 1% é atendida. Em comparação, o agente de IA pode ajustar automaticamente a estratégia. Por exemplo, quando um negócio tem um lucro superior a 1%, mas a avaliação de risco através da análise de dados é excessiva, o mercado pode mudar repentinamente e resultar em perda, ele decidirá não executar essa arbitragem.

Portanto, o agente de IA possui auto-adaptabilidade, sua principal vantagem está na capacidade de aprendizado autônomo e tomada de decisões autônomas, interagindo com o ambiente (como mercado, comportamento do usuário, etc.) e ajustando estratégias de comportamento com base em sinais de feedback, melhorando continuamente a eficácia da execução das tarefas. Ele também pode tomar decisões em tempo real com base em dados externos e otimizar continuamente suas estratégias de decisão através de aprendizado por reforço.

Dito isso, não parece um pouco como um solucionador no contexto de um framework de intenção? O agente de IA em si também é um produto baseado em intenção, e a maior diferença em relação a um solucionador sob o framework de intenção é que o solucionador depende de algoritmos precisos, possuindo rigor matemático, enquanto a decisão do agente de IA depende de treinamento de dados, muitas vezes exigindo tentativa e erro contínuos durante o processo de treinamento para se aproximar da solução ideal.

Principais estruturas de agentes de IA

A estrutura do agente de IA é a infraestrutura usada para criar e gerenciar agentes inteligentes. Atualmente na Web3, estruturas populares incluem Eliza da ai16z, ZerePy da zerebro e GAME da Virtuals.

Eliza é uma estrutura de agente de IA multifuncional, construída com TypeScript, que suporta operação em várias plataformas (como Discord, Twitter, Telegram, etc.) e, através de uma gestão complexa de memória, é capaz de lembrar conversas e contextos anteriores, mantendo características de personalidade e respostas de conhecimento consistentes. Eliza utiliza um sistema RAG (Geração Aumentada por Recuperação), que pode acessar bancos de dados ou recursos externos para gerar respostas mais precisas. Além disso, Eliza integra plugins TEE, permitindo a implantação em TEE, garantindo assim a segurança e privacidade dos dados.

O GAME é a estrutura que capacita e impulsiona agentes de IA a tomar decisões e ações autônomas. Os desenvolvedores podem personalizar o comportamento do agente de acordo com suas necessidades, expandir suas funcionalidades e fornecer operações personalizadas (como publicações em mídias sociais, respostas, etc.). As diferentes funcionalidades dentro da estrutura, como a localização do agente e as tarefas, são divididas em vários módulos, facilitando a configuração e gestão pelos desenvolvedores. A estrutura GAME divide o processo de decisão do agente de IA em dois níveis: planejamento de alto nível (HLP) e planejamento de baixo nível (LLP), responsáveis por diferentes níveis de tarefas e decisões. O planejamento de alto nível é responsável por definir os objetivos gerais e o planejamento de tarefas do agente, formulando decisões com base em metas, personalidade, informações de fundo e estado do ambiente, determinando a prioridade das tarefas. O planejamento de baixo nível, por sua vez, foca na execução, convertendo as decisões do planejamento de alto nível em etapas operacionais específicas, escolhendo as funcionalidades e métodos de operação adequados.

ZerePy é uma estrutura de código aberto em Python para implantar agentes de IA no X. Esta estrutura integra LLMs fornecidos pela OpenAI e Anthropic, permitindo que os desenvolvedores construam e gerenciem agentes de mídias sociais, automatizando operações como postagem de tweets, respostas a tweets, curtidas e outras ações. Cada tarefa pode ter pesos diferentes definidos de acordo com sua importância. O ZerePy oferece uma interface de linha de comando (CLI) simples, facilitando o início e gerenciamento rápido dos agentes pelos desenvolvedores. Além disso, a estrutura também fornece um modelo do Replit (uma plataforma online de edição e execução de código), permitindo que os desenvolvedores comecem rapidamente a usar o ZerePy sem a necessidade de configurações locais complexas.

Por que o agente de IA enfrenta FUD?

O agente de IA parece inteligente, capaz de reduzir a barreira de entrada e melhorar a experiência do usuário, por que a comunidade tem FUD? A razão é que o agente de IA é essencialmente ainda apenas uma ferramenta, atualmente não consegue completar todo o fluxo de trabalho, apenas consegue melhorar a eficiência e economizar tempo em alguns pontos. Além disso, no estágio atual de desenvolvimento, o papel do agente de IA está mais concentrado em ajudar os usuários a emitir MeMe com um clique e operar contas de mídias sociais. A comunidade brinca dizendo 'os ativos pertencem ao desenvolvedor, as responsabilidades pertencem à IA'.

No entanto, esta semana, o aiPool lançou um agente de IA como pré-venda de token, utilizando tecnologia TEE para alcançar a descentralização. A chave privada da carteira deste agente de IA é gerada dinamicamente no ambiente TEE, garantindo a segurança. Os usuários podem enviar fundos (por exemplo, SOL) para a carteira controlada pelo agente de IA, que posteriormente cria tokens com base em regras definidas e inicia um pool de liquidez na DEX, ao mesmo tempo em que distribui tokens para investidores qualificados. Todo o processo não depende de intermediários de terceiros, sendo totalmente realizado pelo agente de IA no ambiente TEE, evitando os riscos comuns de rug pull no DeFi. É evidente que os agentes de IA estão se desenvolvendo gradualmente. Acredito que os agentes de IA podem ajudar os usuários a reduzir barreiras e melhorar a experiência, mesmo que seja apenas simplificando parte do processo de emissão de ativos, o que já é significativo. No entanto, sob uma perspectiva macro da Web3, os agentes de IA, como produtos fora da cadeia, atualmente desempenham apenas um papel auxiliar como ferramentas de contratos inteligentes, portanto, não é necessário exagerar suas capacidades. Devido à falta de narrativas de efeito de riqueza significativas no segundo semestre deste ano, exceto pelo MeMe, é normal que o hype em torno do agente de IA esteja centrado no MeMe. Apenas o MeMe não pode sustentar valor a longo prazo, portanto, se os agentes de IA puderem trazer mais inovações no fluxo de transações e fornecer valor prático, talvez eles se tornem uma ferramenta infra comum.