Autor: jolestar

Na semana passada, brinquei um pouco com Agentes de IA e participei de um evento da ai16z em Pequim anteontem, para ver o que os Agentes de IA realmente podem fazer agora e refletir sobre o que poderão fazer no futuro.

A situação atual dos Agentes de IA me lembra daquele meme da imagem, onde uma pessoa está escondida dentro de uma máquina de vendas automática. As pessoas já imaginam que os Agentes de IA começaram a ter consciência própria, mas, na verdade, o que está escondido dentro do Agente de IA é um desenvolvedor. (Aqui, todos podem imaginar a cena; tentei fazer a IA gerar essa imagem e descobri que a IA não consegue entender 'esconder').

O modo básico de funcionamento da estrutura do Agente de IA

Atualmente, a estrutura do Agente de IA atua como um adesivo, conectando clientes (Twitter, Discord, Telegram, etc.) e vários plugins (como diferentes blockchains), enquanto a estrutura fornece uma biblioteca básica (armazenamento de memória, isolamento de sessão, geração de contexto), que mais tarde se conectará a várias interfaces de plataformas de IA.

Como a estrutura do Agente de IA se integra a aplicativos e cenários de negócios

Desde que a IA se tornou popular no ano passado, várias plataformas e ferramentas surgiram, e a questão crucial é resolver um problema: como a IA se integra aos aplicativos. Algumas plataformas de IA tentam oferecer plugins, outras criam modelos de fluxo de trabalho, e algumas aplicações tradicionais embutem IA em seus aplicativos. Mas a chave aqui é: 1. Onde está o ponto de interação do aplicativo? 2. Como a IA se integra à lógica de negócios existente.

As interfaces de interação que as plataformas de IA oferecem aos usuários são todas semelhantes a uma janela de bate-papo, e é evidente que todos acreditam que a interação com aplicativos de IA deveria ser de uma maneira 'humanizada'. E nesse aspecto, a inteligência do Agente de IA está em sua capacidade de se conectar diretamente a todos os sistemas de IM e sociais abertos, o que é claramente mais aceitável do que criar algo novo.

Como a IA se integra à lógica de negócios existente. A proposta do Agente de IA é permitir que os desenvolvedores integrem as decisões da IA aos cenários de negócios. Linguagens de programação requerem determinismo; as condições do 'if' só podem ser verdadeiro ou falso, e não podem lidar com lógicas de negócios vagas. Através da IA, lógicas complexas podem ser convertidas em condições precisas, permitindo que sejam integradas perfeitamente aos cenários de negócios.

Por exemplo, a função de responder mensagens em grupos, onde os bots de IM tradicionais precisam de comandos de mensagens explícitos para serem acionados, enquanto com a IA é possível implementar um método chamado shouldReplyMessage, que, ao receber contexto, retorna verdadeiro ou falso.

O papel da IA em cenários de lógica de negócios é principalmente:

1. Descoberta de 'intenção': através da descrição nas palavras-chave, permitir que a IA descubra a 'intenção' nas mensagens de texto do usuário de acordo com o contexto e mapeie essa intenção para um código específico.

2. Assistência na tomada de decisões: transformar condições complexas e vagas em verdadeiro/falso ou tipos enumerativos através da IA, e depois integrá-las na lógica de negócios.

Ao chegar aqui, muitos podem ficar desapontados com os Agentes de IA, pois muitos pensam que um Agente de IA é apenas ensinar a IA e ela fará tudo. Na verdade, devido às limitações de contexto dos grandes modelos, não é possível (pelo menos por enquanto) criar uma IA universal que possa fazer qualquer coisa. Mas a boa notícia é que os programadores não precisam se preocupar com o desemprego, pois ainda há uma grande necessidade de programadores por trás da IA, e ainda precisamos de alguém para lidar com condicionais, mas a diferença crucial é que os limites das operações que um programa pode lidar estão se expandindo.

Dois tipos de Agentes de IA

Em um evento, perguntei a Shaw sobre as duas expectativas do mercado para os Agentes de IA: 1. O Agente de IA desempenha um papel, tem sua própria ID, marca e fornece serviços aos usuários. 2. O usuário tem seu próprio Agente de IA, que funciona como um assistente pessoal, capaz de ajudar o usuário a lidar com algumas tarefas. Qual dessas duas opções seria mais popular? Ele acredita que ambas as direções são promissoras e podem até se combinar.

Atualmente, as principais explorações no mercado ainda se concentram na primeira direção. Esta direção é semelhante à transformação dos serviços em Agentes de IA, e pode ser que não haja mais interfaces de aplicativos no futuro, pois todos os aplicativos se tornarão Agentes de IA, humanizados. A segunda direção é a transformação de aplicativos clientes em Agentes, onde os aplicativos clientes do futuro serão plugins de Agentes assistentes, e os dados locais do aplicativo se tornarão parte da memória do Agente, enquanto esse plugin também se encarregará de se comunicar com os Agentes de serviço na nuvem. Esta é uma nova arquitetura de aplicação que mudará toda a infraestrutura.

Os requisitos dos Agentes de IA para infraestrutura

1. A infraestrutura deve ser implementada sem barreiras de entrada (Permissionless), caso contrário, os Agentes de IA serão limitados por várias estratégias de defesa contra ataques, e os serviços devem usar uma abordagem de custo econômico (Gas) para se proteger contra ataques. Nesse aspecto, plataformas com menor grau de abertura enfrentarão um impacto significativo, e o entusiasmo pelos plataformas abertas do início do Web2 será reacendido.

2. Os Agentes de IA precisam ser capazes de operar fundos para efetuar pagamentos, a fim de resolver os problemas mencionados acima.

Ou seja, os serviços futuros, independentemente de serem baseados em blockchain ou não, precisarão suportar autenticação de identidade baseada em chaves privadas de criptografia e pagamentos baseados em criptografia.

A combinação de Agentes de IA e blockchain

Além dos dois pontos mencionados acima, como os Agentes de IA se integram à blockchain é uma direção que todos estão explorando. Durante o evento, conversei com Mikkke sobre o focEliza que ele está desenvolvendo. As duas categorias de Agentes de IA mencionadas anteriormente, pelo menos a primeira, precisam do ambiente de execução ou verificação fornecido pela blockchain. Porque uma vez que um Agente de IA oferece serviços ao público, surgirá um problema de confiança; o papel que desempenha é de fato semelhante ao de um contrato inteligente.

Houve uma controvérsia sobre o nome 'contrato inteligente', pois é apenas um pedaço de código, onde está a 'inteligência'? A IA pode tornar os contratos inteligentes verdadeiramente inteligentes. O desafio é como chamar interfaces de IA em um ambiente de contrato inteligente. Se a ideia é executar um grande modelo em um ambiente verificável, esse caminho ainda é distante; uma solução semelhante à Oracle é uma abordagem mais prática.

E em torno dos Agentes de IA surgirão muitas demandas, como: como obter conhecimento público sobre Agentes de IA? Como os Agentes de IA determinam a veracidade dos fatos? Como os Agentes de IA identificam o mesmo usuário em diferentes plataformas? Como a 'memória' em contratos inteligentes é armazenada? Se eu tiver vários dispositivos, cada um com um Agente de IA, como eles compartilharão a memória?

Você descobrirá que o 'dados na blockchain' que foram discutidos no Web3, as relações na blockchain, DID, redes P2P, etc., têm novos significados e cenários.

Conclusão

Reutilizando minha conclusão de uma apresentação sobre IA e blockchain de 2021, uma internet mais amigável para a IA também será uma internet mais amigável para a humanidade. Naquela época, era apenas uma ideia, mas agora o futuro chegou.