O laboratório de pesquisa de IA do Google, DeepMind, diz que seu modelo de inteligência artificial recém-lançado, Gemini 2.0, será a base usada para construir agentes de IA mais avançados.
Um agente de IA com tecnologia Gemini 2.0, lançado em 11 de dezembro, pode entender instruções complexas, planejar, raciocinar, agir em sites e pode até mesmo ajudar com estratégias de videogame, disseram o CEO do Google DeepMind, Demis Hassabis, e o diretor de tecnologia Koray Kavukcuoglu em uma postagem de blog em 11 de dezembro.
“A aplicação prática de agentes de IA é uma área de pesquisa cheia de possibilidades interessantes”, disseram Hassabis e Kavukcuoglu.
“Estamos explorando esta nova fronteira com uma série de protótipos que podem ajudar as pessoas a realizar tarefas e concluir coisas.”
De acordo com Hassabis e Kavukcuoglu, existem vários projetos experimentais de assistente de IA alimentados pelo Gemini que todos têm uma função diferente em mente.
Um, conhecido como Deep Research, pode ajudar os usuários a explorar tópicos complexos criando planos de pesquisa em várias etapas, pesquisando na web e, em seguida, gerando um extenso relatório sobre suas descobertas.
O Projeto Astra, um assistente universal de IA, é voltado para tarefas do dia a dia, como fornecer recomendações e conselhos com base em solicitações fornecidas pelo usuário, como como lavar roupas ou mais informações sobre um marco.
O Projeto Mariner foca na criação de um agente de IA que pode assumir o controle do seu navegador Chrome, mover o cursor, clicar em botões, preencher formulários e navegar em sites.
De acordo com Hassabis e Kavukcuoglu, esses projetos estão “ainda nas primeiras etapas de desenvolvimento”, mas eles esperam torná-los “amplamente disponíveis em produtos no futuro” após testes e mais desenvolvimento.
“Ainda é cedo, mas o Projeto Mariner mostra que está se tornando tecnicamente possível navegar dentro de um navegador, embora não seja sempre preciso e demore para concluir tarefas hoje, o que melhorará rapidamente com o tempo.”
Enquanto isso, o Projeto Jules está sendo desenvolvido como um assistente para desenvolvedores que pode se integrar diretamente em um fluxo de trabalho do GitHub e ajudar com tarefas como codificação e planejamento.
Hassabis e Kavukcuoglu disseram que também construíram agentes usando o Gemini 2.0 para videogames que podem oferecer sugestões para o jogador sobre o que fazer a seguir em conversas em tempo real e buscar uma “riqueza de conhecimento sobre jogos” online.
“Estamos colaborando com desenvolvedores de jogos líderes como a Supercell para explorar como esses agentes funcionam, testando sua capacidade de interpretar regras e desafios em uma variedade diversificada de jogos, desde títulos de estratégia até simuladores de fazenda,” disseram eles.
Em novembro, Marc Benioff, CEO da empresa de software de computação em nuvem americana Salesforce, disse que o futuro da IA reside em agentes autônomos em vez de grandes modelos de linguagem (LLMs).
“Na verdade, acho que estamos atingindo os limites superiores dos LLMs agora,” ele disse no podcast “Future of Everything” do The Wall Street Journal em 23 de novembro.
A Nvidia também está se concentrando em se posicionar à frente da tendência.
“Vemos o número de empresas nativas de IA continuar a crescer. E, claro, estamos começando a ver a adoção empresarial da IA agentiva realmente é a última moda,” disse o CEO da Nvidia, Jensen Huang, em uma chamada de resultados do terceiro trimestre em novembro.
Além disso, Hassabis e Kavukcuoglu dizem que a equipe está “experimentando com agentes que podem ajudar no mundo físico” por meio da robótica. Os agentes de IA do Google estão sendo liberados para testadores e desenvolvedores apenas neste estágio.
Revista: Como escolher um vencedor de token de jogos cripto nesta alta: Web3 Gamer