Autor: Stephen Katte, CoinTe; Compilado por: Tao Zhu, Jinse Finance
O laboratório de pesquisa em inteligência artificial do Google, DeepMind, afirmou que seu modelo de IA recém-lançado, Gemini 2.0, servirá como base para construir agentes de inteligência artificial mais avançados.
O CEO da Google DeepMind, Demis Hassabis, e o CTO, Koray Kavukcuoglu, afirmaram em um post de blog no dia 11 de dezembro que os agentes de IA impulsionados pelo Gemini 2.0, lançados em 11 de dezembro, podem entender instruções complexas, planejar, raciocinar, agir em diferentes sites e até ajudar a formular estratégias de videogame.
Hassabis e Kavukcuoglu afirmaram: "A aplicação prática de agentes de IA é um campo de pesquisa repleto de possibilidades empolgantes."
"Estamos explorando esse novo campo por meio de uma série de protótipos que podem ajudar as pessoas a completar tarefas e fazer as coisas bem."
De acordo com Hassabis e Kavukcuoglu, atualmente existem vários projetos experimentais de assistentes de IA impulsionados pelo Gemini, cada um com diferentes funcionalidades.
Um dos projetos é chamado Deep Research, que pode criar planos de pesquisa de várias etapas por meio da busca na web e, em seguida, gerar um longo relatório sobre os resultados da pesquisa, ajudando os usuários a explorar tópicos complexos.
O Project Astra é um assistente de IA geral, voltado principalmente para tarefas do dia a dia, como fornecer sugestões e opiniões com base nas dicas fornecidas pelo usuário, como como lavar roupas ou mais informações sobre pontos de referência.
O Project Mariner se concentra em criar um agente de IA que pode controlar seu navegador Chrome, mover o cursor, clicar em botões, preencher formulários e navegar em sites.
De acordo com Hassabis e Kavukcuoglu, esses projetos "ainda estão em estágios iniciais de desenvolvimento", mas eles esperam que, após testes e desenvolvimento adicional, eles sejam "amplamente utilizados em produtos futuros".
"Ainda é muito cedo, mas o projeto Mariner mostra que a navegação no navegador se tornou tecnicamente possível, embora atualmente não seja sempre precisa e lenta na conclusão de tarefas, mas com o tempo, isso deve melhorar rapidamente."
Enquanto isso, o projeto Jules está em desenvolvimento como um assistente para desenvolvedores, que pode ser integrado diretamente ao fluxo de trabalho do GitHub e ajudar na conclusão de tarefas como codificação e planejamento.
Hassabis e Kavukcuoglu afirmaram que também usaram o Gemini 2.0 para construir agentes para videogames, que podem fornecer sugestões sobre o próximo passo para os jogadores em conversas em tempo real e buscar 'conhecimentos ricos sobre jogos' online.
"Estamos colaborando com desenvolvedores de jogos líderes, como a Supercell, para explorar como esses agentes funcionam, testando sua capacidade de interpretar várias regras e desafios de jogos, desde jogos estratégicos até simuladores agrícolas", disseram eles.
Em novembro, o CEO da Salesforce, Marc Benioff, afirmou que o futuro da inteligência artificial reside em agentes autônomos, e não em grandes modelos de linguagem (LLM).
"Na verdade, eu acho que já chegamos ao limite para o mestrado em direito", disse ele no podcast 'O Futuro de Tudo' do Wall Street Journal em 23 de novembro.
Nvidia também se concentra em se posicionar na vanguarda das tendências.
"Estamos vendo o número de empresas nativas de IA continuar a crescer. Claro, começamos a ver que empresas adotando agentes de IA realmente é a última tendência", disse o CEO da Nvidia, Jensen Huang, na teleconferência do terceiro trimestre em novembro.
Além disso, Hassabis e Kavukcuoglu afirmaram que a equipe está experimentando com robótica 'agentes que podem ajudar no mundo físico'. No momento, os agentes de IA do Google estão disponíveis apenas para testadores e desenvolvedores.