Odaily Planet Daily informou que na madrugada de 15 de maio, horário de Pequim, no discurso principal da Google I/O Developer Conference, o CEO do Google, Sundar Pichai, lançou dezenas de produtos combinados do Google e da IA, que podem ser chamados de "adequados para a família". produtos". Nível "Bucket", lutando contra OpenAI, incluindo Gemini 1.5 Pro e Gemini 1.5 Flash que suportam texto longo de 2 milhões de tokens, versão do Google da tecnologia Sora Veo, o modelo de código aberto mais forte Gemma 2, AI Overviews que suporta pesquisa generativa, e a espera do TPU de sexta geração. Mas o que mais chamou a atenção foi o Projeto Astra, um projeto de assistente universal que realmente leva ao AGI, anunciado por Demis Hassabis, CEO do Google DeepMind e chefe do Google AI, e a voz NotebookLM, que compara diretamente o GPT-4o. Durante o discurso principal da conferência, o Google lançou uma demonstração incrível do assistente de IA e, desta vez, jurou que não havia sido forjado ou adulterado de forma alguma. Demis disse que o Projeto Astra é o protótipo do assistente de IA que ele espera há décadas e é o futuro da IA ​​geral. É relatado que o Projeto Astra é um assistente de IA multimodal em tempo real que interage com o mundo ao seu redor recebendo informações, lembrando o que vê, processando essas informações e compreendendo detalhes contextuais. Sua interação de voz é muito mais rápida do que a atual. O formulário do Google Assistant é mais natural, sem atrasos ou atrasos, e pode responder a perguntas ou ajudá-lo a fazer quase tudo. A partir da demonstração, o Projeto Astra pode processar as informações recebidas muito rapidamente. Ele faz isso codificando continuamente quadros de vídeo e combinando vídeo e fala em uma linha do tempo de eventos e, em seguida, armazena as informações em cache para recuperação. O Google afirma que alguns desses recursos serão adicionados ao aplicativo Gemini e a outros produtos ainda este ano. Além do Projeto Astra, o Google também lançou uma variedade de produtos de uso geral da subsérie AI Agent baseados no Gemini, incluindo NotebookLM para áudio, Music AI Sandbox para música, Veo para vídeo e Imagen 3 para imagens, comparando diretamente com GPT-4o e GPT-4o lançados pela OpenAI e Sora. (Mídia Titânio)