A OpenAI lançou vários novos modelos de inteligência artificial sob um esquema de nomenclatura revisado — começando com seu mais recente modelo OpenAI o1, que diz que pode “pensar antes de responder”.
“Para tarefas de raciocínio complexas, este é um avanço significativo e representa um novo nível de capacidade de IA”, disse a OpenAI em uma postagem de blog de 12 de setembro. “Dado isso, estamos zerando o contador de volta para um e nomeando esta série OpenAI o1.”
Os novos modelos podem levar seu tempo para pensar e usar o raciocínio de “cadeia de pensamento” para resolver tarefas complexas — particularmente em STEM (ciência, tecnologia, engenharia e matemática) e tarefas relacionadas à codificação, disse a OpenAI.
Fonte: OpenAI
A empresa de IA compartilhou vídeos do OpenAI o1 codificando um videogame a partir de um prompt e resolvendo um quebra-cabeça lógico complexo, entre outras coisas.
Os modelos “preview” e “mini” do OpenAI o1 foram disponibilizados aos assinantes do ChatGPT Plus, com a empresa planejando lançar versões aprimoradas nos próximos meses.
A OpenAI compartilhou dados sugerindo que o OpenAI o1 derrota o GPT-4o em vários benchmarks, incluindo tópicos científicos de nível de doutorado em Biologia, Química e Física e alguns exames do ensino médio dos Estados Unidos.
Modelo de melhoria OpenAI o1 comparado com GPT-4o em vários benchmarks. Fonte: OpenAI
Devido ao foco do OpenAI o1 mini em capacidades de raciocínio STEM, ele não é tão bem informado em outras áreas fora de seu foco restrito, disse o OpenAI.
“[Seu] conhecimento factual sobre tópicos não-STEM, como datas, biografias e curiosidades, é comparável a pequenos LLMs, como o GPT-4o mini.”
“Melhoraremos essas limitações em versões futuras, bem como experimentaremos estender o modelo para outras modalidades e especialidades fora de STEM”, acrescentou.
Especialistas do setor previram que a OpenAI lançaria um modelo de IA focado em raciocínio em setembro sob o codinome Strawberry.
No entanto, o OpenAI não divulga distinções entre diferentes modelos em desenvolvimento.
Revista: aposta de US$ 1 milhão que o ChatGPT não levará à AGI, uso inteligente de IA da Apple, aumento de milionários de IA: AI Eye