A OpenAI lançou vários novos modelos de inteligência artificial sob um esquema de nomenclatura revisado — começando com seu mais recente modelo OpenAI o1, que diz que pode “pensar antes de responder”.

“Para tarefas de raciocínio complexas, este é um avanço significativo e representa um novo nível de capacidade de IA”, disse a OpenAI em uma postagem de blog de 12 de setembro. “Dado isso, estamos zerando o contador de volta para um e nomeando esta série OpenAI o1.”

Os novos modelos podem levar seu tempo para pensar e usar o raciocínio de “cadeia de pensamento” para resolver tarefas complexas — particularmente em STEM (ciência, tecnologia, engenharia e matemática) e tarefas relacionadas à codificação, disse a OpenAI.

Fonte: OpenAI

A empresa de IA compartilhou vídeos do OpenAI o1 codificando um videogame a partir de um prompt e resolvendo um quebra-cabeça lógico complexo, entre outras coisas.

Os modelos “preview” e “mini” do OpenAI o1 foram disponibilizados aos assinantes do ChatGPT Plus, com a empresa planejando lançar versões aprimoradas nos próximos meses.

A OpenAI compartilhou dados sugerindo que o OpenAI o1 derrota o GPT-4o em vários benchmarks, incluindo tópicos científicos de nível de doutorado em Biologia, Química e Física e alguns exames do ensino médio dos Estados Unidos.

Modelo de melhoria OpenAI o1 comparado com GPT-4o em vários benchmarks. Fonte: OpenAI

Devido ao foco do OpenAI o1 mini em capacidades de raciocínio STEM, ele não é tão bem informado em outras áreas fora de seu foco restrito, disse o OpenAI.

“[Seu] conhecimento factual sobre tópicos não-STEM, como datas, biografias e curiosidades, é comparável a pequenos LLMs, como o GPT-4o mini.”

“Melhoraremos essas limitações em versões futuras, bem como experimentaremos estender o modelo para outras modalidades e especialidades fora de STEM”, acrescentou.

Especialistas do setor previram que a OpenAI lançaria um modelo de IA focado em raciocínio em setembro sob o codinome Strawberry.

No entanto, o OpenAI não divulga distinções entre diferentes modelos em desenvolvimento.

Revista: aposta de US$ 1 milhão que o ChatGPT não levará à AGI, uso inteligente de IA da Apple, aumento de milionários de IA: AI Eye