Odaily Planet Daily News OpenAI anunciou o lançamento do o1, um modelo de inteligência artificial com capacidade de raciocínio, codinome interno "Strawberry". OpenAI o1 pode raciocinar sobre tarefas complexas e resolver problemas que são mais difíceis do que os modelos científicos, de codificação e matemáticos anteriores. Nos testes, o OpenAI o1 teve um desempenho semelhante ao de um estudante de doutorado em tarefas desafiadoras de referência em física, química e biologia, e se destacou em matemática e codificação. No exame de qualificação da Olimpíada Internacional de Matemática (IMO), o GPT-4o resolveu apenas 13% dos problemas corretamente, enquanto o modelo de inferência obteve pontuação de 83%, e a capacidade de codificação do OpenAI o1 atingiu o 89º percentil na competição Codeforces. Embora o OpenAI o1, um modelo inicial, ainda não tenha muitos dos recursos úteis do ChatGPT, como navegar na web em busca de informações e fazer upload de arquivos e imagens, o GPT-4o será mais poderoso no curto prazo. Mas para tarefas complexas de raciocínio, este é um avanço significativo e representa um novo nível de capacidades de inteligência artificial. Por esta razão o contador é zerado para 1 e a série é denominada OpenAI o1. Os pesquisadores da área de saúde podem usar o1 para anotar dados de sequenciamento celular, os físicos podem usar o1 para gerar as fórmulas matemáticas complexas necessárias para a óptica quântica e os desenvolvedores em todas as áreas podem usar o1 para construir e executar fluxos de trabalho de várias etapas. A OpenAI também lançou o OpenAI o1-mini, um modelo de inferência econômico. o1-mini é excelente em STEM, especialmente matemática e codificação – com desempenho quase tão bom quanto OpenAI o1 em benchmarks de avaliação como AIME e Codeforces. A OpenAI prevê que o1-mini será um modelo mais rápido e econômico, 80% mais barato que o o1-preview para aplicações que exigem inferência sem amplo conhecimento mundial. Os usuários do ChatGPT Plus, Team, Enterprise e Edu podem usar o1-mini como alternativa ao o1-preview com limites de taxa mais altos e menor latência.