A empresa de inteligência artificial OpenAI tomou a iniciativa de contra-atacar o modelo DeepSeek R1, anunciando o lançamento de seu o3-Mini. A empresa se moveu rapidamente na sexta-feira em uma tentativa de responder diretamente ao modelo de IA da startup chinesa que tem feito o mercado falar.
O modelo DeepSeek R1 foi aclamado como um modelo de IA de próximo nível, com relatos afirmando que o modelo produz respostas fantásticas, imitando o processo de pensamento humano. O modelo também reduz o uso de memória e é mais custo-efetivo do que outros concorrentes no mercado. Além de seu desempenho incrível, a criação do modelo custou supostamente $6 milhões, em comparação com o ChatGPT-4 da OpenAI que custa perto de $100 milhões.
A OpenAI chama o o3-Mini de modelo 'mais custo-efetivo'
Com o modelo recente da DeepSeek sendo aclamado como o mais custo-efetivo do mercado, pode ter tocado um nervo, levando a OpenAI a agir. De acordo com seu post no blog, a empresa mencionou que o modelo o3-Mini é o 'mais custo-efetivo' em sua série de raciocínio. “Estamos lançando o OpenAI o3-mini, o mais novo e mais custo-efetivo modelo em nossa série de raciocínio, disponível tanto no ChatGPT quanto na API hoje”, dizia o post no blog.
Em seu comunicado, a empresa também provocou algumas das capacidades do novo modelo, observando que avança o que modelos menores podem alcançar. “Previsto para dezembro de 2024, este poderoso e rápido modelo avança os limites do que modelos pequenos podem alcançar (…) tudo isso enquanto mantém o baixo custo e a baixa latência do OpenAI o1-mini,” acrescentou a OpenAI.
De acordo com seu comunicado, a empresa de inteligência artificial permitirá que os usuários desfrutem das capacidades de raciocínio dos modelos gratuitamente pela primeira vez, enquanto permitirá que os usuários pagos desfrutem de três vezes o limite diário de mensagens, aumentando-o de 50 para 150. A empresa está abrindo isso para aumentar o uso da nova linha de modelos de raciocínio. O novo modelo, que vem em versões baixa, média e alta, fornecerá aos usuários respostas melhores para mais inferência.
A família de modelos de IA “o” da empresa foca majoritariamente em tarefas de raciocínio. Isso significa que eles são menos criativos em comparação com os modelos da família GPT, mas têm uma cadeia de raciocínio incluída em seus modelos. Isso permite que eles resolvam problemas complexos, construam códigos estruturados melhores e retrocedam em análises erradas. Enquanto o novo modelo é pior que o o1-Mini em conhecimento geral e cadeia de pensamento multilíngue, ele se sai melhor em codificação, factualidade e em todos os outros benchmarks.
Avanço da DeepSeek e seus efeitos
O avanço alcançado pela DeepSeek com seu modelo de IA, que entregou resultados melhores do que o modelo de IA da OpenAI, causou um certo alvoroço na indústria de tecnologia dos Estados Unidos. Além do burburinho, o avanço também eliminou cerca de $1 trilhão do mercado de tecnologia dos EUA, com a Nvidia perdendo $600 bilhões em valor de mercado. O desenvolvimento também levantou questões sobre a demanda por seus caros chips de IA no futuro.
A lacuna de eficiência vem da abordagem nova que a DeepSeek adotou em sua arquitetura de modelo. Enquanto empresas de inteligência artificial nos EUA tentavam aumentar o poder de computação de seus modelos, a DeepSeek conseguiu otimizar como os modelos processam informações, levando a mais eficiência. A pressão aumentou um pouco quando a empresa de tecnologia chinesa Alibaba lançou seu Qwen2.5 Max.
Enquanto isso, o o3-Mini estará olhando para aumentar a lacuna, com o modelo funcionando 24% mais rápido do que o modelo anterior. Ele também iguala alguns modelos mais antigos e supera outros em benchmarks chave. Embora seu preço seja bastante competitivo, é mais alto do que o do R1 da DeepSeek. O o3-Mini é precificado em $0,55 por milhão de tokens de entrada e $4,40 por milhão de tokens de saída, enquanto o DeepSeek é precificado em $0,14 e $2,19 para os mesmos volumes.
Academia Cryptopolitan: FOLHA DE TRAPAÇA GRATUITA PARA CURRÍCULO Web3 - Baixe Agora