De acordo com o Cointelegraph, a desenvolvedora de inteligência artificial OpenAI introduziu diversas atualizações em seus modelos no início de outubro, visando melhorar as habilidades de conversação e reconhecimento de imagem. Em 1º de outubro, a OpenAI anunciou quatro novas ferramentas projetadas para facilitar os desenvolvedores na construção de seus modelos de IA.

Uma atualização significativa é a API em tempo real, que permite que os desenvolvedores criem aplicativos de voz gerados por IA usando um único prompt. Esta ferramenta oferece suporte a experiências multimodais de baixa latência por meio do streaming de entradas e saídas de áudio, permitindo conversas naturais semelhantes ao Modo de voz avançado do ChatGPT. Anteriormente, os desenvolvedores tinham que combinar vários modelos para obter essas experiências, resultando em maior latência para aplicativos em tempo real, como conversas de fala para fala. Com a capacidade de streaming da API em tempo real, os desenvolvedores agora podem habilitar interações imediatas e naturais, muito parecidas com assistentes de voz. A API opera no GPT-4, lançado em maio de 2024, que pode raciocinar em áudio, visão e texto em tempo real.

Outra atualização inclui uma ferramenta de ajuste fino para desenvolvedores, permitindo que eles aprimorem as respostas de IA geradas a partir de imagens e entradas de texto. Os ajustadores finos baseados em imagem melhoram a capacidade da IA ​​de entender imagens, aprimorando assim as capacidades de busca visual e detecção de objetos. Esse processo envolve feedback humano, onde exemplos de respostas boas e ruins são fornecidos à IA. Além disso, a OpenAI introduziu “destilação de modelo” e “cache de prompt”, que permitem que modelos menores aprendam com os maiores e reduzam os custos e o tempo de desenvolvimento reutilizando texto já processado.

Os recursos avançados dos modelos da OpenAI são um ponto de venda significativo, já que uma parcela substancial da receita da empresa vem de empresas que constroem seus próprios aplicativos com base na tecnologia da OpenAI. De acordo com a Reuters, a OpenAI projeta que sua receita aumentará para US$ 11,6 bilhões no ano que vem, acima dos estimados US$ 3,7 bilhões em 2024.