A desenvolvedora de inteligência artificial OpenAI entrou em outubro com diversas atualizações em seus modelos, ajudando seus modelos de IA a se envolverem melhor em conversas e melhorar o reconhecimento de imagens.

Em 1º de outubro, a OpenAI revelou quatro atualizações que introduzem novas ferramentas projetadas para facilitar aos desenvolvedores a construção de seus modelos de IA.

Ele fala!

Uma atualização importante é a API em tempo real, que permite aos desenvolvedores criar aplicativos de voz gerados por IA usando um único prompt.

A ferramenta, disponível para teste, oferece suporte a experiências multimodais de baixa latência por meio de streaming de entradas e saídas de áudio, permitindo conversas naturais semelhantes ao Modo de voz avançado do ChatGPT.

Anteriormente, os desenvolvedores tinham que “costurar” vários modelos para criar essas experiências. A entrada de áudio normalmente precisava ser totalmente carregada e processada antes de receber uma resposta, o que significava maior latência para aplicativos em tempo real, como conversas de fala para fala.

Com a capacidade de streaming da Realtime API, os desenvolvedores agora podem habilitar interações imediatas e naturais, muito parecidas com assistentes de voz. A API roda em GPT-4, lançado em maio de 2024, que pode raciocinar em áudio, visão e texto em tempo real.

A IA pode ver claramente agora

Outra atualização inclui uma ferramenta de ajuste fino para desenvolvedores, permitindo que eles melhorem as respostas de IA geradas a partir de imagens e entradas de texto.

Os fine tuners baseados em imagens permitem que a inteligência artificial tenha uma melhor capacidade de entender imagens, melhorando, por sua vez, as capacidades de busca visual e detecção de objetos, de acordo com o desenvolvedor. O processo inclui feedback de humanos que fornecem exemplos de respostas boas e ruins.

Além de suas atualizações de voz e visão, a OpenAI também lançou “destilação de modelo” e “cache de prompt”, que permitem que modelos menores aprendam com os maiores e reduzam os custos e o tempo de desenvolvimento ao reutilizar texto já processado.

Os recursos avançados de seus modelos são um ponto de venda importante, já que uma grande parte da receita da OpenAI vem de empresas que criam seus próprios aplicativos com base na tecnologia da OpenAI.

De acordo com a Reuters, a OpenAI projeta que sua receita aumentará para US$ 11,6 bilhões no ano que vem, ante uma estimativa de US$ 3,7 bilhões em 2024.

Revista: IA já pode usar mais energia do que Bitcoin — e ameaça a mineração de Bitcoin