CoinVoice a récemment appris qu'OpenAI avait apporté quatre mises à jour à son modèle en octobre pour aider son modèle d'IA à mener de meilleures conversations et à améliorer les capacités de reconnaissance d'images, a rapporté Cointelegraph. La première mise à jour majeure est l'API Live, qui permet aux développeurs de créer des applications vocales générées par l'IA à l'aide d'une seule invite, permettant ainsi des conversations naturelles similaires au mode vocal avancé de ChatGPT. Auparavant, les développeurs devaient « assembler » plusieurs modèles pour créer ces expériences. L'entrée audio doit souvent être entièrement téléchargée et traitée avant qu'une réponse ne soit reçue, ce qui signifie une latence plus élevée pour les applications en temps réel telles que les conversations vocales. Grâce aux capacités de streaming de l'API Realtime, les développeurs peuvent désormais réaliser des interactions instantanées et naturelles, tout comme un assistant vocal. L'API fonctionne sur GPT-4, publié en mai 2024, et peut effectuer des inférences audio, visuelles et textuelles en temps réel.
Une autre mise à jour inclut des outils de réglage fin pour les développeurs, leur permettant d'améliorer les réponses de l'IA générées à partir de la saisie d'images et de texte. Les spinners basés sur l'image permettent à l'intelligence artificielle de mieux comprendre les images, améliorant ainsi les capacités de recherche visuelle et de détection d'objets. Le processus inclut les commentaires des humains, qui fournissent des exemples de bonnes et de mauvaises réponses lors de la formation.
En plus des mises à jour de la parole et de la vision, OpenAI introduit également la « distillation de modèles » et la « mise en cache d'indices » qui permettent à des modèles plus petits d'apprendre à partir de modèles plus grands et de réduire les coûts et le temps de développement en réutilisant le texte traité. OpenAI s'attend à ce que ses revenus atteignent 11,6 milliards de dollars l'année prochaine, contre 3,7 milliards de dollars attendus en 2024, a rapporté Reuters. [lien d'origine]