TLDR

  • OpenAI a lancé GPT-4o mini, une version plus abordable et efficace de GPT-4o

  • Le GPT-4o mini offre des performances comparables à celles des modèles plus grands à une fraction du coût

  • Le nouveau modèle prend en charge le texte et la vision, avec un support audio et vidéo bientôt disponible

  • GPT-4o mini est disponible sur Azure AI avec des fonctionnalités de sécurité améliorées

  • Le modèle dispose d'une fenêtre contextuelle de 128 000 jetons et est nettement moins cher que les versions précédentes.

OpenAI, la société américaine d'intelligence artificielle, a lancé un nouveau modèle d'IA générative appelé GPT-4o mini.

Ce nouveau modèle vise à fournir des performances comparables à des modèles plus grands à moindre coût, élargissant potentiellement la gamme d'applications d'IA.

GPT-4o mini est essentiellement une version plus rentable du modèle grand public haut de gamme actuel d’OpenAI. Selon OpenAI, le nouveau modèle est « un ordre de grandeur plus abordable que les modèles frontières précédents » et « plus de 60 % moins cher que le GPT-3.5 Turbo ».

Malgré sa taille réduite et sa consommation énergétique moindre, le GPT-4o mini ne semble pas manquer de performances. OpenAI déclare qu'il surpasse GPT-3.5 Turbo et d'autres petits modèles sur les critères académiques en matière d'intelligence textuelle et de raisonnement multimodal. Il prend également en charge la même gamme de langues que GPT-4o.

vers une intelligence trop bon marché pour être mesurée :https://t.co/76GEqATfws

15 cents par million de jetons d'entrée, 60 cents par million de jetons de sortie, MMLU de 82 % et rapide.

Plus important encore, nous pensons que les gens aimeront vraiment utiliser le nouveau modèle.

– Sam Altman (@sama) 18 juillet

Actuellement, GPT-4o mini prend en charge les fonctionnalités de texte et de vision. OpenAI a annoncé que la prise en charge des entrées et sorties audio et vidéo « arrivera dans le futur ».

Le modèle dispose d'une fenêtre contextuelle de 128 000 jetons, ce qui mesure ce dont il peut se souvenir dans une conversation donnée. C’est nettement plus grand que la fenêtre contextuelle de 16 000 jetons de GPT-3.5 Turbo.

En termes de prix, GPT-4o mini coûte 15 cents par million de jetons d'entrée et 60 cents par million de jetons de sortie. C'est nettement moins cher que GPT-4o, qui coûte 5 $ par million de jetons d'entrée et 2,50 $ par million de jetons de sortie.

OpenAI envisage un avenir dans lequel les modèles d'IA seront intégrés de manière transparente dans chaque application et site Web. Ils pensent que GPT-4o mini ouvre la voie aux développeurs pour créer et faire évoluer de puissantes applications d’IA de manière plus efficace et plus abordable.

La plateforme Azure AI de Microsoft a également annoncé la disponibilité de GPT-4o mini. Azure AI étend ses fonctionnalités de sécurité au nouveau modèle, notamment les boucliers d'invite et la détection de matériel protégé, qui sont désormais « activés par défaut » pour les utilisateurs de GPT-4o mini sur Azure OpenAI Service.

Azure AI propose GPT-4o mini avec des options de résidence des données dans 27 régions, permettant aux clients de contrôler l'endroit où leurs données sont stockées et traitées. Cette fonctionnalité vise à aider les clients à répondre à leurs exigences de conformité uniques.

Le nouveau modèle est disponible sur le déploiement mondial avec paiement à l’utilisation d’Azure AI, permettant aux clients de payer uniquement pour les ressources qu’ils consomment. Cette option offre un débit plus élevé tout en permettant de contrôler l'endroit où résident les données au repos.

Azure AI introduit également GPT-4o mini dans son service Batch, qui fournit des tâches à haut débit avec un délai d'exécution de 24 heures à un taux de remise de 50 % en utilisant la capacité hors pointe. Un réglage précis du GPT-4o mini sera disponible, permettant aux clients de personnaliser le modèle pour des cas d'utilisation spécifiques.

L'article OpenAI présente GPT-4o Mini : un modèle d'IA plus efficace et plus rentable apparaît en premier sur Blockonomi.