OpenAI a lancé un tout nouveau modèle de raisonnement o3, établissant un nouveau record avec un score révolutionnaire de 75,7 % au test ARC-AGI, et introduisant la technologie d'« alignement délibéré » pour renforcer la sécurité du modèle. Ce modèle est actuellement ouvert aux demandes de tests de sécurité et devrait être officiellement lancé début 2025. (Récapitulatif : L'outil de génération de vidéos d'OpenAI, Sora, est officiellement en ligne ! 5 points forts, plans d'abonnement à découvrir) (Contexte supplémentaire : OpenAI a présenté une version complète du modèle o1 et un nouveau plan d'abonnement ChatGPT Pro, vaut-il les 200 dollars par mois ? ) Le développeur de ChatGPT, OpenAI, a présenté de nouveaux produits pendant 12 jours consécutifs, se concluant hier (20) avec le lancement du tout nouveau modèle de raisonnement « o3 » et « o3-mini », ce modèle d'IA possède de meilleures capacités de raisonnement, visant à résoudre des tâches complexes nécessitant un raisonnement logique progressif. Aujourd'hui, nous avons partagé des évaluations pour une version précoce du prochain modèle de notre série de raisonnement o-model : OpenAI o3 pic.twitter.com/e4dQWdLbAD — OpenAI (@OpenAI) 20 décembre 2024 Caractéristiques du modèle 1) Capacité de raisonnement atteignant un score SoTA OpenAI a déclaré que le modèle o3 a excellé dans plusieurs tests de référence, y compris des problèmes complexes de programmation, de mathématiques et de sciences, montrant sa puissante capacité de raisonnement logique. Dans l'évaluation « ARC-AGI » développée par le Center for Alignment Research (ARC), utilisée pour tester la capacité d'intelligence artificielle générale (AGI), o3 a atteint un score révolutionnaire de 75,7 % dans certains tests non publics, établissant un nouveau sommet technologique (State of the Art, SoTA). De plus, une version à haute configuration de calcul (high-compute configuration) de o3 a atteint un score encore plus élevé de 87,5 % dans le même test, mais n'a pas pu être qualifiée pour ARC-AGI-Pub (résultats des tests ARC-AGI vérifiables publiquement) en raison des exigences de ressources dépassant les normes. Nouveau SoTA vérifié ARC-AGI-Pub ! @OpenAI o3 a obtenu un score révolutionnaire de 75,7 % lors de l'évaluation semi-privée ARC-AGI. Et une configuration o3 à haute puissance (non éligible pour ARC-AGI-Pub) a obtenu 87,5 % lors de l'évaluation semi-privée. 1/4 pic.twitter.com/uQA47JWkl6 — ARC Prize (@arcprize) 20 décembre 2024 2) Choix de plusieurs versions OpenAI a proposé deux versions, o3 et o3-mini, cette dernière étant prévue pour fin janvier 2025, la version complète o3 étant publiée par la suite (sans date précise annoncée). Ce nouveau modèle utilise l'API de Temps de Pensée Adaptatif récemment lancée par OpenAI, offrant trois modes de raisonnement différents : faible, moyen et élevé. Cette fonctionnalité permet aux utilisateurs d'ajuster la durée de « réflexion » du modèle avant de répondre aux questions en fonction de leurs besoins. Comme le montre l'image ci-dessous, o3-mini peut rivaliser avec le modèle o1 actuel en termes de résultats de raisonnement, mais réduit considérablement les coûts de calcul. 3) Renforcement de la sécurité OpenAI a adopté une nouvelle méthode d'entraînement « d'alignement délibéré », enseignant directement aux modèles de langage de grande taille (LLMs) à comprendre les normes de sécurité explicables écrites par les humains, et à s'assurer qu'ils respectent ces normes lors de leur raisonnement avant de répondre à des questions. OpenAI a déclaré dans son communiqué : Grâce à cette méthode, nous avons optimisé les modèles de la série o d'OpenAI, permettant l'utilisation de la technique de raisonnement « chaîne de pensée » (Chain-of-Thought, CoT) pour réfléchir aux questions des utilisateurs, identifier les textes normatifs pertinents dans les politiques internes d'OpenAI, et ainsi générer des réponses plus sûres. Origine du nom Il convient de noter qu'OpenAI a sauté la dénomination « o2 » et a directement utilisé « o3 ». Le PDG Sam Altman a expliqué que cela visait à éviter toute confusion avec le fournisseur de télécommunications britannique O2, tout en montrant l'humour unique d'OpenAI. Il a déclaré en direct : « Par respect pour Telefónica (la société mère d'O2), et pour continuer la tradition d'OpenAI d'être très mauvais en matière de noms, nous l'avons nommé o3. » Invitation aux chercheurs à participer aux tests de sécurité Actuellement, o3 et o3-mini sont en phase de tests de sécurité internes, OpenAI a ouvert les inscriptions, invitant les chercheurs externes à participer aux tests de sécurité. Les candidatures seront closes le 10 janvier 2025. Pour le lancement de ce modèle, Sam Altman a déclaré sans modestie que cela marquait le début de la « prochaine étape » dans le développement de l'IA. En revenant sur les révélations de Bloomberg au milieu de l'année sur le système de classement de l'IA d'OpenAI, la prochaine étape après les chatbots et les modèles de raisonnement est les Agents — des systèmes d'IA avancés capables d'agir au nom des utilisateurs. C'est précisément la direction actuellement explorée et développée dans les marchés de la cryptomonnaie et dans le domaine du Web2. Le système de classement d'IA d'OpenAI. Source : Bloomberg Rapports connexes OpenAI a présenté la nouvelle fonctionnalité « ajustement par renforcement » lors de Day2, renforçant la précision de l'apprentissage des domaines spécialisés de l'IA. OpenAI a annoncé des diffusions en direct pendant 12 jours consécutifs : lancement de nombreuses nouvelles fonctionnalités, des concepts de cryptomonnaie d'IA à exploiter ? OpenAI a perdu dans les jeux politiques, Sam Altman aura du mal à rivaliser avec l'« alliance IA » de Musk et Trump ? "OpenAI lance le modèle o3 ! La capacité de raisonnement passe à un niveau supérieur, ouvrant la voie à la prochaine génération d'IA" cet article a été publié pour la première fois sur BlockTempo (le média d'actualités blockchain le plus influent).