GPT-5.4 est disponible — OpenAI vient de rendre tous les autres modèles IA obsolètes

0
59
GPT-5.4 ChatGPT nouveau modèle

OpenAI n’a pas eu une semaine tranquille. Entre les polémiques autour d’un contrat avec le Pentagone et une fuite de transcript interne qui a fait du bruit, la boîte gérait des crises sur plusieurs fronts. Et pourtant, au milieu de tout ça, elle a lancé GPT-5.4, son modèle le plus puissant et le plus efficace à ce jour.

Le déploiement a débuté simultanément sur ChatGPT, la plateforme Codex et l’API développeurs. Pour les abonnés Plus, Team et Pro, le modèle s’appelle GPT-5.4 Thinking dans l’interface ChatGPT. Ce n’est pas une mise à jour cosmétique.

Ce que GPT-5.4 change vraiment

GPT-5.4 combine les capacités de codage avancées de GPT-5.3 Codex avec un raisonnement nettement amélioré, une utilisation native de l’ordinateur et des fonctions de travail de connaissance renforcées. L’objectif : faire du vrai travail, pas seulement générer du texte à ce sujet.

Ce modèle peut opérer des logiciels, analyser des tableurs et piloter des workflows d’agents sur le long terme avec un minimum d’intervention humaine. C’est un changement de nature, pas de degré.

La grande nouveauté : l’utilisation native de l’ordinateur

GPT-5.4 est le premier modèle polyvalent d’OpenAI capable de prendre le contrôle d’un ordinateur. Cliquer, taper, naviguer dans des logiciels en utilisant des captures d’écran et des commandes souris/clavier, sans s’appuyer sur un modèle spécialisé distinct.

Sur OSWorld-Verified, le benchmark qui mesure la capacité d’un modèle à naviguer dans un environnement desktop réel, GPT-5.4 obtient un score de 75,0 %. GPT-5.2 était à 47,3 %. Le niveau humain de référence ? 72,4 %. Ce modèle dépasse déjà la personne moyenne dans cette tâche.

Les développeurs peuvent maintenant construire des agents qui opèrent réellement des sites et des applications, plutôt que de simplement en parler.

Des performances de codage qui réécrivent les standards

En matière de code, les chiffres sont également parlants. Sur SWE-bench Verified, le test de référence pour résoudre des bugs logiciels réels, GPT-5.4 atteint 72,1 %. Contre 49,0 % pour GPT-5.2. C’est un bond de 23 points en quelques mois.

Sur Aider Polyglot, qui évalue la qualité du code sur plusieurs langages de programmation, GPT-5.4 monte à 73,7 % contre 54,6 % pour son prédécesseur. Pour les développeurs qui utilisent Codex ou l’API d’OpenAI, c’est une différence très concrète dans leur quotidien.

Raisonnement et vitesse : les deux en même temps

GPT-5.4 n’est pas seulement plus fort, il est aussi plus rapide. OpenAI annonce des vitesses d’inférence deux fois supérieures à celles de GPT-5.3 Codex. Sur AIME 2025 (mathématiques de compétition), le modèle atteint 86,5 % avec 64 tentatives, et 78,3 % dès la première réponse.

Pour comparer : o3, le modèle de raisonnement actuel d’OpenAI, obtient 69,1 % au premier essai. GPT-5.4 le dépasse tout en étant conçu pour les workflows agentic et le travail réel, pas seulement les puzzles logiques.

Qui peut y accéder et comment ?

Le déploiement se fait en plusieurs phases. Pour les utilisateurs de ChatGPT abonnés (Plus, Team, Pro), GPT-5.4 Thinking est disponible dès maintenant dans la liste des modèles. Pour les développeurs, il est accessible via l’API sous le nom gpt-5.4, avec des points d’entrée spécialisés pour les réponses en temps réel et les agents.

OpenAI proposera aussi des versions allégées de GPT-5.4 optimisées pour le déploiement à grande échelle, moins gourmandes en ressources pour les entreprises qui ont besoin de milliers d’appels par jour.

Ce que ça change concrètement pour vous

Si vous utilisez ChatGPT pour du travail quotidien (emails, code, analyse de documents), vous allez remarquer une différence sur les tâches longues et complexes. Le modèle tient mieux le contexte sur des échanges prolongés et produit des résultats plus cohérents.

Si vous développez des applications ou des agents IA, GPT-5.4 ouvre des possibilités qui n’existaient tout simplement pas avant : automatiser des tâches qui impliquent de naviguer dans un logiciel existant, sans devoir réécrire ce logiciel pour qu’il expose une API.

OpenAI n’a pas mis fin à la concurrence avec ce modèle. Mais elle a fixé un nouveau plancher que Gemini, Claude et les autres vont devoir atteindre, et vite.