● Les Numériques Télécom
📅 24/04/2026 à 07:01
OpenAI dévoile ChatGPT GPT-5.5 : benchmarks records, tarifs doublés, mais Mythos reste intouchable
Intelligence Artificielle
👤 Aymeric Geoffre-Rouland
OpenAI dévoile ChatGPT GPT-5.5 : benchmarks records, tarifs doublés, mais Mythos reste intouchable Par Aymeric Geoffre-Rouland Publié le 24/04/26 à 07h01 Nos réseaux : Suivez-nous Commenter 3 © JarTee - GPT-5.5 est d'ores et déjà accessible aux abonnés payants de ChatGPT sur mobile et desktop. Le 23 avril 2026, OpenAI a lancé GPT-5.5, qu'il présente comme son système d'intelligence artificielle le plus performant et le plus autonome à ce jour. Le modèle, développé sous le nom de code "Spud", arrive à peine six semaines après GPT-5.4. Un rythme de publication qui témoigne de l'intensité de la rivalité entre les grands laboratoires d'IA, alors qu'Anthropic a dévoilé Claude Opus 4.7 une semaine plus tôt.Un socle technique retravaillé en profondeur, des benchmarks au sommetGPT-5.5 n'est pas un simple ajustement incrémental. Il repose sur un réentraînement complet du modèle de base, le premier depuis GPT-4.5, avec une architecture nativement omnimodale (texte, image, audio, vidéo). Sa fenêtre de contexte atteint un million de tokens, et OpenAI assure que la latence par token reste équivalente à celle de GPT-5.4.Comparatif des performances de GPT-5.5 et GPT-5.5 Pro face à leurs prédécesseurs (GPT-5.4, GPT-5.4 Pro), à Claude Opus 4.7 (Anthropic) et à Gemini 3.1 Pro (Google) sur dix benchmarks couvrant le codage, le travail agentique, les mathématiques avancées et la cybersécurité. Les scores en gras indiquent le meilleur résultat par ligne.© OpenAICôté résultats, le modèle affiche 82,7 % sur Terminal-Bench 2.0 (workflows en ligne de commande), 78,7 % sur OSWorld-Verified (pilotage autonome d'environnements informatiques) et 84,9 % sur GDPval, un benchmark évaluant la capacité à produire du travail qualifié dans 44 métiers. En codage, il obtient 58,6 % sur SWE-Bench Pro, un score toutefois inférieur aux 64,3 % de Claude Opus 4.7 sur ce même test. Le cabinet juridique Harvey rapporte, de son côté, un score de 91,7 % sur BigLaw Bench.Score sur l'Artificial Analysis Intelligence Index en fonction du volume de tokens générés (échelle logarithmique). GPT-5.5 domine à chaque palier de compute, devant GPT-5.4, Claude Opus 4.7, Opus 4.6 et Gemini 3.1 Pro Preview.© OpenAITarification, disponibilité et premiers retours terrainL'accès API est fixé à 5 dollars par million de tokens en entrée et 30 dollars en sortie, soit le double de GPT-5.4. La variante Pro, destinée aux tâches à haute exigence de précision, grimpe à 30 dollars en entrée et 180 dollars en sortie. OpenAI justifie cette hausse par une efficacité accrue en tokens consommés : le modèle accomplit davantage avec moins de requêtes intermédiaires.GPT-5.5 est d'ores et déjà accessible aux abonnés Plus, Pro, Business et Enterprise via ChatGPT et Codex. L'API publique est annoncée pour les jours qui viennent, une fois les garde-fous de cybersécurité finalisés. ChatGPT revendique désormais plus de 900 millions d'actifs hebdomadaires et 50 millions d'abonnés payants. Greg Brockman, président d'OpenAI, qualifie GPT-5.5 de "nouvelle classe d'intelligence". La Bank of New York, qui a testé le modèle en avant-première, salue une résistance aux hallucinations nettement supérieure, un critère déterminant pour les institutions soumises à des obligations réglementaires strictes.Reste l'éléphant dans la pièce : Claude Mythos Preview, qu'Anthropic réserve à un consortium de défense cyber, surpasse GPT-5.5 sur la majorité des benchmarks partagés, SWE-bench Pro en tête (77,8 % contre 58,6 %). Un écart réel, mais sur un modèle que personne, pour l'heure, ne peut utiliser librement. À lire également : J'ai écouté Sam Altman torpiller Anthropic sur Claude Mythos, pendant qu'OpenAI fuitait GPT-5.5 en silence Suivez toute l'actualité des Numériques sur Google Actualités et sur la chaîne WhatsApp des Numériques Envie de faire encore plus d'économies ? Découvrez nos codes promo sélectionnés pour vous.
🔗 Lire l'article original
👁️ 0 lecture