● Numerama 📅 16/04/2026 à 20:17

Anthropic dévoile Claude Opus 4.7, le nouveau meilleur modèle du marché

Intelligence Artificielle 👤 Lisa Imperatrice

🏷️ Tags : anthropic edr gemini openai rte

Lecture Zen Résumer l'article Anthropic lance Claude Opus 4.7, désormais son modèle grand public le plus puissant. Sur SWE‑bench Pro, il atteint 64,3%, signe d’un bond net par rapport à Opus 4.6 et d’un avantage sur GPT‑5.4 et Gemini 3.1 Pro. Opus 4.7 sert de banc d’essai pour les garde‑fous de cybersécurité du projet Glasswing, avec des capacités volontairement restreintes sur ces usages. Anthropic lance Claude Opus 4.7, désormais son modèle grand public le plus puissant. Sur SWE‑bench Pro, il atteint 64,3%, signe d’un bond net par rapport à Opus 4.6 et d’un avantage sur GPT‑5.4 et Gemini 3.1 Pro. Opus 4.7 sert de banc d’essai pour les garde‑fous de cybersécurité du projet Glasswing, avec des capacités volontairement restreintes sur ces usages. Recevez tous les soirs un résumé de l’actu importante avec Le Récap’ Le 16 avril 2026, Anthropic a dévoilé Claude Opus 4.7, une nouvelle version de son modèle orientée vers les tâches complexes et l’usage « agentique ». Plus performant que son prédécesseur, il sert aussi de terrain de test pour de nouveaux garde-fous en cybersécurité. Anthropic a plus que jamais le vent en poupe et ne compte pas ralentir. Le 16 avril 2026, la firme a dévoilé Claude Opus 4.7, successeur direct d’Opus 4.6, lancé il y a à peine deux mois. Présenté comme nettement amélioré en « matière d’ingénierie logicielle avancée, notamment pour les tâches les plus complexes », le modèle reste toutefois en retrait face à Claude Mythos Preview, la version interne la plus puissante d’Anthropic. Selon l’entreprise, Opus 4.7 est désormais capable de gérer des projets de programmation particulièrement complexes, jusque-là difficiles à mener sans supervision quasi constante. Le modèle met notamment en avant sa capacité à tenir sur des tâches longues, à suivre strictement les consignes et à vérifier ses propres résultats avant restitution, afin de limiter les erreurs. Autre évolution : l’analyse d’images progresse nettement, avec une prise en charge de visuels en bien plus haute définition. Opus 4.7 se veut ainsi plus précis et plus créatif dans les usages professionnels, qu’il s’agisse de générer des interfaces, des présentations ou des documents. Anthropic a dévoilé Claude Opus 4.7 le 16 avril 2026. Claude Opus 4.7, le meilleur modèle d’Anthropic pour le grand public S’il reste moins polyvalent que Claude Mythos, Anthropic affirme qu’Opus 4.7 surpasse déjà Opus 4.6 sur un large éventail de tests et constitue leur « modèle le plus puissant disponible pour le grand public ». Les benchmarks publiés montrent une progression nette : Sur le développement logiciel « agentique » (SWE‑bench Pro), Opus 4.7 atteint 64,3%, contre 53,4% pour Opus 4.6, 57,7% pour GPT‑5.4 et 54,2% pour Gemini 3.1 Pro, tandis que Mythos culmine à 77,8%. Sur la résolution de bugs dans des projets open source (SWE‑bench Verified), le nouveau modèle grimpe à 87,6%, contre 80,8% pour Opus 4.6, quand Mythos demeure nettement devant à 93,9%. Enfin, sur l’analyse financière « agentique » (Finance Agent v1.1), Opus 4.7 atteint 64,4%, contre 60,1% pour Opus 4.6, 61,5% pour GPT‑5.4 et 59,7% pour Gemini 3.1 Pro. La même tendance se retrouve sur d’autres tests. Sur l’utilisation « agentique » de l’ordinateur (OSWorld‑Verified), Opus 4.7 atteint 78,0%, contre 72,7% pour Opus 4.6, quand Mythos monte à 79,6%. Sur le raisonnement multidisciplinaire de haut niveau (Humanity’s Last Exam), il passe de 40,0% à 46,9% sans outils (56,8% pour Mythos), et de 53,3% à 54,7% avec outils, là où Mythos atteint 64,7%. Le benchmark publié par Anthropic pour Claude Opus 4.7. // Source : Anthropic Anthropic met aussi en avant une meilleure gestion de la mémoire via un système de fichiers : le modèle conserve des notes dans la durée, puis s’en sert pour enchaîner les tâches, avec moins de remise en contexte. La tarification reste inchangée (5 dollars par million de jetons en entrée, 25 dollars en sortie). L’entreprise précise toutefois que cette version repose sur un nouveau découpage du texte en jetons, pouvant associer 1 à 1,35 fois plus de jetons à un même contenu. Autre point : Opus 4.7 « réfléchit » plus longtemps aux niveaux d’effort élevés, ce qui allonge les réponses. En pratique, même à tarif constant, la consommation peut augmenter. Anthropic recommande donc d’ajuster les niveaux d’effort, de fixer des budgets de tâches et d’optimiser les prompts. La firme se veut néanmoins rassurante : « Nos tests internes ont montré un résultat positif : l’utilisation des jetons est améliorée à tous les niveaux d’effort (…) Nous recommandons toutefois de mesurer la différence sur un trafic réel.» Un guide de migration, avec des conseils pour passer d’Opus 4.6 à Opus 4.7, est également disponible. Quelques modifications de comportement et d’API sont à prendre en compte lors de la migration. // Source : Anthropic Opus 4.7 n’est « pas un modèle dédié à la cybersécurité » Le lancement d’Opus 4.7 intervient dans un contexte particulier. La semaine dernière, Anthropic a présenté le projet Glasswing, consacré aux risques et aux bénéfices des modèles d’IA en cybersécurité. À cette occasion, l’entreprise a indiqué que la diffusion de Claude Mythos Preview resterait très limitée, le temps de tester de nouveaux garde-fous sur des modèles moins puissants. Opus 4.7 est le premier de ces modèles « test ». Ses capacités en cybersécurité sont volontairement moins avancées que celles de Mythos Preview : Anthropic a expérimenté différentes techniques pour les réduire lors de l’entraînement. Le modèle est ainsi lancé avec de nouveaux mécanismes capables de détecter et de bloquer automatiquement les demandes liées à des usages interdits ou jugés à haut risque, présentés comme « un premier test en conditions réelles » de l’approche définie avec le projet Glasswing. Anthropic insiste par ailleurs sur le positionnement du modèle : « Opus 4.7 n’est pas un modèle dédié à la cybersécurité », et reste en retrait sur ces usages face à Mythos Preview. Les retours issus de ce déploiement doivent, à terme, permettre d’ouvrir plus largement l’accès aux modèles de la famille Mythos, précise la firme. Dans son communiqué, l’entreprise invite par ailleurs les professionnels souhaitant utiliser Opus 4.7 à « des fins légitimes de cybersécurité » à rejoindre son nouveau programme de vérification. Opus 4.7 est disponible dès aujourd’hui dans les interfaces Claude, via l’API (sous le nom claude-opus-4-7), ainsi que sur Amazon Bedrock, Google Cloud Vertex AI et Microsoft Foundry. Par ailleurs, ce lancement intervient alors qu’OpenAI a présenté, le 14 avril 2026, GPT-5.4-Cyber, une déclinaison orientée cyberdéfense. La firme devrait prochainement annoncer GPT-5.5, tandis que Google, engagé dans une accélération similaire avec Gemini, devrait suivre. Toute l'actu tech en un clin d'œil Ajoutez Numerama à votre écran d'accueil et restez connectés au futur ! Installer Numerama Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer ! Crédit photo de la une : numerama / anthropic Signaler une erreur dans le texte Anthropic Claude Code IA générative Intelligence artificielle Ne plus voir cette pub Ne plus voir cette pub

🔗 Lire l'article original 👁️ 3 lectures

← Retour