● Numerama 📅 03/04/2026 à 12:47

Combien de tokens me reste-t-il ? La question que Claude n'arrivera peut-être jamais à résoudre

Intelligence Artificielle 👤 Amine Baba Aissa
Illustration
Lecture Zen Résumer l'article Anthropic est confronté à des difficultés avec la gestion des quotas de tokens pour ses abonnés, rendant la consommation imprévisible et frustrante pour les utilisateurs. Les ajustements de session et les limitations horaires introduits pour gérer la demande exacerbent les plaintes des utilisateurs, amplifiant la confusion sur les capacités par forfait. La situation reflète une problématique plus large dans le secteur, alors que d'autres grands acteurs comme Google font face à des pressions similaires sur leurs modèles d'abonnement AI. Anthropic est confronté à des difficultés avec la gestion des quotas de tokens pour ses abonnés, rendant la consommation imprévisible et frustrante pour les utilisateurs. Les ajustements de session et les limitations horaires introduits pour gérer la demande exacerbent les plaintes des utilisateurs, amplifiant la confusion sur les capacités par forfait. La situation reflète une problématique plus large dans le secteur, alors que d'autres grands acteurs comme Google font face à des pressions similaires sur leurs modèles d'abonnement AI. Recevez tous les soirs un résumé de l’actu importante avec Le Récap’ Anthropic tâtonne sous la pression : ses quotas de tokens, devenus imprévisibles, mettent une partie de ses utilisateurs en rogne. L’entreprise américaine paie en partie le succès de Claude et se retrouve depuis plusieurs semaines à manœuvrer entre ajustements à chaud et infrastructure qui peine à suivre. Anthropic fait face à un problème structurel. Alors que l’entreprise américaine s’est imposée ces derniers mois comme l’acteur le plus en vue de l’écosystème IA, elle est aussi victime de son succès. Point principal de tension ? L’utilisation des tokens, ces crédits alloués selon le forfait choisi. Une métrique particulièrement sensible pour sa base d’utilisateurs la plus fidèle, les développeurs qui montent des projets complexes. Pour attirer les clients vers des produits toujours plus ambitieux, l’entreprise propose quatre options : un forfait gratuit, un forfait Pro, un forfait Max 5x et un forfait Max 20x, chacun assorti de capacités de consommation différentes. Problème pour l’entreprise comme pour les utilisateurs : il est très difficile d’anticiper la consommation effective de ces tokens, tant elle peut varier selon les requêtes, leur longueur, leur complexité ou le modèle sollicité. Sur X, les échanges houleux entre les équipes techniques d’Anthropic et les utilisateurs s’accumulent. Dernier exemple en date, le 2 avril 2026. Lydia Hallie, membre des équipes en charge de Claude Code, a tenté de répondre aux plaintes de nombreux abonnés qui jugeaient les limitations trop strictes. Sa recommandation aux abonnés Pro de privilégier Sonnet 4.6 ne passe pas, alors même qu’Opus, le modèle le plus élaboré, est disponible car il « consomme environ deux fois plus de tokens ». Peak-hour limits are tighter and 1M-context sessions got bigger, that's most of what you're feeling. We fixed a few bugs along the way, but none were over-charging you.We also rolled out efficiency fixes and added popups in-product to help avoid large prompt cache misses— Lydia Hallie ✨ (@lydiahallie) April 2, 2026 Ce contenu est bloqué car vous n’avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Twitter. Pour pouvoir le visualiser, vous devez accepter l’usage étant opéré par Twitter avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l’amélioration des produits d’Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l’audience de ce site (en savoir plus) En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires. Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies. J’accepte tout Gérer mes choix Des mesures qui interrogent En réalité, cela fait plusieurs semaines que les équipes techniques sont sommées de répondre à une question pour l’heure insoluble : comment proposer un modèle transparent et prévisible pour une technologie qui, par essence, s’adapte à la demande de l’utilisateur ? Les réponses sont pour le moins floues, et les ajustements proposés relèvent plus du bricolage que d’une stratégie viable. Fin mars, Thariq Shihipar, autre membre de l’équipe technique d’Anthropic, écrivait sur X : « Afin de gérer la demande croissante pour Claude, nous ajustons la limite de session à cinq heures pour les abonnés gratuits, Pro et Max aux heures de pointe. Vos limites hebdomadaires restent inchangées. » To manage growing demand for Claude we're adjusting our 5 hour session limits for free/Pro/Max subs during peak hours. Your weekly limits remain unchanged.During weekdays between 5am–11am PT / 1pm–7pm GMT, you'll move through your 5-hour session limits faster than before.— Thariq (@trq212) March 26, 2026 Ce contenu est bloqué car vous n’avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Twitter. Pour pouvoir le visualiser, vous devez accepter l’usage étant opéré par Twitter avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l’amélioration des produits d’Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l’audience de ce site (en savoir plus) En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires. Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies. J’accepte tout Gérer mes choix En clair, ce changement signifie que pendant les heures de pointe, situées entre 5h et 11h en Californie, soit de 14h à 20h en France, les utilisateurs de Claude pourraient épuiser leur limite de session de cinq heures en moins de cinq heures réelles. En contrepartie, une session réalisée hors de ces horaires serait plus permissive. Si l’ingénieur tente de rassurer en précisant que seul « 7 % des utilisateurs atteindront des limites qu’ils n’auraient pas atteintes auparavant », les utilisateurs ne cachent pas leur mécontentement en commentaires. Ils soulignent, à juste titre, que la mesure rend encore plus difficile l’estimation de leur consommation avant d’atteindre la limite. Un problème qui touche tout le secteur Car, c’est ici que réside le problème central. Anthropic ne distille que des ordres de grandeur sur l’évolution des capacités entre forfaits, sans jamais fournir de point de référence absolu. Ainsi, selon la documentation officielle, un forfait Pro promet seulement « au moins cinq fois plus d’utilisation par session que le service gratuit » ; Max 5x offre cinq fois plus que le Pro ; Max 20x, vingt fois plus ; et le forfait Team Standard, « 1,25 fois plus que le forfait Pro ». Difficile, dans ces conditions, pour les développeurs de connaître leurs limites réelles, si ce n’est en consultant la jauge de leur tableau de bord, qui affiche le quota consommé sans jamais préciser le plafond. Seuls les utilisateurs passant par l’API disposent d’une vision claire, leur consommation est directement mesurable en tokens, avec un coût associé à chaque requête. La colère monte aussi sur Reddit, et au-delà du manque de visibilité, certains affirment atteindre les limites d’utilisation bien trop rapidement. Anthropic ne nie pas le problème, confirmant que bon nombre de ses abonnés atteignent « beaucoup plus rapidement que prévu » les limites d’utilisation, et assure mettre tout en œuvre pour y remédier. En réalité, ces tâtonnements illustrent une tension profonde sur la capacité d’Anthropic à absorber la hausse de trafic venue avec l’engouement récent. Une pression qui pèse à la fois sur l’infrastructure technique et sur le modèle économique, où bon nombre d’abonnements pourraient ne pas couvrir les coûts engendrés par la génération. Un problème qu’avait admis Sam Altman en janvier dernier à propos des abonnements Pro d’OpenAI. Plus largement, c’est tout un écosystème qui se retrouve face à ce défi. Mi-mars 2026, Google et son assistant à la programmation Antigravity ont fait face à une fronde similaire, à la suite de modifications apportées à ses options d’abonnement. Toute l'actu tech en un clin d'œil Ajoutez Numerama à votre écran d'accueil et restez connectés au futur ! Installer Numerama Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer ! Tout comprendre à La guerre de l’IA Google dévoile Gemma 4, son nouveau modèle open source que vous pouvez faire tourner sans Internet Le code source de Claude Code a fuité : quelles conséquences pour Anthropic ? 15 millions de paramètres et 1 seul GPU : Yann LeCun fait un premier pas vers l’IA qui comprend le monde réel Google a peut-être réglé la crise de la mémoire vive (RAM) avec un algorithme OpenAI abandonne la génération de vidéos (Sora) et perd son deal avec Disney : comment expliquer un tel échec ? Crédit photo de la une : montage Numerama Signaler une erreur dans le texte Ne plus voir cette pub Ne plus voir cette pub Anthropic Claude IA générative Opus token
← Retour