Une méthode redoutable permet de manipuler les chatbots IA pour influencer leurs réponses

Intelligence artificielle Une méthode redoutable permet de manipuler les chatbots IA pour influencer leurs réponses Des chercheurs alertent sur deux techniques de manipulation des chatbots IA. Par Jennifer Larcher Publié le 24 juin 2026 à 12h32 Vous posez une question à votre chatbot préféré sur un sujet géopolitique sensible. La réponse arrive en trois secondes, bien formulée, avec des sources.

Sauf que l’une de ces sources appartient à un réseau de faux sites d’actualités créés pour diffuser de la propagande. Le chatbot ne le sait pas et vous non plus. La réponse ressemble à un fait vérifié.

En réalité, elle provient d’une usine à désinformation. Ce scénario ne relève pas de la fiction. Des tests réalisés par l’organisation Newsguard prouvent qu’il se produit régulièrement. 📩 L’actu digitale évolue vite.

Restez à jour.Recevez la newsletter quotidienne, gratuitement. En vous inscrivant vous acceptez notre politique de protection des données personnelles. Empoisonner le puits avant que tout le monde y boive Valentin Châtelet et Esteban Ponce de León, chercheurs au laboratoire d’investigation numérique de l’Atlantic Council, différencient deux process.

L’empoisonnement intervient avant le lancement du modèle. Des acteurs glissent du contenu corrompu dans les immenses bases de données qui servent à l’entraînement. Common Crawl, l’une des plus grandes archives du web, alimente 60 % de l’entraînement de GPT-3.

En mars 2026, le DFRLab a trouvé des entrées en provenance du réseau Pravda, un maillage de centaines de faux portails d’information qui relaient les positions du Kremlin dans plusieurs langues. Quelques centaines de documents soigneusement rédigés suffisent à implanter des failles dans un modèle de plusieurs milliards de paramètres. Une étude menée par Anthropic et l’institut britannique de sécurité de l’IA l’a démontré en 2025.

Noyer le web pour tromper l’algorithme Le conditionnement fonctionne autrement. Le modèle est déjà en service. L’attaquant publie massivement du contenu en ligne pour que les robots de collecte le récupèrent.

Le chatbot, conçu pour identifier la réponse statistiquement la plus probable, finit par considérer que si mille pages web disent la même chose, le récit est fiable. Newsguard a testé cette vulnérabilité sur plusieurs chatbots commerciaux. Le Chat, le modèle de Mistral, régurgitait de la désinformation sur le conflit iranien puisée dans des sites de propagande.

Claude, le chatbot d’Anthropic, faisait de même dans environ 15 % des cas face à des questions ciblées. Des millions de dollars pour truquer les réponses de ChatGPT Le think tank Responsible Statecraft et le média The Intercept ont sorti l’affaire en mai 2026. Clock Tower X, une boîte américaine pilotée par l’ancien directeur de campagne de Donald Trump, a encaissé plusieurs millions de dollars versés par des entités rattachées au gouvernement israélien.

L’objectif du contrat ne visait pas Facebook ou X. Il concernait les chatbots eux-mêmes. Clock Tower X a fabriqué un réseau de sites web conçus pour alimenter les bases de données que les modèles d’IA aspirent en permanence.

Pour Ponce de León, chercheur au DFRLab estime qu’il s’agit de la désinformation à la demande. Nettoyer les dégâts coûte un prix que personne ne veut payer. Châtelet estime que la seule solution viable impliquerait de relancer l’entraînement du modèle depuis zéro, en ayant préalablement identifié et retiré chaque fragment de contenu corrompu.

Pour aller plus loin L’ONU réclame des réponses sur l’empreinte énergétique grandissante de l’IAOracle reconnaît que l’IA a contribué à supprimer 21 000 emplois en un anAprès le départ de ses meilleurs talents de l’IA, Google perd 270 milliards de dollars en boursePourquoi Wikipédia voit son trafic reculer et durcit le ton contre l’IA ?Google investit 75 millions de dollars pour faire entrer l’IA à HollywoodDès 2027, tous les lycéens de seconde auront un cours d’IA chaque semaine IA