● Phonandroid 📅 16/04/2026 à 09:05

Ces grands médias effacent leur propre histoire du web, et l'IA en est la seule coupable

Géopolitique 👤 Alexandre Mathiot
🏷️ Tags : chine cert rag
Illustration
De grands médias choisissent d'effacer leur propre trace du web pour se protéger de l'IA. Vingt-trois organisations ont déjà franchi le pas, dont certains des titres les plus influents au monde. Ce mouvement pourrait condamner l'une des ressources les plus précieuses d'internet. Source : 123rf La préservation de la mémoire numérique est un enjeu croissant à l'heure où le web évolue vite. Des contenus disparaissent, des articles sont modifiés, des pages entières s'évaporent sans laisser de trace. C'est pour répondre à ce problème qu'Internet Archive, une organisation à but non lucratif, a créé la Wayback Machine. Cet outil permet de consulter des instantanés de millions de sites web à différentes dates. Plus surprenant encore, plus de 130 000 conversations avec des chatbots y ont déjà été archivées. Son champ d'action dépasse donc largement la simple mémoire du web. La Wayback Machine reste pourtant une ressource incontournable pour les journalistes et les chercheurs. Mais une nouvelle menace pèse désormais sur lui. L'organisation fait régulièrement face à des poursuites pour violation de droits d'auteur, ce qui fragilise déjà son modèle. Selon la société Originality AI, 23 grands médias bloquent désormais son robot d'indexation. Parmi eux figurent le New York Times et USA Today. Ce dernier a pourtant publié une enquête récente qui s'appuyait largement sur la Wayback Machine. Une ironie que n'a pas manqué de relever Mark Graham, le directeur de l'outil. 23 médias mondiaux bloquent la Wayback Machine pour échapper au scraping des entreprises d'IA Ces grands médias bloquent la Wayback Machine pour empêcher que leurs contenus servent à entraîner des modèles d'IA. Selon Wired, le New York Times juge que ses archives sont exploitées par des entreprises d'IA en violation du droit d'auteur. Reddit a pris la même décision pour les mêmes raisons. Ces organisations veulent éviter un scraping indirect de leurs contenus, impossible à contrôler autrement. Les conséquences dépassent largement le cadre du droit d'auteur. Si l'accès à la Wayback Machine continue de se restreindre, sa capacité à garder un historique fiable du web s'érode. Or cet outil permet de retrouver des contenus supprimés et de vérifier les déclarations passées de gouvernements ou d'entreprises. Plus de 100 journalistes ont signé une pétition pour défendre son rôle. Des discussions sont en cours entre Internet Archive et les éditeurs, mais l'issue reste incertaine.
← Retour