● Korben
📅 23/03/2026 à 11:57
Un agent IA a mené 700 expériences en deux jours pour améliorer un modèle de langage - Korben
Cybersécurité
👤 Korben
Un agent IA a mené 700 expériences en deux jours pour améliorer un modèle de langage23 mars 2026 / PAR VINCENT LAUTIER / 3 MIN DE LECTURE / À lire plus tard SauvegardéCe qu’il faut retenirUn agent IA a conduit 700 expériences en 48h sur un modèle de langage et identifié 20 optimisations cumulables, réduisant le temps d'entraînement de 11% (de 2h02 à 1h80).Contrairement à AutoML, cet "autoresearch" utilise un vrai modèle de langage qui lit le code, formule des hypothèses, modifie le script et apprend de ses résultats précédents de façon itérative.Karpathy envisage des essaims d'agents parallèles qui collaborent pour tester des pistes différentes à grande échelle, remplaçant le travail d'une communauté entière de chercheurs.Résumé généré par IAAndrej Karpathy, ancien chercheur chez OpenAI et ex-responsable de l'IA chez Tesla, a laissé tourner un agent IA pendant 48 heures sur un petit modèle de langage. Résultat : 700 expériences, 20 optimisations retenues et un gain de 11 % sur le temps d'entraînement.Le principe d'autoresearchMais c'est quoi ce concept d'autoresearch ? Et bien le fonctionnement est assez direct : un agent IA reçoit un script d'entraînement de 630 lignes en Python et un budget de calcul fixe de 5 minutes par expérience sur un seul GPU. Et c'est là que l'agent se met en mouvement pour lire le code, formuler une hypothèse, modifier le script, lancer l'entraînement, évaluer le résultat, et surtout décider, ou non, de conserver une modification.Si le modèle s'améliore, le changement devient la nouvelle base. Sinon, il revient en arrière et essaie autre chose. En deux jours de boucle continue, l'agent a conduit environ 700 itérations et identifié 20 améliorations cumulables qui ont réduit le temps nécessaire pour atteindre le niveau GPT-2 de 2,02 heures à 1,80 heure.Tobias Lütke, le patron de Shopify, a d'ailleurs testé le système sur des données internes : après une nuit, 37 expériences et un gain de 19 % sur les performances de son modèle.La question de l'auto-améliorationLà où le projet fait pas mal parler, c'est l'idée que cette IA s'améliore elle-même en boucle, dans un scénario que certains chercheurs en sécurité aiment appeler "exploser d'intelligence" (c'est aussi comme ça que j'appelle chaque moment que je passe à regarder l'ami Korben me parler de ses projets en cours).Karpathy tempère : son agent n'optimise pas son propre code, il ajuste l'entraînement d'un modèle bien plus petit et bien moins complexe.Par contre, il assume que tous les grands labos d'IA vont adopter cette méthode et que ça va accélérer la recherche. Il imagine à terme des essaims d'agents qui collaborent en parallèle, testent des pistes différentes et remontent les meilleures idées à des échelles de plus en plus grandes. Son objectif : ne pas reproduire le travail d'un doctorant, mais celui d'une communauté entière de chercheurs.Bon maintenant il faut quand même relever que certains critiquent quand même l'idée, car elle ressemble en partie à AutoML, une technique qui est déjà utilisée chez Microsoft et Google.Karpathy a répondu que la comparaison ne tient pas : AutoML fonctionne avec des variations aléatoires ou des algorithmes évolutifs, alors qu'autoresearch utilise un vrai modèle de langage qui écrit du code, apprend de ses expériences précédentes et a accès à internet. Bref, tout ceci est fascinant.Source : The News HackRéférenceshttps://thenewstack.io/karpathy-autonomous-experiment-loop/Cet article peut contenir des images générées à l'aide de l'IA - J'apporte le plus grand soin à chaque article, toutefois, si vous repérez une boulette, faites-moi signe !Vous avez aimé cet article ?Alors rejoignez ma communauté sur Patreon et accédez à des articles exclusifs, des tutos avancés et plein d'autres surprises que je réserve à mes soutiens. C'est grâce à vous que je peux continuer à partager ma passion depuis 20 ans !Rejoindre l'aventure Créateurs de contenus, voici les offres qu'il vous faut pour cartonner !Contenu partenaireBlogueurs, influenceurs, créateurs de contenus... Si comme moi vous vivez de votre créativité en ligne, vous méritez ce qu'il y a de mieux pour votre activité !Laissez-moi vous présenter les nouvelles offres de o2switch : LA solution idéale pour propulser votre site ou blog. Avec l'offre Cloud à 1,86 € HT/mois, profitez de 12 CPU et 48 Go de RAM, de 42MB/s I/O, d'un espace disque illimité en NVMe, et de 8 sous-comptes inclus pour gérer plusieurs projets !Gérez votre WordPress comme un pro grâce aux outils exclusifs et à l'interface cPanel ultra simple. Soyez serein avec un nom de domaine inclus, des sauvegardes sur 45 jours, une instance NextCloud 250Go et TigerGuard. Le support prioritaire 24/7 est là pour vous !Vous voulez le meilleur ? L'offre Cloud est à seulement 1,86 € HT/mois. Oui oui, c'est tout ! Et si vous voulez encore plus de puissance, l'offre Pro avec 24 CPU et 64 Go de RAM est à 6,25 € HT/mois. Offrez à votre site le tremplin qu'il mérite !Découvrez les nouvelles offres o2switch
🔗 Lire l'article original
👁️ 2 lectures