● Korben
📅 27/05/2026 à 08:49
GhostDesk - Un bureau Linux complet pour votre agent IA - Korben
📡 Télécom & Opérateurs
👤 Korben ✨
🏷️ Tags :
réseau
GhostDesk - Un bureau Linux complet pour votre agent IA27 mai 2026 / PAR KORBEN ✨ / 3 MIN DE LECTURE /Catégories connexes Écouter cet article ~ 3 minCe qu’il faut retenirGhostDesk est un serveur MCP open source qui expose un bureau Linux complet dans Docker à un agent IA, lui permettant de voir l'écran, cliquer, taper et lancer des applis comme un humain, contrairement aux outils limités au browser comme Playwright.L'agent interprète directement les captures d'écran et envoie des commandes via douze outils (click, drag, scroll, type, etc.), ce qui évite les bidouilles CSS et fonctionne sur n'importe quelle interface graphique, y compris les ERP legacy ou LibreOffice.Le serveur peut tourner avec des modèles locaux comme Qwen sans sortir de données du réseau et sans coût API, rendant les cas d'usage sensibles (données de santé, comptabilité, SI interne) envisageables ; Claude et ChatGPT marchent aussi mais avec compromis sur latence et confidentialité.Résumé généré par IAGhostDesk , c'est un serveur MCP open source qui file à votre agent IA un bureau Linux complet tournant dans Docker. L'agent voit l'écran, clique, tape, lance des applis, comme un humain. Bref, c'est pas juste un browser à la Playwright, puisque grâce à lui, n'importe quelle interface graphique devient pilotable. Yoann Vanitou son créateur m'a pitché son projet par email, et comme j'ai trouvé ça cool, je vous emmène faire un petit tour du propriétaire.Le principe c'est un conteneur Docker qui tourne avec un bureau Linux minimal, Firefox, un terminal, un éditeur de texte, une calculatrice, et un serveur MCP en frontal. Votre agent IA préféré se connecte alors sur http://localhost:3000/mcp, demande un screenshot, identifie ce qui est à l'écran, puis envoie des commandes souris et clavier via les douze outils exposés (click, drag, scroll, type, key press, copy/paste, launch app, etc.). Votre navigateur ne supporte pas la lecture de vidéos HTML5. Voici un lien vers la vidéo.Et vous pouvez même regarder l'agent bosser en direct depuis votre navigateur sur le port 6080, via noVNC. C'est assez satisfaisant de voir l'IA cliquer toute seule dans Firefox, je dois bien le reconnaitre !Là où Playwright et consorts sont coincés dans le browser, GhostDesk fonctionne ainsi sur n'importe quelle fenêtre. Un workflow automatisé qui mélange plusieurs applis , un ERP legacy, LibreOffice, un IDE, un client mail, peu importe.... Ça évite les bidouilles à base sélecteurs CSS ou code custom puisque l'agent interprète l'écran directement à partir des captures écran qu'il fait.Et comme le serveur est pensé pour tourner avec des modèles locaux comme Qwen sur une workstation GPU, y'a vraiment aucune donnée qui sort de votre réseau et aucun coût API. Puis surtout, des cas d'usage sensibles (genre avec des données de santé, de la compta, du SI interne..etc) deviennent parfaitement envisageables. Claude et ChatGPT marchent aussi, mais avec les compromis habituels sur la latence et la confidentialité.Pour tester, une seule commande Docker suffit :docker run -d --shm-size 2g -p 3000:3000 -p 6080:6080 ghcr.io/yv17labs/ghostdesk:latest Vous branchez ensuite votre client MCP sur localhost:3000/mcp, vous ouvrez localhost:6080 dans un onglet pour observer, et hop ! Pour la prod, y'a aussi un mode TLS plus bearer token qui chiffre le transport, parce qu'exposer un bureau Linux en clair sur le réseau, c'est pas l'idée du siècle, c'est vrai ^^.Les applis pré-installées restent sobres, mais rien n'empêche de builder votre propre image avec d'autres logiciels.Maintenant, le projet est très jeune et son développement repose quasi uniquement sur Yoann, donc je pense qu'il ne sera pas contre un petit coup de main. A voir avec lui.Après côté licence, c'est une license non-concurrentielle qui interdit l'usage commercial rival pendant une période fixée avant bascule vers une licence ouverte classique.Bref, GhostDesk c'est une idée sympa et je pense que si vous faites de l'automation d'applis desktop ou que vous voulez brancher un agent local sur un bureau virtuel sans payer d'API, ça mérite le coup d'œil !Bravo à Yoann !Référenceshttps://www.yv17labs.com/Cet article peut contenir des images générées à l'aide de l'IA - J'apporte le plus grand soin à chaque article, toutefois, si vous repérez une boulette, faites-moi signe !Vous avez aimé cet article ?Alors rejoignez ma communauté sur Patreon et accédez à des articles exclusifs, des tutos avancés et plein d'autres surprises que je réserve à mes soutiens. C'est grâce à vous que je peux continuer à partager ma passion depuis 20 ans !Rejoindre l'aventure Créateurs de contenus, voici les offres qu'il vous faut pour cartonner !Contenu partenaireBlogueurs, influenceurs, créateurs de contenus... Si comme moi vous vivez de votre créativité en ligne, vous méritez ce qu'il y a de mieux pour votre activité !Laissez-moi vous présenter les nouvelles offres de o2switch : LA solution idéale pour propulser votre site ou blog. Avec l'offre Cloud à 1,86 € HT/mois, profitez de 12 CPU et 48 Go de RAM, de 42MB/s I/O, d'un espace disque illimité en NVMe, et de 8 sous-comptes inclus pour gérer plusieurs projets !Gérez votre WordPress comme un pro grâce aux outils exclusifs et à l'interface cPanel ultra simple. Soyez serein avec un nom de domaine inclus, des sauvegardes sur 45 jours, une instance NextCloud 250Go et TigerGuard. Le support prioritaire 24/7 est là pour vous !Vous voulez le meilleur ? L'offre Cloud est à seulement 1,86 € HT/mois. Oui oui, c'est tout ! Et si vous voulez encore plus de puissance, l'offre Pro avec 24 CPU et 64 Go de RAM est à 6,25 € HT/mois. Offrez à votre site le tremplin qu'il mérite !Découvrez les nouvelles offres o2switch📬 La newsletter Korben — Un concentré de tech, d'actu et de bidouille dans votre boite mail. S'inscrire
🔗 Lire l'article original
👁️ 1 lecture