OpenAI Codex Computer Use arrive sur Windows : l'agent IA contrôle votre PC à distance
🔎 Un agent IA qui prend le contrôle de votre PC Windows, c'est maintenant réel
OpenAI vient de franchir un cap qui va redistribuer les cartes de l'automatisation desktop. Le 29 mai 2026, la mise à jour v26.527 de Codex déploie le Computer Use sur Windows 11. Jusqu'à présent, cette fonctionnalité restait confinée à macOS. L'agent peut maintenant voir votre écran, cliquer, naviguer et taper dans n'importe quelle application Windows, de façon totalement autonome.
Pourquoi maintenant ? Parce que Windows représente encore plus de 75% du marché des ordinateurs de bureau selon les données de StatCounter (2025). Ignorer cette plateforme, c'était se priver de l'écrasante majorité des utilisateurs professionnels. OpenAI comble ce retard avec un timing calculé : la concurrence (Claude Code de Anthropic, Grok Build de xAI) monte en puissance, et le besoin d'agents capables d'agir directement sur le système d'exploitation devient la nouvelle frontière de l'IA agentic.
Ce n'est pas un simple assistant qui suggère des commandes. Codex agit. Il ouvre VS Code, lance des tests, corrige des bugs, valide des résultats — sans que vous n'ayez à toucher au clavier.
L'essentiel
- Codex Computer Use est désormais disponible sur Windows 11 (v26.527, 29 mai 2026), après un lancement initial sur macOS.
- L'agent voit l'écran, clique, navigue et tape dans n'importe quelle application Windows de manière autonome.
- Le pilotage à distance via l'app mobile ChatGPT permet de lancer et superviser des tâches depuis son smartphone.
- Ce déploiement touche 75%+ du marché desktop, un enjeu stratégique majeur face à Claude Code et Grok Build.
- Les implications sécuritaires sont considérables : un IA qui contrôle votre PC implique une surface d'attaque nouvelle.
Outils recommandés
| Outil | Usage principal | Prix (juin 2025, vérifiez sur openai.com) | Idéal pour |
|---|---|---|---|
| OpenAI Codex | Agent coding avec Computer Use | Inclus dans les plans ChatGPT Pro/Team | Développeurs qui veulent un agent autonome sur leur PC |
| Hostinger | Hébergement pour déployer les projets générés | À partir de 2,99€/mois | Développeurs et freelances qui déploient vite |
| ChatGPT Mobile (iOS/Android) | Pilotage à distance des tâches Codex | Inclus dans l'abonnement ChatGPT | Coder depuis son téléphone pendant que l'agent travaille |
Ce que Computer Use fait réellement sur Windows
Computer Use, ce n'est pas de la génération de code dans un éditeur. C'est un agent qui interagit avec votre système d'exploitation comme le ferait un humain. Il capture des captures d'écran, analyse l'interface, identifie les éléments cliquables, et exécute des actions.
Concrètement sur Windows 11, Codex peut ouvrir le terminal PowerShell, exécuter des commandes, lancer Visual Studio, naviguer dans l'explorateur de fichiers, ouvrir un navigateur pour tester une web app, et vérifier les résultats visuellement. Le tout sans intervention humaine entre chaque étape.
Selon The Decoder, l'agent est capable de chasser des bugs et de tester des applications de manière autonome. Il ne s'arrête pas à la première erreur : il lit le message d'erreur, identifie la source, modifie le code, relance, et itère jusqu'à résolution.
C'est une différence fondamentale avec le Copilot classique, qui se contente de compléter du texte dans un éditeur. Ici, on est dans l'agentic pur : un objectif est donné, l'agent décompose les étapes, les exécute, et s'adapte en temps réel.
Comment ça fonctionne techniquement
Le flux est le suivant : vous décrivez une tâche en langage naturel. Codex la décompose en sous-tâches. Pour chaque sous-tâche, il capture l'état actuel de l'écran, décide de l'action (clic, frappe, navigation), l'exécute, et observe le résultat. La boucle se répète jusqu'à complétion.
Les modèles GPT-5.3 Codex (score agentic de 80) et GPT-5.4 Pro (91.8) sont les moteurs derrière cette capacité. Le premier est optimisé pour le code pur, le second apporte le raisonnement avancé nécessaire pour naviguer dans des interfaces complexes.
De macOS à Windows : pourquoi ce retard, pourquoi maintenant
Le Computer Use a d'abord été déployé sur macOS, une plateforme plus homogène et plus facile à cibler pour un agent visuel. Les applications macOS partagent des conventions d'interface plus uniformes, ce qui simplifie l'apprentissage de l'agent.
Windows, c'est un autre monde. L'écosystème est hétérogène : applications Win32 historiques, apps UWP, applications modernes avec Fluent Design, logiciels tiers aux interfaces chaotiques. Un agent doit pouvoir naviguer dans tout ce mélange.
NewsBytes rapporte qu'OpenAI a dû adapter son système de reconnaissance visuelle pour gérer cette diversité. Les éléments d'interface Windows ne se comportent pas comme ceux de macOS : les menus, les fenêtres modales, les notifications système ont des patterns visuels distincts.
Le timing n'est pas anodin. Anthropic pousse Claude Code (basé sur Claude Opus 4.7, score 94.3) comme l'agent de référence pour les développeurs. xAI a lancé Grok Build avec Grok 4.1 (score 79) comme alternative. OpenAI ne pouvait pas se permettre de laisser Windows sans agent alors que c'est le terrain de jeu principal de la majorité des développeurs.
Piloter Codex depuis son téléphone : le coup de génie mobile
C'est peut-être le détail le plus sous-estimé de cette mise à jour. L'intégration avec l'app mobile ChatGPT permet de piloter les tâches Codex à distance, depuis votre smartphone. Vous donnez un objectif, vous fermez votre PC, et l'agent travaille.
Vous pouvez vérifier l'avancement depuis votre téléphone, valider des étapes si nécessaire, ou simplement laisser l'agent terminer. C'est une forme de computing asynchrone appliquée au développement logiciel.
Cette fonctionnalité ouvre des scénarios concrets : lancer une suite de tests avant de rentrer chez soi, demander à l'agent de corriger un bug critical repéré en consultation depuis le métro, ou déclencher un déploiement depuis la terrasse d'un café.
Pour comprendre toute la portée de ce mécanisme, notre article dédié au Codex dans ChatGPT Mobile détaille comment le pipeline mobile-agent fonctionne en pratique, de l'envoi de la requête à l'exécution sur la machine distante.
Codex vs Claude Code vs Grok Build : la guerre des coding agents
Le marché des coding agents avec contrôle système explose. Voici où se positionne Codex Computer Use face à ses concurrents directs.
| Agent | Modèle moteur | Score agentic | Computer Use Windows | Computer Use macOS | CLI natif |
|---|---|---|---|---|---|
| OpenAI Codex | GPT-5.4 Pro | 91.8 | Oui (v26.527) | Oui | Oui |
| Claude Code | Claude Opus 4.7 | 94.3 | Partiel | Oui | Oui |
| Grok Build | Grok 4.1 | 79 | Non annoncé | Non | Oui |
Claude Code d'Anthropic reste le leader sur le score de raisonnement pur (94.3 pour Claude Opus 4.7 contre 91.8 pour GPT-5.4 Pro). Mais Codex possède un avantage tangible : la disponibilité native de Computer Use sur les deux principaux OS desktop, couplée au pilotage mobile.
Grok Build, lancé par xAI, se positionne comme l'alternative open-source-friendly mais n'a pas encore déployé de Computer Use. Son score agentic de 79 avec Grok 4.1 le place derrière ses deux concurrents directs sur les tâches de raisonnement complexe.
Un point crucial : ces agents ne sont pas de simples autocomplete. L'étude Automatic Program Repair with OpenAI's Codex: Evaluating QuixBugs (2021) démontrait déjà que Codex pouvait réparer des programmes automatiquement. Cinq ans plus tard, cette capacité s'étend de l'éditeur à l'ensemble du système d'exploitation.
L'évaluation d'OpenAI Codex pour la génération de noyaux HPC, documentée dans cette étude de 2023, montrait aussi les limites de l'époque sur les modèles de programmation parallèle. Les scores agentic actuels de GPT-5.4 Pro (91.8) montrent la progression monumentale en trois ans.
Sécurité : quand un IA prend le contrôle de votre PC
C'est l'éléphant dans la pièce. Un agent qui voit votre écran, clique partout, tape des commandes, accède à vos fichiers — ça ressemble furieusement à un cheval de Troie, sauf que c'est vous qui l'installez volontairement.
La surface d'attaque est réelle. Si un prompt malveillant parvient à détourner Codex, l'agent dispose des mêmes privilèges que votre session utilisateur. Il peut lire des fichiers sensibles, modifier des configurations système, exécuter des commandes destructrices.
OpenAI a intégré des garde-fous : un système de validation avant les actions sensibles (suppression de fichiers, commandes admin), des logs complets de chaque action, et la possibilité de couper le processus à tout moment depuis le mobile ou le desktop.
Mais comme le note Kingy.ai, la question n'est pas tant de savoir si les garde-fous actuels suffisent, mais comment l'écosystème va évoluer quand des millions d'utilisateurs feront confiance à un agent pour agir sur leur machine.
La carte système d'OpenAI o1 documentait déjà les préoccupations liées aux comportements incontrôlés des modèles de raisonnement. Avec Computer Use, ces préoccupations passent du théorique au pratique : l'agent n'est plus dans une sandbox, il est dans votre environnement de travail réel.
Bonnes pratiques de sécurité
Ne donnez jamais à Codex des accès administrateur inutiles. Utilisez un compte utilisateur limité pour les tâches automatisées. Vérifiez les logs d'action après chaque session. Et surtout : ne laissez pas un agent tourner sans supervision sur une machine contenant des données sensibles non chiffrées.
Automatisation desktop : au-delà du code
Computer Use sur Windows n'est pas limité au développement logiciel. C'est un framework d'automatisation visuelle qui s'applique à n'importe quel flux de travail desktop.
Un comptable peut demander à Codex d'ouvrir Excel, d'importer un CSV, d'appliquer des formules de consolidation, et de générer un rapport PDF. Un designer peut demander à l'agent d'ouvrir Figma, d'exporter les assets, et de les organiser dans un dossier structuré. Un support technique peut faire ouvrir un outil de ticketing, trier les demandes, et appliquer des réponses types.
La différence avec les macros classiques ou RPA (Robotic Process Automation) est fondamentale. Les macros sont déterministes : elles rejouent une séquence enregistrée. Si l'interface change d'un pixel, elles cassent. Codex s'adapte visuellement : il comprend ce qu'il voit, pas seulement où cliquer.
C'est le même principe de manipulation habile que les chercheurs explorent dans la robotique. L'étude Learning Dexterous In-Hand Manipulation montrait qu'un système peut apprendre à manipuler des objets physiques avec dextérité. Computer Use transpose ce paradigme à la manipulation d'interfaces numériques.
Créer un agent IA personnalisé avec Codex : les possibilités
Pour les développeurs qui veulent aller plus loin que l'usage standard, Codex Computer Use ouvre la voie à la création d'agents IA spécialisés. Le concept est simple : vous définissez un périmètre d'action, un ensemble de tâches autorisées, et l'agent opère dans ce cadre sur votre machine Windows.
Si vous voulez comprendre les fondamentaux de cette approche, notre guide sur comment créer un agent IA couvre les principes de conception : définition d'objectifs, boucle d'observation-action, gestion des erreurs, et mécanismes de rappel.
La clé réside dans la mémoire. Un agent sans mémoire refait les mêmes erreurs, ne se souvient pas de vos préférences, et ne capitalise pas sur les sessions précédentes. C'est un point critique pour Computer Use : si Codex oublie que vous préférez PowerShell à CMD, ou que votre projet utilise pnpm et non npm, chaque session repart de zéro.
Notre article sur la mémoire IA détaille les architectures permettant à un agent de construire une mémoire persistante — essentielle quand l'agent interagit avec votre environnement de travail réel et non un bac à sable.
Extensibilité : plugins et intégrations
Un agent desktop autonome devient vraiment puissant quand on peut lui greffer des capacités spécifiques. C'est là que l'écosystème de plugins entre en jeu.
Le principe est analogue à ce que fait l'écosystème Hermes Agent avec ses extensions. Comme nous l'avons détaillé pour les plugins Hermes Agent, un agent de base est un moteur généraliste. Les plugins ajoutent des compétences métier : connexion à des APIs spécifiques, intégration avec des outils internes, protocoles de communication particuliers.
Avec Codex sur Windows, les développeurs peuvent créer des plugins qui spécialisent l'agent pour leur stack technique, leurs outils internes, ou leurs processus métier. Un plugin pourrait par exemple permettre à Codex d'interagir directement avec Jenkins pour déclencher des pipelines CI/CD, ou avec Docker Desktop pour gérer des conteneurs.
L'exemple de TagLib-Wasm, une bibliothèque TypeScript pour le taggage musical compilée en WebAssembly, illustre la tendance : des outils spécialisés et performants qui peuvent être exposés comme capacités d'un agent. Un plugin Codex pourrait utiliser TagLib-Wasm pour automatiser le tagging de fichiers audio directement depuis l'explorateur Windows.
Ce que ça change pour le développeur au quotidien
L'impact concret est immédiat pour certaines catégories de tâches. Les tests de régression, par exemple. Au lieu d'écrire des scripts Selenium fragiles, vous demandez à Codex : "Lance l'application, navigue jusqu'à la page de checkout, remplis le formulaire avec ces données, vérifie que le message de confirmation apparaît." L'agent le fait visuellement, comme un humain.
Le debugging aussi change de nature. Vous ne cherchez plus l'erreur dans les logs. Vous dites à Codex : "Cette fonction crash quand on passe un tableau vide." L'agent ouvre le code, identifie le problème, applique le fix, lance les tests pour vérifier, et vous notifie quand c'est résolu.
La refactorisation de code legacy, souvent un cauchemar, devient gérable. Codex peut naviguer dans un codebase qu'il ne connaît pas, comprendre la structure, identifier les patterns à moderniser, et appliquer les changements progressivement.
L'étude Vision Based Game Development Using Human Computer Interaction (2010) explorait déjà l'idée d'interfaces basées sur la vision pour le développement. Seize ans plus tard, OpenAI concrétise cette vision avec un agent qui lit littéralement l'écran pour interagir avec n'importe quel logiciel.
❌ Erreurs courantes
Erreur 1 : Laisser Codex tourner sans supervision sur une machine de production
C'est l'erreur la plus dangereuse. Computer Use dispose des droits de votre session. Sur une machine de production, un agent qui modifie un fichier de config ou tue un processus par erreur peut causer un incident majeur. La solution : utilisez Codex sur un environnement de développement ou de staging isolé, jamais en direct sur un serveur de production.
Erreur 2 : Donner des objectifs vagues à l'agent
"Améliore le code" ou "Fais marcher l'appli" ne sont pas des objectifs exploitables. Codex va interpréter ces consignes de manière imprévisible et potentiellement destructive. La solution : soyez ultra-spécifique. "Dans le fichier src/auth/login.ts, la fonction validateToken ne gère pas les tokens expirés. Ajoute un check d'expiration et retourne une erreur 401 avec le message approprié."
Erreur 3 : Ignorer les logs d'action
Chaque clic, chaque frappe, chaque commande exécutée par Codex est loguée. Ne pas vérifier ces logs, c'est comme ne pas lire un diff avant de merger. L'agent peut prendre des raccourcis ou faire des choix que vous n'auriez pas validés manuellement. La solution : prenez 2 minutes après chaque session pour scanner les logs.
Erreur 4 : Confondre Computer Use avec un simple assistant
Computer Use n'est pas Copilot dans VS Code. C'est un agent avec des droits d'exécution réels sur votre système. Le traiter comme un simple outil de suggestion, c'est sous-estimer radicalement ce qu'il peut faire — et les dégâts qu'il peut causer s'il déraille.
❓ Questions fréquentes
Codex Computer Use fonctionne-t-il sur Windows 10 ?
Non. OpenAI cible exclusivement Windows 11 pour cette première version. Les APIs de capture d'écran et d'accessibilité utilisées par Computer Use s'appuient sur des fonctionnalités spécifiques à Windows 11. Aucune annonce concernant Windows 10 n'a été faite.
Quel modèle GPT pilote Computer Use sur Windows ?
OpenAI utilise principalement GPT-5.4 Pro (score agentic 91.8) pour les tâches Computer Use nécessitant un raisonnement complexe, et GPT-5.3 Codex (score 80) pour les tâches de code plus directes. Le basculement entre les deux se fait automatiquement selon la complexité de la tâche.
Est-ce que Codex peut accéder à mes mots de passe enregistrés ?
Techniquement oui, s'ils sont visibles à l'écran ou dans un gestionnaire de mots de passe ouvert. C'est pourquoi il est crucial de ne pas lancer Computer Use quand des informations sensibles sont affichées. Utilisez un gestionnaire de mots de passe qui ne se déverrouille pas automatiquement à l'écran.
Comment couper Codex s'il part en vrille ?
Depuis le desktop : un bouton d'arrêt d'urgence est disponible dans la barre de notification Codex. Depuis le mobile : glissez vers le bas dans la conversation ChatGPT pour accéder au bouton stop. L'agent s'arrête à la fin de l'action en cours, pas en plein milieu d'une frappe.
Codex remplace-t-il Claude Code ?
Pas entièrement. Claude Code reste supérieur sur le raisonnement pur (Claude Opus 4.7 à 94.3 vs GPT-5.4 Pro à 91.8) et certains développeurs le préfèrent pour l'analyse de code complexe. Mais Codex a l'avantage du Computer Use natif sur Windows + le pilotage mobile, ce qui en fait le choix logique pour l'automatisation de workflows desktop complets.
✅ Conclusion
OpenAI ne vient pas d'ajouter une feature à Codex. Il vient de transformer chaque PC Windows 11 en un environnement exécutable pour agent IA — et le fait piloter depuis un smartphone change la donne sur le travail asynchrone. Si vous développez sur Windows et que vous ne testez pas Computer Use dans la semaine, vous perdez concrètement du temps face à ceux qui l'ont fait. Commencez par notre guide pour créer un agent IA pour comprendre les fondamentaux avant de laisser Codex prendre les commandes de votre machine.