OpenAI Codex Record & Replay : montrez une tâche une fois, l'agent la répète à l'infini — la fin du scripting manuel
🔎 Pourquoi Record & Replay change tout pour l'automatisation
L'automatisation de tâches sur ordinateur est un cauchemar depuis des décennies. Les macros Excel sont fragiles. Les scripts Python demandent des compétences techniques. Les outils RPA coûtent des milliers d'euros et cassent dès qu'une interface change.
OpenAI vient de sortir une feature qui rend tout ça obsolète. Record & Replay, intégré dans l'app Codex version 26.616 le 18 juin 2026, permet de démontrer un workflow une seule fois sur votre Mac pour que l'agent IA le répète indéfiniment. Zéro ligne de code. Zéro prompt engineering complexe.
Cette feature s'inscrit dans une vague d'automatisation agressive d'OpenAI : le même jour, Scheduled Tasks arrivait dans ChatGPT, avec une sidebar dédiée pour gérer des tâches récurrentes. Mais Record & Replay va plus loin : c'est la concrétisation de la promesse « show, don't tell » de l'IA agentic.
L'essentiel
- Record & Replay capture vos clics, frappes clavier et changements de fenêtre pour créer un « skill » réutilisable dans Codex.
- Disponible sur macOS uniquement au lancement (version 26.616), pour les comptes ChatGPT payants. L'EEE, le Royaume-Uni et la Suisse sont exclus au démarrage.
- Fonctionne grâce à Computer Use — Codex « voit » votre écran et comprend le contexte, pas seulement les coordonnées de clic.
- Les skills sont éditables : vous pouvez modifier le déroulé, ajouter des conditions ou ajuster les étapes après enregistrement.
- Cas d'usage concrets validés par OpenAI : expense reports, demandes de congés, emails récurrents.
Outils recommandés
| Outil | Usage principal | Prix (juin 2026, vérifiez sur openai.com) | Idéal pour |
|---|---|---|---|
| Codex (OpenAI) | Automatisation par démonstration | Inclus dans les abonnements ChatGPT payants | Knowledge workers, automatisation bureau |
| Claude Computer Use | Contrôle d'ordinateur par IA | Inclus dans Claude Pro/Team/Enterprise | Workflows nécessitant du raisonnement complexe |
| Macros classiques / Automator | Automatisation système macOS | Gratuit | Tâches système simples, pas de compréhension contextuelle |
Comment fonctionne Record & Replay techniquement
Record & Replay repose sur la couche Computer Use de Codex. Ce n'est pas un simple enregistreur de macros qui mémorise des coordonnées de clic.
L'agent capture trois choses simultanément : vos actions (clics, frappes, raccourcis), le contenu visible des fenêtres (texte, boutons, menus), et la séquence logique entre les étapes. Cette distinction est cruciale. Une macro classique qui clique aux coordonnées (x:340, y:520) casse si la fenêtre est déplacée. Codex, lui, comprend qu'il faut cliquer sur le bouton « Soumettre » parce qu'il reconnaît le contenu de l'interface.
L'enregistrement se déclenche de trois façons selon la documentation officielle : via le menu bar de l'app Codex, via un overlay visuel, ou par commande vocale. Une fois le workflow démontré, Codex le sauvegarde comme un « skill » éditable.
C'est cette combinaison — perception visuelle + compréhension contextuelle + éditabilité — qui fait de Record & Replay un saut générationnel par rapport aux outils d'automatisation précédents. Cette évolution s'inscrit dans la lignée de l'arrivée de Codex Computer Use sur Windows, qui avait déjà posé les bases du contrôle d'ordinateur par agent IA.
Le rôle de GPT-5.3 Codex dans la boucle
Le modèle sous-jacent est GPT-5.3 Codex, qui score 80 sur les benchmarks agentic (juin 2025). Ce n'est pas le modèle le plus puissant d'OpenAI — GPT-5.5 domine à 98.2 — mais il est optimisé pour les tâches de contrôle d'ordinateur et l'exécution de workflows séquentiels. Le choix est logique : pour de l'automatisation de bureau, la fiabilité d'exécution prime sur le raisonnement abstrait.
Les cas d'usage concrets qui changent la donne
OpenAI a validé trois scénarios dans sa démo vidéo officielle et dans son article sur AI/TLDR. Chacun mérite d'être décortiqué car ils révèlent ce que Record & Replay peut et ne peut pas faire.
Les expense reports
C'est le cas phare de la démo. L'utilisateur ouvre son outil de gestion, navigue jusqu'au formulaire de notes de frais, remplit les champs (montant, catégorie, justificatif), et soumet. Le tout démontré une fois. Ensuite, Codex peut reproduire ce workflow avec de nouvelles données.
L'intérêt n'est pas seulement la vitesse. C'est la résilience : si le formulaire change légèrement (un champ renommé, un bouton déplacé), Computer Use s'adapte parce qu'il comprend la structure sémantique de la page, pas seulement sa géométrie.
Les demandes de congés
Même principe : navigation dans le portail RH, sélection des dates, remplissage du motif, soumission. Le workflow est capturé en 30 secondes et devient un skill disponible en un clic.
Ce cas illustre bien la différence avec les macros : un portail RH change fréquemment (mises à jour, nouveaux champs obligatoires). Une macro classique nécessite une maintenance constante. Un skill Codex, grâce à sa compréhension visuelle, tolère mieux ces variations.
Les emails récurrents
Répondre aux mêmes types d'emails avec le même format. L'utilisateur montre comment il ouvre le message, rédige la réponse, choisit les destinataires, et envoie. Codex reproduit le pattern en s'adaptant au contenu spécifique de chaque nouvel email.
C'est ici que la limite apparaît clairement : si l'email nécessite un jugement nuancé, Record & Replay ne suffit pas. Il reproduit le pattern, pas le raisonnement. Pour les réponses templates, c'est parfait. Pour les négociations contractuelles, c'est insuffisant.
Record & Replay vs les alternatives d'automatisation
Le marché de l'automatisation bureau est encombré. Record & Replay arrive avec un positionnement clair : zéro code, zéro configuration, compréhension contextuelle. Mais comment ça se compare concrètement ?
Contre les macros classiques (Automator, AutoHotkey, Excel VBA)
Les macros sont gratuites, intégrées, et fonctionnent depuis 30 ans. Mais elles sont fragiles par nature : elles reproduisent des séquences mécaniques sans comprendre le contexte. Déplacez une fenêtre, changez une résolution d'écran, mettez à jour un logiciel — la macro casse.
Record & Replay est fondamentalement différent parce que Codex « lit » l'écran. Il ne clique pas à des coordonnées fixes, il identifie les éléments d'interface par leur contenu et leur rôle. C'est la différence entre un aveugle qui mémorise un chemin et quelqu'un qui voit où il va.
Contre Anthropic Computer Use (Claude)
Anthropic a lancé Computer Use avec Claude fin 2024, et c'est devenu une feature mature. La différence clé : Claude Computer Use fonctionne par instructions textuelles (« va sur ce site, clique sur ce bouton, remplis ce formulaire »), pas par démonstration.
L'approche d'Anthropic est plus flexible pour les tâches uniques et nécessite du prompt engineering. L'approche d'OpenAI est plus accessible pour les tâches répétitives — vous montrez, vous ne décrivez pas. Les deux ont leur place. Claude avec Sonnet 4.6 (score 81.4) excelle sur les workflows qui nécessitent du raisonnement en cours de route. Record & Replay excelle sur la répétition fidèle d'un pattern démontré.
Contre les outils RPA (UiPath, Automation Anywhere)
Les outils RPA professionnels sont puissants mais ont trois défauts rédhibitoires pour les particuliers et petites équipes : le coût (souvent plusieurs milliers par mois), la complexité de mise en œuvre (des semaines de développement), et la fragilité face aux changements d'interface.
Record & Replay s'attaque directement au segment des tâches répétitives simples à moyennes — exactement là où le RPA est surdimensionné et sous-performant. C'est le même phénomène que lorsque les outils no-code ont mangé le bas du marché du développement logiciel.
Contre la capture d'écran automatisée
Il existe des outils qui capturent des séquences d'écran pour les rejouer. Mais sans couche d'IA, ces outils sont encore plus fragiles que les macros : ils comparent des pixels, pas du sens. Si un bouton change de couleur ou si une police est mise à jour, la comparaison d'images échoue.
Computer Use ajoute la couche sémantique qui manque à ces outils. C'est ce qui rend Record & Replay viable en production, là où la capture d'écran brute ne l'est pas.
Disponibilité et limites actuelles
Toute la puissance de Record & Replay ne doit pas masquer ses contraintes réelles. OpenAI a lancé cette feature de manière ciblée, et il faut comprendre exactement ce qui est inclus et exclu.
Restrictions géographiques
La documentation officielle est claire : Record & Replay exclut l'Espace Économique Européen, le Royaume-Uni et la Suisse au lancement. C'est une restriction réglementaire classique pour les features de contrôle d'ordinateur, liée au GDPR et aux législations locales sur la surveillance informatique.
Un rollout en Europe est prévu mais non daté. Pour les utilisateurs francophones en Europe, cela signifie attendre. Pour ceux situés hors de ces zones (Canada, États-Unis, Asie, etc.), la feature est accessible immédiatement.
macOS uniquement
Pas de version Windows au lancement. C'est un choix stratégique cohérent avec le déploiement progressif de Computer Use — Codex Computer Use est arrivé sur Windows séparément, et Record & Replay suit probablement le même chemin avec un décalage.
La restriction macOS permet aussi à OpenAI de contrôler l'environnement d'exécution. macOS offre des API de capture d'écran et de contrôle d'interface plus prévisibles que l'écosystème Windows, particulièrement fragmenté.
Comptes payants uniquement
Record & Replay n'est pas disponible sur les comptes gratuits ChatGPT. Il faut un abonnement payant (Plus, Team, ou Enterprise). Le prix exact dépend du forfait (vérifiez sur openai.com, juin 2026), mais cela positionne clairement la feature comme un outil professionnel.
Les limites techniques inhérentes
Record & Replay ne résout pas tout. Premier point : il ne gère pas les workflows multi-jours. Si votre tâche nécessite d'attendre une validation par email puis de reprendre le lendemain, Record & Replay seul ne suffit pas — il faudrait le combiner avec Scheduled Tasks.
Deuxième point : les applications avec des sécurités anti-bot (CAPTCHA, détection d'automatisation) peuvent bloquer l'exécution. Computer Use est conçu pour ressembler à une interaction humaine, mais ce n'est pas infaillible.
Troisième point : la qualité du skill dépend directement de la qualité de la démonstration. Si vous vous trompez pendant l'enregistrement, le skill reproduira l'erreur. Heureusement, les skills sont éditables après coup — c'est un filet de sécurité essentiel.
Implications pour les knowledge workers
Record & Replay n'est pas un gadget. C'est un outil qui redéfinit ce que signifie « productivité bureautique ». Les implications sont concrètes et mesurables.
Le temps récupéré est réel
Selon MyKreaTool, les cas d'usage identifiés (expense reports, time-off requests, emails récurrents) représentent typiquement 2 à 5 heures par semaine pour un knowledge worker. C'est du temps purement mécanique, sans valeur ajoutée, qui consiste à copier-coller des données d'un système à un autre.
Multiplié par le nombre d'employés dans une entreprise, Record & Replay peut représenter des centaines d'heures récupérées par mois. Pas en optimisant le processus, mais en l'éliminant purement et simplement.
La décentralisation de l'automatisation
Jusqu'à présent, automatiser une tâche bureautique nécessitait trois intermédiaires : l'employé qui identifie le besoin, le développeur ou consultant RPA qui construit la solution, et le service IT qui valide le déploiement. Ce cycle peut prendre des semaines.
Avec Record & Replay, l'employé démontre la tâche lundi, le skill est opérationnel lundi. L'automatisation passe d'un projet IT à un geste individuel. C'est un changement de paradigme organisationnel, pas seulement technique.
Le risque de dérive « copier-coller IA »
Le risque évident est que les employés automatisent des tâches qui ne devraient pas l'être. Un expense report avec des montants variables nécessite une vérification humaine. Un email récurrent peut contenir des nuances que le skill ne capte pas.
Record & Replay ne remplace pas le jugement. Il élimine la mécanique. La frontière entre les deux est parfois floue, et c'est là que les erreurs arriveront. Les entreprises devront définir des garde-fous — probablement une liste de workflows approuvés pour l'automatisation.
Record & Replay dans l'écosystème plus large d'OpenAI
Cette feature ne sort pas du vide. Elle s'inscrit dans une stratégie cohérente d'OpenAI pour transformer Codex d'un simple outil de coding en un agent d'automatisation généraliste.
La convergence avec Scheduled Tasks
Le lancement simultané de Scheduled Tasks dans ChatGPT et de Record & Replay dans Codex n'est pas un hasard. Les deux features se complètent : Record & Replay définit ce que l'agent fait, Scheduled Tasks définit quand il le fait.
Imaginez : vous enregistrez un skill de traitement d'emails, puis vous le planifiez pour s'exécuter chaque matin à 8h. L'automatisation devient un cron job intelligent, sans aucune ligne de code.
Le lien avec le déploiement on-premise
L'arrivée de Codex on-premise en partenariat avec Dell ouvre une perspective intéressante pour Record & Replay. Les entreprises qui hésitent à envoyer des captures d'écran de leur environnement de travail vers les serveurs d'OpenAI pourront peut-être un jour utiliser Record & Replay en local.
C'est particulièrement pertinent pour les secteurs réglementés (banque, santé) où les données à l'écran contiennent des informations sensibles. Le on-premise pourrait être le débloqueur qui transforme Record & Replay d'un outil grand public en outil enterprise.
La dynamique avec Microsoft
Le contexte de Microsoft Build 2026 et Project Polaris est aussi pertinent. Microsoft développe son propre Windows Agent Framework, qui pourrait à terme concurrencer l'approche d'OpenAI. Mais pour l'instant, Record & Replay a une avance significative en termes de simplicité d'utilisation.
OpenAI et Microsoft restent partenaires stratégiques, mais leurs visions de l'agent IA sur l'ordinateur divergent progressivement. OpenAI mise sur la démonstration directe. Microsoft mise sur un framework d'agents intégrés au système. Le marché tranchera.
❌ Erreurs courantes
Erreur 1 : Confondre Record & Replay avec une macro vidéo
Une macro vidéo enregistre des pixels et des coordonnées. Record & Replay enregistre des intentions et du contexte. Si vous traitez Record & Replay comme une macro, vous serez déçu par les limites de rejeu sur des interfaces modifiées. Traitez-le comme un agent qui a « appris » votre workflow, et vous exploiterez sa vraie valeur.
Erreur 2 : Enregistrer un workflow trop complexe en une seule fois
Plus un skill est long, plus il est fragile. Si vous enregistriez un workflow de 25 étapes traversant 5 applications, la probabilité d'échec au rejeu augmente exponentiellement. Découpez vos workflows en skills courts et chaînez-les. Un skill de 5 étapes fiable vaut mieux qu'un skill de 20 étapes capricieux.
Erreur 3 : Ignorer l'étape d'édition
OpenAI insiste sur le fait que les skills sont éditables. Beaucoup d'utilisateurs vont enregistrer un workflow imparfait, voir qu'il échoue au rejeu, et conclure que la feature ne marche pas. La bonne pratique : enregistrer rapidement, tester, éditer le skill pour corriger les erreurs de démonstration, puis réessayer. L'itération est la clé.
Erreur 4 : Automatiser des tâches à forte variance
Record & Replay excelle sur les tâches répétitives à structure stable. Si le contenu change radicalement à chaque exécution (un email dont le format varie énormément, un formulaire avec des champs conditionnels imprévisibles), le skill va échouer. Restez sur les patterns stables : c'est là que la feature brille.
❓ Questions fréquentes
Record & Replay fonctionne-t-il sur Windows ?
Non, uniquement macOS au lancement (juin 2026). OpenAI a déployé Computer Use sur Windows séparément, et Record & Replay suivra probablement avec un décalage. Aucune date n'a été annoncée.
Est-ce que mes données d'écran sont envoyées aux serveurs d'OpenAI ?
Oui, au lancement. Computer Use nécessite que l'agent « voie » votre écran, ce qui implique l'envoi de captures vers les serveurs d'OpenAI. Pour les environnements sensibles, le déploiement on-premise avec Dell pourrait être une solution future, mais il n'est pas encore confirmé pour Record & Replay.
Quelle est la différence avec les Scheduled Tasks de ChatGPT ?
Record & Replay définit comment l'agent agit (le workflow). Scheduled Tasks définissent quand il agit (la planification). Ce sont deux features complémentaires, pas concurrentes. Vous pouvez créer un skill avec Record & Replay, puis le planifier avec Scheduled Tasks.
Peut-on partager un skill avec des collègues ?
OpenAI n'a pas détaillé le partage de skills au lancement. En l'état, les skills semblent liés au compte utilisateur. Le partage équipe serait un ajout logique pour les comptes ChatGPT Team et Enterprise, mais il faut attendre une mise à jour.
Record & Replay remplace-t-il les agents IA autonomes comme AutoGPT ?
Non. Les agents IA autonomes opèrent de manière auto-dirigée avec des objectifs larges. Record & Replay est déterministe : il reproduit fidèlement un workflow démontré. Ce sont des outils pour des besoins différents — l'autonomie vs la fidélité de reproduction.
✅ Conclusion
Record & Replay est la feature d'automatisation la plus accessible jamais lancée par un acteur IA majeur. Pas de code, pas de prompt, pas de configuration : vous montrez, Codex répète. Les knowledge workers qui passent des heures sur des tâches répétitives ont enfin un outil à la hauteur de la promesse « show, don't tell ». La restriction macOS et l'exclusion géographique tempèrent l'enthousiasme, mais la direction est tracée. Le scripting manuel vient de prendre un coup de vieux. Pour creuser le sujet des meilleurs agents IA autonomes et comprendre où Record & Replay s'inscrit dans l'écosystème agentic, notre guide complet fait le tour de tous les acteurs du marché.