📑 Table des matières

Qu'est-ce qu'OpenClaw ? L'agent IA qui change tout

01 - Qu'est-ce qu'OpenClaw ? L'agent IA qui change tout

OpenClaw 🟢 Débutant ⏱️ 8 min de lecture 📅 2026-02-09

Introduction

Vous avez probablement déjà utilisé ChatGPT, Copilot ou d'autres assistants IA. Mais avez-vous déjà eu un agent IA personnel, qui tourne 24h/24 sur votre propre serveur, connecté à vos messageries, capable d'exécuter des commandes, de naviguer sur le web, de gérer vos fichiers — et qui se souvient de vous d'une session à l'autre ?

C'est exactement ce qu'est OpenClaw.

Dans cet article, on va décortiquer ce qu'est OpenClaw, comment il fonctionne sous le capot, ce qui le distingue des autres outils IA, et pourquoi il pourrait bien changer votre façon de travailler avec l'intelligence artificielle.

Qu'est-ce qu'OpenClaw exactement ?

OpenClaw est un agent IA autonome que vous hébergez vous-même (self-hosted). Contrairement à ChatGPT qui vit dans un onglet de navigateur, OpenClaw est un daemon (service) qui tourne en permanence sur votre machine ou votre VPS.

💡 Besoin d'un VPS pour héberger OpenClaw ? Découvrez notre guide complet : l'installer sur un VPS. Nous recommandons Hostinger — avec notre code partenaire, 20% de remise sur un pack annuel.

Il se connecte à vos canaux de communication — Telegram, WhatsApp, Discord, iMessage — et vous pouvez lui parler naturellement depuis n'importe lequel de ces services. Il exécute des tâches, lit et écrit des fichiers, lance des commandes shell, navigue sur le web, et maintient une mémoire persistante de vos interactions.

En résumé : OpenClaw transforme un modèle de langage (Claude, GPT-4, Gemini, modèles locaux…) en un véritable assistant personnel avec des mains, des yeux et une mémoire.

L'architecture : Gateway → Agent → Tools

Pour comprendre OpenClaw, il faut comprendre ses trois couches principales :

Le Gateway (la passerelle)

Le Gateway est le cœur du système. C'est un daemon Node.js qui :

  • Maintient les connexions avec tous vos canaux (Telegram, WhatsApp, Discord…)
  • Gère les sessions de conversation
  • Route les messages vers le bon agent
  • Expose une API WebSocket pour les clients (CLI, app macOS, interface web)

Le Gateway écoute par défaut sur 127.0.0.1:18789. Il est le point central de toute l'infrastructure OpenClaw.

Client (Telegram/WhatsApp/CLI)
        ↓
    Gateway (daemon)
        ↓
    Agent (LLM + Tools)
        ↓
    Actions (fichiers, shell, web, messages…)

L'Agent (le cerveau)

L'agent est le runtime qui fait tourner le modèle de langage. OpenClaw utilise un runtime embarqué dérivé de pi-mono. À chaque message reçu, le Gateway déclenche un run de l'agent qui :

  1. Reçoit le contexte (prompt système + historique + fichiers workspace)
  2. Réfléchit et décide quoi faire
  3. Utilise des outils (tools) si nécessaire
  4. Répond à l'utilisateur

L'agent opère dans un workspace — un dossier sur le disque (~/.openclaw/workspace par défaut) qui contient ses fichiers de personnalité, sa mémoire, et ses notes.

Les Tools : l'écosystème complet des capacités

Les tools sont les mains, yeux et super-pouvoirs de l'agent. OpenClaw propose un écosystème complet organisé en 7 catégories principales :

1. Built-in Tools (outils de base)

Les outils fondamentaux, toujours disponibles par défaut :

Tool Capacité
read Lire des fichiers (texte et images) avec support offset/limit pour les gros fichiers
write Créer ou écraser des fichiers avec création automatique des dossiers parents
edit Modifier précisément du texte dans un fichier (recherche/remplacement exact)
exec Exécuter des commandes shell avec support PTY pour les CLI interactifs
process Gérer les sessions exec en arrière-plan (list, poll, write, kill)
web_search Rechercher sur le web via Brave Search API (région, langue, freshness)
web_fetch Extraire le contenu d'une URL (HTML → markdown/text)
tts Convertir du texte en parole et retourner un fichier audio
image Analyser des images avec un modèle de vision

Ces outils couvrent les besoins essentiels : manipuler des fichiers, exécuter des scripts, chercher de l'information, analyser du contenu.

2. Browser (contrôle du navigateur)

Le tool browser offre un contrôle complet d'un navigateur web dédié. C'est bien plus qu'un simple scraper :

Deux modes de fonctionnement :
- Profile openclaw : navigateur isolé, géré par OpenClaw (recommandé pour l'automatisation)
- Profile chrome : relais vers votre navigateur système via l'extension Browser Relay

Capacités avancées :
- Gestion d'onglets : list, open, focus, close avec ciblage précis
- Snapshots : capture de l'arbre d'accessibilité (aria) pour comprendre la structure de la page
- Actions : click, type, press, hover, drag, select, fill, resize
- Screenshots : captures d'écran (pleine page ou élément spécifique)
- Navigation : multi-étapes avec wait/evaluate pour les contenus dynamiques
- Profiles multiples : openclaw, work, remote… avec ports CDP distincts

Exemple concret :

Agent : "Vérifie s'il y a des nouveaux messages sur le forum"
→ browser open https://forum.example.com
→ browser snapshot (analyse la page)
→ browser click sur "Messages"
→ browser screenshot
→ Analyse et rapport

Le browser tool transforme l'agent en automation web complète, capable de naviguer, remplir des formulaires, extraire des données — tout ce qu'un humain ferait manuellement.

3. Agent Coordination (coordination multi-agents)

OpenClaw gère nativement les sessions multiples et la coordination entre agents :

Sessions :
- Session principale (agent:main:main) : votre conversation continue
- Sessions de groupe : isolées par canal/thread
- Sessions cron : pour les tâches planifiées
- Subagents : agents temporaires pour des tâches spécifiques

Tool message :
- Envoyer des messages sur tous vos canaux (Telegram, WhatsApp, Discord, iMessage…)
- Actions avancées : send, broadcast, react, delete, edit
- Gestion de groupes/serveurs : create, invite, ban, manage
- Polls, stickers, médias, citations

Cas d'usage :

# L'agent peut notifier sur plusieurs canaux
"Envoie un résumé de cette analyse à mon groupe Telegram tech" message send --target="Tech Team" --channel=telegram --message="..."

# Ou coordonner des workflows
"Démarre un subagent pour surveiller ce déploiement" Subagent isolé qui reporte dans la session principale

4. Extensions & Plugins (Skills)

Les Skills sont des modules additionnels qui étendent les capacités de l'agent. Ils fonctionnent comme des plugins opt-in :

Exemples de skills disponibles :
- SSH : exécuter des commandes sur des serveurs distants
- ElevenLabs TTS : voix synthétiques ultra-réalistes
- Caméra locale : capture photo/vidéo depuis des caméras connectées
- Home automation : contrôle de domotique (Hue, HomeKit…)
- Database : requêtes SQL directes

Installation et activation :

openclaw skills install ssh-exec
openclaw skills enable ssh-exec

Les skills sont opt-in par design : ils ne sont jamais activés automatiquement. Vous contrôlez explicitement quelles capacités votre agent possède.

Configuration granulaire :

{
  "agents": {
    "list": [{
      "id": "main",
      "tools": {
        "allow": [
          "ssh-exec",    // skill spécifique
          "cameras",     // plugin complet
          "group:plugins" // tous les plugins
        ]
      }
    }]
  }
}

💡 Note importante : dans le prochain article, nous détaillerons les skills en profondeur (création, publication, écosystème). Ici, nous couvrons uniquement les tools built-in et natifs.

5. Automation (automatisation proactive)

OpenClaw ne se contente pas de répondre : il peut agir de façon autonome grâce à deux mécanismes complémentaires :

Heartbeat (battements de cœur)

Le heartbeat fait "réveiller" l'agent à intervalles réguliers (30 min par défaut) pour vérifier s'il y a quelque chose à faire :

{
  "heartbeat": {
    "every": "30m",
    "activeHours": { "start": "08:00", "end": "22:00" },
    "target": "last"
  }
}

L'agent lit alors HEARTBEAT.md dans son workspace :

# Heartbeat checklist

- Vérifier les emails urgents
- Contrôler le calendrier (événements dans les 2h)
- Surveiller les erreurs serveur
- Check-in léger si inactif depuis 8h+

Avantages du heartbeat :
- Batching : regroupe plusieurs vérifications en un seul tour
- Context-aware : l'agent connaît le contexte récent et priorise
- Économique : 1 appel API au lieu de 5 cron jobs séparés
- Smart suppression : si rien d'urgent, répond HEARTBEAT_OK (pas de notification)

Cron Jobs (tâches planifiées)

Les cron jobs offrent un timing précis pour des tâches indépendantes :

# Briefing quotidien à 7h précises
openclaw cron add \
  --name "Morning brief" \
  --cron "0 7 * * *" \
  --tz "Europe/Paris" \
  --session isolated \
  --message "Briefing du jour : météo, calendrier, top emails" \
  --announce

# Rappel ponctuel dans 20 minutes
openclaw cron add \
  --name "Call back" \
  --at "20m" \
  --session main \
  --system-event "Rappel : rappeler le client"

Heartbeat vs Cron : quand utiliser quoi ?

Cas d'usage Recommandation
Surveillance continue (emails, calendrier) Heartbeat
Rapport quotidien à heure fixe Cron (isolated)
Rappel ponctuel précis Cron (--at)
Multiples checks groupés Heartbeat
Tâche lourde/modèle différent Cron (isolated)

6. Hooks (automatisation événementielle)

Les Hooks sont un système event-driven qui réagit aux événements internes d'OpenClaw :

Types d'événements :
- Command events : command:new, command:reset, command:stop
- Agent events : agent:bootstrap (avant injection workspace)
- Gateway events : gateway:startup (démarrage)
- Tool events : tool_result_persist (transformation résultats avant sauvegarde)

Hooks bundled (livrés avec OpenClaw) :

Hook Événement Fonction
session-memory command:new Sauvegarde contexte de session dans memory/YYYY-MM-DD-slug.md
command-logger command Log audit de toutes les commandes (JSONL)
boot-md gateway:startup Exécute BOOT.md au démarrage
soul-evil agent:bootstrap Swap SOUL.mdSOUL_EVIL.md (fun!)

Créer un hook custom :

mkdir -p ~/.openclaw/hooks/my-hook

HOOK.md :

---
name: my-hook
description: "Sauvegarde auto des projets"
metadata: { "openclaw": { "emoji": "💾", "events": ["command:stop"] } }
---

# My Hook
Sauvegarde automatique du workspace quand on stop une session.

handler.ts :

import type { HookHandler } from "../../src/hooks/hooks.js";

const handler: HookHandler = async (event) => {
  if (event.type !== "command" || event.action !== "stop") return;

  // Logique de sauvegarde
  console.log("[my-hook] Sauvegarde workspace...");
};

export default handler;

Activation :

openclaw hooks enable my-hook

Les hooks permettent d'étendre OpenClaw sans modifier le code : audit trails, snapshots mémoire, intégrations externes…

7. Media and Devices (médias et périphériques)

OpenClaw peut interagir avec le monde physique via les tools média et les nodes (appareils connectés) :

Tools média :
- tts : génération de voix (formats optimisés par canal)
- image : analyse d'images avec vision models

Nodes (appareils iOS/Android/macOS) :

Les nodes sont des appareils qui se pairent avec le Gateway et offrent des capacités étendues :

# Prendre une photo
openclaw nodes camera_snap --node=iphone --facing=back

# Enregistrer l'écran
openclaw nodes screen_record --node=macbook --duration=10s

# Canvas interactif (UI HTML)
openclaw canvas present --node=ipad --url=http://dashboard.local

# Géolocalisation
openclaw nodes location_get --node=iphone --accuracy=precise

Cas d'usage concrets :
- Surveillance : "Prends une photo de l'entrée" → caméra du node
- Debugging : "Enregistre l'écran pendant que je reproduis le bug"
- Dashboards : Afficher une interface sur un iPad dédié
- Localisation : "Où est mon téléphone ?"

Sécurité :
- Pairing sécurisé : token + approbation manuelle
- Permissions granulaires : contrôle par capability (caméra, screen, location)
- Notifications : le node affiche une notification avant toute action sensible


Tableau récapitulatif des outils

Catégorie Outils Usage principal
Built-in read, write, edit, exec, process, web_search, web_fetch Manipulation fichiers, shell, recherche web
Browser browser (profiles, snapshot, actions, screenshot) Automatisation web complète
Agent Coordination message, sessions, subagents Communication multi-canal, workflows distribués
Extensions Skills (SSH, ElevenLabs, caméras, DB…) Capacités opt-in modulaires
Automation heartbeat, cron Tâches proactives (surveillance, rapports, rappels)
Hooks session-memory, command-logger, boot-md, customs Event-driven automation (audit, snapshots)
Media & Devices tts, image, nodes (camera, screen, canvas, location) Interaction physique et multimédia

Cet écosystème d'outils fait d'OpenClaw bien plus qu'un chatbot : c'est un véritable système d'exploitation pour agents IA, capable d'interagir avec le monde numérique et physique.

Ce que peut faire OpenClaw au quotidien

💬 Communication multi-canal

OpenClaw se connecte simultanément à :
- Telegram (via grammY)
- WhatsApp (via Baileys/WhatsApp Web)
- Discord (via discord.js)
- iMessage (via CLI macOS)
- Mattermost (via plugin)

Vous pouvez lui parler depuis n'importe quel canal. Les sessions sont intelligemment gérées : vos DMs convergent vers une session principale (main), tandis que les groupes ont des sessions isolées.

🧠 Mémoire persistante

C'est l'un des aspects les plus puissants d'OpenClaw. Contrairement à ChatGPT qui oublie tout entre les conversations, OpenClaw maintient :

  • memory/YYYY-MM-DD.md : un journal quotidien (notes brutes de la journée)
  • MEMORY.md : une mémoire long-terme curatée (faits importants, préférences, décisions)

À chaque nouvelle session, l'agent relit automatiquement ses fichiers de mémoire. Il se "réveille" avec le contexte de qui vous êtes et ce qui s'est passé récemment.

⏰ Automatisation proactive

Grâce au heartbeat et aux cron jobs, OpenClaw peut :
- Surveiller vos emails et calendrier toutes les 30 minutes
- Envoyer un briefing quotidien à heure fixe
- Vous rappeler une tâche dans X minutes
- Surveiller un serveur et alerter en cas d'anomalie
- Exécuter des workflows complexes de façon autonome

L'agent peut :
- Rechercher sur le web via Brave Search
- Extraire le contenu de pages web
- Contrôler un navigateur complet (cliquer, remplir des formulaires, prendre des captures d'écran)
- Automatiser des tâches web répétitives

📁 Gestion de fichiers et développement

OpenClaw est un excellent assistant de développement :
- Lire, écrire et modifier des fichiers
- Exécuter des commandes (git, npm, python, etc.)
- Gérer des projets complets
- Déboguer du code en analysant logs et stack traces

📱 Appareils connectés (Nodes)

Vous pouvez connecter des nodes — des appareils iOS, Android ou macOS qui se pairent avec le Gateway. Les nodes fournissent :
- Accès caméra (photo/vidéo)
- Enregistrement d'écran
- Canvas (interface HTML interactive)
- Géolocalisation
- Notifications push

OpenClaw vs les alternatives

vs ChatGPT / Claude.ai

ChatGPT/Claude OpenClaw
Hébergement Cloud (chez OpenAI/Anthropic) Self-hosted (votre serveur)
Mémoire Limitée, opaque Fichiers Markdown, transparente
Outils Limités (plugins) Shell, fichiers, browser, tout
Canaux Interface web uniquement Telegram, WhatsApp, Discord…
Proactivité Aucune Heartbeat, cron, hooks
Personnalisation Minimal Totale (SOUL.md, AGENTS.md)
Données Chez eux Chez vous

💡 En résumé : ChatGPT est un outil de conversation. OpenClaw est un agent opérationnel.

vs n8n / Make / Zapier

Ces outils d'automatisation sont puissants mais rigides. Chaque workflow doit être conçu manuellement avec des nœuds et des connexions. OpenClaw, lui, comprend vos instructions en langage naturel et s'adapte dynamiquement.

n8n/Make OpenClaw
Approche Workflows visuels Langage naturel
Flexibilité Prédéfinie Adaptative
Courbe d'apprentissage Moyenne Faible (on parle, c'est tout)
Debugging Nœud par nœud Conversation

vs AutoGPT / AgentGPT

Les agents autonomes comme AutoGPT ont fait beaucoup de bruit, mais souffrent de problèmes fondamentaux :
- Boucles infinies et hallucinations sans contrôle
- Pas de canal de communication pratique
- Pas de mémoire structurée
- Pas de sécurité intégrée

OpenClaw prend une approche plus pragmatique : l'agent est supervisé (vous lui parlez via vos messageries), sa mémoire est transparente (fichiers Markdown lisibles), et ses actions sont contrôlées (politique d'outils, sandbox).

À qui s'adresse OpenClaw ?

🧑‍💻 Développeurs et DevOps

Si vous êtes à l'aise avec un terminal, OpenClaw est votre nouveau meilleur ami. Il peut :
- Surveiller vos serveurs
- Committer et pusher du code
- Déboguer des problèmes
- Automatiser vos workflows

📊 Créateurs de contenu et entrepreneurs

Même sans coder, OpenClaw peut :
- Gérer vos réseaux sociaux
- Rédiger et planifier du contenu
- Surveiller des tendances
- Organiser vos projets

🔬 Chercheurs et analystes

Pour ceux qui manipulent beaucoup de données et d'informations :
- Veille automatisée
- Résumé de documents
- Analyse de données

⚠️ Attention : OpenClaw nécessite un VPS ou une machine qui tourne en permanence. Ce n'est pas (encore) un service clé en main — il faut un minimum de confort technique pour l'installer et le configurer.

Prérequis techniques

Pour utiliser OpenClaw, vous aurez besoin de :

  1. Un serveur : VPS (Hetzner, OVH, Oracle Cloud Free Tier…) ou une machine locale
  2. Node.js 22+ : le runtime sur lequel tourne OpenClaw
  3. Un modèle IA : via OpenRouter (accès à Claude, GPT-4, Gemini…) ou un provider direct (Anthropic, OpenAI)
  4. Un canal : au minimum Telegram (le plus simple à configurer)

Le coût typique :
- VPS : 0-5€/mois (Oracle Free Tier = gratuit)
- API IA : 5-30€/mois selon l'usage (Claude Haiku est très économique pour les tâches courantes)

Comment ça se passe concrètement ?

Voici un exemple de conversation typique avec OpenClaw via Telegram :

Vous : "Vérifie s'il y a des mises à jour sur mon serveur"

OpenClaw : J'ai vérifié. 3 paquets à mettre à jour :
- nginx 1.24.0 → 1.26.0
- nodejs 22.11 → 22.12
- openssl (security patch)

Voulez-vous que je les installe ?

Vous : "Oui, vas-y"

OpenClaw : ✅ Mise à jour terminée. Tous les services tournent correctement.

L'agent a exécuté apt update && apt list --upgradable, analysé le résultat, et vous l'a présenté de façon claire. Puis il a exécuté la mise à jour avec apt upgrade -y et vérifié que tout fonctionnait.

La philosophie OpenClaw

OpenClaw repose sur quelques principes forts :

🔓 Transparence totale

Tout est visible : les fichiers de mémoire sont du Markdown lisible, les logs sont accessibles, les prompts système sont dans votre workspace. Pas de boîte noire.

🏠 Souveraineté des données

Vos données restent chez vous. Le seul trafic externe, ce sont les appels API au modèle de langage. Votre historique, votre mémoire, vos fichiers — tout est sur votre serveur.

🎨 Personnalisation profonde

Via SOUL.md, vous définissez la personnalité de votre agent. Via AGENTS.md, ses règles de fonctionnement. Via USER.md, qui vous êtes. L'agent n'est pas un produit générique — c'est votre agent.

🛡️ Sécurité par design

  • Politique d'outils configurable (quelles commandes sont autorisées)
  • Sandbox optionnel pour les sessions non-principales
  • Authentification Gateway (token/password)
  • Pairing sécurisé pour les nodes

Conclusion

OpenClaw n'est pas "encore un chatbot". C'est une nouvelle catégorie d'outil : un agent IA personnel, autonome, self-hosted et multi-canal.

Il transforme un modèle de langage en un véritable assistant qui :
- Vit sur votre serveur
- Se souvient de vous
- Agit concrètement (fichiers, commandes, web, automation)
- Vous contacte proactivement (heartbeat, cron, hooks)
- Respecte votre vie privée
- S'étend à l'infini (skills, plugins, hooks)

Si l'idée d'avoir votre propre IA personnelle vous intrigue, le prochain pas est simple : l'installer sur un VPS. En 30 minutes, votre agent sera opérationnel.

Bienvenue dans l'ère des agents personnels. 🐾


📚 Pour aller plus loin

#openclaw #agent-ia #introduction #comparaison #self-hosted