🧠 Comprendre le raisonnement des LLM
Avant de plonger dans les techniques, comprenons pourquoi elles fonctionnent. Les grands modèles de langage (LLM) ne « pensent » pas comme nous. Ils prédisent le token suivant le plus probable. Quand vous posez une question complexe, le modèle peut « sauter » directement à une réponse sans passer par les étapes intermédiaires — et se tromper.
Les techniques avancées de prompting exploitent une idée simple : en forçant le modèle à expliciter son raisonnement, on améliore considérablement la qualité de ses réponses. C'est comme la différence entre un élève qui écrit directement la réponse d'un problème de maths et un élève qui montre tout son raisonnement.
Le problème du raisonnement implicite
Sans raisonnement explicite, un modèle peut facilement se tromper sur des problèmes complexes à plusieurs étapes. Prenons l'exemple d'un calcul simple : si Marie a 3 pommes, qu'elle en donne la moitié à Jean puis qu'elle en achète 5, le modèle trouvera souvent la bonne réponse. Mais pour des énoncés plus complexes avec de nombreuses variables, sauter les étapes intermédiaires conduit fréquemment à des erreurs de logique.
⛓️ Chain-of-Thought (CoT) : penser étape par étape
Le principe
Le Chain-of-Thought (chaîne de pensée), introduit par Wei et al. en 2022 dans une étude de Google, consiste à demander au modèle de décomposer son raisonnement en étapes explicites avant de donner sa réponse finale. Cette méthode a démontré une amélioration significative de la précision sur les tâches de raisonnement.
Comment l'utiliser
La forme la plus simple est d'ajouter « Réfléchis étape par étape » à votre prompt. Par exemple, face à un calcul de prix avec réduction et TVA, un prompt sans CoT présente un risque d'erreur car le modèle peut appliquer les calculs dans le mauvais ordre. En ajoutant CoT, vous guidez le modèle en lui demandant de calculer d'abord le prix après réduction, puis d'appliquer la TVA, et enfin de donner le prix final.
CoT avancé : structurer les étapes
Pour des problèmes complexes, structurez explicitement les étapes de raisonnement. Cette approche est particulièrement efficace pour l'analyse de viabilité de projets : en demandant au modèle de passer par des étapes clairement définies (calcul du marché adressable, projection des acquisitions, calcul de la LTV, ratio LTV/CAC, projection de revenus, puis verdict), vous obtenez une analyse structurée où chaque calcul et chaque raisonnement sont explicités.
Zero-shot CoT vs Manual CoT
| Type | Description | Exemple |
|---|---|---|
| Zero-shot CoT | Ajouter simplement « étape par étape » | « Résous ce problème étape par étape » |
| Manual CoT | Définir explicitement les étapes | « Étape 1 : ... Étape 2 : ... » |
| Auto-CoT | Le modèle génère ses propres étapes | « Décompose ce problème en sous-problèmes » |
Le Manual CoT est généralement le plus fiable car vous contrôlez la structure du raisonnement.
Quand utiliser le CoT
- ✅ Problèmes mathématiques et logiques
- ✅ Analyse multi-facteurs
- ✅ Débogage de code
- ✅ Prise de décision complexe
- ✅ Raisonnement juridique ou médical
- ❌ Pas nécessaire pour les tâches simples (traduction, reformulation)
- ❌ Peut ralentir les tâches créatives
🎯 Few-Shot Prompting : apprendre par l'exemple
Le principe
Le Few-Shot prompting consiste à fournir des exemples concrets de paires entrée/sortie avant de poser votre question. Le modèle comprend le pattern et l'applique à votre cas. Selon les travaux de recherche d'OpenAI en 2023, cette technique améliore significativement la précision sur les tâches de classification et de transformation de format.
Les variantes du Few-Shot
| Variante | Nombre d'exemples | Cas d'usage |
|---|---|---|
| Zero-shot | 0 exemple | Tâches simples, instructions claires |
| One-shot | 1 exemple | Pattern simple à reproduire |
| Few-shot | 2-5 exemples | Tâches spécifiques, format précis |
| Many-shot | 5+ exemples | Tâches très spécialisées |
Few-Shot en pratique
Exemple 1 : Classification de sentiment
En fournissant deux ou trois exemples d'avis clients avec leur sentiment (Positif, Négatif, Neutre) et leur catégorie associée, le modèle identifie le pattern attendu. Quand vous lui soumettez un nouvel avis comme « Interface magnifique mais plante toutes les 5 minutes », il reproduit automatiquement le format pour en déduire le sentiment et la catégorie pertinents.
Exemple 2 : Transformation de format
Cette variante est idéale pour convertir des descriptions produit en fiches techniques structurées. En montrant un exemple avec un sac à dos — où la description en texte libre est transformée en tableau avec des caractéristiques comme la capacité, la matière, la résistance à l'eau — le modèle applique la même extraction structurée à n'importe quel autre produit, comme une enceinte Bluetooth.
Exemple 3 : Style d'écriture spécifique
Le Few-Shot permet aussi de contrôler le ton et le niveau de langage. En donnant des exemples de phrases techniques réécrites en langage accessible pour un blog grand public, vous apprenez au modèle à transposer des concepts complexes (architecture microservices, attention multi-tête, RLHF) en explications vulgarisées que n'importe quel lecteur peut comprendre.
Astuces Few-Shot
- Choisissez des exemples diversifiés — couvrant les cas limites
- Gardez une cohérence de format entre les exemples
- Ordonnez du simple au complexe — le modèle comprend mieux la progression
- 3-5 exemples suffisent généralement — au-delà, les rendements diminuent
- Testez avec différents exemples — certains fonctionnent mieux que d'autres
🌳 Tree-of-Thought (ToT) : explorer plusieurs chemins
Le principe
Le Tree-of-Thought (arbre de pensée), proposé par Yao et al. en 2023, va plus loin que le CoT. Au lieu de suivre un seul chemin de raisonnement, le modèle explore plusieurs pistes en parallèle, évalue chacune, et sélectionne la meilleure.
Pour aller plus loin sur ce sujet, consultez notre guide Le guide ultime du prompt engineering en 2025.
C'est comme un joueur d'échecs qui considère plusieurs coups possibles avant d'en choisir un.
Comment l'implémenter
Pour implémenter le ToT, demandez au modèle d'explorer plusieurs approches distinctes pour un même problème, puis de les comparer. Par exemple, pour organiser une conférence tech de 200 personnes à Paris avec un budget contraint, vous pouvez demander au modèle de développer trois approches (lieu premium avec contenu basique, lieu modeste avec speakers de haut niveau, format hybride présentiel et streaming), d'évaluer chacune avec ses avantages, risques et un score, puis de les synthétiser dans un tableau comparatif pour recommander la meilleure option.
ToT avec auto-évaluation
Une variante puissante consiste à ajouter une phase d'élimination et de fusion. Le modèle propose plusieurs stratégies, évalue chacune (forces, faiblesses, ROI, score de faisabilité), élimine la plus faible en justifiant pourquoi, puis propose une stratégie hybride combinant les meilleurs éléments des options restantes. Cette méthode est particulièrement efficace pour la planification marketing ou le lancement de produits.
Quand utiliser le ToT
| Situation | CoT suffit ? | ToT nécessaire ? |
|---|---|---|
| Calcul mathématique | ✅ | ❌ |
| Choix stratégique | ⚠️ | ✅ |
| Résolution de problème unique | ✅ | ❌ |
| Planification complexe | ⚠️ | ✅ |
| Créativité / brainstorming | ❌ | ✅ |
| Arbitrage entre options | ⚠️ | ✅ |
📊 Tableau comparatif global
| Technique | Complexité | Tokens utilisés | Meilleur pour | Fiabilité |
|---|---|---|---|---|
| Zero-shot | ⭐ | Faible | Tâches simples | Variable |
| Few-shot | ⭐⭐ | Moyen | Format précis, classification | Haute |
| CoT | ⭐⭐ | Moyen-élevé | Raisonnement logique | Haute |
| Few-shot + CoT | ⭐⭐⭐ | Élevé | Problèmes complexes avec pattern | Très haute |
| ToT | ⭐⭐⭐⭐ | Très élevé | Décisions stratégiques | Très haute |
Coût vs Qualité
Un point crucial en 2025 : ces techniques consomment plus de tokens (et donc coûtent plus cher). Selon les données d'OpenRouter en 2025, le coût d'un prompt ToT peut être 5 à 8 fois supérieur à un simple zero-shot. Utilisez OpenRouter pour optimiser vos coûts en routant automatiquement vers le modèle le plus adapté.
| Technique | Tokens moyens (prompt) | Coût relatif |
|---|---|---|
| Zero-shot | 50-200 | 1x |
| Few-shot (3 exemples) | 300-800 | 3-4x |
| CoT détaillé | 200-500 | 2-3x |
| ToT (3 branches) | 500-1500 | 5-8x |
🔬 Techniques bonus : au-delà des classiques
Self-Consistency
Cette technique, introduite par Wang et al. en 2022, consiste à exécuter le même prompt CoT plusieurs fois et à prendre la réponse majoritaire. Particulièrement utile pour les problèmes mathématiques, elle réduit significativement le taux d'erreurs en demandant au modèle de résoudre un même problème par trois approches différentes (algébrique, estimation, décomposition), puis de confronter les résultats pour identifier la réponse la plus fiable en cas de divergence.
Prompt Chaining (chaînage)
Plutôt qu'un seul mega-prompt, décomposez en une série de prompts qui s'enchaînent. Chaque étape alimente la suivante : un premier prompt extrait les points clés d'un brief, un deuxième génère des propositions créatives à partir de ces points, un troisième évalue et développe la meilleure proposition en plan détaillé. C'est exactement ce que permet OpenClaw de faire automatiquement.
ReAct (Reasoning + Acting)
Introduit par Yao et al. en 2022, ce framework combine raisonnement et actions. Le modèle pense, agit, observe le résultat, puis pense à nouveau en alternant entre phases de réflexion (« Qu'est-ce que je dois trouver ? »), d'action (la démarche pour obtenir l'information), d'observation (ce qui est obtenu), jusqu'à synthétiser une réponse finale. Cette approche est particulièrement efficace pour les tâches de recherche et de résolution de problèmes nécessitant des étapes itératives.
🎯 Guide de choix rapide
Utilisez cet arbre de décision pour choisir la bonne technique :
- Votre tâche est-elle simple (traduction, résumé court) ? → Zero-shot suffit
- Avez-vous un format précis à reproduire ? → Few-shot (2-5 exemples)
- La tâche nécessite-t-elle du raisonnement logique ? → Chain-of-Thought
- Devez-vous comparer plusieurs options/stratégies ? → Tree-of-Thought
- La tâche est-elle multi-étapes avec dépendances ? → Prompt Chaining (OpenClaw)
- Sinon → Combinez Few-shot + CoT
💡 Combiner les techniques
La vraie puissance vient de la combinaison. Par exemple, mélanger Few-shot + CoT + auto-évaluation est redoutable pour l'analyse UX : vous fournissez un exemple de méthode d'analyse (diagnostic, principe UX violé, solution, évaluation d'impact), puis vous demandez au modèle d'appliquer cette même structure à un nouveau problème — comme un taux d'abandon de panier de 78% — en proposant trois solutions, en évaluant chacune, et en recommandant la meilleure.
Les techniques avancées de prompting ne sont pas de la théorie abstraite — ce sont des outils concrets qui produisent des résultats mesurables. Commencez par le CoT pour vos tâches de raisonnement, ajoutez le Few-shot quand vous avez un format à reproduire, et passez au ToT pour vos décisions stratégiques.
Avec de la pratique, ces techniques deviendront aussi naturelles que d'écrire un email. Et avec des outils comme OpenClaw pour orchestrer des chaînes de prompts, vous pourrez automatiser des workflows complexes qui combinent toutes ces approches.