📑 Table des matières

Vercel eve : le framework open source qui veut faire pour les agents IA ce que Next.js a fait pour le web

Agents IA 🟢 Débutant ⏱️ 14 min de lecture 📅 2026-06-22

Vercel eve : le framework open source qui veut faire pour les agents IA ce que Next.js a fait pour le web

🔎 Pourquoi un framework pour agents IA change la donne en juin 2026

Construire un agent IA en production aujourd'hui, c'est du bricolage. Vous prenez un LLM, vous ajoutez du tool calling, vous gérez l'état manuellement, vous bricolez du checkpointing, et vous priez pour que l'exécution survive à un crash.

Vercel vient de déclarer la fin de cette ère. Le 17 juin 2026, au Ship 26 à Londres, l'entreprise a dévoilé eve : un framework open source en TypeScript conçu comme le Next.js des agents IA.

L'idée est radicale dans sa simplicité : un agent n'est ni une API ni un graphe, c'est un dossier de fichiers. Le framework compile ce dossier en un service de production durable, avec sandbox, approvals et scaling inclus.

La validation n'est pas théorique. Vercel utilise eve en interne pour faire tourner v0 et sa propre flotte d'agents, selon TechTimes. Ce n'est pas un POC labo, c'est du code qui sert des millions de requêtes.


L'essentiel

  • Filesystem-first : un agent = un dossier (instructions.md, tools/, skills/, channels/, subagents/), directement inspiré du file-system routing de Next.js.
  • Durable execution : checkpointing automatique à chaque étape, l'agent reprend là où il s'est arrêté même après un crash.
  • Compute sandboxé : le code généré par l'agent est exécuté comme non-fiable, dans un environnement isolé.
  • Open source : licence Apache-2.0, disponible sur npm via npm install eve@latest, scaffolding avec npx eve init.
  • Human-in-the-loop natif : les approvals sont intégrés au framework, pas greffés après coup.

Outils recommandés

Outil Usage principal Prix (juin 2026, vérifiez sur vercel.com) Idéal pour
eve Framework agents IA production Open source (Apache-2.0) Devs TypeScript qui veulent déployer des agents
v0 Génération d'UI par agent Freemium Prototypage rapide d'interfaces
Hostinger Hébergement web pour déployer À partir de 2,99 €/mois Déployer des apps autour de vos agents

Un agent = un dossier : le paradigme filesystem-first

C'est le coup de génie de eve. Oubliez les builders graphiques, les YAML à rallonge et les graphes d'état impossibles à debugger.

Un agent eve, c'est un répertoire sur votre disque. À l'intérieur, des fichiers conventionnels qui décrivent tout ce que l'agent sait faire.

instructions.md contient le prompt système. tools/ héberge des fonctions typées en TypeScript. skills/ regroupe des comportements réutilisables. channels/ définit les interfaces (Slack, web, API). subagents/ permet de déléguer à d'autres agents.

Comme le souligne Towards AI, cette approche est inédite pour un framework d'agents. Un agent n'est ni une API qu'on appelle ni un graphe qu'on construit : c'est un dossier.

La parallèle avec Next.js est assumée par Vercel. En 2016, Next.js a imposé le file-system routing pour le web. En 2026, eve impose le file-system agent pour l'IA. Même logique, même ambition : éliminer le plumbing manuel.

Pour les développeurs qui ont déjà utilisé des approches similaires avec des agents open source exécutés en local, le concept sera familier. Mais eve ajoute la couche production qui manquait.

L'architecture en détail

Chaque fichier a un rôle précis. instructions.md est le cerveau. tools/ sont les mains. channels/ sont les oreilles et la bouche. subagents/ sont les collègues.

Le framework compile l'ensemble, branche les workflows durables et connecte les canaux. Vous n'écrivez pas de glue code. Vous déclarez des capacités, eve s'occupe du reste.

Cette architecture rend l'inspection et l'extension triviales. Vous ouvrez un dossier, vous lisez des fichiers, vous comprenez ce que fait l'agent. Fini les boîtes noires.


Durable execution : le checkpointing qui change tout

Un agent qui tourne pendant 30 minutes puis crash à l'étape 28, c'est 30 minutes de perdues. C'est le cauchemar de tout développeur qui a mis des agents en production.

eve résout ça avec ce que la documentation officielle sur GitHub appelle le checkpointing à chaque step boundary. À chaque fois que l'agent termine une étape, son état entier est sérialisé et sauvegardé.

Si le process crash, si le serveur redémarre, si la facture cloud explose : l'agent reprend exactement là où il s'est arrêté. Pas de logique de reprise à écrire. Pas de gestion manuelle d'état.

Le code tourne dans un step géré. Les tools, la sandbox et les subagents paraissent synchrones dans votre code, bien que la session sous-jacente soit durable. C'est une abstraction puissante qui vous fait écrire du code simple tandis que eve gère la complexité underneath.

Pour les agents de code qui manipulent des projets entiers — comme le fait Qwen3-Coder-Next avec ses 80B paramètres MoE — cette durabilité est non négociable. Un agent de code qui perd son contexte en cours de génération, c'est un agent inutile.


Compute sandboxé : le code généré est traité comme hostile

C'est peut-être la décision d'architecture la plus importante d'eve. Tout code généré par l'agent est exécuté dans un compute sandboxé, comme s'il était non-fiable.

Parce qu'il l'est. Un LLM peut générer du code malveillant, involontairement ou non. Un agent qui a accès à votre filesystem sans garde-fou, c'est une faille de sécurité en production.

eve isole l'exécution du code généré dans un environnement sécurisé. L'agent peut écrire, exécuter et itérer sur du code, mais ce code ne touche jamais à votre infrastructure directement.

Cette approche tranche avec la plupart des meilleurs agents IA autonomes du marché qui exécutent souvent du code dans des environnements partiellement isolés, voire pas isolés du tout.

La sandbox n'est pas un add-on optionnel. C'est un composant du framework, activé par défaut. Vercel a appris de ses propres erreurs en production et a intégré cette leçon dans l'ADN d'eve.


Human-in-the-loop : les approvals ne sont pas un afterthought

Beaucoup de frameworks ajoutent le human-in-the-loop comme un plugin. eve l'intègre au modèle d'exécution lui-même.

Un agent peut demander une approbation avant d'exécuter une action sensible. La demande est routée via le channel approprié (Slack, email, interface web). L'humain approuve ou rejette. L'agent reprend son exécution.

Ce mécanisme est particulièrement critique pour les agents qui manipulent du code en production. Un coding agent comme Claude Code qui est passé en crédits mensuels montre que l'industrie prend conscience de la nécessité de contrôler finement ce que les agents font réellement.

Avec eve, les approvals sont déclaratifs. Vous définissez dans la configuration de l'agent quelles actions nécessitent une validation humaine. Le framework gère le routing, le blocage et la reprise automatique.


Subagents, channels et skills : la composition au service de la complexité

Un agent seul a des limites. eve permet de composer des agents complexes à partir de sous-agents spécialisés.

subagents/ est un dossier comme les autres. Vous y placez des agents fils qui héritent du même modèle d'exécution durable. Un agent orchestrateur peut déléguer une tâche de recherche à un subagent, une tâche de code à un autre, et agréger les résultats.

Les channels/ définissent comment l'agent communique avec le monde extérieur. Web, Slack, API REST, email : chaque canal est un fichier de configuration. Même principe que le routing dans Next.js.

Les skills/ sont des comportements réutilisables qu'un agent peut invoquer. Pensez aux middleware de Next.js, mais pour les capacités d'agents.

Cette architecture modulaire change la donne pour les agents de recherche. Un agent construit avec eve pourrait utiliser Crawl4AI, le crawler open source numéro 1 sur GitHub comme tool, et déléguer l'analyse à un subagent spécialisé. Le tout en bénéficiant du durable execution.

Le parallèle avec OpenSeeker-v2 qui casse le monopole des search agents industriels est éclairant : le marché va vers des agents composables et open source, pas des monolithes propriétaires.


eve vs LangGraph vs Microsoft Agent Framework : où se place-t-il ?

Le paysage des frameworks d'agents est en pleine consolidation. Voici comment eve se positionne.

Critère eve (Vercel) LangGraph Microsoft Agent Framework
Paradigme Filesystem-first (dossier) Graphe d'état Déclaratif/orchestration
Langage TypeScript natif Python (TypeScript partiel) C# / Python / TypeScript
Durabilité Checkpointing automatique natif Manuelle via checkpointer Via external state store
Sandbox Intégrée par défaut Optionnelle Non native
Human-in-the-loop Natif dans le modèle d'exécution Via interrupt/guard Via extension
Open source Apache-2.0 MIT MIT
Philosophie Un agent = un dossier Un agent = un graphe Un agent = un composant

LangGraph vous demande de penser en termes de nœuds et d'arêtes. C'est puissant pour des workflows complexes, mais la courbe d'apprentissage est rude. Microsoft Agent Framework adopte une approche plus entreprise, avec toute la verbosité qui accompagne ce monde.

eve choisit une autre voie : la simplicité déclarative par fichiers. Vous ne construisez pas un graphe, vous décrivez un agent. Le framework s'occupe de l'exécution.

Cette approche rappelle aussi la philosophie Hermes Agent, où instructions, skills et tools sont organisés en fichiers. Si vous utilisez des LLM optimisés pour les agents comme ceux de la famille OpenClaw/Hermes, le passage à eve sera naturel.

Le choix du LLM derrière eve

eve ne impose pas de modèle. Vous branchez le LLM que vous voulez. Mais en pratique, les agents en production nécessitent des modèles agentic solides.

Un GPT-5.5 (score agentic 98.2) ou un Claude Opus 4.7 Adaptive (94.3) donneront des résultats optimaux. Pour du code, GPT-5.3 Codex (80) ou Claude Sonnet 4.6 (81.4) offrent un excellent rapport qualité/coût. Les modèles self-hosted comme Kimi K2.6 (88.1) ou GLM-5 Reasoning (82) sont viables si vous contrôlez toute la stack.

Le framework est agnostique, mais la qualité de l'agent dépendra directement du LLM que vous choisissez pour le piloter.


npx eve init : démarrer un agent en 30 secondes

Le scaffolding d'eve suit la tradition Vercel : une commande, un projet complet.

npx eve init génère un dossier d'agent avec la structure conventionnelle : instructions.md, tools/, channels/, skills/. Vous éditez les fichiers, vous ajoutez vos tools en TypeScript, vous configurez vos canaux, et vous lancez.

La couverture de WebDeveloper.com confirme que le package est disponible sur npm (npm install eve@latest) et que la documentation est incluse directement dans le package (node_modules/eve/docs).

Vous définissez vos agents dans agent.ts et instructions.md. Le premier pointe vers le LLM et la configuration d'exécution. Le second contient le prompt système. Le reste est convention sur le filesystem.

C'est radicalement plus simple que de configurer un graphe LangGraph avec ses state channels, ses reducers et ses checkpointer custom. Et c'est conçu pour le déploiement immédiat sur l'infrastructure Vercel.

Pour les devs qui viennent du monde des agents open source avec Ollama en local, la transition est naturelle : vous gardez le contrôle local, vous ajoutez la couche production.


Sécurité en production : ce que eve ne résout pas

eve sandboxe le code généré par l'agent. C'est essentiel mais insuffisant pour une posture de sécurité complète.

Un agent qui a accès à des tools mal configurés peut causer des dégâts sans exécuter de code. Un tool qui envoie des emails, qui supprime des fichiers, qui modifie une base de données : la sandbox ne protège pas contre ça.

La sécurité d'un agent eve dépend de ce que vous mettez dans tools/. Chaque fonction est une surface d'attaque. Le framework fournit l'infrastructure, pas la validation métier.

Le menace model des agents en production est encore immature. Des attaques comme l'agentjacking, où une fake bug report suffit à compromettre un agent, montrent que la surface d'attaque dépasse le simple code exécuté.

eve vous donne les briques pour construire sécurisé (sandbox, approvals, moindre privilège par tools). Mais la responsabilité de la configuration reste vôtre.


Evals et tracing : observer ce que fait réellement votre agent

Un agent en production sans observabilité, c'est un黑洞. Vous ne savez pas ce qu'il fait, pourquoi il a fait tel choix, ni où il a échoué.

eve intègre le tracing et les evals directement dans le framework. Chaque étape de l'exécution est tracée. Vous pouvez voir quel tool a été appelé, avec quels paramètres, quel résultat a été retourné, combien de temps a pris chaque étape.

Les evals permettent de définir des critères de succès et de mesurer automatiquement les performances de votre agent sur des jeux de test. C'est indispensable pour itérer.

Selon SiliconANGLE, eve combine tous les éléments pour assembler, évaluer et faire tourner des agents. L'évaluation n'est pas un outil externe, c'est une partie du cycle de développement.

Pour les équipes qui déploient des agents à grande échelle, cette intégration native vaut à elle seule le passage à eve. Fini les pipelines d'observabilité bricolées avec du logging custom.


Qui doit adopter eve (et qui ne doit pas)

eve est fait pour les développeurs TypeScript qui veulent mettre des agents en production sans bricoler l'infrastructure. Si vous êtes à l'aise avec Next.js, vous serez à l'aise avec eve.

C'est particulièrement pertinent si vous construisez des agents qui doivent tourner longtemps (durable execution), qui exécutent du code généré (sandbox), ou qui nécessitent des validations humaines (approvals).

En revanche, si vos agents sont de simples chaînes RAG avec deux-trois appels LLM, eve est probablement surdimensionné. Un script Python avec LangChain fera l'affaire.

Si vous êtes en Python pur, sans envie de passer à TypeScript, eve n'est pas pour vous. LangGraph reste le meilleur choix dans cet écosystème.

Si vous avez besoin de graphes d'état complexes avec des branchements conditionnels profonds, l'approche fichier d'eve pourrait vous frustrer. Dans ce cas, LangGraph offre plus de contrôle granulaire.

Pour les équipes qui veulent du coding agent open source comme OpenCode avec ses 172K étoiles GitHub, eve offre le framework pour le faire passer du prototype à la production.


❌ Erreurs courantes

Erreur 1 : Confondre eve et Vercel Agent

eve est un framework open source pour construire des agents. Vercel Agent est un produit distinct de revue de code autonome, comme le précise Agent Swarm. Ce sont deux choses différentes. Ne les mélangez pas dans votre architecture.

Erreur 2 : Mettre toute la logique dans instructions.md

Le prompt système est important, mais si votre agent a besoin de logique procédurale complexe, elle doit aller dans les tools et skills, pas dans un prompt de 5000 mots. Les LLM actuels, même un GPT-5.5 à 98.2, ne sont pas fiables pour exécuter des algorithmes déterministes via prompt seul.

Erreur 3 : Ignorer la configuration des approvals

La sandbox protège contre l'exécution de code non-fiable. Les approvals protègent contre les actions non-fiables. Si vous ne configurez pas les approvals sur vos tools sensibles, votre agent peut envoyer des emails, supprimer des données ou effectuer des paiements sans validation. C'est une faille de conception, pas de framework.

Erreur 4 : Choisir son LLM sans tester sur son use case

Un score agentic élevé ne garantit pas la performance sur votre cas spécifique. GPT-5.5 domine les benchmarks généraux, mais Claude Sonnet 4.6 peut être meilleur sur certaines tâches de code. Testez avant de verrouiller votre choix.


❓ Questions fréquentes

eve est-il vraiment open source ?

Oui. eve est publié sous licence Apache-2.0, selon les sources de la présentation au Ship 26. Le code est sur GitHub dans le repo vercel/eve, et le package est disponible sur npm.

eve remplace-t-il LangGraph ?

Non. eve et LangGraph ciblent des besoins différents. eve est filesystem-first et optimisé pour la simplicité déclarative en TypeScript. LangGraph est graphe-first et offre plus de contrôle sur les workflows complexes, surtout en Python. Le choix dépend de votre stack et de la complexité de vos workflows.

Peut-on utiliser eve sans l'infrastructure Vercel ?

Oui. eve est un framework open source. Vous pouvez l'exécuter n'importe où. L'intégration avec l'infrastructure Vercel est un atout pour le déploiement, mais pas une obligation. Vous pouvez le faire tourner sur votre propre serveur, y compris chez Hostinger pour les projets modestes.

Quels LLM sont compatibles avec eve ?

eve est agnostique. Tout LLM avec une API compatible peut être branché. Les modèles les plus performants en agentic sont GPT-5.5 (98.2), Gemini 3 Pro Deep Think (95.4) et Claude Opus 4.7 Adaptive (94.3). Pour le code spécifiquement, GPT-5.3 Codex et Claude Sonnet 4.6 sont d'excellents choix.

La durabilité fonctionne-t-elle avec des subagents ?

Oui. Chaque subagent bénéficie du même modèle d'exécution durable que l'agent parent. Le checkpointing s'applique à tous les niveaux de la hiérarchie d'agents. Si un subagent crash, il reprend individuellement sans affecter les autres.


✅ Conclusion

eve est la première tentative crédible de créer un framework d'agents IA qui soit aussi simple à adopter que Next.js l'a été pour le web. Le paradigme filesystem-first, le checkpointing natif, la sandbox intégrée et les approvals déclaratifs addressent les vrais problèmes de la production. Si vous construisez des agents en TypeScript, eve mérite votre attention immédiate.