Poolside Laguna M.1 : le modèle open-source de 225B pour le coding agent, Apache 2.0

LLM & Modèles 🟢 Débutant ⏱️ 12 min de lecture 📅 2026-06-27

Poolside Laguna M.1 : le modèle open-source de 225B pour le coding agent, Apache 2.0

🔎 Le marché du coding agent vient de basculer

En octobre 2025, Poolside lève 2 milliards de dollars à une valorisation de 12 milliards, avec le soutien de Nvidia, eBay et Bain Capital Ventures. Moins de six mois plus tard, la startup française fondée en 2023 livre son premier véritable modèle phare : Laguna M.1.

Le timing n'est pas anodin. Le marché des outils de coding IA est en pleine consolidation — SpaceX a récemment investi dans Anysphere à une valorisation de 60 milliards de dollars. Dans ce contexte, les entreprises cherchent des alternatives aux API propriétaires d'OpenAI et d'Anthropic pour des raisons de coûts, de confidentialité et de souveraineté.

Laguna M.1 répond exactement à cette demande : 225 milliards de paramètres, 23 milliards actifs par token, licence Apache 2.0, et des benchmarks qui le placent au niveau des meilleurs modèles propriétaires en software engineering. C'est le modèle open-source le plus sérieux pour le coding agentique à ce jour.

L'essentiel

Laguna M.1 est un modèle sparse mixture-of-experts (MoE) de 225,8B paramètres totaux avec seulement 23B activés par token, ce qui le rend exécutable sur des stations de travail bien équipées.
Il atteint 72,5% sur SWE-bench Verified, 67,3% sur SWE-bench Multilingual et 46,9% sur SWE-bench Pro, des scores qui rivalisent avec Claude Opus 4.7 et GPT-5.4 Pro en coding.
Disponible sous licence Apache 2.0 sur Hugging Face, il peut être self-hosté sans aucune restriction commerciale — une première pour un modèle de cette envergure en coding.
Son accès est gratuit via OpenRouter à 0,00$/1M tokens en entrée, ce qui permet de le tester immédiatement sans infrastructure.

Outils recommandés

Outil	Usage principal	Prix (juin 2026, vérifiez sur openrouter.ai)	Idéal pour
Laguna M.1 (free)	Coding agentique, SWE-bench	0,00$/1M tokens (entrée)	Tests immédiats, prototypage
Laguna M.1 sur Hugging Face	Self-hosting complet	Gratuit (Apache 2.0)	Entreprises avec GPU, souveraineté
Ollama	Exécution LLM local	Gratuit	Développeurs individuels, Mac haut de gamme

Architecture : pourquoi le MoE sparse change la donne pour le self-hosting

Laguna M.1 utilise une architecture sparse mixture-of-experts avec 67 couches, 256 experts et un routing top-k=16. Concrètement, pour chaque token traité, seul un sous-ensemble de 16 experts parmi les 256 est activé.

Cela signifie que sur les 225,8 milliards de paramètres du modèle, seuls 23 milliards sont effectivement calculés à chaque passage. Le reste des poids reste inactif, ce qui réduit drastiquement la charge de calcul par rapport à un modèle dense équivalent.

Un modèle dense de 225B nécessiterait des clusters de GPU multi-nœuds. Laguna M.1, grâce à son sparsité, peut tourner sur une station de travail avec suffisamment de VRAM pour charger les poids complets, tout en consommant la puissance de calcul d'un modèle 23B. C'est un compromis idéal pour le self-hosting de LLM en entreprise.

La fenêtre de contexte de 256K tokens permet de travailler sur des codebases entières, des diffs de pull requests complexes ou des sessions de debugging prolongées — exactement ce dont un coding agent a besoin pour opérer à "long horizon" selon la terminologie de Poolside.

Benchmarks : Laguna M.1 face aux géants propriétaires

Les benchmarks ont été effectués avec le pool agent harness de Poolside, qui permet jusqu'à 500 steps d'exécution en sandbox. Ce protocole est plus représentatif que l'évaluation single-turn classique, car il mesure la capacité réelle d'un modèle à résoudre des tâches de software engineering de bout en bout.

Benchmark	Laguna M.1	Claude Opus 4.7	GPT-5.4 Pro	GLM-5 (Reasoning)
SWE-bench Verified	72,5%	~74% (estimé)	~73% (estimé)	~65% (estimé)
SWE-bench Multilingual	67,3%	N/A	N/A	N/A
SWE-bench Pro	46,9%	~48% (estimé)	~47% (estimé)	~38% (estimé)
Terminal-Bench 2.0	40,7%	N/A	N/A	N/A

Les scores de Laguna M.1 sur SWE-bench Verified le placent dans le même cercle que les meilleurs LLM pour coder du marché. La mention de SWE-bench Multilingual (67,3%) est particulièrement notable : c'est un benchmark que peu de modèles peuvent même aborder, et Laguna M.1 y excelle.

Le score de 40,7% sur Terminal-Bench 2.0 confirme la vocation agentique du modèle. Ce benchmark mesure la capacité à exécuter des commandes, naviguer dans un filesystem et résoudre des problèmes en environnement terminal — exactement le workflow d'un agent IA de coding.

Ces résultats sont d'autant plus impressionnants que Laguna M.1 est open-weights. Historiquement, l'écart entre modèles ouverts et propriétaires en coding était de 10 à 20 points. Laguna M.1 le réduit à quasi zéro.

Contexte concurrentiel : GLM-5.2, Qwen3.6 et la nouvelle vague open weights

Laguna M.1 n'arrive pas dans un désert. L'année 2026 a vu une accélération spectaculaire des modèles open weights orientés coding, avec notamment GLM-5.2 de Z.AI et la famille Qwen3.6.

GLM-5 (Reasoning) de Z.AI, disponible en self-host, atteint un score agentic de 82 sur les classements de référence. C'est un modèle généraliste fort en raisonnement, mais qui n'est pas spécifiquement optimisé pour le software engineering agentique. Son architecture dense le rend aussi plus coûteux à héberger que le MoE de Laguna M.1 à paramètres équivalents.

La famille Qwen3.6, comme le Qwen3 Coder Next, se positionne sur le créneau du coding léger et mobile, capable de tourner sur des Mac 64 Go. C'est complémentaire à Laguna M.1 : Qwen cible le développeur individuel, Laguna cible l'infrastructure entreprise.

Le Kimi K2.7-Code avec ses 1 trillion de paramètres représente une autre approche — la brute force scalaire. Mais son coût d'infrastructure le réserve à des déploiements cloud massifs, pas au self-hosting.

Laguna M.1 se distingue par son positionnement précis : la puissance d'un modèle 225B avec les coûts d'inférence d'un 23B, le tout sous Apache 2.0. C'est le point d'équilibre que les équipes d'ingénierie recherchent.

Self-hosting : quelles ressources pour faire tourner Laguna M.1

C'est la question que tout CTO se pose. Laguna M.1 pèse 225B en poids totaux, ce qui impose un minimum de VRAM pour le chargement complet.

En pratique, avec une quantification INT4 (qui préserve la quasi-totalité des performances en coding), le modèle nécessite environ 120-130 Go de VRAM. Cela correspond à :

2x GPU Nvidia H100 80Go en configuration NVLink
1x GPU Nvidia H200 141Go (configuration idéale)
4x GPU RTX 4090 24Go en configuration multi-GPU (solution budget)

Les discussions sur r/LocalLLaMA confirment que la communauté a déjà réussi à faire tourner Laguna M.1 en configuration multi-GPU grand public. L'architecture MoE avec son routing top-k=16 facilite le sharding des experts sur plusieurs GPU.

Pour les entreprises qui n'ont pas cette infrastructure sur site, Baseten a publié un cas d'usage détaillant comment ils ont permis à Poolside de déployer Laguna M.1 en temps record sur leur infrastructure cloud. C'est une option intermédiaire entre le self-hosting pur et l'API propriétaire.

Pour les développeurs qui veulent tester le modèle sans investir dans du hardware, l'option OpenRouter gratuite reste le chemin le plus simple. Et pour des modèles plus légers adaptés au poste individuel, le guide d'installation LLM local avec Ollama ou LM Studio reste pertinent.

Intégration dans un coding agent : comment exploiter Laguna M.1

Un modèle, même excellent, ne fait pas un agent. La vraie valeur de Laguna M.1 se révèle quand il est intégré dans un pipeline agentique avec accès aux outils — lecture de fichiers, exécution de commandes, recherche dans le code, édition de fichiers.

Poolside a d'ailleurs conçu son propre "pool agent harness" pour évaluer Laguna M.1, avec jusqu'à 500 steps d'exécution en sandbox. C'est ce framework qui produit les scores SWE-bench de référence. L'entreprise ne publie pas ce harness en open source, mais le principe est reproductible.

Des projets comme OpenCode, avec ses 172 000 étoiles GitHub, démontrent que la communauté open source construit déjà les couches agentiques autour des LLM. Remplacer le modèle backend d'OpenCode par Laguna M.1 est techniquement faisable et pourrait donner naissance à un coding agent entièrement open source, du modèle à l'orchestration.

Le score de 40,7% sur Terminal-Bench 2.0 est ici crucial : il prouve que Laguna M.1 n'est pas un simple générateur de code, mais un modèle capable de naviguer dans un environnement, d'exécuter des commandes et d'itérer sur ses propres erreurs. C'est ce qui le rend pertinent pour les meilleurs LLM pour les agents IA.

Les entreprises qui veulent créer un agent IA de coding propriétaire peuvent prendre Laguna M.1 comme base et ajouter leurs propres outils, leurs guards Rails et leurs intégrations CI/CD. La licence Apache 2.0 le permet sans aucune restriction.

Poolside : de la startup française au challenger de 12 milliards

Le parcours de Poolside mérite d'être rappelé. Fondée en 2023, la startup a levé 500 millions de dollars en série B en 2024, puis 2 milliards supplémentaires en octobre 2025, portant sa valorisation à 12 milliards de dollars.

Parmi les investisseurs : Nvidia, qui voit dans Poolside un cas d'usage majeur pour ses GPU, et eBay, qui utilise potentiellement ces modèles en interne. Bain Capital Ventures accompagne le tour avec plus d'1 milliard déjà engagé, dont 700 millions d'investisseurs existants.

Cette war chest de plusieurs milliards donne à Poolside les moyens de continuer à entraîner des modèles de plus en plus puissants. Laguna M.1 est le premier modèle qui justifie cette valorisation. Si les benchmarks se confirment en production, Poolside devient le candidat naturel pour toute entreprise qui veut un alternative crédible à OpenAI et Anthropic en coding.

Le fait que le modèle soit publié en open weights sous Apache 2.0 est un signal stratégique fort. Poolside ne monétise pas le modèle lui-même, mais l'infrastructure autour — API managée, outils enterprise, intégrations. C'est le même modèle économique que Meta avec Llama, mais appliqué au coding vertical.

Le marché du coding IA en juin 2026 : consolidation et prix fou

Le contexte de sortie de Laguna M.1 est essentiel pour comprendre son importance. Le marché des outils de coding IA est en pleine bulle spéculative.

Anysphere, la startup derrière Cursor, a atteint une valorisation de 60 milliards de dollars grâce à un investissement de SpaceX. Cette valorisation repose sur la promesse que le coding IA va remplacer une part massive du travail des développeurs. Mais Anysphere dépend entièrement des API propriétaires d'Anthropic et d'OpenAI.

C'est précisément la vulnérabilité que Laguna M.1 exploite. Une entreprise qui build son infrastructure de coding sur Claude ou GPT est liée par le contrat, les prix et les changements de termes de son fournisseur. Avec Laguna M.1 en self-host, cette dépendance disparaît.

Le fait qu'OpenRouter propose Laguna M.1 gratuitement en entrée est aussi un signal de marché. Poolside subventionne l'accès pour accélérer l'adoption, la même stratégie que DeepSeek ou Groq ont utilisée avant lui. Pour les développeurs qui comparent les meilleurs LLM gratuits, Laguna M.1 devient immédiatement une option à tester.

❌ Erreurs courantes

Erreur 1 : Confondre paramètres totaux et paramètres actifs

Laguna M.1 a 225B de paramètres totaux mais n'en active que 23B par token. Comparer sa consommation de calcul à un modèle dense de 225B est une erreur fondamentale. En termes de FLOPs par token, il est beaucoup plus proche d'un modèle 23B que d'un modèle 225B.

Erreur 2 : Sous-estimer les besoins en VRAM pour le self-hosting

Oui, seul 23B est actif par token. Mais les 225B de poids doivent quand même être chargés en mémoire. En INT4, cela représente ~125 Go de VRAM. Un seul GPU grand public ne suffit pas. Il faut soit un H200, soit un setup multi-GPU avec NVLink.

Erreur 3 : Évaluer Laguna M.1 en single-turn

Les benchmarks de référence (SWE-bench Verified à 72,5%) ont été obtenus avec le pool agent harness de Poolside, jusqu'à 500 steps en sandbox. Évaluer ce modèle en générant un seul bloc de code et en le comparant au gold standard ne rendra pas justice à ses capacités agentiques.

Erreur 4 : Ignorer la licence Apache 2.0

Apache 2.0 n'est pas la même chose que "open source libre de droits". La licence impose la conservation du copyright et du notice de licence, et inclut une grant de patent license. Pour un usage enterprise, c'est parfait. Pour un fork sans attribution, c'est interdit.

❓ Questions fréquentes

Laguna M.1 peut-il réellement remplacer Claude ou GPT en coding ?

En benchmarks agentiques (SWE-bench Verified), l'écart est de l'ordre de 1 à 3 points. Pour des tâches de software engineering réelles impliquant du debugging, du refactoring et de la navigation dans un codebase, oui, Laguna M.1 est une alternative crédible au self-host.

Quelle est la différence entre Laguna XS.2 et Laguna M.1 ?

Laguna XS.2 est le modèle léger de la gamme, conçu pour tourner sur un seul GPU. Laguna M.1 est le modèle phare de 225B, optimisé pour les tâches agentiques complexes à long horizon. XS.2 pour le rapide, M.1 pour le complexe.

Le modèle est-il vraiment gratuit sur OpenRouter ?

Oui, au 28 avril 2026, Laguna M.1 est listé à 0,00$/1M tokens en entrée sur OpenRouter. C'est une stratégie d'acquisition. Les prix de sortie (output) et les conditions à long terme peuvent évoluer — vérifiez sur openrouter.ai.

Peut-on utiliser Laguna M.1 avec des agents existants comme OpenCode ?

Techniquement oui, si l'agent supporte un endpoint OpenAI-compatible. OpenCode et d'autres frameworks agentiques open source peuvent être configurés pour pointer vers une instance Laguna M.1 locale ou via API. Les meilleurs LLM pour la recherche et le coding partagent souvent les mêmes formats d'intégration.

Comment Laguna M.1 se compare-t-il aux autres LLM pour le code en français ?

Pour le code, la langue du prompt a peu d'importance — le code est universel. Mais pour les explications et la documentation, Laguna M.1 n'a pas été spécifiquement entraîné pour le français. Pour un usage bilingue strict, les meilleurs LLM en français restent plus adaptés à la partie textuelle.

✅ Conclusion

Laguna M.1 est le premier modèle open-weights qui rend le self-hosting d'un coding agent de niveau enterprise techniquement et économiquement réaliste. Avec 72,5% sur SWE-bench Verified sous Apache 2.0, Poolside a créé l'alternative que les équipes d'ingénierie attendaient aux API propriétaires. Testez-le gratuitement sur OpenRouter avant d'investir dans le hardware de self-hosting.

#coding-agent #ia-open-source #poolside-laguna-m.1 #modèle-225b #licence-apache-2.0

📚 Articles liés

LLM & Modèles 🟢 Débutant 15 min

FrontierCode : le benchmark de Cognition qui enterre SWE-Bench et classe les agents de code sur la qualité réelle des pull requests — Fable 5 à 46,3%, Opus 4.8 à 34,3%, GPT-5.5 à 25,5%

Découvrez FrontierCode, le nouveau benchmark de Cognition qui remplace SWE-Bench en évaluant la qualité réelle des pull requests des agents de code.

2026-06-26 17:03

LLM & Modèles 🟢 Débutant 15 min

DeepSWE : le benchmark qui prouve que les agents de code trichaient — Artificial Analysis enterre SWE-Bench

Découvrez DeepSWE, le nouveau benchmark qui remplace SWE-Bench et prouve que les agents de code trichaient. Analyse du classement bouleversé par Artificial Anal

2026-06-22 16:02

LLM & Modèles 🟢 Débutant 16 min

Gemini 3.5 Pro : compte à rebours — 10 jours avant le deadline de Google, 2 millions de tokens et le mode Deep Think, le modèle le plus attendu de l'année (en plein chaos des talents)

Gemini 3.5 Pro : à 10 jours du deadline de Google, découvrez les rumeurs sur ses 2 millions de tokens et le mode Deep Think en plein chaos des talents.

2026-06-20 17:05

📑 Table des matières