📑 Table des matières

Microsoft Build 2026 : Project Polaris, Windows Agent Framework et la fin de la dépendance OpenAI

Actu IA 🟢 Débutant ⏱️ 14 min de lecture 📅 2026-06-03

Microsoft Build 2026 : Project Polaris, Windows Agent Framework et la fin de la dépendance OpenAI

🔎 Pourquoi Microsoft vient de changer toutes les règles du jeu

Du 2 au 3 juin 2026, à San Francisco, Microsoft n'a pas organisé une simple conférence développeur. Il a exécuté un pivot stratégique d'une rare violence.

L'éditeur a dévoilé cinq annonces majeures qui racontent toutes la même histoire : la fin de la dépendance envers OpenAI. Project Polaris remplace GPT-4 Turbo dans GitHub Copilot. Windows Agent Framework passe open-source sous MIT. Foundry Local fait tourner l'inférence sur machine sans un octet envoyé au cloud. Azure Agent Mesh orchestre des essaims d'agents. Et Project Solara imagine un monde post-smartphone.

Cinq coups coordonnés, un seul objectif. Reprendre le contrôle de la pile IA, de la puce à l'interface.


L'essentiel

  • Project Polaris : modèle MoE de coding propriétaire à Microsoft, remplace GPT-4 Turbo dans GitHub Copilot dès août 2026. Première rupture concrète avec OpenAI sur le produit qui génère le plus de revenus IA de Microsoft.
  • Windows Agent Framework 1.0 : framework open-source (licence MIT) pour créer des agents qui contrôlent nativement Windows. Microsoft mise sur l'écosystème plutôt que sur le verrouillage.
  • Foundry Local : runtime d'environ 20 Mo permettant l'inférence on-device sans connexion cloud. L'antidote aux latences et aux coûts Azure.
  • Azure Agent Mesh : couche d'orchestration multi-agents pour déployer et superviser des flottes d'agents collaboratifs en production.
  • Project Solara : plateforme agent-first avec badge 5G/Android, vision matérielle d'un futur sans smartphone où l'agent est l'interface.

Outils et modèles mentionnés

Outil / Modèle Rôle Statut (juin 2026)
Project Polaris Modèle MoE coding, remplace GPT-4 Turbo dans Copilot Déploiement août 2026
Windows Agent Framework 1.0 Framework open-source agents sur Windows Disponible, licence MIT
Foundry Local Runtime ~20 Mo, inférence on-device Disponible
Azure Agent Mesh Orchestration multi-agents cloud Disponible sur Azure
Project Solara Plateforme agent-first + badge 5G/Android Prototype/démo
GPT-5.5 (OpenAI) Modèle tiers, encore utilisé côté chat Score agentic 98.2
Claude Opus 4.7 (Anthropic) Concurrent direct sur le coding Score agentic 94.3

Project Polaris : le modèle qui casse le monopole OpenAI dans Copilot

Project Polaris est un modèle MoE (Mixture of Experts) de coding développé en interne par Microsoft. Et il ne sert pas de démonstration de recherche : il remplace directement GPT-4 Turbo dans GitHub Copilot à partir d'août 2026.

C'est un signal stratégique massif. GitHub Copilot représente la plus grosse ligne de revenus IA de Microsoft. Confier cette ligne à un modèle propriétaire, c'est retirer à OpenAI son produit phare chez le client le plus important.

Pourquoi un modèle MoE pour le code

L'architecture MoE active uniquement les sous-réseaux experts pertinents pour chaque requête. Résultat : une qualité de génération comparable aux gros modèles généralistes, mais avec un coût d'inférence divisé. Pour du code, où les requêtes sont répétitives et spécialisées, c'est un gain multiplicatif.

D'après le recap de ChatForest, Polaris a été entraîné spécifiquement sur les corpus de code GitHub, ce qui lui donne un avantage contextuel que GPT-4 Turbo n'avait pas par construction.

Les implications pour le marché des coding agents

La move de Microsoft arrive alors que la guerre des coding agents s'intensifie. xAI vient de lancer Grok Build, son premier agent coding CLI. Anthropic pousse Claude Opus 4.7 comme référence absolue du coding. Google positionne Gemini 3 Pro Deep Think sur ce créneau.

Dans ce contexte, Polaris n'est pas qu'un modèle. C'est la preuve que Microsoft peut se passer d'OpenAI sur le segment le plus rentable. Pour les développeurs qui veulent aller plus loin et créer un agent IA personnalisé, cela signifie aussi que les briques de base deviennent accessibles hors de l'écosystème OpenAI.

Coût et performance : le calcul de Microsoft

Le passage de GPT-4 Turbo à Polaris ne se justifie pas seulement par l'indépendance stratégique. C'est aussi un calcul économique. Chaque requête Copilot qui passe de l'API OpenAI à l'inférence interne représente des millions de dollars d'économie à l'échelle de la base de 15 millions d'abonnés Copilot.


Windows Agent Framework 1.0 : Microsoft ouvre le jeu, pour mieux le contrôler

Windows Agent Framework (WAF) 1.0 est un framework open-source sous licence MIT qui permet de construire des agents capables de contrôler nativement l'interface Windows. Cliquer, naviguer, automatiser des tâches multi-applications, tout cela devient scriptable via le framework.

Le choix de la licence MIT n'est pas anodin. C'est la plus permissive possible. Microsoft ne cherche pas à verrouiller le framework : il veut qu'il devienne le standard de fait, comme VS Code l'est devenu pour les éditeurs de code.

Ce que WAF permet concrètement

Un agent construit avec WAF peut lire l'interface Windows, interagir avec les éléments UI, et enchaîner des actions complexes à travers plusieurs applications. C'est le pendant open-source de ce qu'OpenAI expérimente avec Codex Computer Use, qui vient d'arriver sur Windows pour contrôler votre PC à distance.

La différence fondamentale : WAF est natif, open-source, et ne dépend d'aucun modèle tiers. Vous pouvez y brancher Polaris, GPT-5.5, Claude Opus 4.7, ou n'importe quel modèle local.

Pourquoi l'open-source est la bonne stratégie ici

Le marché des agents desktop est encore naissant. Si Microsoft avait fermé WAF, les développeurs auraient créé des alternatives. En l'ouvrant MIT, Microsoft s'assure que tout l'écosystème construit au-dessus de Windows reste compatible. C'est de l'embrace-and-extend classique, mais appliqué à l'ère des agents.

ABHS souligne que WAF intègre des sandbox de sécurité pour empêcher les agents d'effectuer des actions destructrices, un point critique pour l'adoption enterprise.


Foundry Local : 20 Mo pour l'inférence sans cloud

Foundry Local est probablement l'annonce la plus sous-estimée de ce Build. C'est un runtime d'environ 20 Mo qui permet de faire tourner des modèles d'inférence directement sur la machine de l'utilisateur, sans aucune connexion au cloud.

20 Mo. C'est la taille d'une photo JPEG. Et ça suffit pour exécuter des modèles optimisés localement.

Pourquoi ça change la donne

L'inférence cloud a trois problèmes structurels : la latence, le coût, et la confidentialité. Foundry Local attaque les trois simultanément. Un agent qui tourne localement répond en millisecondes, coûte zéro en API calls, et ne jamais quitte la machine.

AwesomeAgents note que Foundry Local est conçu pour fonctionner avec les NPU des processeurs récents (Qualcomm Snapdragon X, Intel Lunar Lake, AMD Ryzen AI). L'inférence n'est plus un service cloud, c'est une capacité matérielle locale.

Le lien avec WAF et Polaris

La combinaison WAF + Foundry Local + Polaris dessine une pile 100% Microsoft, 100% locale. Un agent WAF qui utilise Polaris via Foundry Local ne fait jamais appel à OpenAI, ni à Azure. C'est un agent totalement autonome sur la machine de l'utilisateur.

C'est cette pile qui rend la dépendance OpenAI obsolète. Pas une rupture brutale, mais une migration progressive rendue possible par l'équivalent technique.

Les limites actuelles

Les modèles locaux restent moins performants que les modèles cloud haut de gamme. GPT-5.5 (score 98.2) ou Claude Opus 4.7 (94.3) restent inaccessibles en local. Mais pour les tâches de coding répétitives et l'automatisation desktop, un modèle MoE optimisé comme Polaris suffit largement.


Azure Agent Mesh : orchestrer des armées d'agents

Azure Agent Mesh est la couche d'orchestration multi-agents de Microsoft. Elle permet de déployer, superviser et coordonner des flottes d'agents qui collaborent sur des tâches complexes.

L'idée n'est pas nouvelle. Mais l'exécution à l'échelle d'Azure, c'est différent d'un prototype GitHub.

Comment ça fonctionne concrètement

Agent Mesh fournit un registre central où chaque agent déclare ses capacités. Un orchestrateur attribue les tâches, gère les dépendances entre agents, et supervise l'exécution. Si un agent échoue, un autre de même spécialité le remplace.

C'est du workflow d'entreprise, mais appliqué aux agents IA. Et c'est précisément ce que les entreprises attendent pour passer du proof-of-concept à la production.

La concurrence avec les modèles agentic autonomes

La tendance actuelle pousse vers des modèles agentic monolithiques : GPT-5.5, Gemini 3 Pro Deep Think, Claude Opus 4.7, qui gèrent seuls la planification et l'exécution. Microsoft prend le contre-pied avec Agent Mesh : au lieu d'un super-agent, préférer un essaim d'agents spécialisés.

Les deux approches ont leurs mérites. Le monolithe est plus simple à déployer. L'essaim est plus résilient et plus économique (on n'active pas GPT-5.5 pour une tâche qu'un petit modèle local peut gérer).


Project Solara : après le smartphone, l'agent

Project Solara est la vision la plus ambitieuse de ce Build, mais aussi la plus lointaine. Microsoft a présenté une plateforme agent-first accompagnée d'un badge 5G/Android. Pas un téléphone. Un badge.

Le concept : l'interface n'est plus un écran tactile, c'est un agent vocal et contextuel porté sur soi. Le badge 5G assure la connectivité permanente. Android fournit la compatibilité app. L'agent est le médiateur entre l'utilisateur et le monde numérique.

Pourquoi Microsoft parie sur le post-smartphone

Le smartphone est une interface conçue pour des humains qui tapent et regardent. Les agents IA n'ont pas besoin d'écran. Ils ont besoin de connectivité, de capteurs, et d'un moteur vocal. Le badge est l'hardware minimal pour cette interaction.

C'est spéculatif, mais le signal stratégique est clair : Microsoft ne veut pas être le fournisseur d'IA du smartphone d'Apple ou de Google. Il veut créer son propre form factor.

Le lien avec la monétisation

Là où le badge 5G devient intéressant pour Microsoft, c'est dans la monétisation. Un agent Solara qui passe ses journées à résoudre des problèmes pour vous, c'est un agent qui génère des requêtes, des appels API, des transactions. Le hardware est un vecteur d'accès. Le vrai business reste l'orchestration et l'inférence.

Ce modèle rappelle étrangement la stratégie d'OpenAI, qui ouvre désormais la publicité ciblée à tous les annonceurs US dans ChatGPT, transformant l'interface conversationnelle en surface publicitaire. Microsoft, avec Solara, pourrait faire la même chose depuis un badge plutôt qu'un écran.


La géopolitique IA : ce que Polaris signifie pour le partenariat OpenAI

Il faut replacer ces annonces dans le contexte du partenariat Microsoft-OpenAI. Microsoft a investi plus de 13 milliards de dollars dans OpenAI. En échange, il obtenait un accès exclusif à la technologie et une intégration profonde dans ses produits.

Ce deal est en train de se fissurer de toutes parts.

OpenAI se comporte comme un concurrent

OpenAI lève des fonds de manière agressive, développe son propre infrastructure, et signe des accords avec les concurrents de Microsoft. Le partenariat exclusif est mort. Reste un accord commercial que Microsoft peut désormais contourner grâce à ses propres modèles.

Polaris comme levier de négociation

Même si Polaris ne remplace pas GPT-5.5 dans les produits grand public (Bing Chat, Microsoft 365 Copilot), le simple fait qu'il existe dans GitHub Copilot change la dynamique de négociation. Microsoft peut dire à OpenAI : "Votre prix est trop élevé ? On bascule sur Polaris."

C'est exactement ce qui s'est passé avec GPT-4 Turbo dans Copilot. Le modèle coûtait trop cher par requête. Polaris fait la même chose pour moins cher, et l'argent reste chez Microsoft.

Les modèles OpenAI restent utiles, mais pas indispensables

GPT-5.5 domine le classement agentic avec 98.2 points. GPT-5.4 Pro suit à 91.8. Ce sont des modèles exceptionnels que Microsoft ne peut pas répliquer demain. Mais pour 80% des cas d'usage enterprise (coding, automatisation, tri d'emails, résumés), un modèle spécialisé comme Polaris via Foundry Local suffit.

Le ratio 80/20 est le seuil à partir duquel la dépendance devient optionnelle, pas structurelle.


L'écosystème des agents en juin 2026 : où se place Microsoft

Le marché des agents IA est en explosion. Voici où se positionnent les acteurs clés par rapport aux annonces de ce Build.

Les modèles agentic qui comptent

Le classement actuel est dominé par OpenAI, mais la marge se réduit :

Modèle Éditeur Score agentic Usage agents
GPT-5.5 OpenAI 98.2 Agent généraliste haut de gamme
Gemini 3 Pro Deep Think Google 95.4 Raisonnement long, multi-étapes
Claude Opus 4.7 (Adaptive) Anthropic 94.3 Coding, analyse de code
GPT-5.4 Pro OpenAI 91.8 Équilibre coût/performance
o1-preview OpenAI 90.2 Raisonnement mathématique
Kimi K2.6 Moonshot AI 88.1 Open-source, self-host
GPT-5.4 OpenAI 87.6 Usage général
Gemini 3.1 Pro Google 87.3 Multimodal, mobile
Claude Opus 4.6 Anthropic 84.7 Coding, rédaction
GLM-5 (Reasoning) Z.AI 82 Self-host, Chine
Claude Sonnet 4.6 Anthropic 81.4 Rapide, économique
GPT-5.3 Codex OpenAI 80 Coding spécialisé
Grok 4.1 xAI 79 Intégration X/Twitter
GPT-5 (high) OpenAI 78.1 Entrée de gamme

La stratégie de Microsoft est différente

Microsoft ne cherche pas à battre GPT-5.5 au classement. Il construit l'infrastructure (WAF, Foundry Local, Agent Mesh) qui permet d'utiliser n'importe lequel de ces modèles, y compris les siens. C'est une stratégie de plateforme, pas de modèle.


❌ Erreurs courantes

Erreur 1 : Penser que Microsoft rompt totalement avec OpenAI

Ce n'est pas une rupture, c'est une diversification. Microsoft continuera d'utiliser GPT-5.5 et les modèles OpenAI là où ils sont les meilleurs (raisonnement complexe, tâches généralistes). Polaris remplace GPT-4 Turbo sur un segment précis : le coding dans Copilot. Ne surestimez pas la portée immédiate de cette move.

Erreur 2 : Croire que Foundry Local remplace le cloud

Foundry Local est complémentaire, pas substitutif. Pour les tâches sensibles ou les automatisations répétitives, le local est parfait. Pour le raisonnement lourd nécessitant GPT-5.5 ou Claude Opus 4.7, le cloud reste indispensable. La bonne architecture est hybride : local par défaut, cloud en fallback.

Erreur 3 : Ignorer WAF parce que c'est "juste un framework"

Les frameworks open-source gagnent rarement par leurs features initiales. Ils gagnent par l'écosystème qui se construit au-dessus. VS Code n'était rien à sa sortie. Aujourd'hui, c'est l'éditeur dominant. WAF sous licence MIT pourrait suivre la même trajectoire dans l'espace des agents desktop.

Erreur 4 : Sous-estimer l'enjeu de la licence MIT

Une licence MIT signifie que n'importe qui peut fork, modifier, et commercialiser WAF. Y compris les concurrents de Microsoft. C'est un pari risqué mais calculé : mieux vaut un écosystème ouvert où Microsoft est le contributeur principal qu'un écosystème fermé où personne ne vient.


❓ Questions fréquentes

Project Polaris remplacera-t-il tous les modèles OpenAI chez Microsoft ?

Non. Polaris cible spécifiquement le coding dans GitHub Copilot, en remplacement de GPT-4 Turbo. Les produits grand public comme Microsoft 365 Copilot continueront d'utiliser GPT-5.5 et d'autres modèles OpenAI pour le raisonnement complexe.

Windows Agent Framework fonctionne-t-il sur Windows 10 ?

Non. WAF 1.0 nécessite Windows 11 avec les API d'accessibilité modernes et le support NPU. C'est un levier de migration supplémentaire vers Windows 11 pour les entreprises.

Foundry Local peut-il faire tourner GPT-5.5 en local ?

Absolument pas. GPT-5.5 est un modèle cloud-only. Foundry Local exécute des modèles optimisés et quantifiés conçus pour le hardware local (NPU, GPU grand public). La qualité est inférieure mais suffisante pour l'automatisation courante.

Azure Agent Mesh est-il gratuit ?

Non, c'est un service Azure facturé à l'usage. Le coût dépend du nombre d'agents déployés, du volume de requêtes inter-agents, et de la durée d'exécution des workflows. Un modèle de tarification détaillé est disponible sur le portail Azure.

Project Solara sera-t-il commercialisé en 2026 ?

Probablement pas. Microsoft a présenté Solara comme une vision et un prototype. La commercialisation d'un nouveau form factor hardware prend généralement 18 à 36 mois après une démo de ce type. 2028 est un horizon plus réaliste.

La licence MIT de WAF est-elle vraiment irréversible ?

Techniquement oui. Une fois publié sous MIT, le code reste sous MIT. Microsoft pourrait cesser de contribuer ou créer une version propriétaire parallèle, mais le fork open-source existera toujours. C'est un engagement structurel, pas contractuel.


✅ Conclusion

Microsoft Build 2026 marque le moment où Microsoft a cessé d'être le distributeur d'OpenAI pour devenir un acteur IA autonome. Project Polaris dans Copilot, WAF en open-source, Foundry Local pour le edge, Agent Mesh pour le cloud, Solara pour le hardware : chaque pièce de la pile est en place.

La dépendance OpenAI n'est pas finie. Elle est devenue optionnelle. Et dans la tech, optionnel est le premier pas vers obsolète. Pour les développeurs qui veulent comprendre cette nouvelle donne et créer un agent IA dans cet écosystème émergent, le moment de se former est maintenant.