GitHub Copilot passe aux AI Credits : fin du flat-rate et colère des développeurs
🔎 Le 1er juin 2026, 4,7 millions de développeurs ont découvert leur nouvelle facture
Le 28 avril 2026, GitHub annonçait dans un billet officiel la fin du modèle Premium Request Units (PRUs). Depuis le 1er juin, chaque interaction Copilot est facturée en tokens via un système appelé AI Credits. Le changement semblait technique. Il est en réalité financier, massif, et profondément impopulaire.
En 72 heures, les forums GitHub Community, Reddit et X ont explosé de témoignages de développeurs découvrant des prévisions de factures multipliées par 10, 20, parfois 50. Un cas documenté par Working Ref fait état d'une projection passée de 39,07$ à 902,72$ pour un usage identique.
Ce basculement n'est pas un simple ajustement tarifaire. C'est un changement de modèle économique qui redéfinit la relation entre GitHub et ses utilisateurs les plus engagés — ceux précisément qui adoptent les workflows agentic.
L'essentiel
- Les Premium Request Units (PRUs) sont supprimées depuis le 1er juin 2026, remplacées par des AI Credits facturés au token.
- Chaque modèle a son propre coût par token : Claude Opus 4.7 coûte 27 fois plus cher que GPT-5.4 en termes de consommation de crédits.
- Les utilisateurs agentic sont les plus touchés : des hausses de 10x à 50x sont documentées, avec un cas extrême à 902$ pour un ancien forfait à 39$.
- 4,7 millions d'abonnés payants sont impactés, mais les workloads agentic concentrent l'essentiel de la hausse.
- Le marché réagit : Cursor, Claude Code et OpenAI Codex deviennent des alternatives crédibles, comme le confirme le Gartner MQ 2026.
- Le risque de lock-in augmente : les crédits achetés sont non remboursables et non transférables.
Outils recommandés
| Outil | Usage principal | Prix (juin 2026, vérifiez sur site) | Idéal pour |
|---|---|---|---|
| Cursor | IDE avec IA intégrée | 20$/mois | Développeurs cherchant une alternative directe à Copilot |
| Claude Code | Agent de coding terminal | API directe | Workflows agentic lourds sans surcoût d'intermédiaire |
| OpenAI Codex | Agent de coding cloud | Facturation API | Équipes enterprise avec infrastructure existante |
| Cline | Agent VS Code open-source | Gratuit (apporte votre clé API) | Développeurs autonomes voulant maîtriser leurs coûts |
Ce qui change exactement le 1er juin 2026
Le principe est simple en apparence, complexe en pratique. Avant juin 2026, Copilot fonctionnait avec des PRUs : chaque requête consommait une unité, peu importe le modèle choisi ou la longueur du contexte. Le système était prévisible. Un abonnement à 39$/mois donnait droit à un quota mensuel de requêtes, avec un coût supplémentaire modéré au-delà.
Désormais, tout se mesure en tokens. Un token représente environ 0,75 mot en anglais (un peu moins en français). Chaque interaction Copilot — complétion inline, chat, appel agentic dans VS Code ou GitHub Actions — consomme des tokens en entrée (votre prompt + contexte) et en sortie (la réponse générée).
La documentation officielle GitHub publie une grille de tarification par modèle. Chaque modèle a un « multiplicateur de crédits » qui détermine combien d'AI Credits consomme un token de ce modèle.
La grille des multiplicateurs, le vrai problème
D'après les données compilées par SeptimLabs et CodePick, les écarts entre modèles sont vertigineux :
| Modèle | Multiplicateur de crédits | Coût relatif par token |
|---|---|---|
| GPT-5.4 | 1x | Référence |
| GPT-5.5 | 3x | 3x plus cher |
| Claude Sonnet 4.6 | 8x | 8x plus cher |
| Claude Opus 4.7 (Adaptive) | 27x | 27x plus cher |
| Gemini 3 Pro Deep Think | 15x | 15x plus cher |
Ces multiplicateurs signifient concrètement qu'un développeur qui utilise Claude Opus 4.7 en mode agentic — exactement le type de workflow que GitHub poussait activement depuis fin 2025 — voit ses coûts multipliés par 27 par rapport à un usage basique sur GPT-5.4.
Le problème n'est pas le prix du modèle en soi. C'est que GitHub ne communiquait pas ces multiplicateurs de manière transparente avant la bascule. Les développeurs utilisaient Claude Opus en pensant que cela comptait pour une « requête » comme une autre.
Qui perd quoi : la comparaison avant/après
Pour comprendre l'impact réel, il faut distinguer trois profils d'usage. Le détail complet est disponible sur le calculateur de SeptimLabs, mais voici les projections mensuelles documentées.
Profil 1 : développeur occasionnel (complétions inline + chat léger)
Ce profil utilise principalement les complétions de code dans l'éditeur et quelques requêtes chat par jour sur GPT-5.4. Avant : 39$/mois fixes, jamais de dépassement. Après : environ 32$ à 45$/mois selon l'usage. Impact faible, parfois même une légère baisse.
Profil 2 : développeur intensif (chat fréquent + GPT-5.5)
Utilisation régulière du chat avec GPT-5.5 pour la revue de code, le refactoring, l'écriture de tests. Avant : 39$/mois avec quelques dépassements ponctuels à 50-60$. Après : 80$ à 150$/mois selon le volume de contexte injecté. Impact modéré à fort.
Profil 3 : utilisateur agentic (Copilot Agent avec Claude Opus 4.7)
C'est le profil qui explose. Un développeur qui laisse Copilot Agent exécuter des tâches multi-fichiers avec Claude Opus 4.7, plusieurs fois par jour. Le contexte accumulé par l'agent (fichiers lus, historique de conversation, résultats intermédiaires) gonfle la consommation en entrée.
Le cas documenté par Working Ref est éclairant : 902,72$ projetés pour un usage qui coûtait 39,07$ en PRUs. Soit un multiplicateur de 23x. D'après How2Shout, certains développeurs alertent sur des trajets de 29$ à 750$/mois.
Pourquoi les agents sont-ils si gourmands ?
Un agent Copilot ne fait pas qu'un appel. Il lit des fichiers, analyse le contexte, planifie des étapes, exécute des commandes, itère. Chaque étape envoie des tokens en entrée (souvent 50 000 à 200 000 tokens de contexte) et reçoit des tokens en sortie. Avec Claude Opus 4.7 et son multiplicateur de 27x, une seule session agentic complexe peut consommer l'équivalent de centaines de requêtes « classiques ».
C'est précisément le paradoxe : GitHub a massivement poussé les workflows agentic comme l'avenir du développement, puis a tarifié ces mêmes workflows de façon rétroactive et punitive.
La stratégie de monétisation de Microsoft/GitHub décryptée
Passer d'un système par requêtes à un système par tokens n'est pas un hasard technique. C'est une décision stratégique dont SmartScope analyse les mécanismes de lock-in.
Du buffet à la carte : capter la valeur des usages avancés
Le modèle PRUs était un buffet à prix fixe. Les utilisateurs légers subventionnaient les utilisateurs lourds. Ce modèle fonctionne quand l'usage est homogène. Il devient intenable quand 10% des utilisateurs (les agentic) consomment 80% des ressources.
Le passage aux tokens résout ce problème pour GitHub : chaque utilisateur paie exactement ce qu'il consomme, au modèle près. Mais surtout, le système par tokens permet de capturer la valeur des modèles premium (Claude Opus, Gemini Deep Think) dont le coût d'infrastructure est significativement plus élevé pour GitHub.
L'opacité comme levier de revenus
Le système PRUs était transparent : une requête = une unité. Le système AI Credits est opaque par construction. Le développeur ne sait pas exactement combien de tokens va consommer son prochaine requête agentic, car cela dépend du contexte accumulé, de la longueur des fichiers ouverts, du modèle sélectionné.
Cette opacité n'est pas un bug. Elle rend la prévision budgétaire quasi impossible pour les équipes, ce qui pousse naturellement vers l'achat de crédits supplémentaires « par sécurité » — crédits qui sont, selon les conditions de GitHub, non remboursables.
Le parallèle avec le cloud computing
La stratégie rappelle le modèle AWS/Azure : un tarif attractif à l'entrée, une facturation à l'usage qui semble raisonnable au début, puis une complexité croissante qui rend l'estimation des coûts impossible sans des outils de monitoring dédiés. GitHub ne propose pas de tel outil de prévision en temps réel dans l'IDE. Le développeur découvre sa consommation a posteriori.
Comme le note l'article de Défense-Sud-Est, c'est la fin d'une ère : celle où le développeur individuel pouvait utiliser un outil IA de manière quasi illimitée pour un prix fixe prévisible.
Le backlash : réactions de la communauté développeur
La colère n'est pas un surréaction de quelques utilisateurs pingres. Elle est structurelle et repose sur trois griefs principaux documentés par NotebookCheck et les forums communautaires.
Grief 1 : le changement rétroactif
Les développeurs ont adopté des workflows agentic sur la base d'un tarif flat-rate. Modifier les règles du jeu après que les habitudes sont prises crée un sentiment de piège. « J'ai structuré tout mon workflow autour de Copilot Agent avec Claude Opus. Maintenant on me dit que ça coûte 900$/mois. Je n'aurais jamais commencé si j'avais su » — commentaire récurrent sur GitHub Community.
Grief 2 : l'absence de garde-fous
Aucun plafond de dépense n'est activé par défaut. Un développeur peut théoriquement consommer des milliers de dollars en une journée sans alerte en temps réel dans son IDE. GitHub a ajouté un tableau de bord de consommation, mais il n'est pas proactif. C'est au développeur de le consulter.
Grief 3 : le sentiment de double facturation
GitHub facture les AI Credits, mais les modèles sous-jacents (GPT-5.5, Claude Opus 4.7) sont fournis par OpenAI et Anthropic, qui facturent déjà GitHub aux tokens. Le développeur a le sentiment de payer une marge significative sur chaque token, sans valeur ajoutée proportionnelle par rapport à un appel API direct. SeptimLabs a calculé que Copilot applique un markup de 2x à 5x par rapport au coût API direct pour les modèles non-OpenAI.
La fuite a déjà commencé
D'après nxcode, un nombre croissant de développeurs migrent vers des alternatives. Le mouvement s'accélère depuis l'annonce du 28 avril, avec un pic le 1er juin lors des premières factures réelles.
Les alternatives : qui gagne dans ce chaos ?
Le backlash profite directement aux concurrents. Le Gartner MQ 2026 positionne Cursor, OpenAI Codex et GitHub Copilot comme les trois leaders des agents de coding entreprise, mais la dynamique est en train de basculer.
Cursor : le grand gagnant immédiat
Cursor est probablement la alternative la plus naturelle pour un utilisateur Copilot. L'IDE basé sur VS Code offre des fonctionnalités comparables (complétions, chat, agents multi-fichiers) avec un modèle de tarification plus prévisible. À 20$/mois, le plan Pro de Cursor inclut un quota généreux qui couvre la plupart des usages agentic sans surprise.
La migration est simple : Cursor est un fork de VS Code, les extensions et raccourcis sont compatibles. Notre guide des meilleurs outils IA pour le code détaille les différences de fonctionnement.
Claude Code : pour les développeurs qui veulent du contrôle
Claude Code d'Anthropic est un agent de coding en ligne de commande. Il ne passe pas par un intermédiaire qui ajoute un markup. Vous payez les tokens Anthropic directement via votre clé API. Pour un usage agentic intensif avec Claude Opus 4.7 (scoré 94.3 en agentic selon les benchmarks), c'est souvent 2 à 5 fois moins cher que le même usage via Copilot.
Le compromis : pas d'IDE intégré, configuration manuelle, et il faut gérer soi-même sa clé API. C'est l'option du développeur senior qui maîtrise son infrastructure.
OpenAI Codex : l'agent cloud natif
OpenAI Codex, scoré 80 en agentic, est l'agent de coding cloud d'OpenAI. Il fonctionne dans un sandbox dédié et est facturé directement via l'API OpenAI. Pour les équipes déjà dans l'écosystème OpenAI, c'est une transition naturelle depuis Copilot (qui utilisait déjà les modèles GPT sous-jacents).
Cline et les agents open-source : l'option radicale
Cline, disponible dans notre comparatif des meilleurs outils IA pour le code, est un agent open-source pour VS Code qui fonctionne avec n'importe quelle clé API. Vous choisissez votre modèle (GPT-5.4, Claude Sonnet 4.6, DeepSeek V4 Pro), vous payez ce que vous consommez, sans intermédiaire. C'est l'anti-lock-in par définition.
Pour les équipes qui veulent aller plus loin dans l'orchestration multi-agent, des plateformes comme ruflo gagnent en traction sur GitHub précisément grâce à ce besoin de contrôle et de flexibilité.
Impact sur les équipes et les entreprises
Le passage aux AI Credits ne touche pas que les développeurs individuels. Il bouleverse la gestion budgétaire des équipes engineering.
Le cauchemar du responsable budgétaire
Avant juin 2026, le coût Copilot d'une équipe de 20 développeurs était prévisible : 20 × 39$ = 780$/mois, plus un petit dépassement. Aujourd'hui, ce même coût peut varier de 780$ à 5 000$+ selon les workflows adoptés, les modèles choisis, et la complexité des tâches du mois.
Aucun outil de budgeting ne permet à un CTO de dire « on alloue X$ par développeur par mois pour Copilot » avec une marge d'erreur inférieure à 50%. C'est ingérable.
Les crédits non remboursables : un risque financier
GitHub vend des packs de crédits supplémentaires. Ces crédits n'ont pas de date d'expiration, mais ils ne sont pas remboursables. Une équipe qui achète 500$ de crédits en prévision d'un sprint intensif, puis voit le sprint annulé ou reporté, a 500$ bloqués dans l'écosystème Copilot. C'est un lock-in financier discret mais réel.
La réaction enterprise : négocier ou fuir
Les grands comptes avec des contrats enterprise GitHub ont des leviers de négociation que les développeurs individuels n'ont pas. Mais même là, le signal envoyé est négatif : si les termes peuvent changer du jour au lendemain avec un impact de 10x à 50x sur la facture, la confiance contractuelle est érodée.
Ce que cette bascule révèle sur le marché de l'IA pour le code
Au-delà du cas Copilot, ce changement illustre trois tendances structurelles du marché de l'IA pour le code en 2026.
La fin de l'illusion du « tout-you-can-eat » IA
L'ère où les outils IA pouvaient offrir un accès illimité pour un prix fixe touche à sa fin partout. La réalité des coûts d'infrastructure (GPU, inference scaling, modèles premium) rattrape les modèles de tarification agressifs adoptés pour la conquête de marché. Copilot est le premier outil majeur à franchir le Rubicon, mais il ne sera pas le dernier.
La bataille se déplace de l'IDE vers l'agent
Les complétions inline sont devenues un commodity. La vraie valeur est dans les agents capables d'exécuter des tâches multi-étapes, de lire des codebases entières, de modifier plusieurs fichiers. C'est exactement ce que Copilot a poussé, et c'est exactement ce qu'il tarifie désormais au prix fort. Le paradoxe est complet.
La transparence deviendra un avantage compétitif
Les outils qui offriront une visibilité en temps réel sur la consommation de tokens, des plafonds configurables par utilisateur et par modèle, et une facturation prévisible gagneront des parts de marché. Cursor commence à le faire. Copilot ne le fait pas encore suffisamment.
❌ Erreurs courantes
Erreur 1 : continuer à utiliser Claude Opus 4.7 dans Copilot sans monitoring
Claude Opus 4.7 a un multiplicateur de 27x. L'utiliser en mode agentic sans surveiller sa consommation revient à laisser un compteur de taxi tourner sans regarder. La solution : basculer sur GPT-5.4 pour les tâches courantes, réserver Claude Opus aux cas où sa supériorité (94.3 en agentic) est démontrée, ou migrer vers Claude Code en direct.
Erreur 2 : ne pas configurer de plafond de dépense
GitHub permet de configurer des alertes de consommation, mais ce n'est pas activé par défaut. Ne pas le faire dès le 1er juin est une erreur budgétaire. Configurez un plafond dans les paramètres de votre organisation GitHub immédiatement.
Erreur 3 : croire que le plan Enterprise vous protège
Le plan Enterprise à 79$/mois inclut plus de crédits, mais le modèle de facturation est identique. Une équipe enterprise agressive sur Claude Opus 4.7 peut tout aussi bien voir sa facture exploser. Le plan Enterprise ne vous protège pas de la facturation à l'usage, il repousse juste le seuil.
Erreur 4 : ignorer le coût du contexte en entrée
Beaucoup de développeurs se focalisent sur la longueur de la réponse générée. Mais dans un workflow agentic, le coût en tokens d'entrée (fichiers lus, historique, plan de l'agent) représente souvent 70 à 80% de la facture. Réduire le contexte injecté (fermer les onglets inutiles, cibler les fichiers pertinents) a un impact plus fort que réduire la longueur des requêtes.
❓ Questions fréquentes
Les AI Credits remplacent-ils totalement les PRUs ?
Oui. Depuis le 1er juin 2026, les PRUs n'existent plus. Tout est converti en AI Credits facturés au token selon le modèle utilisé. Il n'y a pas de période de transition ou de double comptage.
Puis-je encore utiliser Copilot pour un prix prévisible ?
Partiellement. Si vous utilisez exclusivement GPT-5.4 en complétions inline et chat léger, votre facture restera proche des 39$/mois. Dès que vous basculez sur un modèle premium ou un workflow agentic, la prévisibilité disparaît.
Combien coûte réellement Claude Opus 4.7 via Copilot vs l'API directe ?
Selon les calculs de SeptimLabs, le markup est de 2x à 5x par rapport à un appel API direct Anthropic. Pour un même usage agentic, passer par Copilot coûte significativement plus cher qu'utiliser Claude Code avec votre propre clé API.
Les crédits achetés en surplus sont-ils remboursables ?
Non. Les crédits AI supplémentaires achetés sur GitHub ne sont ni remboursables ni transférables. C'est un investissement bloqué dans l'écosystème Copilot, ce qui renforce le lock-in analysé par SmartScope.
Cursor est-il vraiment une alternative viable ?
Oui, pour la majorité des usages. Cursor offre des complétions, du chat et des agents multi-fichiers dans un IDE compatible VS Code, pour 20$/mois avec un quota qui couvre la plupart des besoins. Notre guide des meilleurs outils IA pour le code compare les deux en détail.
✅ Conclusion
Le passage de GitHub Copilot aux AI Credits est un tournant : il marque la fin de l'abonnement IA prévisible pour les développeurs et instaure un modèle opaque où les utilisateurs agentic paient le prix fort pour les workflows que GitHub leur a vendus comme l'avenir. Face à des hausses documentées de 10x à 50x et un lock-in renforcé par des crédits non remboursables, la migration vers des alternatives comme Cursor, Claude Code ou Cline n'est plus une option de confort — c'est une question de survie budgétaire. Pour comprendre tous les enjeux de ce basculement, consultez notre analyse détaillée : GitHub Copilot passe au token billing : fin de l'abonnement, début de la facture à l'usage.