Together AI lève 800 millions de dollars pour démocratiser l'IA open source
🔎 8,3 milliards de dollars pour un pari que les géants de l'IA refusent de faire
Le 1er juillet 2026, Together AI annonçait une levée de fonds de 800 millions de dollars en Series C, propulsant sa valorisation à 8,3 milliards de dollars. Soit un bond de x2,5 par rapport à sa valorisation de 3,3 milliards $ en février 2025, lorsqu'elle avait clôturé un round mené par General Catalyst.
Le détail qui change tout : c'est Aramco Ventures, le bras venture du géant pétrolier saoudien Saudi Aramco, qui mène le round. Nvidia, Vista Equity Partners, General Catalyst et March Capital participent également. Le total des fonds levés depuis la création de l'entreprise atteint désormais 1,3 milliard de dollars.
Selon Reuters, ce round est le signal le plus fort à ce jour que l'infrastructure open source est devenue un marché institutionnel. Pas un pari de fondations idéalistes. Un marché que le capital pétrolier, le capital technologique et le capital privé jugent suffisamment rentable pour y injecter près d'un milliard en une seule transaction.
L'argument de Together AI est simple et radical : les economics des modèles fermés ne scalent pas. Et les chiffres semblent leur donner raison.
L'essentiel
- 800 millions $ levés en Series C, évaluation post-money de 8,3 milliards $ (Reuters, juillet 2026).
- Aramco Ventures lead investor : premier entrée massive du capital moyen-oriental dans l'infra IA open source.
- Bookings annuels > 1,15 milliard $ au dernier trimestre, avec une utilisation des modèles open source qui a triplé en 12 mois (Together AI Blog).
- L'infrastructure de compute prévoit une multiplication par ~50x sur 5 ans (DataCenterDynamics).
- Total funding cumulé : 1,3 milliard $.
Outils recommandés
| Outil | Usage principal | Prix (juin 2025, vérifiez sur together.ai) | Idéal pour |
|---|---|---|---|
| Together AI Inference API | Exécution de modèles open source | À l'usage (pay-per-token) | Entreprises voulant migrer du closed vers l'open |
| Together AI Fine-tuning | Spécialisation de modèles open weight | À l'usage | Équipes ML avec données propriétaires |
| Hostinger | Hébergement web pour apps IA | À partir de 2,99 €/mois | Déployer des interfaces autour des modèles |
Les chiffres qui expliquent tout — Bookings, triplement et seuil symbolique
Together AI ne survit pas de subventions. La company génère des revenus réels, et le communiqué de BusinessWire lève l'ambiguïté : les bookings annuels ont dépassé 1,15 milliard de dollars au dernier trimestre.
Ce n'est pas du revenue recognized, c'est des bookings — des contrats signés. Mais l'ordre de grandeur parle. Pour une entreprise valorisée 8,3 milliards, un run rate de bookings supérieur au milliard donne un multiple raisonnable, pas une bulle méta-universelle.
Le deuxième chiffre clé : l'usage des modèles open source sur la plateforme a triplé en 12 mois. TechTimes le frame clairement : l'inference open source a franchi le seuil du milliard de dollars tandis que les closed models stagnent.
Ce triplement n'est pas un effet de base. C'est un changement de comportement des entreprises. Quand une organisation signe un contrat d'infrastructure IA, elle compare désormais systématiquement le coût par million de tokens entre GPT-5.5 chez OpenAI et un modèle open weight comme DeepSeek V4 Pro (Max) hébergé sur Together AI. Et de plus en plus, le second gagne.
Pourquoi les closed models ne scalent pas — L'argument économique
L'argument central de Together AI, détaillé dans son annonce officielle, repose sur une équation mathématique simple. Les modèles fermés facturent une marge sur deux couches : le modèle lui-même et l'infrastructure de compute.
OpenAI, Anthropic, Google — ils facturent le droit d'utiliser leur modèle propriétaire ET le coût de l'infrastructure qui l'exécute. C'est une double taxation. À petite échelle, c'est invisible. À l'échelle enterprise avec des millions de requêtes par jour, cela devient insoutenable.
Les modèles open source inversent cette logique. Le modèle est gratuit (ou quasi-gratuit via des licences permissives). Vous ne payez que le compute. Et sur le compute, la concurrence entre fournisseurs fait baisser les prix.
Le résultat : pour un cas d'usage de classification de texte à haut volume, le coût par million de tokens sur un modèle comme DeepSeek V4 Pro (High) via Together AI peut être 5 à 10 fois inférieur à celui de GPT-5.5 via l'API OpenAI. La qualité est-elle identique ? Non. DeepSeek V4 Pro (High) score 84 au benchmark général contre 91 pour GPT-5.5. Mais pour 80 % des cas d'usage enterprise, la différence de qualité ne justifie pas un écart de coût de 500 %.
C'est cet arbitrage que les entreprises font massivement depuis 12 mois.
Aramco Ventures en lead — Le capital moyen-oriental entre dans l'infra IA
C'est le signal géopolitique le plus important de cette levée. Quartz le souligne : le round mené par Aramco Ventures marque l'entrée du capital moyen-oriental dans l'infrastructure IA.
L'Arabie Saoudite ne se contente plus d'acheter des GPU. Elle investit dans la couche qui contrôle l'accès aux modèles. C'est stratégiquement différent. Posséder du compute, c'est avoir une capacité. Financer l'infrastructure qui distribue les modèles open source à l'échelle mondiale, c'est avoir une influence.
Le contexte saoudien éclaire ce move. Le royaume a lancé des initiatives massives autour de l'IA, avec un objectif de devenir un hub AI régional. Investir dans Together AI lui donne un accès direct à la pile technologique qui sert les modèles open source les plus performants, dont Kimi K2.6 de Moonshot AI qui atteint 88,1 en score agentic en self-host.
Nvidia participe aussi au round, ce qui n'est pas surprenant mais significatif. Le fabricant de puces valide ainsi le modèle économique de Together AI : plus l'open source se démocratise, plus les GPU se vendent. C'est un cercle vertueux pour Nvidia, qui n'a aucun intérêt à ce que seuls les modèles fermés d'OpenAI et Anthropic dominent le marché.
Neocloud — Together AI n'est pas un cloud classique
TechCrunch désigne Together AI comme un « neocloud » — une nouvelle génération de fournisseurs cloud dédiés exclusivement au hosting et à l'exécution de modèles d'IA.
La différence avec AWS, Azure ou GCP est fondamentale. Les hyperscalers sont des generalists. Ils vendent du stockage, du compute, des bases de données, du networking. L'IA est une ligne de revenus parmi d'autres. Leur optimisation ne se fait pas au niveau du token, mais au niveau de l'instance.
Un neocloud comme Together AI optimise chaque couche pour un seul objectif : faire tourner des modèles de langage le plus efficacement possible. Cela inclut des optimisations matérielles (choix précis de configurations GPU), logicielles (kernel custom, scheduling optimisé) et d'architecture (routing intelligent entre modèles selon la complexité de la requête).
PYMNTS insiste sur cet aspect : Together AI ne vend pas du cloud, il vend de l'exécution de modèles open source à moindre coût. Le positionnement est précis et différencié.
Cette spécialisation permet des performances par dollar de compute nettement supérieures. Quand vous déployez un modèle sur AWS, vous payez la marge générale d'Amazon. Quand vous le déployez sur Together AI, vous payez la marge d'une entreprise dont toute l'architecture est conçue pour minimiser le coût par token.
50x de compute en 5 ans — Ce que ça signifie concrètement
DataCenterDynamics rapporte que Together AI prévoit de multiplier son infrastructure de compute par environ 50x sur les 5 prochaines années. C'est un chiffre vertigineux qui mérite d'être décortiqué.
50x de compute, cela ne signifie pas 50x plus de data centers. Cela signifie des sauts générationnels successifs en hardware (H200 → B200 →下一代), des optimisations logicielles continues, et une expansion géographique vers de nouvelles régions où le coût de l'énergie est faible.
C'est là que le partenariat avec Aramco Ventures prend tout son sens. L'Arabie Saoudite dispose d'énergie à bas coût et de projets d'infrastructures massifs. Un neocloud qui veut scaler 50x a besoin de deux choses : du capital et de l'énergie bon marché. Aramco apporte potentiellement les deux.
Pour les utilisateurs, cette expansion se traduira par des prix par token en baisse continue et une disponibilité géographique accrue. Aujourd'hui, la latence est un frein réel à l'adoption de l'open source en Europe. Des régions de compute plus proches résoudront partiellement ce problème.
La guerre de l'inference — Open source vs modèles fermés
La bataille entre open source et modèles fermés a changé de nature. Il ne s'agit plus d'un débat philosophique sur l'ouverture. Il s'agit d'un débat économique sur le coût marginal de l'intelligence.
Prenons un exemple concret. Une entreprise de e-commerce veut classifier 10 millions de requêtes client par jour et générer des réponses automatisées. Avec GPT-5.4 Pro d'OpenAI (score 91), le coût mensuel d'inference serait significatif. Avec Claude Sonnet 4.6 d'Anthropic (score 83), légèrement inférieur mais toujours élevé.
En basculant vers DeepSeek V4 Pro (High) (score 84) ou Kimi K2.6 (score 84) hébergés sur Together AI, le coût chute drastiquement. La qualité est comparable à Claude Sonnet 4.6 pour une fraction du prix. Et pour les cas où le maximum de qualité est requis, l'entreprise peut router uniquement ces requêtes vers un modèle fermé — une stratégie de routing hybride que les neoclouds rendent triviale à implémenter.
EnterpriseDNA note que le focus explicite de Together AI avec cette levée est de réduire les coûts d'inference pour les modèles open source en entreprise. C'est le bon message au bon moment. Les entreprises ont compris que l'IA n'est pas un projet, c'est une infrastructure. Et comme toute infrastructure, le coût récurrent est le critère décisif.
Optimisations techniques — OSCAR et la réduction de mémoire
L'avantage de Together AI ne repose pas uniquement sur le volume de compute. Il repose aussi sur des innovations logicielles qui maximisent l'efficacité de ce compute. Un exemple récent et significatif : OSCAR, la quantification KV cache 2-bit open-sourcée par Together AI qui réduit la mémoire par 8.
Le KV cache est l'un des principaux goulots d'étranglement de l'inference de modèles de langage. Plus le contexte est long, plus le cache grossit, plus la mémoire requise explose. OSCAR résout ce problème en quantifiant le cache à 2 bits, permettant de servir des requêtes à contexte long sur le même hardware qui auparavant ne pouvait gérer que des contextes courts.
C'est le type d'innovation qui fait la différence entre un fournisseur de compute générique et un neocloud spécialisé. AWS ne va pas optimiser le KV cache d'un modèle open source spécifique. Together AI, si. Parce que c'est son métier.
Ces optimisations se cumulent. Moins de mémoire par requête signifie plus de requêtes simultanées par GPU. Plus de requêtes simultanées signifie un meilleur amortissement du hardware. Un meilleur amortissement signifie des prix plus bas. Le cercle vertueux est en place.
Souveraineté AI — Pourquoi l'open source est un enjeu géopolitique
Au-delà de l'économie, la levée de Together AI touche à un enjeu plus profond : la souveraineté technologique. Quand une entreprise européenne ou asiatique dépend exclusivement des API d'OpenAI (américain) ou d'Anthropic (américain), elle prend un risque géopolitique.
Les modèles open source offrent une alternative. Vous téléchargez les poids, vous les hébergez où vous voulez, vous les contrôlez. La fondation Sentient, qui a levé 42 millions de dollars pour l'AGI open source, poursuit un objectif similaire : s'assurer que l'intelligence artificielle de pointe ne soit pas la propriété exclusive de deux ou trois entreprises californiennes.
Together AI, en rendant l'exécution de ces modèles open source abordable et scalable, est l'infrastructure de cette souveraineté. Sans un neocloud efficace, l'open source reste un jouet de chercheurs. Avec Together AI, il devient une alternative viable pour des entreprises de toute taille.
C'est aussi pour cela que des acteurs comme Moonshot AI, qui a levé 2 milliards de dollars avec son modèle Kimi K2.6, misent sur l'open weight. Leur stratégie : développer le meilleur modèle possible, le publier en open weight, et laisser l'écosystème (dont Together AI) se charger de la distribution. Le modèle gagne en adoption, l'entreprise gagne en influence.
Ollama et le local — L'écosystème open source est complet
L'infrastructure cloud de Together AI n'est que la face visible de l'écosystème open source. En complément, des outils comme ceux permettant de créer des agents IA open source avec Ollama en local offrent une alternative totalement décentralisée.
Le spectre est désormais complet. Vous pouvez exécuter un modèle localement sur votre machine avec Ollama pour le développement et le prototypage. Puis, quand vous passez en production, déployer le même modèle sur Together AI pour bénéficier de la scalabilité et de la faible latence. Même famille de modèles, même format de poids, mais deux infrastructures d'exécution adaptées à deux besoins différents.
C'est une flexibilité que les modèles fermés ne peuvent tout simplement pas offrir. Vous ne pouvez pas faire tourner GPT-5.5 en local. Vous ne pouvez pas le déplacer d'un fournisseur à un autre. Vous êtes captif.
L'open source brise cette captivité. Et Together AI monetise cette rupture.
Comparatif rapide — Modèles open source pertinents sur Together AI
| Modèle | Éditeur | Score général | Score agentic (self-host) | Intérêt sur Together AI |
|---|---|---|---|---|
| DeepSeek V4 Pro (Max) | DeepSeek | 88 | — | Meilleur rapport qualité/prix open source |
| DeepSeek V4 Pro (High) | DeepSeek | 84 | — | Alternative fiable à Claude Sonnet 4.6 |
| Kimi K2.6 | Moonshot AI | 84 | 88,1 | Meilleur score agentic open weight en self-host |
| GLM-5.1 | Z.AI | 83 | — | Modèle chinois performant, bon marché |
| Claude Sonnet 4.6 | Anthropic | 83 | 81,4 | Benchmark de référence (closed source) |
| GPT-5.4 | OpenAI | 89 | 87,6 | Benchmark haut de gamme (closed source) |
Ce tableau illustre le point clé : les modèles open source comme DeepSeek V4 Pro (Max) à 88 points sont désormais à un cheveu des modèles fermés comme GPT-5.4 à 89 points. L'écart de qualité ne justifie plus systématiquement le surcoût.
❌ Erreurs courantes
Erreur 1 : Confondre open source et gratuité totale
L'open source ne signifie pas que tout est gratuit. Les poids du modèle sont libres, mais le compute pour les exécuter a un coût. Together AI monétise précisément cette couche compute. Penser que l'open source élimine tous les coûts, c'est ignorer que l'infrastructure est le vrai poste de dépense en IA.
Erreur 2 : Croire que l'open source est inférieur en qualité
En 2026, DeepSeek V4 Pro (Max) score 88, à deux points de GPT-5.5 (91). Kimi K2.6 atteint 88,1 en agentic self-host, dépassant GPT-5.4 (87,6) dans cette configuration. L'écart de qualité entre open et closed a quasiment disparu pour la majorité des cas d'usage.
Erreur 3 : Ignorer la latence géographique
Déployer sur un neocloud sans vérifier la localisation des data centers est une erreur. Si vos utilisateurs sont en Europe et que le compute est aux États-Unis, la latence dégradera l'expérience. Vérifiez les régions disponibles avant de migrer.
Erreur 4 : Sous-estimer le coût de migration
Migrer d'un modèle fermé à un modèle open source n'est pas un simple changement d'URL d'API. Les formats de réponse, les tokenizers, les comportements de système prompt diffèrent. Prévoyez un budget de réglage fin post-migration.
❓ Questions fréquentes
Qui est Aramco Ventures et pourquoi ce choix surprend ?
Aramco Ventures est le bras capital-risque de Saudi Aramco, le géant pétrolier saoudien. Ce choix surprend car c'est le premier investissement moyen-oriental majeur dans l'infra IA open source occidentale. Il signale une stratégie de diversification géopolitique au-delà du pétrole.
Together AI est-il rentable ?
Les bookings annuels dépassent 1,15 milliard $, mais les bookings ne sont pas le revenue reconnu. L'entreprise est probablement encore en perte à cause des investissements massifs en infrastructure, mais la trajectoire de revenus justifie la valorisation.
Quel est le meilleur modèle open source à utiliser sur Together AI ?
Pour un usage général, DeepSeek V4 Pro (Max) offre le meilleur rapport qualité/prix avec un score de 88. Pour les tâches agentic en self-host, Kimi K2.6 domine avec 88,1. Le choix dépend de votre cas d'usage spécifique.
Cette levée menace-t-elle directement OpenAI et Anthropic ?
Pas à court terme. OpenAI et Anthropic dominent encore le segment premium. Mais Together AI s'attaque au volume, c'est-à-dire à la base de la pyramide. Si les entreprises migrent massivement leurs cas d'usage "suffisamment bons" vers l'open source, le revenue des modèles fermés sera pressé par le bas.
Puis-je utiliser Together AI depuis l'Europe ?
Oui, via API. La question pertinente est plutôt : où se trouvent les data centers les plus proches de vos utilisateurs ? Together AI étend son infrastructure, mais vérifiez la couverture régionale pour votre cas d'usage spécifique avant de vous engager.
✅ Conclusion
Together AI vient de lever 800 millions de dollars non pas parce que l'open source est un idéal, mais parce que ses economics écrasent ceux des modèles fermés à l'échelle enterprise. Avec 1,15 milliard $ de bookings annuels, un triplement de l'usage open source en 12 mois et une infrastructure prévue en croissance 50x, le neocloud a passé le point de non-retour. L'entrée d'Aramco Ventures ajoute une dimension géopolitique qui rend cette levée stratégiquement irréversible. L'open source n'est plus l'alternative bon marché — il devient l'infrastructure par défaut.