📑 Table des matières

Recursive Superintelligence lève 650M$ : Richard Socher, Tim Rocktäschel et Jeff Clune veulent construire une IA qui s'améliore seule

Funding & Startup 🟢 Débutant ⏱️ 16 min de lecture 📅 2026-05-23

Recursive Superintelligence lève 650M$ : Richard Socher, Tim Rocktäschel et Jeff Clune veulent construire une IA qui s'améliore seule

🔎 650 millions de dollars, zéro produit public, quatre mois d'existence

Mai 2026. Une startup sort du stealth et lève 650 millions de dollars à une valuation de 4,65 milliards de dollars. Aucun produit commercial, aucune démo publique, aucun utilisateur. Juste une idée : construire une intelligence artificielle capable de s'améliorer elle-même, indéfiniment, sans intervention humaine.

C'est Recursive Superintelligence (RSI), cofondée par Richard Socher (ex-CTO de Salesforce), Tim Rocktäschel (ex-Google DeepMind), Jeff Clune (ex-OpenAI) et Caiming Xiong. Selon le New York Times, huit chercheurs de haut niveau ont rejoint cette effort dès le départ. Nvidia et GV (Google Ventures) ont co-dirigé le tour, avec la participation de GreyCroft et AMD.

Le timing n'est pas anodin. Alors que Moonshot AI lève 2 milliards de dollars : Kimi K2.6 domine l'open-weight et la Chine accélère dans la course à l'IA et que les modèles comme GPT-5.5 d'OpenAI ou Claude Opus 4.7 d'Anthropic poussent les benchmarks agentic vers les 98 points, la question n'est plus "peut-on faire mieux que l'humain sur une tâche" mais "peut-on faire en sorte que la machine fasse le travail de découverte toute seule".

Recursive Superintelligence parie que oui. Et les investisseurs lui donnent les moyens de le prouver.


L'essentiel

  • 650M$ levés à 4,65B$ de valuation en mai 2026, quatre mois après la fondation. Co-dirigé par Nvidia et GV (Google Ventures), avec GreyCroft et AMD.
  • La thèse : l'amélioration récursive (recursive self-improvement) est le chemin le plus probable vers la superintelligence. L'IA génère ses propres expériences, en tire des leçons, et itère sans aide humaine.
  • L'équipe : Richard Socher (GloVe, TreeRNNs, ex-Salesforce), Tim Rocktäschel (ex-DeepMind), Jeff Clune (ex-OpenAI), Caiming Xiong — 25+ chercheurs venus d'OpenAI, DeepMind, Meta, Uber AI.
  • Le produit : inexistant publiquement. Pas de démo, pas d'API, pas de waitlist. RSI est un labo de recherche pur à ce stade.
  • Le contexte : c'est potentiellement le plus gros seed de l'histoire de la tech. Le précédent record tourne autour de 200-300M$ pour des sorties de stealth.

Outils recommandés

Outil Usage principal Prix (juin 2025, vérifiez sur site) Idéal pour
Hostinger Hébergement web pour projets IA À partir de 2,99€/mois Déployer des dashboards de monitoring IA
GPT-5.5 (OpenAI) Benchmarking agentic de référence Via API OpenAI Comparer les performances des modèles actuels
Claude Opus 4.7 (Anthropic) Raisonnement long et analyse critique Via API Anthropic Analyser les publications de recherche RSI
Gemini 3 Pro Deep Think (Google) Raisonnement profond multi-étapes Via Google AI Studio Évaluer la faisabilité de l'auto-amélioration

L'équipe : pourquoi ces quatre-là changent tout

Richard Socher n'est pas un inconnu. C'est l'un des chercheurs les plus cités de l'histoire du NLP. Ses travaux à Stanford sur GloVe et les TreeRNNs ont posé les fondations des architectures de langage modernes. Après Salesforce, il a fondé You.com avant de se lancer dans ce qui est clairement son projet le plus ambitieux.

Tim Rocktäschel vient de Google DeepMind, où il a travaillé sur l'apprentissage par renforcement et les agents autonomes. Son expertise dans les systèmes qui apprennent par interaction avec un environnement est directement pertinente pour la vision de RSI.

Jeff Clune, ancien chercheur chez OpenAI, est spécialisé dans l'évolution artificielle et l'apprentissage auto-supervisé. Il a publié sur la notion de "quality diversity" — l'idée qu'un système doit explorer un espace de solutions large plutôt que converger trop vite.

Caiming Xiong complète le tableau avec une expertise en traitement du langage et en architectures multimodales.

L'équipe compte au total 25+ personnes, toutes issues de labs de pointe. C'est un profil typique des nouvelles startups "frontier AI" : peu de personnes, énormément de talent par tête. La différence ici, c'est la profondeur cumulée en recherche fondamentale. Ce ne sont pas des ingénieurs produit. Ce sont des scientifiques.


La vision : l'amélioration récursive, c'est quoi exactement ?

L'idée n'est pas nouvelle. I.J. Good la décrivait déjà en 1965 sous le nom d'"explosion d'intelligence". Le principe : si une machine intelligente peut créer une machine plus intelligente qu'elle, alors cette nouvelle machine peut créer une encore plus intelligente, et ainsi de suite — une boucle exponentielle.

Ce que RSI propose de concrétiser, c'est la version algorithmique de cette idée. Selon GV (Google Ventures), la startup veut développer "des algorithmes ouverts qui génèrent une découverte scientifique sans fin". Concrètement, cela signifie un système qui :

  1. Formule une hypothèse
  2. Conçoit une expérience pour la tester
  3. Exécute l'expérience (en simulation ou dans le monde réel)
  4. Analyse les résultats
  5. Met à jour ses propres capacités en conséquence
  6. Recommence, en étant plus compétent qu'au cycle précédent

La distinction clé avec l'approche actuelle (type GPT-5.5 ou Claude Opus 4.7) est que ces modèles sont entraînés une fois, puis déployés. Leurs capacités sont figées après l'entraînement. RSI veut un système dont les capacités croissent en continu pendant le déploiement.

C'est un changement de paradigme fondamental. On passe du "pré-entraîner puis servir" au "apprendre puis améliorer puis servir puis améliorer". Le défi technique est colossal, mais si quelqu'un peut le résoudre, c'est probablement cette équipe.


Les investisseurs : Nvidia et GV ne parient pas à l'aveugle

Nvidia et GV (Google Ventures) en co-lead, c'est inhabituel. Les deux firmes ont des stratégies d'investissement en IA très différentes.

Nvidia investit dans ce qui va augmenter la demande de compute. Une IA qui s'améliore indéfiniment consomme théoriquement une quantité croissante de GPU. C'est un pari sur l'infrastructure autant que sur la recherche.

GV, le bras venture de Google, parie sur la direction scientifique. Leur propre article sur l'investissement est remarquablement précis sur la thèse : ils croient que l'amélioration récursive est "le chemin vers la superintelligence". Ce n'est pas un investissement de diversification. C'est un positionnement philosophique.

GreyCroft et AMD complètent le tour. La présence d'AMD est notable : elle suggère que RSI ne veut pas dépendre exclusivement de l'écosystème Nvidia, ce qui serait cohérent avec une vision à long terme où le coût du compute est un facteur limitant.

Le signal le plus fort, c'est le montant. 650M$ pour une startup sans produit, c'est sans précédent connu. Même les levées d'Anthropic ou d'xAI en phase initiale étaient accompagnées de démos ou de modèles ouverts. RSI n'a rien montré. Les investisseurs achètent l'équipe et la thèse, pas un produit.


650M$ en 4 mois : est-ce un record du seed ?

La réponse courte : très probablement oui, et de loin.

Selon FrontierBeat, qui a suivi la levée dès avril 2026 à 500M$ (avant l'extension à 650M$), la startup a levé cet argent seulement quatre mois après sa fondation. Pour mettre en contexte :

  • Les plus gros seeds "classiques" de la décennie tournaient autour de 100-200M$
  • xAI a levé des milliards, mais avec un produit public (Grok) et une notoriété médiatique
  • Anthropic a levé 124M$ en seed en 2021, ce qui était alors considéré comme énorme

650M$ en quatre mois, sans aucun produit, sans aucune démo, sans aucun utilisateur — c'est un signal que les capitaux frontier AI ne suivent plus les métriques traditionnelles. La valuation de 4,65B$ selon TechFundingNews place RSI immédiatement parmi les labos IA les mieux capitalisés au monde, au même niveau que des entreprises qui emploient des milliers de personnes.

C'est aussi un risque considérable. Si la thèse de l'amélioration récursive s'avère plus difficile que prévu — ou si quelqu'un d'autre y arrive en premier — cet argent sera vu comme l'un des paris les plus cher de l'histoire du venture.


Le contexte 2025-2026 : l'année des IA auto-améliorantes

RSI n'est pas seul sur cette thèse. Le paysage 2025-2026 montre une accélération claire vers les systèmes auto-améliorants.

Les modèles agentic actuels comme GPT-5.5 (98,2 au benchmark agentic), Gemini 3 Pro Deep Think (95,4) et Claude Opus 4.7 Adaptive (94,3) montrent que les modèles sont déjà capables de chaîner des actions complexes de manière autonome. La différence avec RSI, c'est que ces modèles ne modifient pas leurs propres poids pendant l'inférence. Ils sont compétents mais statiques.

Du côté chinois, Moonshot AI lève 2 milliards de dollars : Kimi K2.6 domine l'open-weight et la Chine accélère dans la course à l'IA avec un modèle open-weight qui atteint 88,1 en agentic et 84 en général — un signal que la recherche ouverte reste compétitive et que la course est mondiale.

Chez Meta, le débat sur l'open-source prend un nouveau tournant avec Meta Muse Spark : pourquoi Meta a trahi l'open-source — le premier modèle fermé de la Superintelligence Lab, montrant que même les défenseurs de l'ouverture commencent à verrouiller leurs modèles les plus avancés. Si la superintelligence est à portée, personne ne veut la donner.

Et dans la recherche robotique, des projets comme SigLoMa : un robot quadrupede qui apprend la manipulation dans le monde reel grace a sa seule vision montrent que l'apprentissage par interaction directe avec le monde physique progresse rapidement — une condition nécessaire pour que l'auto-amélioration ne reste pas confinée à la simulation.

RSI s'inscrit dans cette convergence : les modèles sont assez bons pour raisonner, la robotique fournit un corps, et l'open-source a déjà prouvé que les meilleurs résultats sont atteignables. Il manque un mécanisme d'auto-amélioration. C'est exactement ce qu'ils construisent.


Ce qui différencie RSI des autres labos frontier

La différence fondamentale entre RSI et OpenAI, Anthropic, Google DeepMind ou xAI, c'est le focus.

Les grands labs cherchent à améliorer les modèles en les rendant plus gros, mieux entraînés, avec plus de données et de compute. C'est l'approche "scaling" : GPT-5.5 est meilleur que GPT-5.4 (91,8 vs 87,6 en agentic) parce qu'il a plus de paramètres et plus de données d'entraînement. Claude Opus 4.7 surpasse Claude Opus 4.6 (94,3 vs 84,7) par le même mécanisme.

RSI propose une voie différente : au lieu de scaler les inputs, scaler le processus d'apprentissage lui-même. L'idée est qu'un système médiocre mais auto-améliorant finira par dépasser un système brillant mais statique, simplement parce que le premier ne cesse jamais de progresser.

C'est philosophiquement séduisant mais techniquement non prouvé. Aucun système n'a encore démontré une amélioration récursive soutenue dans un domaine complexe. Les tentatives passées (évolution artificielle, apprentissage par renforcement auto-généré) ont toutes atteint des plateaux.

La question que les 650M$ doivent répondre : est-ce que la combinaison des techniques modernes (LLM + RL + compute massif) change l'équation ?


Les implications pour la course à l'AGI

Si RSI réussit ne serait-ce qu'en partie, les conséquences sont considérables.

Premièrement, le timing de l'AGI deviendrait imprévisible. Avec l'approche scaling actuelle, on peut extrapoler : si chaque génération prend 12-18 mois, on a une roadmap approximative. Avec l'amélioration récursive, chaque cycle d'auto-amélioration pourrait être plus court que le précédent. L'extrapolation linéaire ne fonctionne plus.

Deuxièmement, le contrôle devient le problème central. Une IA qui modifie ses propres poids sans supervision humaine est exactement le scénario que les chercheurs en sécurité AI mettent en garde depuis des années. RSI affirme travailler sur ce problème, mais les détails sont inexistants publiquement.

Troisièmement, la dynamique compétitive change. Si l'auto-amélioration est le chemin le plus court vers la superintelligence, alors chaque labo a une incitation massive à y aller le plus vite possible — y compris en relâchant les contraintes de sécurité. C'est le classique dilemme du prisonnier de la course aux armements, appliqué à l'IA.

Le fait que Nvidia et Google Ventures soient tous les deux à la table n'est pas rassurant à cet égard. Ce sont deux entreprises qui ont intérêt à ce que l'IA avance le plus vite possible, pour des raisons de vente de hardware (Nvidia) et de positionnement stratégique (Google).


Le parallèle avec la biologie évolutive

L'analogie la plus éclairante pour comprendre la thèse de RSI n'est pas informatique — c'est biologique.

L'évolution darwinienne est un algorithme d'amélioration récursive. Les organismes produisent des variants, l'environnement sélectionne les meilleurs, et le processus recommence avec une population légèrement plus adaptée. En 3,8 milliards d'années, ce processus simple a produit l'intelligence humaine.

RSI veut compresser ce processus. Au lieu de millions de générations biologiques, des millions de cycles d'apprentissage automatique. Au lieu de la sélection naturelle, une fonction de reward algorithmique. Au lieu de l'ADN, des poids neuronaux.

Jeff Clune, l'un des cofondateurs, a passé une grande partie de sa carrière à travailler sur cette analogie précise — l'évolution artificielle appliquée aux réseaux de neurones. Ses travaux sur "Quality Diversity" et "Open-Ended Learning" sont parmi les plus cités dans le domaine.

Le risque de cette analogie, c'est que l'évolution biologique n'a pas d'objectif. Elle n'a pas de "but" vers lequel elle converge. L'intelligence humaine est un sous-produit, pas une cible. Si RSI reproduit ce caractère ouvert sans objectif, le résultat pourrait être imprévisible — et potentiellement indésirable.


Les défis techniques concrets

L'amélioration récursive n'est pas qu'un concept philosophique. Elle pose des problèmes d'ingénierie très précis.

Le problème de la récompense : pour qu'un système s'améliore, il faut une métrique d'amélioration. Mais comment définir "mieux" de façon qui ne plafonne pas ? Si la reward function est trop étroite, le système trouve un exploit et stagne. Si elle est trop large, le système diverge.

Le problème de l'évaluation : pour savoir si le système s'améliore, il faut l'évaluer. Mais si le système est plus intelligent que l'évaluateur humain, l'évaluation devient impossible. C'est le paradoxe fondamental de l'auto-amélioration.

Le problème de la stabilité : modifier ses propres poids pendant l'inférence est intrinsèquement instable. Un mauvais cycle d'auto-amélioration peut dégrader les capacités du système, créant un effet domino négatif. Comment garantir que chaque itération est au moins aussi bonne que la précédente ?

Le problème du compute : l'auto-amélioration requiert de l'expérimentation, et l'expérimentation requiert du compute. Les estimations suggèrent qu'un système auto-améliorant pourrait consommer 10-100x plus de compute qu'un système statique équivalent. Même avec le soutien de Nvidia, ce n'est pas infini.

Aucun de ces problèmes n'est insoluble en principe. Mais les résoudre simultanément, dans un système unique, est un défi d'une difficulté rarement vue en informatique.


Ce que cela signifie pour les développeurs et entreprises

Même si RSI ne livre jamais de produit commercial, son existence change le paysage pour tous les acteurs de l'IA.

Pour les développeurs qui travaillent avec les modèles actuels (GPT-5.5, Claude Opus 4.7, Gemini 3 Pro Deep Think), le message est clair : les modèles d'aujourd'hui sont probablement les plus "stupides" que vous utiliserez jamais. Si l'amélioration récursive devient réalité, la notion même de "version" d'un modèle pourrait disparaître, remplacée par des systèmes en évolution continue.

Pour les entreprises qui investissent dans l'intégration d'IA, cela signifie que les architectures doivent être conçues pour gérer des modèles dont les capacités changent entre deux appels d'API. Le monitoring, le versionning et les tests deviendront des défis permanents plutôt que ponctuels.

Pour les hébergeurs et infrastructureurs, c'est une opportunité massive. Un système auto-améliorant a besoin de compute non seulement pour l'inférence, mais aussi pour l'entraînement continu. Les besoins en infrastructure pourraient exploser. Des solutions comme Hostinger pour les petits acteurs et les clouds GPU pour les gros deviendront encore plus stratégiques.


La réponse sceptique : pourquoi ça pourrait ne pas marcher

Il serait irresponsable de ne pas présenter les arguments contre la thèse de RSI.

L'argument du plateau : chaque tentative d'auto-amélioration dans l'histoire de l'IA a fini par plafonner. Les algorithmes génétiques des années 1990, l'apprentissage par renforcement auto-play, l'évolution artificielle des réseaux de neurones — tous ont atteint un niveau puis stagné. Pourquoi serait-ce différent cette fois ?

L'argument du scaling : peut-être que l'amélioration récursive n'est pas nécessaire. Si le scaling law continue de tenir, GPT-6 ou Claude Opus 5 pourraient atteindre la superintelligence simplement en étant plus gros. Dans ce scénario, RSI est une distraction.

L'argument de la sécurité : même si c'est techniquement faisable, les contraintes réglementaires pourraient empêcher le déploiement. Une IA qui modifie ses propres poids sans supervision humaine est exactement le type de système que les régulateurs américains et européens cherchent à encadrer.

L'argument du talent : 25 personnes, aussi brillantes soient-elles, c'est peu face aux milliers de chercheurs d'OpenAI, DeepMind et Anthropic. L'histoire des startups IA montre que le talent seul ne suffit pas — il faut aussi de l'infrastructure, des données, et du temps.

Ces arguments sont sérieux. Mais 650M$ achètent beaucoup de temps et de compute.


❌ Erreurs courantes

Erreur 1 : Confondre RSI avec un modèle de langage

RSI n'est pas un LLM. Ce n'est pas un concurrent de GPT-5.5 ou Claude Opus 4.7. C'est un projet de recherche sur l'architecture d'auto-amélioration. Comparer RSI à un modèle existant, c'est comme comparer un laboratoire de physique nucléaire à une centrale électrique.

Erreur 2 : Penser que "auto-améliorant" signifie "auto-programmant"

L'auto-amélioration dont parle RSI ne concerne probablement pas la modification du code source du système. Elle concerne la modification des poids du réseau neuronal via un processus d'apprentissage automatisé. C'est subtillement différent et techniquement plus plausible.

Erreur 3 : Ignorer le risque de "reward hacking"

Tout système d'auto-amélioration basé sur une fonction de récompense est vulnérable au reward hacking — le système trouve un moyen de maximiser la reward sans réellement s'améliorer. C'est le problème numéro un en apprentissage par renforcement, et il n'est pas résolu.

Erreur 4 : Extrapoler la valuation comme une indication de probabilité de succès

4,65B$ de valuation ne signifie pas que RSI a 90% de chances de réussir. En venture, les valuations reflètent le potentiel en cas de succès multiplié par une probabilité souvent très faible. Un pari de 650M$ sur un 5% de chance de créer la superintelligence peut être rationnel.


❓ Questions fréquentes

Qui est Richard Socher ?

Chercheur en NLP parmi les plus cités au monde, ancien CTO de Salesforce, fondateur de You.com. Ses travaux à Stanford (GloVe, TreeRNNs) ont fondé les bases des modèles de langage modernes. Il dirige RSI en tant que CEO.

Qu'est-ce que l'amélioration récursive ?

Un système qui modifie ses propres capacités d'apprentissage de manière autonome, créant une boucle où chaque itération produit un système plus compétent que le précédent. Souvent considéré comme le chemin théoriquement le plus rapide vers la superintelligence.

650M$ sans produit, c'est légitime ?

En frontier AI, les investisseurs achètent des équipes et des thèses, pas des produits. Nvidia et GV ont évalué que la probabilité pondérée de succès justifie le pari. C'est un nouveau standard de risque pour la catégorie, pas une anomalie isolée.

RSI va-t-il publier en open-source ?

Rien n'indique cela pour l'instant. GV parle d'"algorithmes ouverts" dans sa présentation, mais cela pourrait simplement désigner des architectures publiées dans des papers, pas des poids ou du code. Le contexte de verrouillage progressif (cf. Meta Muse Spark) suggère que la tendance est à la fermeture.

Quel est le lien avec les modèles actuels comme GPT-5.5 ?

Aucun lien direct. RSI ne construit pas un LLM. Mais les modèles actuels (GPT-5.5 à 98,2 en agentic, Claude Opus 4.7 à 94,3) démontrent que les systèmes sont déjà capables de raisonnement autonome complexe — une condition préalable à l'auto-amélioration.

Quand aura-t-on un produit ?

Aucune timeline n'a été annoncée. RSI est un labo de recherche, pas une startup produit. Il est probable qu'un premier résultat concret (paper, démo technique) apparaisse dans les 12-18 mois, mais un produit commercial est probablement à plusieurs années.


✅ Conclusion

Recursive Superintelligence est le pari le plus audacieux — et le plus risqué — de l'année 2026 en IA. 650M$ pour une équipe de 25 personnes qui veulent résoudre un problème que personne n'a encore résolu : faire en sorte qu'une machine devienne définitivement plus intelligente, par elle-même, sans nous. Si ça marche, rien ne sera jamais comme avant. Si ça rate, ce sera l'un des échecs les plus chers de l'histoire du venture. Dans les deux cas, ça vaut la peine de regarder de près.