Claude Science : Anthropic lance un workbench IA pour les chercheurs
🔎 Pas un nouveau modèle, un operating layer pour la science
Le 30 juin 2026, Anthropic a dévoilé Claude Science. Et contrairement à ce que le nom suggère, ce n'est pas un modèle IA spécialisé en biologie ou en chimie.
C'est un environnement de travail complet — un workbench — qui prend les modèles Claude existants et les transforme en système d'exploitation pour la recherche scientifique. La même logique que Claude Code pour les développeurs, mais appliquée aux labos.
Le timing n'est pas anodin. Anthropic vient de lever 65 milliards de dollars en Series H et de lancer Claude Opus 4.8, signe que la société a les moyens de se payer une guerre d'infrastructures. Et pour cause : Anthropic a signé avec SpaceX pour Colossus 1, un cluster de 220 000 GPUs et 300 MW dédié à l'entraînement de Claude. Claude Science s'inscrit dans cette stratégie de déploiement à grande échelle.
L'approche est fondamentalement différente de ce que font OpenAI et Google DeepMind dans le domaine scientifique. Et c'est exactement le point.
L'essentiel
- Claude Science n'est pas un nouveau modèle : il utilise les modèles Claude existants (Opus 4.8, Sonnet 4.6) via une couche workflow multi-agent.
- 60+ connecteurs préconfigurés couvrent la génomique, l'analyse unicellulaire, la protéomique, la biologie structurale et la chemo-informatique.
- Un agent coordinateur délègue à des sous-agents spécialisés, tandis qu'un reviewer agent vérifie automatiquement les citations et les calculs.
- L'exécution est 100% locale (macOS, Linux) ou via SSH/HPC — les données sensibles ne quittent jamais le laboratoire.
- La reproductibilité est garantie : chaque artefact inclut le code source exact, l'environnement et l'historique complet des messages.
- 50 projets seront soutenus à hauteur de 30 000$ de crédits Anthropic + 2 000$ de compute Modal. Candidatures ouvertes jusqu'au 15 juillet 2026.
Outils recommandés
| Outil | Usage principal | Disponibilité (juin 2026) | Idéal pour |
|---|---|---|---|
| Claude Science | Workbench scientifique multi-agent | Beta : Pro, Max, Team, Enterprise | Chercheurs en sciences de la vie |
| Modal | Compute scalable GPU pour Claude Science | Intégration native | Analyses lourdes nécessitant du scaling |
| NVIDIA BioNeMo Agent Toolkit | Skills spécialisés (Evo 2, Boltz-2, OpenFold3) | Via connecteurs Claude Science | Biologie structurale et génomique |
Ce que Claude Science fait réellement — et ce qu'il ne fait pas
Claude Science est une couche d'orchestration. Pas un modèle fine-tuné sur des papers scientifiques, pas un AlphaFold clone.
Concrètement, l'outil combine un agent coordinateur généraliste avec des sous-agents spécialisés créés par l'utilisateur ou préconfigurés par Anthropic. Le coordinateur reçoit votre requête, la décompose, assigne les tâches aux agents appropriés, et compile les résultats.
Les artefacts produits sont reproductibles par construction. Claude Science génère des structures 3D de protéines, des tracks de genome browser, des dessins chimiques — mais surtout, il produit le code exact et l'historique de messages qui ont mené à chaque résultat. Selon Reuters, cette approche vise directement le problème de la reproductibilité en science.
Le point crucial : les données restent locales. L'outil s'exécute sur votre machine (macOS ou Linux) ou via une connexion SSH à un cluster HPC. Vos données génomiques ou cliniques ne sont jamais envoyées sur les serveurs d'Anthropic. Seuls les appels aux modèles Claude transitent par l'API — comme n'importe quelle autre utilisation de l'API Anthropic.
C'est un choix architectural qui distingue fondamentalement Claude Science d'une simple interface web. Et c'est ce qui permet à Anthropic de cibler des labos travaillant avec des données soumises à des réglementations strictes (HIPAA, RGPD).
L'architecture multi-agent : coordinateur, spécialistes et reviewer
Le système repose sur trois types d'agents avec des rôles clairement séparés.
L'agent coordinateur est le point d'entrée. Il comprend votre requête en langage naturel, la décompose en sous-tâches, et distribue le travail. C'est lui qui décide s'il faut appeler un connecteur génomique, lancer un script Python, ou consulter une base de données de protéines.
Les sous-agents spécialisés exécutent les tâches. Anthropic a préconfiguré des agents pour chaque domaine (génomique, protéomique, chemo-informatique), mais les utilisateurs peuvent créer leurs propres agents spécialisés. C'est ici que les skills NVIDIA BioNeMo entrent en jeu — Evo 2 pour la génomique, Boltz-2 pour les protéines, OpenFold3 pour la biologie structurale.
Le reviewer agent est peut-être le composant le plus stratégique. Il vérifie systématiquement les citations et les calculs produits par les autres agents. Dans un domaine où les hallucinations peuvent avoir des conséquences réelles (un médicament mal ciblé, une analyse génétique erronée), cette couche de vérification automatique n'est pas un luxe — c'est une nécessité.
Cette architecture rappelle ce qu'Anthropic a fait avec Claude Code Agent View, le dashboard qui tue le terminal split-screen. Même philosophie : un agent principal qui orchestre, une interface qui rend le processus visible, et une traçabilité complète.
Les 60+ connecteurs : génomique, protéomique, chimo-informatique
Les connecteurs sont le cœur opérationnel de Claude Science. Sans eux, ce ne serait qu'un chatbot scientifique de plus.
Selon l'annonce officielle d'Anthropic, le workbench intègre plus de 60 compétences et connecteurs préconfigurés, répartis en cinq domaines majeurs.
Génomique : accès aux bases de données de séquences, outils d'alignement, analyse de variants. C'est ce connecteur que Stephen Francis (UCSF Brain Tumor Center) a utilisé pour accélérer l'analyse germinale de gliomas d'un facteur 10 — un résultat documenté par TechCrunch.
Analyse unicellulaire : pipelines pour le traitement de données RNA-seq single-cell, clustering, annotation cellulaire. Un domaine où la complexité computationnelle est un goulot d'étranglement majeur pour beaucoup de labos.
Protéomique : identification de protéines, quantification, analyse post-traductionnelle. Couplé aux skills NVIDIA BioNeMo (Boltz-2, OpenFold3), ce connecteur permet de prédire des structures 3D de protéines directement depuis le workbench.
Biologie structurale : visualisation et manipulation de structures moléculaires, intégrant les sorties d'OpenFold3 et d'autres outils de prédiction.
Chemo-informatique : selon GEN, ce connecteur permet même de concevoir des antibiotiques par simple prompt texte — une application qui illustre le potentiel de transformation de l'outil en découverte de médicaments.
L'intégration avec Modal permet de scaler le compute d'un GPU unique à des centaines de GPUs pour les analyses les plus lourdes. C'est ce qui rend les 60+ connecteurs réellement utilisables en pratique, au-delà des démonstrations.
Anthropic vs OpenAI vs Google DeepMind : trois stratégies pour la science IA
Le lancement de Claude Science révèle trois approches radicalement différentes pour appliquer l'IA à la recherche scientifique. Et chacune reflète la philosophie de son créateur.
Anthropic : le workflow ouvert. Claude Science est accessible à tous les plans payants (Pro, Max, Team, Enterprise). Pas de modèle spécialisé, pas de fine-tuning domaine-spécifique. Anthropic mise sur la couche workflow et l'architecture multi-agent pour créer de la valeur. C'est l'approche "large et abordable" — un chercheur individuel dans un petit labo peut y accéder aussi facilement qu'une équipe de Novo Nordisk.
OpenAI : le modèle gated. GPT-Rosalind, lancé en avril 2026, est un modèle fine-tuné spécifiquement pour la biologie. Mais il est réservé aux clients enterprise avec un accès contrôlé : Amgen, Moderna, Novo Nordisk, Thermo Fisher. Pas de version Pro ou Max. OpenAI parie que la performance brute d'un modèle spécialisé justifie une restriction d'accès. C'est l'approche "premium et exclusif".
Google DeepMind : les modèles owned. AlphaFold et AlphaGenome sont des modèles propriétaires spécialisés, couplés à Gemini for Science qui intègre plus de 30 bases de données. Google ne fait pas de workflow — il fait des modèles qui résolvent des problèmes spécifiques avec une précision inégalée. C'est l'approche "profonde et propriétaire".
| Critère | Anthropic (Claude Science) | OpenAI (GPT-Rosalind) | Google DeepMind |
|---|---|---|---|
| Approche | Workflow multi-agent | Modèle fine-tuné | Modèles spécialisés propriétaires |
| Accès | Pro, Max, Team, Enterprise | Gated enterprise uniquement | Bases de données publiques + API |
| Modèle IA | Claude existants (Opus 4.8, etc.) | GPT-Rosalind (spécialisé) | AlphaFold, AlphaGenome, Gemini |
| Bases de données | 60+ connecteurs | Non spécifié | 30+ bases de données |
| Exécution | Locale / SSH / HPC | Cloud OpenAI | Cloud Google |
| Reproductibilité | Artefacts avec code + historique | Non spécifié | Dépend du modèle |
| Cible prioritaire | Chercheurs individuels et labos | Big pharma | Communauté scientifique ouverte |
Laquelle de ces approches va dominer ? Trop tôt pour le dire. Mais les early adopters de Claude Science donnent des résultats concrets qui plaident pour la stratégie d'Anthropic.
Cas d'usage concrets : ce que les early adopters ont déjà accompli
Les résultats documentés sont suffisamment impressionnants pour mériter qu'on s'y arrête.
Allen Institute — Reviews computationnelles de 100+ pages. Jérôme Lecoq a construit un pipeline multi-agent de review computationnelle avec Claude Science. Résultat : 10 reviews de plus de 100 pages, avec citations vérifiées automatiquement. Ce processus prenait auparavant deux ans. Selon TechCrunch, c'est passé à quelques mois. Le reviewer agent est ici central — sans lui, des reviews de cette ampleur seraient inutilisables.
UCSF Brain Tumor Center — Analyse germinale de gliomas. Stephen Francis a utilisé Claude Science pour accélérer les analyses germinales de tumeurs cérébrales d'un facteur 10. Pour un domaine où chaque jour compte pour les patients, ce gain n'est pas anecdotique.
Manifold Bio — Ciblage tissu-spécifique de médicaments. La biotech a utilisé le workbench pour nommer des cibles de médicaments spécifiques à certains tissus — une tâche qui requiert de croiser des données de génomique, de protéomique et de chemo-informatique. Exactement le type de workflow multi-domaine pour lequel Claude Science est conçu.
Ces cas montrent quelque chose d'important : la valeur n'est pas dans le modèle lui-même, mais dans l'orchestration. Un chercheur pourrait théoriquement faire la même chose avec des scripts Python et des appels API directs. Mais l'effort de glue engineering nécessaire serait colossal. Claude Science élimine cette friction.
Compute et infrastructure : le rôle de Modal et du HPC
Un workbench scientifique sans compute adapté est un outil inutile. Anthropic l'a compris.
L'intégration avec Modal permet de passer d'un GPU local à des centaines de GPUs en quelques clics pour les analyses qui le nécessitent. Selon HPC Wire, cette intégration est un élément clé de la stratégie de Claude Science pour le calcul haute performance.
Le modèle d'exécution est flexible. Vous pouvez tout faire tourner en local sur votre Mac ou votre machine Linux, avec Python, R et le shell directement accessibles. Vous pouvez aussi vous connecter via SSH à un cluster HPC de votre institution. Ou encore déléguer les calculs lourds à Modal.
Cette flexibilité est stratégique. Beaucoup de labos ont déjà des ressources compute institutionnelles. Claude Science ne les remplace pas — il s'y branche. Et quand ces ressources ne suffisent pas, Modal est là comme filet de sécurité.
Pour les modèles sous-jacents, Claude Science utilise les modèles Claude existants. Si vous avez un plan Pro, vous utilisez les modèles accessibles en Pro (notamment Claude Sonnet 4.6, qui score 83 en benchmark général et 81.4 en agentic selon les classements de juin 2025). Si vous avez un plan Max ou Enterprise, vous accédez à Claude Opus 4.7 (score 90 général, 94.3 agentic). Pour une comparaison détaillée des modèles dans le contexte du code et de l'agentic, voir notre comparatif Claude vs ChatGPT et notre guide des meilleurs LLM pour coder.
Le programme de financement : 50 projets, 30 000$ chacun, deadline 15 juillet
Anthropic ne se contente pas de lancer un outil — il finance son adoption.
50 projets seront sélectionnés, chacun recevant jusqu'à 30 000$ de crédits Anthropic et 2 000$ de compute Modal. Les candidatures sont ouvertes jusqu'au 15 juillet 2026, avec annonce des résultats le 31 juillet. Les projets retenus s'exécuteront de septembre à décembre 2026.
Selon Anthropic, ce programme vise explicitement à générer des cas d'usage démontrant la valeur du workbench dans des contextes de recherche réels. C'est un investissement de 1,6 million de dollars au total (1,5M en crédits + 100k en compute Modal) — modeste pour une entreprise qui vient de lever 65 milliards, mais suffisant pour créer un effet de démonstration.
En parallèle, Anthropic lance ses propres programmes pré-cliniques de médicaments pour des maladies négligées. Eric Kauderer-Abrams, head of life sciences chez Anthropic, a confirmé à Reuters que l'entreprise utilise Claude Science en interne pour ces programmes. C'est un signal fort : Anthropic ne vend pas seulement un outil, il l'utilise lui-même pour produire de la recherche.
Reproductibilité et vérification : le reviewer agent en détail
Le problème de la reproductibilité en science n'est pas nouveau. Mais l'IA l'amplifie dangereusement.
Quand un chercheur utilise un chatbot IA pour analyser des données et obtient un résultat, comment reproduire ce résultat ? Quelles étapes exactes ont été suivies ? Quelles versions des outils ont été utilisées ? Sans réponse à ces questions, le résultat est scientifiquement invalide.
Claude Science attaque ce problème de front. Chaque artefact produit inclut le code source exact, la description de l'environnement d'exécution, et l'historique complet des messages entre l'utilisateur et les agents. C'est la garantie que n'importe qui peut reprendre le même artefact et reproduire le résultat de manière déterministe.
Le reviewer agent ajoute une couche de vérification supplémentaire. Il vérifie systématiquement que les citations dans un rapport pointent vers les bonnes sources, que les calculs numériques sont corrects, et que les conclusions sont supportées par les données présentées. C'est loin d'être infaillible — c'est toujours un modèle IA qui vérifie un autre modèle IA — mais c'est nettement mieux que rien.
Dans le cas des reviews computationnelles de l'Allen Institute, le reviewer agent a permis de produire des documents de 100+ pages avec un niveau de vérification des citations qui aurait été humainement impossible dans le même laps de temps.
Ce que Claude Science signifie pour l'avenir de la recherche
L'impact potentiel dépasse le cadre de l'outil lui-même.
Claude Science représente un changement de paradigme : passer d'une IA conversationnelle (poser une question, obtenir une réponse) à une IA opérationnelle (décrire un workflow, obtenir un artefact reproductible). C'est la différence entre demander "qu'est-ce que l'analyse unicellulaire ?" et demander "analyse ces données RNA-seq single-cell, cluster les cellules, annote les types cellulaires, et produis un rapport reproductible avec visualisations".
Ce changement a des implications profondes pour la formation des chercheurs. Les compétences requises évoluent : moins de scripting manuel, plus de conception de workflows et de validation critique des sorties IA. Le chercheur du futur passera peut-être plus de temps à vérifier les résultats de son IA qu'à les produire.
Anthropic parie que cette approche workflow-centric — plutôt que modèle-centric — est la bonne. Pas de modèle spécialisé pour la biologie, pas de fine-tuning domaine-spécifique. Juste un bon modèle généraliste, bien orchestré, avec les bons connecteurs et les bonnes garde-fous. Si ce pari est gagnant, il remet en question la stratégie de tous les concurrents qui investissent dans des modèles spécialisés.
❌ Erreurs courantes
Erreur 1 : Confondre Claude Science avec un nouveau modèle
Claude Science n'est pas un modèle. C'est un environnement de travail qui utilise les modèles Claude existants. Si vous attendez un Claude "spécialisé science" avec de nouvelles capacités de raisonnement, vous serez déçu. La valeur est dans l'orchestration et les connecteurs, pas dans le modèle sous-jacent.
Erreur 2 : Penser que les données scientifiques sont envoyées dans le cloud
Par défaut, Claude Science s'exécute en local. Vos données de génomique, vos séquences protéiques, vos données cliniques restent sur votre machine ou votre cluster HPC. Seuls les textes envoyés aux modèles Claude transitent par l'API. C'est un point de confusion fréquent, mais il est crucial pour la conformité réglementaire.
Erreur 3 : Ignorer le reviewer agent
Il est tentant de désactiver le reviewer agent pour gagner du temps. C'est une erreur. Dans un contexte scientifique, une citation hallucinée ou un calcul erroné peut invalider des mois de travail. Le reviewer agent est un filet de sécurité, pas un luxe.
Erreur 4 : Comparer Claude Science à un simple chatbot avec plugins
La différence est architecturale. Un chatbot avec plugins exécute des outils un par un, séquentiellement. Claude Science orchestre des agents parallèles qui communiquent entre eux, avec un système de vérification intégré. Ce n'est pas la même catégorie d'outil.
❓ Questions fréquentes
Claude Science est-il disponible gratuitement ?
Non. La beta est accessible aux abonnés Pro, Max, Team et Enterprise d'Anthropic. Le programme de financement offre 30 000$ de crédits aux 50 projets sélectionnés, mais c'est un appel à candidatures, pas un accès gratuit généralisé.
Claude Science remplace-t-il les outils scientifiques existants ?
Non, il s'y connecte. Les 60+ connecteurs font le pont avec les bases de données et outils que les chercheurs utilisent déjà (NVIDIA BioNeMo, bases de données génomiques, outils de chemo-informatique). Claude Science est une couche d'orchestration, pas un remplaçant.
Quel modèle Claude est utilisé en arrière-plan ?
Celui de votre abonnement. En Pro, vous utiliserez principalement Claude Sonnet 4.6. En Max ou Enterprise, Claude Opus 4.8 est disponible. Claude Science ne change pas le modèle — il change la façon dont vous l'utilisez.
Comment Claude Science se compare-t-il à GPT-Rosalind d'OpenAI ?
Les approches sont opposées. GPT-Rosalind est un modèle fine-tuné pour la biologie, réservé à l'enterprise. Claude Science est un workflow ouvert utilisant des modèles généralistes, accessible dès le plan Pro. Anthropic mise sur l'orchestration, OpenAI sur la spécialisation du modèle.
Les données restent-elles confidentielles ?
Oui, l'exécution est locale ou via SSH/HPC. Les données scientifiques ne sont pas uploadées sur les serveurs d'Anthropic. Seuls les prompts et réponses transitent par l'API, comme pour toute utilisation standard de Claude.
Peut-on créer ses propres agents spécialisés ?
Oui. Anthropic fournit des agents préconfigurés pour les cinq domaines couverts, mais les utilisateurs peuvent créer des agents spécialisés adaptés à leur domaine de recherche spécifique.
✅ Conclusion
Claude Science n'est pas un nouveau modèle IA — c'est la preuve qu'Anthropic a compris que la valeur dans l'IA scientifique n'est pas dans le modèle, mais dans le workflow. En misant sur un operating layer ouvert, local et reproductible, Anthropic prend le contre-pied d'OpenAI (modèle gated) et de Google DeepMind (modèles propriétaires). Les résultats des early adopters sont suffisamment concrets pour prendre cette approche au sérieux. Candidatures pour le programme de financement ouvertes jusqu'au 15 juillet 2026 sur le site d'Anthropic.
```