Le nouveau produit d'Anthropic est-il assez puissant pour rendre l'équipe d'infrastructure d'agents IA obsolète ?

By: blockbeats|2026/04/09 13:00:12

Titre original : "Anthropic a lancé aujourd'hui un nouveau produit susceptible de provoquer une vague de suppressions d'emplois au sein des équipes d'infrastructure d'agents IA"

Auteur original : Bayu, ingénieur IA

Ce produit s'appelle Claude Managed Agents. En résumé : vous indiquez à Anthropic le type d'agent IA que vous souhaitez, et il vous aide à l'exécuter dans le cloud, infrastructure incluse, avec une tarification basée sur l'utilisation. Sentry l'a utilisé pour mettre en place une correction automatisée des bugs de bout en bout en quelques semaines, tandis que Rakuten a déployé un agent spécialisé en une semaine. Auparavant, ces tâches auraient nécessité une équipe d'ingénierie entière travaillant pendant des mois.

Pendant ce temps, le revenu récurrent annuel d'Anthropic vient de dépasser les 30 milliards de dollars, soit le triple de celui de décembre dernier. La majeure partie de cette croissance provient des entreprises clientes. Wall Street commence à s'inquiéter, le WSJ affirmant que les investisseurs deviennent de plus en plus prudents vis-à-vis du cours des actions des sociétés SaaS traditionnelles, craignant que des produits comme ceux d'Anthropic ne rendent certains services logiciels traditionnels obsolètes.

Qu'est-ce que ce produit exactement ? En quoi diffère-t-il de Claude Code que vous utilisez déjà ? Comment a-t-il été réalisé techniquement ?

Qu'est-ce que c'est ? En quoi diffère-t-il de Claude Code ?

Si vous avez utilisé Claude Code, vous savez comment fonctionnent les agents IA : vous leur confiez une tâche, et ils planifient les étapes de manière autonome, utilisent des outils, écrivent du code, modifient des fichiers et accomplissent la tâche étape par étape.

Claude Code s'exécute sur votre propre ordinateur et est un outil en ligne de commande destiné à un usage personnel par les développeurs. Il s'arrête lorsque vous éteignez votre ordinateur.

Les Managed Agents s'exécutent sur le cloud d'Anthropic et constituent un service API destiné aux entreprises. Ils peuvent fonctionner en continu 24h/24 et 7j/7, conservent leur progression même en cas de déconnexion, et votre produit peut intégrer directement les capacités de l'agent IA.

C'est ainsi que fonctionne Notion : les utilisateurs assignent des tâches aux agents Claude au sein de Notion, les agents travaillent en arrière-plan, accomplissent les tâches et renvoient les résultats, le tout sans que les utilisateurs aient à quitter Notion.

Quelques cas d'usage typiques :

· Déclenché par un événement : le système détecte un bug, assigne automatiquement un bot pour le corriger et soumettre une pull request, sans intervention humaine.

· Planifié : génère automatiquement un résumé de l'activité GitHub ou un compte-rendu de travail d'équipe chaque matin.

· « Fire-and-forget » : assignez une tâche à un bot dans Slack, il l'exécute et vous renvoie le document, la présentation PowerPoint ou l'application.

· Tâche de longue durée : exécution d'une recherche approfondie ou d'une tâche de refactorisation de code pendant plusieurs heures.

Quelle est la différence entre les bots hébergés dans le cloud et les bots internes ?

Vous pourriez les auto-héberger, mais c'est coûteux et lent.

Un bot intelligent capable d'être opérationnel nécessite bien plus qu'un simple « appel d'API » : un environnement sandbox (un espace sécurisé isolé où l'IA peut exécuter du code, modifier des fichiers et tester sans affecter le système externe réel, comme fournir à l'IA une machine virtuelle dédiée), une gestion des identifiants, une récupération d'état, un contrôle des permissions, un suivi de bout en bout, et plus encore.

De nombreuses entreprises clientes avaient besoin d'une équipe d'ingénierie entière dédiée à ces tâches. Désormais, c'est du « plug and play », libérant les ingénieurs pour qu'ils se concentrent sur le cœur du produit.

Cependant, les problèmes résolus par les Managed Agents vont au-delà de la simple économie de main-d'œuvre.

Matt Dongslee (@dongxi_nlp) propose un résumé concis :

Il existe un exemple spécifique dans le blog d'ingénierie d'Anthropic :

Lorsque Claude Sonnet 4.5 approche de la limite de la fenêtre de contexte, il « panique » et met fin à la tâche précipitamment. Ils ont ajouté une réinitialisation du contexte dans le framework de planification pour résoudre ce problème. Cependant, avec Claude Opus 4.5, ce problème a disparu et le correctif précédent est devenu un fardeau.

Si vous construisez votre propre framework de planification, vous devez le mettre à jour à chaque montée de version du modèle. Déléguez cette tâche à Anthropic ; ils l'optimisent pour vous, optimisant essentiellement ce qu'ils vous vendent.

Qui l'utilise ? Comment ?

Notion permet aux utilisateurs de déléguer des tâches telles que le codage, la création de présentations PPT et l'organisation de feuilles de calcul directement à Claude au sein de l'espace de travail, en exécutant des dizaines de tâches en parallèle, avec toute l'équipe collaborant sur le même résultat. Eric Liu, chef de produit chez Notion, a déclaré que les utilisateurs peuvent déléguer des tâches complexes et ouvertes sans quitter Notion.

Sentry a mis en place un processus entièrement automatisé « de la découverte du bug à la soumission du correctif ». Leur outil de débogage IA, Seer, après avoir identifié la cause première, permet à Claude d'écrire directement des correctifs et d'ouvrir des PR (pull requests). Le directeur de l'ingénierie, Indragie Karunaratne, a déclaré qu'ils ont pu lancer le service en quelques semaines, économisant ainsi les coûts de maintenance continus d'une infrastructure auto-construite.

Atlassian l'a intégré dans Jira, permettant aux développeurs d'assigner directement des tâches à l'IA de Claude.

Asana a créé des « AI Teammates », ajoutant des collaborateurs IA dans la gestion de projet capables de prendre en charge des tâches et des livrables.

General Legal (société de technologie juridique) a l'approche la plus intéressante : leur IA peut créer temporairement des outils pour rechercher des données en fonction des requêtes des utilisateurs. Auparavant, chaque requête utilisateur devait être anticipée et un outil de recherche développé à l'avance, mais désormais, l'IA les génère à la demande. Le CTO a déclaré que le temps de développement a été réduit par 10.

Rakuten a déployé des agents IA spécialisés dans les départements ingénierie, produit, ventes, marketing et finance, chacun étant opérationnel en une semaine, recevant des tâches via Slack et Teams et livrant des résultats tangibles tels que des feuilles de calcul, des présentations PPT et des applications.

Prix de --

Principe technique : découpler le cerveau des mains

L'équipe d'ingénierie d'Anthropic a rédigé un article technique intitulé « Scaling Managed Agents: Decoupling the brain from the hands », discutant de l'évolution architecturale derrière les Managed Agents.

Au départ, ils mettaient tout dans un seul conteneur : la boucle d'inférence de l'IA, l'environnement d'exécution de code et le journal de session, le tout ensemble. L'avantage était la simplicité, mais l'inconvénient était que tous les œufs étaient dans le même panier : si le conteneur tombait, toute la session était perdue, et les composants individuels ne pouvaient pas être remplacés séparément.

Plus tard, ils ont effectué une séparation clé :

· Le « Cerveau » est Claude et son framework de planification, responsable de la réflexion et de la prise de décision.

· La « Main » est la sandbox et divers outils, responsables de l'exécution des opérations spécifiques.

· La « Mémoire » est un journal de session indépendant, enregistrant tout ce qui se passe.

Les trois sont indépendants, et si l'un tombe, cela n'affecte pas les deux autres.

Cette séparation a apporté plusieurs avantages pratiques :

Vitesse

Toutes les tâches n'ont pas besoin de lancer l'environnement sandbox complet. Désormais, la sandbox n'est lancée qu'à la demande lorsque l'IA a réellement besoin d'exécuter du code. La latence médiane de la première réponse a diminué d'environ 60 %, et dans des cas extrêmes, elle a chuté de plus de 90 %.

Sécurité

Le code généré par l'IA s'exécute dans la sandbox, tandis que les identifiants pour accéder aux systèmes externes sont stockés dans un coffre-fort sécurisé en dehors de la sandbox, avec une isolation physique des deux côtés. Par exemple, pour accéder à un dépôt Git, le système clone le code lors de l'initialisation, et l'IA interagit normalement avec git push/pull, mais le jeton lui-même n'est pas visible pour l'IA. Pour des services comme Slack et Jira, ils sont accessibles via le protocole MCP, où les requêtes passent par une couche proxy, la couche proxy récupère les identifiants du coffre-fort pour appeler le service, et l'IA ne manipule jamais les identifiants tout au long du processus.

Flexibilité

Le Cerveau ne se soucie pas de ce qu'est la Main. Il y a une phrase intéressante dans le blog d'ingénierie : le framework de planification ne sait pas si la sandbox est un conteneur, un téléphone mobile ou un émulateur Pokémon. Il doit simplement respecter l'interface « entrer un nom, obtenir une chaîne de caractères ».

Cela signifie également que plusieurs Cerveaux peuvent partager la Main, et qu'un Cerveau peut passer la Main à un autre Cerveau, jetant ainsi les bases de la collaboration multi-agents.

Limites

Les Managed Agents ne sont pas tout-puissants. Il y a plusieurs points à noter :

Certaines fonctionnalités sont encore au stade de prévisualisation de recherche. Des capacités telles que la collaboration multi-agents, les outils de mémoire avancés et l'itération d'auto-évaluation (permettant à l'agent de juger la qualité de l'achèvement de sa tâche et de s'améliorer de manière itérative) ne sont pas encore totalement ouvertes et nécessitent une demande d'accès.

Verrouillage par la plateforme. Opter pour les Managed Agents signifie que votre infrastructure d'agents est liée à l'écosystème Anthropic. Si vous prévoyez de changer de modèle ou de plateforme à l'avenir, les coûts de migration ne doivent pas être négligés.

La gestion du contexte reste un défi. Bien que les journaux de session soient stockés indépendamment, décider quelles informations conserver ou supprimer lors de tâches longues implique toujours des décisions irréversibles. C'est un défi permanent, et leur approche actuelle sépare le stockage du contexte de la gestion du contexte : le stockage assure la préservation, tandis que les politiques de gestion s'ajustent avec l'évolution des modèles.

Prévisibilité des coûts. 0,08 $ par heure de session peut sembler raisonnable, mais pour des tâches complexes nécessitant que l'agent fonctionne pendant plusieurs heures, en tenant compte de la consommation de jetons et des coûts d'exécution, le coût global peut ne pas être négligeable. Les entreprises doivent évaluer leurs budgets en conséquence.

Les Managed Agents indiquent que la plupart des entreprises ont encore un long chemin à parcourir avant de pouvoir « compter entièrement sur les agents IA pour travailler ».

Bien que la barrière de l'infrastructure ait été abaissée, les Managed Agents ne peuvent pas aider à définir de bonnes tâches, à concevoir des flux de travail ou à établir la confiance nécessaire pour permettre à l'IA d'accéder aux données commerciales essentielles.

Le « moment AWS » de l'infrastructure des agents IA

Les Managed Agents semblent suivre la voie qu'AWS a empruntée à ses débuts : d'abord fournir la puissance de calcul, puis encapsuler l'environnement d'exécution.

Il y a dix ans, les entreprises débattaient de la nécessité de « passer au cloud » ; aujourd'hui, le débat porte sur le choix entre « auto-héberger l'infrastructure d'agents ou opter pour des services gérés ». L'expérience historique nous apprend que la plupart des entreprises choisissent finalement les services gérés, car l'infrastructure n'est jamais une compétence clé. OpenAI a également lancé sa propre plateforme d'agents, Frontier, et la concurrence dans ce domaine ne fait que commencer.

D'un point de vue technologique, l'approche architecturale de la « séparation du cerveau et de la main » mérite d'être soulignée. Elle permet à chaque partie du système d'évoluer indépendamment : mettre à jour le modèle, changer le cerveau ; besoin d'un nouvel outil, ajouter une main ; modifier la solution de stockage, remplacer la couche mémoire.

Une bonne analogie tirée d'un blog d'ingénierie : la commande read() d'un système d'exploitation ne se soucie pas de savoir si elle traite avec un disque des années 1970 ou un SSD moderne ; la couche d'abstraction est stable, permettant de remplacer facilement l'implémentation sous-jacente.

Du point de vue de l'utilisation, si vous êtes un développeur en entreprise cherchant à intégrer des capacités d'agent IA dans votre produit, les Managed Agents pourraient vous faire économiser plusieurs mois de travail d'infrastructure.

Six langages (Python, TypeScript, Java, Go, Ruby, PHP) sont pris en charge par des SDK. Si vous utilisez déjà Claude Code, mettez à jour vers la dernière version et tapez /claude-api managed-agents-onboarding pour commencer.

Si vous êtes un passionné d'IA, l'impact le plus immédiat que vous pourriez ressentir est le suivant : dans les produits SaaS que vous utilisez, de plus en plus d'agents IA travailleront en arrière-plan pour vous assister, ces agents fonctionnant probablement sur des Managed Agents.

Référence tarifaire : Les coûts des jetons sont basés sur la tarification standard de l'API Anthropic, avec un coût d'exécution de 0,08 $ par heure de session (le temps d'inactivité n'est pas facturé) et 10 $ par millier de recherches web.

Pensez-vous que l'infrastructure pour les agents IA sera finalement dominée par quelques acteurs majeurs, de la même manière que le cloud computing aujourd'hui ?

Lien vers l'article original

Vous pourriez aussi aimer

Rapport du matin | Coinbase Ventures réalise son premier investissement dans ENA ; SpaceX prévoit de fixer le prix de son introduction en bourse à 135 $ par action

Aperçu des événements importants du marché le 3 juin

Texte intégral et analyse du discours du PDG de SanDisk lors de la 42e conférence annuelle sur les décisions stratégiques de Bernstein

La valeur fondamentale du discours de Goeckeler réside dans la fourniture d'un cadre narratif très transparent et logiquement clair pour la transformation de l'entreprise.

Prévision du prix du Bitcoin pour 2030 : Ark Invest anticipe 710 000 $

Découvrez les prévisions de prix du bitcoin pour 2030 d'Ark Invest et de Standard Chartered, ainsi que les risques clés et comment positionner votre portefeuille. Analyse complète sur WEEX.

Prix du SOL aujourd'hui : cours en direct de Solana, graphiques et données de marché

Découvrez le prix du SOL aujourd'hui avec des données en temps réel, ainsi que les facteurs clés influençant le mouvement de Solana et des conseils de trading exploitables. Lisez l'analyse complète sur WEEX.

Rapport du matin | Strategy a vendu 32 BTC et plus de 800 000 actions MSTR la semaine dernière ; Binance a officiellement annoncé son portail de trading d'actions américaines ; Polymarket a conclu un partenariat exclusif avec OneFootball

Aperçu des événements importants du marché au 1er juin

Bootcamp de trading WEEXPERIENCE en Pologne : comment WEEX et FireCrew rendent le trading crypto accessible à tous

WEEX s'est associé à Firecrew en Pologne le 29 mai pour le bootcamp de trading WEEXPERIENCE. Découvrez le compte-rendu des sessions d'experts sur l'analyse technique, la psychologie du trading et les outils d'IA qui prouvent la mission de WEEX : rendre le trading crypto accessible à tous.

Le sacre de Paris : comment le PSG a brisé le rêve d'Arsenal lors d'une finale de Ligue des champions historique

PSG contre Arsenal, drame, destin et une malédiction de 20 ans enfin brisée. Revivez la finale de la Ligue des champions 2026 où le PSG a défendu son titre lors d'une séance de tirs au but sous haute tension, alors que le moment de gloire d'Ousmane Dembélé et un raté déchirant ont marqué l'histoire à Budapest.

TaiJi finalise un financement stratégique de 3,5 millions de dollars, avec la participation de Castrum Capital, Becker Ventures et Coinvestor Ventures

La plateforme d'intelligence de marché on-chain Web3 pilotée par l'IA, TaiJi, a annoncé la clôture d'un financement stratégique de 3,5 millions de dollars, qui accélérera la construction d'un nouveau moteur de simulation de marché par IA.

Bitcoin stagne près de 73 000 $ ? Comment les traders trouvent des opportunités dans un marché latéral en juin

Le Bitcoin stagne près de 73 000 $ alors que les flux des ETF ralentissent et que l'incertitude macroéconomique rend les traders prudents. Découvrez comment des campagnes de récompenses comme la WEEX Joker Party aident les traders à rester actifs durant ce marché latéral de juin.

Comment staker Solana : un guide étape par étape pour 2026

Découvrez les meilleures cryptomonnaies IA de 2026 grâce à des sélections basées sur les données : Bittensor, Render et des projets émergents. Métriques on-chain, risques et guide de trading WEEX inclus.

Le prix garanti est désormais disponible sur WEEX : exécutez vos ordres avec une plus grande précision

Pour offrir une expérience de trading de contrats à terme plus fluide, WEEX futures a lancé une fonctionnalité de « Prix garanti ».

Dernières recherches de la BRI : L'avenir des stablecoins et le paysage monétaire mondial

Le rapport estime que les stablecoins renforceront la domination du dollar américain à court terme, faisant peser des risques sur la souveraineté monétaire des marchés émergents et des économies en développement, tandis que leur trajectoire à long terme dépendra de leurs modèles d'adoption, des réponses réglementaires et de la synergie de...

Entretien avec l'expert macro Raoul Pal : La course à l'IA mène à une « singularité économique », ne lâchez pas vos jetons trop facilement au cours des quatre prochaines années

Par rapport au Nasdaq, le Bitcoin se trouve actuellement dans une position de survente sévère au sein de sa tendance à long terme.

Pourquoi Peter Thiel, l'homme derrière Palantir, prépare-t-il une sortie en Argentine ?

Palantir, risque politique et autopréservation des oligarques technologiques.

La crise de la quarantaine des GP Crypto : sans PMF, pas de nouveau chèque des LP

Après avoir perdu la grandeur des étoiles et de la mer, la plupart des GP Crypto qui n'ont pas réussi à générer des rendements excédentaires lors de ce cycle doivent lancer de manière pragmatique un produit avec un PMF, soit en prouvant leur capacité à aider les LP à obtenir des rendements excédentaires sur un marché de niche, soit en résolvant des problèmes spécifiques pour les LP/partenaires...

Rapport du matin | Coinbase Ventures réalise son premier investissement dans ENA ; SpaceX prévoit de fixer le prix de son introduction en bourse à 135 $ par action

Aperçu des événements importants du marché le 3 juin

Texte intégral et analyse du discours du PDG de SanDisk lors de la 42e conférence annuelle sur les décisions stratégiques de Bernstein

La valeur fondamentale du discours de Goeckeler réside dans la fourniture d'un cadre narratif très transparent et logiquement clair pour la transformation de l'entreprise.