Le nouveau produit d'Anthropic est-il assez puissant pour rendre l'équipe d'infrastructure d'agents IA obsolète ?

By: blockbeats|2026/04/09 13:00:12
0
Partager
copy
Titre original : "Anthropic a lancé aujourd'hui un nouveau produit susceptible de provoquer une vague de suppressions d'emplois au sein des équipes d'infrastructure d'agents IA"
Auteur original : Bayu, ingénieur IA

Ce produit s'appelle Claude Managed Agents. En résumé : vous indiquez à Anthropic le type d'agent IA que vous souhaitez, et il vous aide à l'exécuter dans le cloud, infrastructure incluse, avec une tarification basée sur l'utilisation. Sentry l'a utilisé pour mettre en place une correction automatisée des bugs de bout en bout en quelques semaines, tandis que Rakuten a déployé un agent spécialisé en une semaine. Auparavant, ces tâches auraient nécessité une équipe d'ingénierie entière travaillant pendant des mois.

Le nouveau produit d'Anthropic est-il assez puissant pour rendre l'équipe d'infrastructure d'agents IA obsolète ?

Pendant ce temps, le revenu récurrent annuel d'Anthropic vient de dépasser les 30 milliards de dollars, soit le triple de celui de décembre dernier. La majeure partie de cette croissance provient des entreprises clientes. Wall Street commence à s'inquiéter, le WSJ affirmant que les investisseurs deviennent de plus en plus prudents vis-à-vis du cours des actions des sociétés SaaS traditionnelles, craignant que des produits comme ceux d'Anthropic ne rendent certains services logiciels traditionnels obsolètes.

Qu'est-ce que ce produit exactement ? En quoi diffère-t-il de Claude Code que vous utilisez déjà ? Comment a-t-il été réalisé techniquement ?

Qu'est-ce que c'est ? En quoi diffère-t-il de Claude Code ?

Si vous avez utilisé Claude Code, vous savez comment fonctionnent les agents IA : vous leur confiez une tâche, et ils planifient les étapes de manière autonome, utilisent des outils, écrivent du code, modifient des fichiers et accomplissent la tâche étape par étape.

Claude Code s'exécute sur votre propre ordinateur et est un outil en ligne de commande destiné à un usage personnel par les développeurs. Il s'arrête lorsque vous éteignez votre ordinateur.

Les Managed Agents s'exécutent sur le cloud d'Anthropic et constituent un service API destiné aux entreprises. Ils peuvent fonctionner en continu 24h/24 et 7j/7, conservent leur progression même en cas de déconnexion, et votre produit peut intégrer directement les capacités de l'agent IA.

C'est ainsi que fonctionne Notion : les utilisateurs assignent des tâches aux agents Claude au sein de Notion, les agents travaillent en arrière-plan, accomplissent les tâches et renvoient les résultats, le tout sans que les utilisateurs aient à quitter Notion.

Quelques cas d'usage typiques :

· Déclenché par un événement : le système détecte un bug, assigne automatiquement un bot pour le corriger et soumettre une pull request, sans intervention humaine.

· Planifié : génère automatiquement un résumé de l'activité GitHub ou un compte-rendu de travail d'équipe chaque matin.

· « Fire-and-forget » : assignez une tâche à un bot dans Slack, il l'exécute et vous renvoie le document, la présentation PowerPoint ou l'application.

· Tâche de longue durée : exécution d'une recherche approfondie ou d'une tâche de refactorisation de code pendant plusieurs heures.

Quelle est la différence entre les bots hébergés dans le cloud et les bots internes ?

Vous pourriez les auto-héberger, mais c'est coûteux et lent.

Un bot intelligent capable d'être opérationnel nécessite bien plus qu'un simple « appel d'API » : un environnement sandbox (un espace sécurisé isolé où l'IA peut exécuter du code, modifier des fichiers et tester sans affecter le système externe réel, comme fournir à l'IA une machine virtuelle dédiée), une gestion des identifiants, une récupération d'état, un contrôle des permissions, un suivi de bout en bout, et plus encore.

De nombreuses entreprises clientes avaient besoin d'une équipe d'ingénierie entière dédiée à ces tâches. Désormais, c'est du « plug and play », libérant les ingénieurs pour qu'ils se concentrent sur le cœur du produit.

Cependant, les problèmes résolus par les Managed Agents vont au-delà de la simple économie de main-d'œuvre.

Matt Dongslee (@dongxi_nlp) propose un résumé concis :

Il existe un exemple spécifique dans le blog d'ingénierie d'Anthropic :

Lorsque Claude Sonnet 4.5 approche de la limite de la fenêtre de contexte, il « panique » et met fin à la tâche précipitamment. Ils ont ajouté une réinitialisation du contexte dans le framework de planification pour résoudre ce problème. Cependant, avec Claude Opus 4.5, ce problème a disparu et le correctif précédent est devenu un fardeau.

Si vous construisez votre propre framework de planification, vous devez le mettre à jour à chaque montée de version du modèle. Déléguez cette tâche à Anthropic ; ils l'optimisent pour vous, optimisant essentiellement ce qu'ils vous vendent.

Qui l'utilise ? Comment ?

Notion permet aux utilisateurs de déléguer des tâches telles que le codage, la création de présentations PPT et l'organisation de feuilles de calcul directement à Claude au sein de l'espace de travail, en exécutant des dizaines de tâches en parallèle, avec toute l'équipe collaborant sur le même résultat. Eric Liu, chef de produit chez Notion, a déclaré que les utilisateurs peuvent déléguer des tâches complexes et ouvertes sans quitter Notion.

Sentry a mis en place un processus entièrement automatisé « de la découverte du bug à la soumission du correctif ». Leur outil de débogage IA, Seer, après avoir identifié la cause première, permet à Claude d'écrire directement des correctifs et d'ouvrir des PR (pull requests). Le directeur de l'ingénierie, Indragie Karunaratne, a déclaré qu'ils ont pu lancer le service en quelques semaines, économisant ainsi les coûts de maintenance continus d'une infrastructure auto-construite.

Atlassian l'a intégré dans Jira, permettant aux développeurs d'assigner directement des tâches à l'IA de Claude.

Asana a créé des « AI Teammates », ajoutant des collaborateurs IA dans la gestion de projet capables de prendre en charge des tâches et des livrables.

General Legal (société de technologie juridique) a l'approche la plus intéressante : leur IA peut créer temporairement des outils pour rechercher des données en fonction des requêtes des utilisateurs. Auparavant, chaque requête utilisateur devait être anticipée et un outil de recherche développé à l'avance, mais désormais, l'IA les génère à la demande. Le CTO a déclaré que le temps de développement a été réduit par 10.

Rakuten a déployé des agents IA spécialisés dans les départements ingénierie, produit, ventes, marketing et finance, chacun étant opérationnel en une semaine, recevant des tâches via Slack et Teams et livrant des résultats tangibles tels que des feuilles de calcul, des présentations PPT et des applications.

Prix de --

--

Principe technique : découpler le cerveau des mains

L'équipe d'ingénierie d'Anthropic a rédigé un article technique intitulé « Scaling Managed Agents: Decoupling the brain from the hands », discutant de l'évolution architecturale derrière les Managed Agents.

Au départ, ils mettaient tout dans un seul conteneur : la boucle d'inférence de l'IA, l'environnement d'exécution de code et le journal de session, le tout ensemble. L'avantage était la simplicité, mais l'inconvénient était que tous les œufs étaient dans le même panier : si le conteneur tombait, toute la session était perdue, et les composants individuels ne pouvaient pas être remplacés séparément.

Plus tard, ils ont effectué une séparation clé :

· Le « Cerveau » est Claude et son framework de planification, responsable de la réflexion et de la prise de décision.

· La « Main » est la sandbox et divers outils, responsables de l'exécution des opérations spécifiques.

· La « Mémoire » est un journal de session indépendant, enregistrant tout ce qui se passe.

Les trois sont indépendants, et si l'un tombe, cela n'affecte pas les deux autres.

Cette séparation a apporté plusieurs avantages pratiques :

Vitesse

Toutes les tâches n'ont pas besoin de lancer l'environnement sandbox complet. Désormais, la sandbox n'est lancée qu'à la demande lorsque l'IA a réellement besoin d'exécuter du code. La latence médiane de la première réponse a diminué d'environ 60 %, et dans des cas extrêmes, elle a chuté de plus de 90 %.

Sécurité

Le code généré par l'IA s'exécute dans la sandbox, tandis que les identifiants pour accéder aux systèmes externes sont stockés dans un coffre-fort sécurisé en dehors de la sandbox, avec une isolation physique des deux côtés. Par exemple, pour accéder à un dépôt Git, le système clone le code lors de l'initialisation, et l'IA interagit normalement avec git push/pull, mais le jeton lui-même n'est pas visible pour l'IA. Pour des services comme Slack et Jira, ils sont accessibles via le protocole MCP, où les requêtes passent par une couche proxy, la couche proxy récupère les identifiants du coffre-fort pour appeler le service, et l'IA ne manipule jamais les identifiants tout au long du processus.

Flexibilité

Le Cerveau ne se soucie pas de ce qu'est la Main. Il y a une phrase intéressante dans le blog d'ingénierie : le framework de planification ne sait pas si la sandbox est un conteneur, un téléphone mobile ou un émulateur Pokémon. Il doit simplement respecter l'interface « entrer un nom, obtenir une chaîne de caractères ».

Cela signifie également que plusieurs Cerveaux peuvent partager la Main, et qu'un Cerveau peut passer la Main à un autre Cerveau, jetant ainsi les bases de la collaboration multi-agents.

Limites

Les Managed Agents ne sont pas tout-puissants. Il y a plusieurs points à noter :

Certaines fonctionnalités sont encore au stade de prévisualisation de recherche. Des capacités telles que la collaboration multi-agents, les outils de mémoire avancés et l'itération d'auto-évaluation (permettant à l'agent de juger la qualité de l'achèvement de sa tâche et de s'améliorer de manière itérative) ne sont pas encore totalement ouvertes et nécessitent une demande d'accès.

Verrouillage par la plateforme. Opter pour les Managed Agents signifie que votre infrastructure d'agents est liée à l'écosystème Anthropic. Si vous prévoyez de changer de modèle ou de plateforme à l'avenir, les coûts de migration ne doivent pas être négligés.

La gestion du contexte reste un défi. Bien que les journaux de session soient stockés indépendamment, décider quelles informations conserver ou supprimer lors de tâches longues implique toujours des décisions irréversibles. C'est un défi permanent, et leur approche actuelle sépare le stockage du contexte de la gestion du contexte : le stockage assure la préservation, tandis que les politiques de gestion s'ajustent avec l'évolution des modèles.

Prévisibilité des coûts. 0,08 $ par heure de session peut sembler raisonnable, mais pour des tâches complexes nécessitant que l'agent fonctionne pendant plusieurs heures, en tenant compte de la consommation de jetons et des coûts d'exécution, le coût global peut ne pas être négligeable. Les entreprises doivent évaluer leurs budgets en conséquence.

Les Managed Agents indiquent que la plupart des entreprises ont encore un long chemin à parcourir avant de pouvoir « compter entièrement sur les agents IA pour travailler ».

Bien que la barrière de l'infrastructure ait été abaissée, les Managed Agents ne peuvent pas aider à définir de bonnes tâches, à concevoir des flux de travail ou à établir la confiance nécessaire pour permettre à l'IA d'accéder aux données commerciales essentielles.

Le « moment AWS » de l'infrastructure des agents IA

Les Managed Agents semblent suivre la voie qu'AWS a empruntée à ses débuts : d'abord fournir la puissance de calcul, puis encapsuler l'environnement d'exécution.

Il y a dix ans, les entreprises débattaient de la nécessité de « passer au cloud » ; aujourd'hui, le débat porte sur le choix entre « auto-héberger l'infrastructure d'agents ou opter pour des services gérés ». L'expérience historique nous apprend que la plupart des entreprises choisissent finalement les services gérés, car l'infrastructure n'est jamais une compétence clé. OpenAI a également lancé sa propre plateforme d'agents, Frontier, et la concurrence dans ce domaine ne fait que commencer.

D'un point de vue technologique, l'approche architecturale de la « séparation du cerveau et de la main » mérite d'être soulignée. Elle permet à chaque partie du système d'évoluer indépendamment : mettre à jour le modèle, changer le cerveau ; besoin d'un nouvel outil, ajouter une main ; modifier la solution de stockage, remplacer la couche mémoire.

Une bonne analogie tirée d'un blog d'ingénierie : la commande read() d'un système d'exploitation ne se soucie pas de savoir si elle traite avec un disque des années 1970 ou un SSD moderne ; la couche d'abstraction est stable, permettant de remplacer facilement l'implémentation sous-jacente.

Du point de vue de l'utilisation, si vous êtes un développeur en entreprise cherchant à intégrer des capacités d'agent IA dans votre produit, les Managed Agents pourraient vous faire économiser plusieurs mois de travail d'infrastructure.

Six langages (Python, TypeScript, Java, Go, Ruby, PHP) sont pris en charge par des SDK. Si vous utilisez déjà Claude Code, mettez à jour vers la dernière version et tapez /claude-api managed-agents-onboarding pour commencer.

Si vous êtes un passionné d'IA, l'impact le plus immédiat que vous pourriez ressentir est le suivant : dans les produits SaaS que vous utilisez, de plus en plus d'agents IA travailleront en arrière-plan pour vous assister, ces agents fonctionnant probablement sur des Managed Agents.

Référence tarifaire : Les coûts des jetons sont basés sur la tarification standard de l'API Anthropic, avec un coût d'exécution de 0,08 $ par heure de session (le temps d'inactivité n'est pas facturé) et 10 $ par millier de recherches web.

Pensez-vous que l'infrastructure pour les agents IA sera finalement dominée par quelques acteurs majeurs, de la même manière que le cloud computing aujourd'hui ?

Lien vers l'article original

Vous pourriez aussi aimer

Rapport du matin | Coinbase Ventures réalise son premier investissement dans ENA ; SpaceX prévoit de fixer le prix de son introduction en bourse à 135 $ par action

Aperçu des événements importants du marché le 3 juin

Texte intégral et analyse du discours du PDG de SanDisk lors de la 42e conférence annuelle sur les décisions stratégiques de Bernstein

La valeur fondamentale du discours de Goeckeler réside dans la fourniture d'un cadre narratif très transparent et logiquement clair pour la transformation de l'entreprise.

Prévision du prix du Bitcoin pour 2030 : Ark Invest anticipe 710 000 $

Découvrez les prévisions de prix du bitcoin pour 2030 d'Ark Invest et de Standard Chartered, ainsi que les risques clés et comment positionner votre portefeuille. Analyse complète sur WEEX.

Prix du SOL aujourd'hui : cours en direct de Solana, graphiques et données de marché

Découvrez le prix du SOL aujourd'hui avec des données en temps réel, ainsi que les facteurs clés influençant le mouvement de Solana et des conseils de trading exploitables. Lisez l'analyse complète sur WEEX.

Qu'est-ce qu'un ETF Bitcoin : Spot vs Futures expliqués

Découvrez ce qu'est un ETF Bitcoin, comment fonctionnent les ETF spot et futures, et pourquoi les afflux institutionnels redéfinissent le BTC en 2026. Analyse WEEX.

Pourquoi le Bitcoin chute de 15 % alors que le Nasdaq atteint des records ?

Le Bitcoin chute de 15 % à 66 000 $ dans un contexte de tensions géopolitiques, tandis que le Nasdaq atteint des sommets historiques. Analyse des moteurs macroéconomiques, des flux d'ETF, du comportement des particuliers par rapport aux baleines, et de la corrélation cachée entre crypto et actions.

Cryptos populaires

Dernières actus crypto

Lire plus
iconiconiconiconiconicon
Assistance client:@weikecs
Collaborations commerciales:@weikecs
Trading quantitatif/Market makers:bd@weex.com
Programme VIP:support@weex.com