Convierta la IA en un sistema de ejecución individual, la última Guía de Mejores Prácticas de Agentes Gestionados de Claude

By: blockbeats|2026/04/09 18:00:10

Título del artículo original: Lanzamiento de Agentes Gestionados de Claude
Autor original: Lance Martin
Traducción: Peggy, BlockBeats

Nota del editor: Este artículo presenta los agentes gestionados lanzados por Claude. Proporciona un formulario de software más cercano al futuro: los agentes inteligentes ya no son interfaces que responden a solicitudes una sola vez, sino sistemas de ejecución que se pueden configurar, implementar, programar y ejecutar a largo plazo.

Al desacoplar completamente la "inteligencia" (modelo y marco de ejecución), la "ejecución" (herramientas y entorno seguro) y el "proceso" (sesión y registro), los agentes gestionados de Claude transforman el agente de "lógica en código" a una unidad de infraestructura independiente. Este diseño no solo mejora la estabilidad y seguridad del sistema en tareas de larga duración, sino que también permite que los agentes se expandan continuamente a medida que evolucionan las capacidades del modelo, sin estar limitados por los marcos existentes.

Dentro de este marco, los patrones de uso comunes también han cambiado: de la ejecución programada y desencadenada por eventos a la ejecución automática "desencadenada por entrega", y a tareas complejas que abarcan días o incluso semanas, los agentes adquieren verdaderamente la capacidad de "trabajar continuamente". Esto significa que el valor de la IA ya no se refleja únicamente en la calidad de una sola respuesta, sino en su capacidad para acumularse y componerse con el tiempo.

Si las API anteriores permitían a los desarrolladores "involucrar la inteligencia", los agentes gestionados ahora están intentando responder a otra pregunta: cómo hacer que la inteligencia sea un sistema que se pueda alojar, programar y ejecutar de forma continua. En este sentido, los agentes ya no son solo herramientas, sino más bien una nueva primitiva informática.

El artículo original es el siguiente:

TL;DR

Los agentes gestionados de Claude son un marco de ejecución de agentes preconstruido y configurable (arnés de agente) que se ejecuta en infraestructura gestionada. Solo necesita definir un agente como una plantilla, incluidas herramientas, habilidades, repositorios de archivos/código, etc., y el resto del marco de trabajo en tiempo de ejecución y la infraestructura son proporcionados por el sistema. Este sistema está diseñado para mantenerse al día con los niveles de inteligencia en rápido crecimiento de Claude y para admitir tareas de larga duración.

Enlaces relacionados:

·Blog de Claude: Patrones de uso y casos de clientes

·Blog de Ingeniería: Diseño de agentes gestionados por Claude

·Documentación: Guía de inicio, Inicio rápido, Descripción de la CLI y del SDK

Agentes gestionados por Claude

Por qué se necesitan agentes gestionados por Claude

La API de mensajes de Claude es, en esencia, un punto de entrada para interactuar directamente con el modelo: ingrese un mensaje y reciba un contenido a cambio bloque. Los agentes inteligentes creados en la API de mensajes deben depender de un "marco de ejecución" para manejar la ruta de invocación de herramientas, la gestión de contextos y más. Sin embargo, esto plantea varios desafíos:

1. El marco de ejecución debe mantenerse al día con las capacidades en evolución de Claude
Recientemente escribí una entrada de blog sobre cómo crear un agente basado en las capacidades subyacentes de la API de Claude para manejar la orquestación de herramientas y la gestión del contexto. Sin embargo, el problema es que el marco de ejecución del agente a menudo implica algunas suposiciones sobre "lo que Claude no puede hacer". A medida que las capacidades de Claude crecen, estas suposiciones se vuelven rápidamente obsoletas e incluso pueden convertirse en cuellos de botella de rendimiento. Por lo tanto, el marco de ejecución debe actualizarse continuamente para mantener el ritmo de evolución de Claude.

2. Los ciclos de vida de las tareas de Claude se están haciendo más largos
El rango de tareas que Claude puede manejar está creciendo exponencialmente, superando las 10 horas de trabajo humano en las pruebas de referencia METR. Esto exige mayores exigencias a la infraestructura subyacente del agente: debe tener seguridad, estabilidad en escenarios de larga duración (gestionando diversas fallas de infraestructura) y escalabilidad (por ejemplo, apoyando a múltiples equipos de agentes que funcionan simultáneamente).

Precio de --

¿Por qué son importantes estos desafíos?

Abordar los desafíos mencionados anteriormente es crucial porque anticipamos que las versiones futuras de Claude podrán operar de manera continua durante períodos de días, semanas o incluso meses, abordando los problemas más complejos de la humanidad.

El SDK del Agente Claude es el primer paso en esta dirección, proporcionando un marco de trabajo de agente inteligente de uso general y fácil de usar. Mientras tanto, los agentes gestionados de Claude dan un paso más: basándose en esta base, proporcionan un marco de ejecución completo + infraestructura gestionada específicamente diseñada para admitir la ejecución de tareas segura y confiable durante largos períodos de tiempo.

Introducción

Una forma sencilla de empezar es utilizando nuestra habilidad de código abierto claude-api, que se puede utilizar directamente en Claude Code. Simplemente instale la última versión de Claude Code y luego ejecute el siguiente subcomando para completar la configuración de inicialización de los agentes gestionados de Claude.

Personalmente, tengo una fuerte preferencia por el enfoque de "habilidades" para integrar nuevas funcionalidades, y uso esta habilidad de manera extensiva en la práctica.

Convierta la IA en un sistema de ejecución individual, la última Guía de Mejores Prácticas de Agentes Gestionados de Claude

Además, puede consultar nuestra documentación para empezar rápidamente con el SDK o la CLI y prototipar sus agentes en la Consola de Claude.

Casos de uso

Puede encontrar muchos casos de uso interesantes en el blog oficial de Claude. Combinando estos casos con mi propia experiencia práctica, he observado algunos patrones de uso comunes:

1. Desencadenado por evento
Ejecución de tareas por un agente gestionado desencadenada por un servicio.
Por ejemplo, cuando se detecta un error en el sistema, se realiza una llamada automatizada a un agente gestionado para escribir un parche y enviar una solicitud de extracción. No se requiere intervención humana entre las etapas de "problema identificado" y "parche aplicado".

2. Ejecución programada
Programar tareas para que un agente gestionado las ejecute.
Por ejemplo, muchas personas, incluido yo mismo, utilizamos este método para generar informes diarios (como un resumen de actividades en la Plataforma X o GitHub, o un informe de progreso del equipo generado por un agente). A continuación, se muestra un ejemplo de mi resumen diario de actividades en la Plataforma X.

3. Ejecución y olvido
Ejecución de tareas por un agente gestionado desencadenada por un ser humano pero que no requiere seguimiento continuo. Por ejemplo, asignar tareas a un agente gestionado a través de Slack o Teams, que luego completa la tarea de forma autónoma y entrega los resultados (como tablas, diapositivas o incluso aplicaciones).

4. Tareas de largo plazo
Una tarea de larga duración, que considero uno de los escenarios particularmente valiosos para los agentes gestionados.
He realizado algunos experimentos basados en el repositorio de investigación automática de Andrej Karpathy, explorando diferentes formas de aplicación. Por ejemplo, recientemente utilicé la biblioteca de pretexto de _chenglou como entrada y hice que un agente gestionado investigara cómo aplicarla al contenido de nuestro blog de ingeniería.

Conceptos básicos

Hay tres conceptos fundamentales que hay que entender en el proceso de incorporación:

1. Agente
Una configuración con control de versiones que define la "identidad" del agente: incluyendo el modelo, el mensaje de sistema, las herramientas, las habilidades, el servidor MCP, etc. Una vez creado, se puede invocar repetidamente a través de ID.

2. Entorno
Una plantilla utilizada para describir el entorno de sandbox proporcionado para que se ejecute la herramienta del agente (por ejemplo, tipo de tiempo de ejecución, política de red, configuración del paquete de dependencias, etc.).

3. Sesión
Una instancia en ejecución con estado lanzada en función de un agente y entorno preconfigurados. Creará un nuevo entorno de sandbox a partir de la plantilla del entorno, montará los recursos necesarios para esta ejecución (como archivos, repositorios de GitHub) y almacenará de forma segura la información de autenticación en un almacén de claves (como las credenciales de MCP).

Puede pensarlo de esta manera:

· Agente = La propia configuración

· Entorno = La plantilla de entorno de pruebas necesaria para el funcionamiento del agente

· Sesión = Un proceso de ejecución específico

Un Agente puede corresponder a varias Sesiones.

Uso

Consulte la documentación para obtener más detalles. El uso general se divide en dos categorías:

1. SDK (orientado a código)
Integre el SDK en su aplicación para gestionar sesiones en tiempo de ejecución. Actualmente, los agentes gestionados admiten 6 idiomas: Python, TypeScript, Java, Go, Ruby, PHP.

2. CLI (Interfaz de línea de comandos)
Interactúa con todos los recursos de la API a través de la línea de comandos, incluidos agentes, entornos, sesiones, bóvedas, habilidades, archivos, etc. Cada tipo de recurso tiene subcomandos correspondientes.

Práctica común:
Por lo general, la CLI se utiliza para la configuración e inicialización, mientras que el SDK se utiliza para la lógica en tiempo de ejecución.
Una plantilla de agente es persistente: puede crear una plantilla (por ejemplo, definiendo el modelo, el mensaje de sistema, las herramientas, el servidor MCP, las habilidades en YAML), almacenarla en Git y aplicarla durante el proceso de implementación a través de la CLI.

Flujo de trabajo

Coescribí una entrada de blog de ingeniería de Anthropic con @mc_anthropic, @gcemaj y @jkeatn, que proporcionó una explicación detallada de la construcción de los agentes gestionados por Claude. Una conclusión clave del artículo fue que permitir que los agentes se escalen con el nivel de inteligencia de Claude es fundamentalmente un "problema de infraestructura", no solo un problema de diseño del marco de trabajo en tiempo de ejecución.

Esto significa que el verdadero desafío no radica en "cómo escribir un agente más inteligente", sino en cómo construir un sistema que pueda funcionar de manera estable a largo plazo, ser escalable y ser evolutivo, permitiendo que el agente pueda realizar tareas cada vez más complejas y a largo plazo.

Basándonos en esta filosofía, nosotros did no diseñamos un marco de tiempo de ejecución de agente fijo (armazón) ya que anticipamos su evolución continua. En su lugar, "desacoplamos" varias partes clave del sistema:

“Cerebro” (Claude y su marco de tiempo de ejecución)

“Manos” (sandbox y herramienta que realiza acciones concretas)

“Sesión” (registra los registros de eventos de ejecución)

Estos tres se diseñaron como interfaces independientes con suposiciones mínimas entre sí. Cada parte puede fallar o reemplazarse de forma independiente sin afectar al sistema en general.

En el artículo, también compartimos cómo esta arquitectura ofrece mayor fiabilidad, seguridad y flexibilidad, al mismo tiempo que deja espacio para la futura integración de nuevos marcos de tiempo de ejecución, entornos protegidos o infraestructuras que alojen sesiones.

Conclusión

Estoy muy emocionado con los proyectos que exploran la Orquestación de Múltiples Agentes o las tareas de largo horizonte. Algo que siempre me ha frustrado en el pasado es cómo el marco de ejecución del agente lucha por mantenerse al día con las capacidades en evolución del modelo.

La importancia de los Agentes Gestionados por Claude es que se encarga del marco de ejecución y la capa de infraestructura para usted, permitiéndole concentrarse en un nivel más alto, tratando al "agente" en sí como una nueva primitiva fundamental en la API de Claude, lo que permite una mayor exploración y desarrollo sobre ella.

[Enlace de la publicación original]

Te puede gustar

He Yi: Ya que estás aquí, más vale intentarlo

He Yi, de Binance, fue seleccionada para la lista de "Mujeres más poderosas en los negocios" de Fortune, expresó su gratitud a la comunidad y anunció la nueva visión de Binance: construir una infraestructura financiera al servicio de 3.000 millones de personas en todo el mundo.

WEEX GOGOGO EP3｜LALIGA Camino al Oro – 6 momentos explosivos, 1 entrada para la Copa del Mundo y una noche inolvidable

WEEX se puso en marcha el 24 de mayo con LALIGA, trading con IA, oro sin comisiones y un 100% de TAE. El chat explotó. Las recompensas volaron. Y un afortunado fan se llevó una entrada para la Copa del Mundo. Esto es lo que pasó.

¿2 años, 225 veces la rentabilidad? Revelando la misteriosa técnica de inversión de "cuello de botella" en IA del investigador Serenity

El ex trader de WSB, Serenity, ha logrado una asombrosa rentabilidad de 225 veces en la plataforma X durante dos años, con su teoría original de "cuello de botella en la cadena de suministro" y varios casos de estudio clásicos de micro-capitalización que han atraído una fuerte atención del mercado.

B.AI se asocia con BNB Chain para lanzar la celebración "Subsidio de Tokens de IA de Mil Millones", impulsando el ecosistema de agentes inteligentes on-chain

B.AI se asocia con BNB Chain para lanzar un programa de subsidios de cien mil millones de puntos, con un incentivo especial adicional de 8.000 USDT en el fondo de premios total, ayudando a los usuarios de Web3 a acceder a los mejores modelos de lenguaje sin barreras y a experimentar una infraestructura financiera de IA completa.

El frenesí del billón de dólares por vender memoria: los beneficios de comprarla se reducen a la mitad

La demanda de potencia de computación y almacenamiento por parte de la IA podría ser estructural, y los LTA podrían haber reescrito las reglas del sector; un valor de mercado de un billón de dólares podría ser solo el punto de partida.

El sueño de exploración de Marte de SuperEx: la moneda digital es la clave para desbloquear los intercambios económicos en la era interestelar

SuperEx siempre ha pedido a los exchanges que no se centren en conflictos internos ni en la competencia, sino en promover conjuntamente el desarrollo de las monedas digitales, convirtiéndose en una fuerza impulsora para la futura era interestelar.

Noticias de la mañana | Michael Saylor declaró que esta semana compró bonos en lugar de Bitcoin; StablR fue atacado y perdió cerca de 2,8 millones de dólares; el Congreso de EE. UU. vuelve a impulsar la Ley de Reserva de Bitcoin

Resumen de los eventos importantes del mercado el 24 de mayo

Puntos clave: Texto completo del discurso del científico jefe de Google, Shanahan

Discurso en Londres del científico jefe de Google DeepMind, Shanahan: Deconstrucción de los atributos mentales de los modelos de lenguaje extensos (LLM) mediante el marco de Wittgenstein, analizando la tendencia de la "identidad propia alienígena" en el contexto de los agentes todo terreno.

Patrones de diseño de agentes: Un libro que me hizo replantearme "¿Qué es exactamente un agente?"

El nuevo libro de un director de ingeniería de Google analiza profundamente 21 patrones de diseño de agentes de IA. Este artículo revela la progresión central desde un "LLM básico" hasta agentes inteligentes avanzados, detallando la ingeniería de contexto, el mecanismo de reflexión dual del agente (Productor-Crítico) y el modelo de memoria de tres capas, entre otros...

Ha llegado el presidente de la Reserva Federal más rico en 112 años: Kevin Warsh está reescribiendo las reglas

El nuevo presidente «más rico» de la Reserva Federal, Kevin Warsh, ha tomado posesión oficialmente. Su propuesta alternativa de «reducción del balance + recortes de tipos de interés» no solo pretende remodelar el mecanismo de toma de decisiones, sino también alterar profundamente al Tesoro de EE. UU., al dólar y al panorama global...

Vitalik habla sobre el futuro de la Ethereum Foundation: una nave más pequeña, más distintiva y más duradera

Vitalik profundizó en sus puntos de vista personales sobre la dirección de la transformación de la Ethereum Foundation: la EF no es "el centro de Ethereum", sino uno de los muchos nodos. Con recursos limitados, la EF elige el largo plazo en lugar de dispersarse, centrándose en tareas clave que "no sucederían sin la EF"—...

Nuevos tipos de blanqueo de información en mercados de predicción: cómo los secretos se integran en las señales de inversión

La cruda realidad es que el blanqueo de información no es una laguna creada por el hombre en el mercado de predicción, sino un efecto secundario de su mecanismo operativo central.

Bitcoin Pizza Day en WEEX: cero comisiones, cashback en BTC y 150.000 USDT para honrar la historia cripto

¡Únete a la celebración del Pizza Day de WEEX! Desde cero comisiones hasta cashback en BTC, honramos la primera transacción de bitcoin de la historia en el mundo real. Con un fondo de premios de 150.000 USDT, así es como WEEX recompensa a sus usuarios y rinde homenaje a la historia cripto.

a16z: 7 gráficos para entender cómo la tokenización cambia la naturaleza de los activos

Es mucho más que simplemente trasladar activos tradicionales a la cadena de bloques.

Por qué los traders de criptomonedas vuelven a observar el oro y el Nasdaq en 2026

Bitcoin se mueve en un rango mientras la volatilidad del oro y el Nasdaq se dispara en 2026. Descubra por qué los traders de criptomonedas están utilizando USDT para operar con oro, plata e índices globales sin necesidad de una cuenta de corretaje tradicional.

AIDC, alquiler de potencia de cálculo y nube: La "tesis de tres partes" de la transformación de la IA en las granjas de minería de criptomonedas

La "transformación hacia la IA" de las granjas de minería de criptomonedas no es solo un eslogan; se está desarrollando en tres etapas reconocibles.

Futu ha visto confiscadas todas sus ganancias ilegales, un aviso para los exchanges de criptomonedas

Incluso si las instituciones financieras extranjeras obtienen licencias en el exterior, mientras presten servicios financieros de manera efectiva a residentes en China continental, las autoridades reguladoras chinas pueden evaluar sus acciones conforme a la ley china.

Pizza, póker e trading con IA: Un resumen del WEEX Crypto Pizza Day en Dubái

Revive el WEEX Crypto Pizza Day en Dubái, donde la comunidad cripto de la región MENA se reunió en el WEEX Dubai Studio para celebrar el Bitcoin Pizza Day con pizza, póker, networking y una competición de trading con IA en vivo. Descubre cómo WEEX convirtió un hito histórico de las criptomonedas en una experiencia práctica de trading con IA.

He Yi: Ya que estás aquí, más vale intentarlo

WEEX GOGOGO EP3｜LALIGA Camino al Oro – 6 momentos explosivos, 1 entrada para la Copa del Mundo y una noche inolvidable

¿2 años, 225 veces la rentabilidad? Revelando la misteriosa técnica de inversión de "cuello de botella" en IA del investigador Serenity

B.AI se asocia con BNB Chain para lanzar la celebración "Subsidio de Tokens de IA de Mil Millones", impulsando el ecosistema de agentes inteligentes on-chain

El frenesí del billón de dólares por vender memoria: los beneficios de comprarla se reducen a la mitad

El sueño de exploración de Marte de SuperEx: la moneda digital es la clave para desbloquear los intercambios económicos en la era interestelar

Contenido

Monedas populares

Últimas noticias cripto

17:42

Bit Digital concede un préstamo de 100 millones de dólares a WhiteFiber para apoyar la expansión de la infraestructura de IA con crédito en Ethereum

Según The Block, Bit Digital ha anunciado un préstamo a plazo con disposición diferida de 100 millones de dólares a una filial de WhiteFiber, su empresa controlada de infraestructura de IA, ampliable a 150 millones por mutuo acuerdo, para apoyar los recientes planes de expansión de computación de alto rendimiento e IA de WhiteFiber. B...

ETH

17:42

La filial de Aave, Push, recibe la aprobación de la FCA para operar como proveedor de servicios de intercambio de criptomonedas en el Reino Unido

Las filiales británicas de Aave Labs, Push Labs Ltd y Push Virtual Assets Ltd, han recibido la aprobación de la Autoridad de Conducta Financiera (FCA) del Reino Unido para registrarse como proveedores locales de servicios de intercambio de criptomonedas. Aave declaró que estas licencias permiten a Push realizar actividades reguladas relacionadas con criptomonedas y pagos...

AAVE

17:42

Datos: Una ballena vendió 102.000 HYPE, obteniendo más de 1 millón de dólares de beneficio en 13 días

Según el seguimiento de Onchain Lens, la ballena que comienza por 0x688 vendió 102.001 HYPE a un precio medio de 57,3 $ cada uno, obteniendo 5,84 millones de USDC y logrando un beneficio de más de 1 millón de dólares en 13 días. La cartera solo conserva actualmente 54 HYPE.

17:42

Análisis: En los últimos 30 días, más de 100.000 BTC fluyeron hacia plataformas de trading mientras las stablecoins aceleraron su salida, aumentando la presión vendedora en el mercado

El analista de criptomonedas Axel Adler Jr. afirmó que la entrada de BTC a las plataformas de trading y la salida de stablecoins de las mismas emiten simultáneamente una señal de "aversión al riesgo", lo que indica que la presión vendedora en el mercado está aumentando. Los datos muestran que la entrada neta de BTC a las plataf...

16:42

Los ingresos de DGrid AI Genesis superan los 20 millones de USD, acelerando la integración de la IA y la comunidad cripto

La red de infraestructura de IA descentralizada DGrid AI anunció los datos más recientes de su programa de membresía Genesis: los ingresos acumulados han superado los 20 millones de dólares, con más de 13.000 suscriptores de pago. Los fondos se depositan en una billetera de tesorería multifirma Safe en BNB Chain verificable públicamente, lo que garantiza la...

BNB

IOTX