Convierta la IA en un sistema de ejecución individual, la última Guía de Mejores Prácticas de Agentes Gestionados de Claude
Título del artículo original: Lanzamiento de Agentes Gestionados de Claude
Autor original: Lance Martin
Traducción: Peggy, BlockBeats
Nota del editor: Este artículo presenta los agentes gestionados lanzados por Claude. Proporciona un formulario de software más cercano al futuro: los agentes inteligentes ya no son interfaces que responden a solicitudes una sola vez, sino sistemas de ejecución que se pueden configurar, implementar, programar y ejecutar a largo plazo.
Al desacoplar completamente la "inteligencia" (modelo y marco de ejecución), la "ejecución" (herramientas y entorno seguro) y el "proceso" (sesión y registro), los agentes gestionados de Claude transforman el agente de "lógica en código" a una unidad de infraestructura independiente. Este diseño no solo mejora la estabilidad y seguridad del sistema en tareas de larga duración, sino que también permite que los agentes se expandan continuamente a medida que evolucionan las capacidades del modelo, sin estar limitados por los marcos existentes.
Dentro de este marco, los patrones de uso comunes también han cambiado: de la ejecución programada y desencadenada por eventos a la ejecución automática "desencadenada por entrega", y a tareas complejas que abarcan días o incluso semanas, los agentes adquieren verdaderamente la capacidad de "trabajar continuamente". Esto significa que el valor de la IA ya no se refleja únicamente en la calidad de una sola respuesta, sino en su capacidad para acumularse y componerse con el tiempo.
Si las API anteriores permitían a los desarrolladores "involucrar la inteligencia", los agentes gestionados ahora están intentando responder a otra pregunta: cómo hacer que la inteligencia sea un sistema que se pueda alojar, programar y ejecutar de forma continua. En este sentido, los agentes ya no son solo herramientas, sino más bien una nueva primitiva informática.
El artículo original es el siguiente:
TL;DR
Los agentes gestionados de Claude son un marco de ejecución de agentes preconstruido y configurable (arnés de agente) que se ejecuta en infraestructura gestionada. Solo necesita definir un agente como una plantilla, incluidas herramientas, habilidades, repositorios de archivos/código, etc., y el resto del marco de trabajo en tiempo de ejecución y la infraestructura son proporcionados por el sistema. Este sistema está diseñado para mantenerse al día con los niveles de inteligencia en rápido crecimiento de Claude y para admitir tareas de larga duración.
Enlaces relacionados:
·Blog de Claude: Patrones de uso y casos de clientes
·Blog de Ingeniería: Diseño de agentes gestionados por Claude
·Documentación: Guía de inicio, Inicio rápido, Descripción de la CLI y del SDK
Agentes gestionados por Claude
Por qué se necesitan agentes gestionados por Claude
La API de mensajes de Claude es, en esencia, un punto de entrada para interactuar directamente con el modelo: ingrese un mensaje y reciba un contenido a cambio bloque. Los agentes inteligentes creados en la API de mensajes deben depender de un "marco de ejecución" para manejar la ruta de invocación de herramientas, la gestión de contextos y más. Sin embargo, esto plantea varios desafíos:
1. El marco de ejecución debe mantenerse al día con las capacidades en evolución de Claude
Recientemente escribí una entrada de blog sobre cómo crear un agente basado en las capacidades subyacentes de la API de Claude para manejar la orquestación de herramientas y la gestión del contexto. Sin embargo, el problema es que el marco de ejecución del agente a menudo implica algunas suposiciones sobre "lo que Claude no puede hacer". A medida que las capacidades de Claude crecen, estas suposiciones se vuelven rápidamente obsoletas e incluso pueden convertirse en cuellos de botella de rendimiento. Por lo tanto, el marco de ejecución debe actualizarse continuamente para mantener el ritmo de evolución de Claude.
2. Los ciclos de vida de las tareas de Claude se están haciendo más largos
El rango de tareas que Claude puede manejar está creciendo exponencialmente, superando las 10 horas de trabajo humano en las pruebas de referencia METR. Esto exige mayores exigencias a la infraestructura subyacente del agente: debe tener seguridad, estabilidad en escenarios de larga duración (gestionando diversas fallas de infraestructura) y escalabilidad (por ejemplo, apoyando a múltiples equipos de agentes que funcionan simultáneamente).
¿Por qué son importantes estos desafíos?
Abordar los desafíos mencionados anteriormente es crucial porque anticipamos que las versiones futuras de Claude podrán operar de manera continua durante períodos de días, semanas o incluso meses, abordando los problemas más complejos de la humanidad.
El SDK del Agente Claude es el primer paso en esta dirección, proporcionando un marco de trabajo de agente inteligente de uso general y fácil de usar. Mientras tanto, los agentes gestionados de Claude dan un paso más: basándose en esta base, proporcionan un marco de ejecución completo + infraestructura gestionada específicamente diseñada para admitir la ejecución de tareas segura y confiable durante largos períodos de tiempo.
Introducción
Una forma sencilla de empezar es utilizando nuestra habilidad de código abierto claude-api, que se puede utilizar directamente en Claude Code. Simplemente instale la última versión de Claude Code y luego ejecute el siguiente subcomando para completar la configuración de inicialización de los agentes gestionados de Claude.
Personalmente, tengo una fuerte preferencia por el enfoque de "habilidades" para integrar nuevas funcionalidades, y uso esta habilidad de manera extensiva en la práctica.

Además, puede consultar nuestra documentación para empezar rápidamente con el SDK o la CLI y prototipar sus agentes en la Consola de Claude.
Casos de uso
Puede encontrar muchos casos de uso interesantes en el blog oficial de Claude. Combinando estos casos con mi propia experiencia práctica, he observado algunos patrones de uso comunes:
1. Desencadenado por evento
Ejecución de tareas por un agente gestionado desencadenada por un servicio.
Por ejemplo, cuando se detecta un error en el sistema, se realiza una llamada automatizada a un agente gestionado para escribir un parche y enviar una solicitud de extracción. No se requiere intervención humana entre las etapas de "problema identificado" y "parche aplicado".
2. Ejecución programada
Programar tareas para que un agente gestionado las ejecute.
Por ejemplo, muchas personas, incluido yo mismo, utilizamos este método para generar informes diarios (como un resumen de actividades en la Plataforma X o GitHub, o un informe de progreso del equipo generado por un agente). A continuación, se muestra un ejemplo de mi resumen diario de actividades en la Plataforma X.

3. Ejecución y olvido
Ejecución de tareas por un agente gestionado desencadenada por un ser humano pero que no requiere seguimiento continuo. Por ejemplo, asignar tareas a un agente gestionado a través de Slack o Teams, que luego completa la tarea de forma autónoma y entrega los resultados (como tablas, diapositivas o incluso aplicaciones).
4. Tareas de largo plazo
Una tarea de larga duración, que considero uno de los escenarios particularmente valiosos para los agentes gestionados.
He realizado algunos experimentos basados en el repositorio de investigación automática de Andrej Karpathy, explorando diferentes formas de aplicación. Por ejemplo, recientemente utilicé la biblioteca de pretexto de _chenglou como entrada y hice que un agente gestionado investigara cómo aplicarla al contenido de nuestro blog de ingeniería.

Conceptos básicos
Hay tres conceptos fundamentales que hay que entender en el proceso de incorporación:
1. Agente
Una configuración con control de versiones que define la "identidad" del agente: incluyendo el modelo, el mensaje de sistema, las herramientas, las habilidades, el servidor MCP, etc. Una vez creado, se puede invocar repetidamente a través de ID.
2. Entorno
Una plantilla utilizada para describir el entorno de sandbox proporcionado para que se ejecute la herramienta del agente (por ejemplo, tipo de tiempo de ejecución, política de red, configuración del paquete de dependencias, etc.).
3. Sesión
Una instancia en ejecución con estado lanzada en función de un agente y entorno preconfigurados. Creará un nuevo entorno de sandbox a partir de la plantilla del entorno, montará los recursos necesarios para esta ejecución (como archivos, repositorios de GitHub) y almacenará de forma segura la información de autenticación en un almacén de claves (como las credenciales de MCP).
Puede pensarlo de esta manera:
· Agente = La propia configuración
· Entorno = La plantilla de entorno de pruebas necesaria para el funcionamiento del agente
· Sesión = Un proceso de ejecución específico
Un Agente puede corresponder a varias Sesiones.
Uso
Consulte la documentación para obtener más detalles. El uso general se divide en dos categorías:
1. SDK (orientado a código)
Integre el SDK en su aplicación para gestionar sesiones en tiempo de ejecución. Actualmente, los agentes gestionados admiten 6 idiomas: Python, TypeScript, Java, Go, Ruby, PHP.
2. CLI (Interfaz de línea de comandos)
Interactúa con todos los recursos de la API a través de la línea de comandos, incluidos agentes, entornos, sesiones, bóvedas, habilidades, archivos, etc. Cada tipo de recurso tiene subcomandos correspondientes.
Práctica común:
Por lo general, la CLI se utiliza para la configuración e inicialización, mientras que el SDK se utiliza para la lógica en tiempo de ejecución.
Una plantilla de agente es persistente: puede crear una plantilla (por ejemplo, definiendo el modelo, el mensaje de sistema, las herramientas, el servidor MCP, las habilidades en YAML), almacenarla en Git y aplicarla durante el proceso de implementación a través de la CLI.
Flujo de trabajo
Coescribí una entrada de blog de ingeniería de Anthropic con @mc_anthropic, @gcemaj y @jkeatn, que proporcionó una explicación detallada de la construcción de los agentes gestionados por Claude. Una conclusión clave del artículo fue que permitir que los agentes se escalen con el nivel de inteligencia de Claude es fundamentalmente un "problema de infraestructura", no solo un problema de diseño del marco de trabajo en tiempo de ejecución.
Esto significa que el verdadero desafío no radica en "cómo escribir un agente más inteligente", sino en cómo construir un sistema que pueda funcionar de manera estable a largo plazo, ser escalable y ser evolutivo, permitiendo que el agente pueda realizar tareas cada vez más complejas y a largo plazo.

Basándonos en esta filosofía, nosotros did no diseñamos un marco de tiempo de ejecución de agente fijo (armazón) ya que anticipamos su evolución continua. En su lugar, "desacoplamos" varias partes clave del sistema:
“Cerebro” (Claude y su marco de tiempo de ejecución)
“Manos” (sandbox y herramienta que realiza acciones concretas)
“Sesión” (registra los registros de eventos de ejecución)
Estos tres se diseñaron como interfaces independientes con suposiciones mínimas entre sí. Cada parte puede fallar o reemplazarse de forma independiente sin afectar al sistema en general.
En el artículo, también compartimos cómo esta arquitectura ofrece mayor fiabilidad, seguridad y flexibilidad, al mismo tiempo que deja espacio para la futura integración de nuevos marcos de tiempo de ejecución, entornos protegidos o infraestructuras que alojen sesiones.
Conclusión
Estoy muy emocionado con los proyectos que exploran la Orquestación de Múltiples Agentes o las tareas de largo horizonte. Algo que siempre me ha frustrado en el pasado es cómo el marco de ejecución del agente lucha por mantenerse al día con las capacidades en evolución del modelo.
La importancia de los Agentes Gestionados por Claude es que se encarga del marco de ejecución y la capa de infraestructura para usted, permitiéndole concentrarse en un nivel más alto, tratando al "agente" en sí como una nueva primitiva fundamental en la API de Claude, lo que permite una mayor exploración y desarrollo sobre ella.
Te puede gustar

Hyperbeat, para lanzar un "banco" en Hyperliquid

Investigación macro del mercado de criptomonedas: Alto el fuego entre Estados Unidos e Irán, momento para reevaluar los activos de riesgo

¿Bitcoin tocará fondo en 2026? Cómo el impacto arancelario y el alto el fuego podrían impulsar el BTC hacia los 75.000 dólares.
Es posible que Bitcoin esté formando su mínimo de 2026 cerca de los 65.000 dólares. Vea cómo las fluctuaciones arancelarias, las entradas de capital en los ETF y el alto el fuego en Irán podrían influir en el próximo repunte del BTC hacia los 75.000 dólares.

Las stablecoins alcanzarán los 315 mil millones de dólares en 2026: Por qué esta es la mayor tendencia en criptomonedas ahora mismo.
Es posible que Bitcoin esté formando su mínimo de 2026 cerca de los 65.000 dólares. Descubre cómo las fluctuaciones arancelarias, las entradas de capital en los ETF y las señales geopolíticas podrían influir en la próxima subida del BTC hacia los 75.000 dólares.

Investigación sobre tigres: Un análisis exhaustivo de los negocios más rentables y sus modelos de negocio en el mundo de las criptomonedas.

¿Por qué el alto el fuego entre Estados Unidos e Irán está destinado a ser insostenible?

Lanzamiento de hoy | Lista completa de demostraciones de invitados en "Super Creator Live"

A partir del mundo de las criptomonedas, ¿qué hace que Hermes Agent sea el mayor retador a OpenClaw?

¿Un jugador de Oriente Medio poco conocido se convertirá en la estrella del mercado de predicciones para el Mundial de 2026?

¿Por qué está condenado al fracaso el alto el fuego entre Estados Unidos e Irán?

El viaje de 30 días de un propietario de un gimnasio de escalada con la IA

Crypto OG, ¿por qué Hermes Agent se ha convertido en el principal competidor de OpenClaw?

Los ocho años de trayectoria empresarial de Kalshi: Un boxeador con traje sube al escenario.

La apuesta de 950 millones de dólares del gobierno de Trump sobre el desplome del precio del petróleo antes del alto el fuego convirtió el mercado del crudo en un paraíso para el uso de información privilegiada.

¿Por qué Trump llevó a Estados Unidos a la guerra con Irán?

De la amenaza al alto el fuego: ¿Cómo lo hizo Estados Unidos? ¿Perder su dominio?

Noticias de la mañana | Yi Lihua establece el fondo de IA OpenX Labs; Pharos Network completa una financiación de Serie A de 44 millones de dólares; Irán exige que los petroleros en Hormuz paguen peajes en Bitcoin

¿Cuánto tiempo puede sobrevivir el ecosistema de Ethereum después del lanzamiento de Mythos?
Hyperbeat, para lanzar un "banco" en Hyperliquid
Investigación macro del mercado de criptomonedas: Alto el fuego entre Estados Unidos e Irán, momento para reevaluar los activos de riesgo
¿Bitcoin tocará fondo en 2026? Cómo el impacto arancelario y el alto el fuego podrían impulsar el BTC hacia los 75.000 dólares.
Es posible que Bitcoin esté formando su mínimo de 2026 cerca de los 65.000 dólares. Vea cómo las fluctuaciones arancelarias, las entradas de capital en los ETF y el alto el fuego en Irán podrían influir en el próximo repunte del BTC hacia los 75.000 dólares.
Las stablecoins alcanzarán los 315 mil millones de dólares en 2026: Por qué esta es la mayor tendencia en criptomonedas ahora mismo.
Es posible que Bitcoin esté formando su mínimo de 2026 cerca de los 65.000 dólares. Descubre cómo las fluctuaciones arancelarias, las entradas de capital en los ETF y las señales geopolíticas podrían influir en la próxima subida del BTC hacia los 75.000 dólares.
