Ramp Labs presenta una solución multiagente para compartir la memoria: el consumo de tokens se redujo hasta en un 65%

By: theblockbeats.news|2026/04/11 14:19:36

bloque News, 11 de APR, la Empresa de infraestructura de IA Ramp Labs publicó los resultados de la investigación sobre el “Latent Briefing”, logrando un intercambio eficiente de memoria entre sistemas multiagente a través de la compresión directa del caché de KV del modelo a gran escala, reduciendo significativamente el consumo de token sin sacrificar la precisión.

En las arquitecturas multiagente convencionales, el Orchestrator descompone tareas y llama repetidamente a modelos Worker. A medida que se extiende la cadena de inferencia, el uso de token se infla exponencialmente. La idea central de la información latente es el apalancamiento del mecanismo de atención para identificar las partes verdaderamente críticas en el contexto, desechar directamente la información redundante en la capa de representación, en lugar de confiar en el resumen de LLM a baja velocidad o la recuperación inestable de RAG.

En la prueba de referencia en long v2, este método tuvo un rendimiento notable: El consumo de token disminuyó en un 65%, la mediana de Ahorros de token para documentos de longitud media (32.000 a 100.000) alcanzó el 49%, la precisión general mejoró aproximadamente 3 puntos porcentuales en comparación con la línea base, y el tiempo adicional para cada compresión fue de solo aproximadamente 1,7 segundos, alcanzando una velocidad de aproximadamente 20 veces en comparación con el algoritmo original.

El experimento utilizó a Claude Sonnet 4 como orquestador, y a Qwen3-14B como modelo trabajador, cubriendo varios escenarios documentales como documentos académicos, documentos legales, novelas e informes gubernamentales. La investigación también encontró que el umbral de compresión óptimo varía según la dificultad de la tarea y la longitud del documento: tareas difíciles son adecuadas para compresión agresiva para filtrar el ruido de razonamiento especulativo, mientras que los documentos en long son más adecuados para compresión leve para retener información clave dispersa.

También te puede interesar

Reporte matutino | Coinbase Ventures realiza su primera inversión en ENA; SpaceX planea fijar el precio de su OPI en $135 por acción

Resumen de eventos importantes del mercado el 3 de junio

Texto completo y análisis del discurso del CEO de SanDisk en la 42.ª Conferencia Anual de Decisiones Estratégicas de Bernstein

El valor fundamental del discurso de Goeckeler reside en que proporciona un marco narrativo altamente transparente y lógicamente claro para la transformación corporativa.

Reporte matutino | Strategy vendió 32 BTC y más de 800,000 acciones de MSTR la semana pasada; Binance anunció oficialmente su portal de trading de acciones de EE. UU.; Polymarket alcanzó una asociación exclusiva con OneFootball

Resumen de eventos importantes del mercado el 1 de junio

Bootcamp de trading WEEXPERIENCE en Polonia: Cómo WEEX y FireCrew están haciendo que el trading de criptomonedas sea accesible para todos

WEEX se asoció con Firecrew en Polonia el 29 de mayo para el bootcamp de trading WEEXPERIENCE. Lee el resumen de las sesiones de expertos sobre análisis técnico, psicología del trading y herramientas de IA que demuestran la misión de WEEX de hacer que el trading de criptomonedas sea accesible para todos.

París reina supremo: Cómo el PSG aplastó el sueño del Arsenal en una final histórica de la UCL

PSG vs Arsenal, drama, destino y una maldición de 20 años hecha añicos. Revive la final de la UCL 2026 donde el PSG defendió su corona en una tensa tanda de penales, mientras el momento dorado de Ousmane Dembélé y un fallo agónico hicieron historia en Budapest.

TaiJi completa una ronda de financiamiento estratégico de $3.5 millones, con inversiones de Castrum Capital, Becker Ventures y Coinvestor Ventures

TaiJi, la plataforma de inteligencia de mercado on-chain impulsada por IA para Web3, anunció la culminación de una ronda de financiamiento estratégico de $3.5 millones, la cual acelerará la construcción de un nuevo motor de simulación de mercado basado en IA.

¿Bitcoin estancado cerca de los $73K? Cómo los traders encuentran recompensas en un mercado lateral de junio

Bitcoin está estancado cerca de los $73K a medida que los flujos de los ETF se enfrían y la incertidumbre macroeconómica mantiene a los traders cautelosos. Así es como las campañas de recompensas como WEEX Joker Party ayudan a los traders a mantenerse activos durante un mercado lateral en junio.

Cómo hacer staking de Solana: una guía paso a paso para 2026

Encuentra las mejores criptomonedas de IA de 2026 con selecciones basadas en datos: Bittensor, Render y proyectos emergentes. Incluye métricas on-chain, riesgos y una guía de trading en WEEX.

Precio garantizado ya disponible en WEEX: opere con mayor precisión

Para ofrecer una experiencia de trading de futuros más fluida, los futuros de WEEX han lanzado la función de "Precio garantizado".

La investigación más reciente del BIS: El futuro de las stablecoins y el panorama monetario global

El informe sostiene que las stablecoins fortalecerán el dominio del dólar estadounidense a corto plazo, planteando riesgos para la soberanía monetaria de los mercados emergentes y las economías en desarrollo, mientras que su trayectoria a largo plazo dependerá de sus modelos de adopción, las respuestas regulatorias y la sinergia de...

Entrevista con el experto en macroeconomía Raoul Pal: La competencia en IA está dando lugar a una "singularidad económica", no te deshagas fácilmente de tus activos en los próximos cuatro años

En comparación con el Nasdaq, Bitcoin se encuentra actualmente en una posición de sobreventa severa dentro de su tendencia a largo plazo.

La defensa fallida de los guardianes de Solana: para destrozar a Hyperliquid, ¿realmente retomaron el guion que alguna vez criticó a Ethereum?

El auge de HYPE desata una batalla de gigantes. El líder de Solana critica airadamente a Hyperliquid por ser demasiado centralizado, mientras que Arthur Hayes responde con una réplica contundente, apostando 100 000 USD.

¿Por qué Peter Thiel, el hombre detrás de Palantir, prepara una salida de Argentina?

Palantir, el riesgo político y la autopreservación de los oligarcas tecnológicos.

Reporte matutino | Coinbase Ventures realiza su primera inversión en ENA; SpaceX planea fijar el precio de su OPI en $135 por acción

Resumen de eventos importantes del mercado el 3 de junio

Texto completo y análisis del discurso del CEO de SanDisk en la 42.ª Conferencia Anual de Decisiones Estratégicas de Bernstein

El valor fundamental del discurso de Goeckeler reside en que proporciona un marco narrativo altamente transparente y lógicamente claro para la transformación corporativa.