Ramp Labs presenta una solución de compartición de memoria multiagente que reduce el consumo de tokens hasta en un 65 %.

By: theblockbeats.news|2026/04/11 14:19:36

BlockBeats News, 11 de abril: La empresa de infraestructura de IA Ramp Labs publicó los resultados de su investigación sobre "Latent Briefing", que logra un uso compartido eficiente de la memoria entre sistemas multiagente mediante la compresión directa de la caché KV de modelos a gran escala, lo que reduce significativamente el consumo de tokens sin sacrificar la precisión.

En las arquitecturas multiagente convencionales, el orquestador descompone las tareas y llama repetidamente a los modelos de trabajador. A medida que se extiende la cadena de inferencia, el uso de tokens aumenta exponencialmente. La idea central de Latent Briefing es aprovechar el mecanismo de atención para identificar las partes verdaderamente críticas en el contexto, descartando directamente la información redundante en la capa de representación, en lugar de depender del resumen LLM de baja velocidad o de la recuperación RAG inestable.

En la prueba de rendimiento LongBench v2, este método tuvo un desempeño notable: El consumo de tokens del modelo de trabajador disminuyó en un 65%, el ahorro medio de tokens para documentos de longitud media (de 32k a 100k) alcanzó el 49%, la precisión general mejoró en aproximadamente 3 puntos porcentuales en comparación con la línea base, y el tiempo adicional para cada compresión fue de solo unos 1,7 segundos, logrando una aceleración de aproximadamente 20 veces en comparación con el algoritmo original.

El experimento utilizó a Claude Sonnet 4 como orquestador y a Qwen3-14B como modelo trabajador, abarcando diversos escenarios documentales como artículos académicos, documentos legales, novelas e informes gubernamentales. La investigación también reveló que el umbral de compresión óptimo varía según la dificultad de la tarea y la longitud del documento: las tareas difíciles son adecuadas para una compresión agresiva que filtre el ruido del razonamiento especulativo, mientras que los documentos largos son más adecuados para una compresión suave que conserve la información clave dispersa.

Te puede gustar

Informe matutino | Coinbase Ventures realiza su primera inversión en ENA; SpaceX planea fijar el precio de su OPI en 135 dólares por acción

Resumen de los eventos importantes del mercado el 3 de junio

Texto completo y análisis del discurso del CEO de SanDisk en la 42.ª Conferencia Anual de Decisiones Estratégicas de Bernstein

El valor fundamental del discurso de Goeckeler reside en que proporciona un marco narrativo altamente transparente y lógicamente claro para la transformación corporativa.

Informe matutino | Strategy vendió 32 BTC y más de 800.000 acciones de MSTR la semana pasada; Binance anunció oficialmente su portal de trading de acciones de EE. UU.; Polymarket alcanzó una asociación exclusiva con OneFootball

Resumen de los eventos importantes del mercado el 1 de junio

Bootcamp de trading WEEXPERIENCE en Polonia: cómo WEEX y FireCrew están haciendo que el trading de criptomonedas sea accesible para todos

WEEX se asoció con Firecrew en Polonia el 29 de mayo para el bootcamp de trading WEEXPERIENCE. Lee el resumen de las sesiones de expertos sobre análisis técnico, psicología de trading y herramientas de IA que demuestran la misión de WEEX de hacer que el trading de criptomonedas sea accesible para todos.

París reina: cómo el PSG truncó el sueño del Arsenal en una final histórica de la Champions League

PSG contra Arsenal, drama, destino y una maldición de 20 años rota. Revive la final de la Champions League 2026 donde el PSG defendió su corona en una tensa tanda de penaltis, mientras el momento estelar de Ousmane Dembélé y un fallo agónico hicieron historia en Budapest.

TaiJi completa una ronda de financiación estratégica de 3,5 millones de dólares, con inversiones de Castrum Capital, Becker Ventures y Coinvestor Ventures

La plataforma de inteligencia de mercado on-chain impulsada por IA para Web3, TaiJi, anunció la finalización de una financiación estratégica de 3,5 millones de dólares, que acelerará la construcción de un nuevo motor de simulación de mercado basado en IA.

¿Bitcoin estancado cerca de los 73 000 $? Cómo los traders encuentran recompensas en un mercado lateral en junio

Bitcoin está estancado cerca de los 73 000 $ a medida que los flujos de los ETF se enfrían y la incertidumbre macroeconómica mantiene a los traders cautelosos. Así es como las campañas de recompensas como Weex Joker Party ayudan a los traders a mantenerse activos durante un mercado lateral en junio.

Cómo hacer staking de Solana: una guía paso a paso para 2026

Encuentra las mejores criptomonedas de IA en 2026 con selecciones basadas en datos: Bittensor, Render y proyectos emergentes. Incluye métricas on-chain, riesgos y guía de trading en WEEX.

Precio garantizado ya disponible en WEEX: opere con mayor precisión

Para ofrecer una experiencia de trading de futuros más fluida, los futuros de WEEX han lanzado una función de "Precio garantizado".

Última investigación del BIS: El futuro de las stablecoins y el panorama monetario global

El informe sostiene que las stablecoins fortalecerán el dominio del dólar estadounidense a corto plazo, planteando riesgos para la soberanía monetaria de los mercados emergentes y las economías en desarrollo, mientras que su trayectoria a largo plazo dependerá de sus modelos de adopción, respuestas regulatorias y la sinergia de...

Entrevista con el maestro de la macroeconomía Raoul Pal: La competencia en IA está dando lugar a una "singularidad económica", no te deshagas fácilmente de tus activos en los próximos cuatro años

En comparación con el Nasdaq, Bitcoin se encuentra actualmente en una posición de sobreventa severa dentro de su tendencia a largo plazo.

La defensa rota de los guardianes de Solana: para atacar a Hyperliquid, ¿han rescatado el guion que alguna vez criticaron de Ethereum?

El auge de HYPE desata una batalla de gigantes. Un líder de Solana critica duramente a Hyperliquid por su centralización, mientras que Arthur Hayes responde con contundencia y una apuesta de 100.000 dólares.

¿Por qué Peter Thiel, el hombre detrás de Palantir, prepara su salida de Argentina?

Palantir, el riesgo político y la autopreservación de los oligarcas tecnológicos.

Informe matutino | Coinbase Ventures realiza su primera inversión en ENA; SpaceX planea fijar el precio de su OPI en 135 dólares por acción

Resumen de los eventos importantes del mercado el 3 de junio

Texto completo y análisis del discurso del CEO de SanDisk en la 42.ª Conferencia Anual de Decisiones Estratégicas de Bernstein

El valor fundamental del discurso de Goeckeler reside en que proporciona un marco narrativo altamente transparente y lógicamente claro para la transformación corporativa.