Ramp Labs представляет решение для совместного использования памяти между агентами, потребление токенов сокращено на 65%

By: theblockbeats.news|2026/04/11 14:19:36
0
Поделиться
copy

BlockBeats News, 11 апреля, компания Ramp Labs, занимающаяся инфраструктурой ИИ, опубликовала результаты исследования "Latent Briefing", в котором достигается эффективное совместное использование памяти между многоагентными системами за счет прямой компрессии кэша KV крупномасштабной модели, что значительно снижает потребление токенов без потери точности.


В основных многоагентных архитектурах оркестратор декомпозирует задачи и многократно вызывает модели рабочих. По мере расширения цепочки вывода использование токенов экспоненциально увеличивается. Основная идея Latent Briefing заключается в использовании механизма внимания для выявления действительно критических частей в контексте, непосредственного отбрасывания избыточной информации на уровне представления, а не в использовании медленной процедуры суммирования LLM или нестабильного поиска RAG.


В тесте на базе LongBench v2 этот метод показал выдающиеся результаты: Уменьшение потребления токенов рабочей моделью на 65%, медианное сбережение токенов для документов средней длины (от 32k до 100k) достигло 49%, общая точность улучшилась примерно на 3 процентных пункта по сравнению с базовой моделью, а дополнительное время для каждой компрессии составило всего около 1,7 секунд, что в 20 раз быстрее, чем у оригинального алгоритма.


В эксперименте в качестве оркестратора использовалась Claude Sonnet 4, а в качестве рабочей модели — Qwen3-14B, охватывающая различные сценарии документов, такие как научные статьи, юридические документы, романы и правительственные отчеты. Исследование также показало, что оптимальный порог сжатия варьируется в зависимости от сложности задачи и длины документа — сложные задачи подходят для агрессивного сжатия, чтобы отфильтровать шум спекулятивных рассуждений, в то время как длинные документы лучше подходят для мягкого сжатия, чтобы сохранить разрозненную ключевую информацию.

Вам также может понравиться

Утренний отчет | Coinbase Ventures впервые инвестирует в ENA; SpaceX планирует установить цену IPO на уровне $135 за акцию

Обзор важных событий на рынке 3 июня

Полный текст и анализ выступления генерального директора SanDisk на 42-й ежегодной конференции Bernstein по стратегическим решениям

Основная ценность выступления Геклера заключается в предоставлении высокопрозрачной и логически четкой концептуальной базы для корпоративной трансформации.

Прогноз цены биткоина на 2030 год: Ark Invest ожидает $710 тыс.

Ознакомьтесь с прогнозами цены биткоина на 2030 год от Ark Invest и Standard Chartered, а также узнайте о ключевых рисках и способах формирования портфеля. Полный анализ на WEEX.

Цена SOL сегодня: актуальный курс Solana, графики и рыночные данные

Узнайте цену SOL сегодня с помощью данных в реальном времени, а также ключевые факторы, влияющие на движение Solana, и практические советы по торговле. Читайте полный анализ на WEEX.

Что такое биткоин-ETF: спотовые и фьючерсные фонды

Узнайте, что такое биткоин-ETF, как работают спотовые и фьючерсные фонды и почему институциональные притоки меняют рынок BTC в 2026 году. Аналитика WEEX.

Why Is Bitcoin Dropping 15% While Nasdaq Hits Record Highs?

Bitcoin падает на 15% до $66 000 на фоне опасений из-за геополитической напряженности, в то время как Nasdaq достигает исторических максимумов. Анализ макроэкономических факторов, потоков ETF, поведения розничных инвесторов и «китов», а также скрытой корреляции между криптовалютами и акциями.

Популярные монеты

Последние новости криптовалют

Еще
iconiconiconiconiconiconiconiconicon
Служба поддержки:@weikecs
Деловое сотрудничество:@weikecs
Количественная торговля и ММ:bd@weex.com
VIP-программа:support@weex.com