Ramp Labs представляет решение для совместного использования памяти между агентами, потребление токенов сокращено на 65%
BlockBeats News, 11 апреля, компания Ramp Labs, занимающаяся инфраструктурой ИИ, опубликовала результаты исследования "Latent Briefing", в котором достигается эффективное совместное использование памяти между многоагентными системами за счет прямой компрессии кэша KV крупномасштабной модели, что значительно снижает потребление токенов без потери точности.
В основных многоагентных архитектурах оркестратор декомпозирует задачи и многократно вызывает модели рабочих. По мере расширения цепочки вывода использование токенов экспоненциально увеличивается. Основная идея Latent Briefing заключается в использовании механизма внимания для выявления действительно критических частей в контексте, непосредственного отбрасывания избыточной информации на уровне представления, а не в использовании медленной процедуры суммирования LLM или нестабильного поиска RAG.
В тесте на базе LongBench v2 этот метод показал выдающиеся результаты: Уменьшение потребления токенов рабочей моделью на 65%, медианное сбережение токенов для документов средней длины (от 32k до 100k) достигло 49%, общая точность улучшилась примерно на 3 процентных пункта по сравнению с базовой моделью, а дополнительное время для каждой компрессии составило всего около 1,7 секунд, что в 20 раз быстрее, чем у оригинального алгоритма.
В эксперименте в качестве оркестратора использовалась Claude Sonnet 4, а в качестве рабочей модели — Qwen3-14B, охватывающая различные сценарии документов, такие как научные статьи, юридические документы, романы и правительственные отчеты. Исследование также показало, что оптимальный порог сжатия варьируется в зависимости от сложности задачи и длины документа — сложные задачи подходят для агрессивного сжатия, чтобы отфильтровать шум спекулятивных рассуждений, в то время как длинные документы лучше подходят для мягкого сжатия, чтобы сохранить разрозненную ключевую информацию.
Вам также может понравиться

Утренний отчет | Coinbase Ventures впервые инвестирует в ENA; SpaceX планирует установить цену IPO на уровне $135 за акцию

Полный текст и анализ выступления генерального директора SanDisk на 42-й ежегодной конференции Bernstein по стратегическим решениям

Прогноз цены биткоина на 2030 год: Ark Invest ожидает $710 тыс.

Цена SOL сегодня: актуальный курс Solana, графики и рыночные данные

Что такое биткоин-ETF: спотовые и фьючерсные фонды

Why Is Bitcoin Dropping 15% While Nasdaq Hits Record Highs?
Что такое TradFi и почему в 2026 году все говорят об этом?

Утренний отчет | На прошлой неделе Strategy продала 32 BTC и более 800 000 акций MSTR; Binance официально анонсировала портал для торговли акциями США; Polymarket заключила эксклюзивное партнерство с OneFootball

Торговый буткемп WEEXPERIENCE в Польше: как WEEX и FireCrew делают криптотрейдинг доступным для каждого

Триумф Парижа: как PSG разрушил мечту «Арсенала» в историческом финале Лиги чемпионов

TaiJi привлекла $3,5 млн в рамках стратегического раунда финансирования при участии Castrum Capital, Becker Ventures и Coinvestor Ventures

Биткоин застрял около $73 тыс.? Как трейдеры находят выгоду на боковом рынке в июне

Как стейкать Solana: пошаговое руководство на 2026 год

Гарантированная цена теперь на WEEX: торгуйте с высокой точностью

Новое исследование BIS: будущее стейблкоинов и глобальный валютный ландшафт

Интервью с макро-гуру Раулем Палом: гонка в сфере ИИ ведет к «экономической сингулярности», не спешите расставаться со своими активами в ближайшие четыре года

Провальная защита стражей Solana: чтобы разгромить Hyperliquid, они решили использовать сценарий, за который когда-то критиковали Ethereum?

