Ramp Labsはマルチエージェントメモリー共有ソリューションを導入し、トークン消費を最大65%削減しました。

By: theblockbeats.news|2026/04/11 14:22:54
0
シェア
copy

BlockBeatsニュース、4月11日、AIインフラ企業Ramp Labsは「Latent Briefing」に関する研究結果を発表し、大規模モデルKVキャッシュの直接圧縮を通じてマルチエージェントシステム間で効率的なメモリー共有を実現し、精度を犠牲にすることなくトークン消費を大幅に削減しました。


主流のマルチエージェントアーキテクチャでは、オーケストレーターがタスクを分解し、ワーカーモデルを繰り返し呼び出します。推論チェーンが延びるにつれて、トークンの使用量は指数関数的に膨張します。Latent Briefingの核心的なアイデアは、注意メカニズムを活用して文脈内の本当に重要な部分を特定し、表現層で冗長な情報を直接廃棄することであり、遅いLLM要約や不安定なRAG検索に依存するのではありません。


LongBench v2ベンチマークテストでは、この方法が驚異的な成果を上げました:ワーカーモデルのトークン消費は65%減少し、中程度の長さの文書(32kから100k)の中央値のトークン節約は49%に達し、全体の精度はベースラインと比較して約3ポイント向上し、各圧縮にかかる追加時間は約1.7秒のみで、元のアルゴリズムと比較して約20倍のスピードアップを達成しました。


実験では、オーケストレーターとしてClaude Sonnet 4を使用し、ワーカーモデルとしてQwen3-14Bを使用し、学術論文、法的文書、小説、政府報告書などのさまざまな文書シナリオをカバーしました。研究はまた、最適な圧縮閾値がタスクの難易度と文書の長さによって異なることを発見しました。難しいタスクは推測的な推論ノイズをフィルタリングするために積極的な圧縮に適しており、長い文書は散発的な重要情報を保持するために穏やかな圧縮により適しています。

--価格

--

関連記事

ステーブルコインの流動性と外国為替市場への波及効果

研究によると、ステーブルコインの純流入が外生的要因で増加すると、ステーブルコインと従来の外国為替との価格差が大幅に広がり、現地通貨の価値が下落し、合成ドルの資金調達条件が悪化する(つまり、ドルの...)

2年後、香港の最初の安定コインライセンスがついに発行されました。HSBCとスタンダードチャータードが選ばれました

規制された企業は、今年の前半に安定コインを発行する予定です。

TAOの価格を90%上昇させた人物が、本日再び単独で価格を暴落させた

人間がいる限り、物語は続く。しかし、人間がいなくなったら、対戦に値する相手すら見つからないかもしれない。

BitgetでのSpaceX IPO参加に関する3分ガイド

Bitget IPO Primeは、世界クラスのユニコーンIPOに参加する機会をグローバルユーザーに提供し、一般ユーザーにもトップクラスのIPOの潜在的な経済的利益に平等にアクセスできるようにします。

2026年のアルトコインシーズン前にアイドルUSDTで15,000ドルを稼ぐ方法

2026年にアルトコインシーズンが来るのか気になっていますか?最新の市場更新を受け取り、エントリーを待っているアイドルステーブルコインを15,000 USDTまでの追加報酬に変える方法を学びましょう。

大量の取引量をこなさずに『ジョーカー・リターンズ』で勝つことは可能か?WEEXジョーカーリターンズシーズン2で新規プレイヤーが犯しがちな5つのミス

小規模トレーダーは、大量取引を行わなくてもWEEX Joker Returns 2026で勝つことができるだろうか?はい、これらの5つの高額なミスを避ければ可能です。カードを引く確率を最大化する方法、ジョーカーを賢く使う方法、そして少額の入金を15,000 USDTの報酬に変える方法を学びましょう。

人気のコイン

最新暗号資産ニュース

もっと見る