Founders Fund、Pantera と Franklin Templeton が Sentient の「Arena」に参加し、企業向け AI インテリジェンスのストレステストを実施しました。
過去2年間、企業はAIエージェントを実際のワークフローに導入することを加速してきました:カスタマーサービス、バックエンドオペレーション、金融やコンプライアンスなど、高度な意思決定を必要とするプロセスに至るまで。これらのシステムが実際のビジネスにますます組み込まれるにつれて、新たな問題が浮上しています:エージェントは情報を検索できますが、作業が「汚れた」もの、多段階、または高リスクになると、安定した、説明可能で再現可能な推論プロセスを提供するのが難しいことが多いのです。
本日、オープンソースAIラボのSentientは、Arenaを正式に発表しました------これは、リアルタイムで生産レベルの使用が可能な環境で、世界中の数千人のAI開発者を対象に、さまざまな企業の最も難しい推論問題に対するストレステストと競技的な反復を行うためのものです。Arenaの初期段階の最初の参加者には、Founders Fund、Pantera、そして資産管理規模が1.5兆ドルを超えるFranklin Templeton(フランクリン・テンプルトン)が含まれており------これは、機関が「オンライン展開前にAIエージェントを構造的に評価すること」に対して早期かつ明確な関心を示しているという信号を発信しています。
「企業がAIエージェントを研究、運営、顧客向けのワークフローに適用する際、問題はこれらのシステムが十分に強力かどうかではなく……実際のワークフローで信頼できるかどうかです。」とFranklin Templeton Digital Assets(フランクリン・テンプルトンデジタル資産)のマネージングパートナー、Julian Loveは述べています。Loveは、Arenaのような構造化された環境が、業界が「潜在的なアイデア」と「実際に生産に使用できる能力」を区別するのに役立つと付け加えました。
Sentientの共同創設者Himanshu Tyagiは次のように述べています。「AIエージェントは企業内で単なる実験ではなくなり、顧客、資金、運営結果に影響を与える重要なプロセスに入っています。この変化は評価基準を変えます。システムがデモで素晴らしく見えるだけでは不十分です。企業は、製造環境で失敗のコストが高く、信頼が非常に脆弱なときに、エージェントが安定して推論できるかどうかを知る必要があります。企業は比較可能性、再現性、そして基盤となるモデルやツールスタックに依存せず、長期的に信頼性の向上を追跡できる方法を必要としています。」
Arenaは企業のワークフローの実際の混乱をシミュレートします:情報が不完全で、文脈が長く、指示があいまいで、情報源が相互に矛盾しています。Arenaは、エージェントが「正しい答え」を出すかどうかを評価するだけでなく、エンジニアリングチームが失敗の原因を特定し、長期的に改善が有効かどうかを検証できるように、完全な推論トレース(reasoning trace)を記録します。
これは、モデル間、技術スタック間の推論評価に対して中立的でベンダーに依存しないベンチマーク(vendor-agnostic benchmark)を提供します。Arenaはデモパフォーマンスではなく、生産レベルのパフォーマンスを強調し、高リスクシナリオに適用可能な検証可能なエージェント能力を形成し、企業はこれらの能力を自社のプライベートデータや内部ツールに移行することができます。
最初の挑戦では、Arenaに参加する開発者は企業レベルの基本的な課題に焦点を当てます:文書推論(document reasoning)。AIエージェントは複雑で非構造化データに対して推論と計算を行う必要があります------この種の作業は金融分析、根本原因調査、投資メモ作成、カスタマーサービスなどのシナリオの基盤を支えています。
初期段階の他の参加者には、alphaXiv、Fireworks、OpenHands、OpenRouterなどが含まれています;Arenaがタスク、業界、モデルの統合を拡大するにつれて、さらに多くの参加者が加わることが期待されています。
最近の調査もArenaが解決しようとしているギャップを浮き彫りにしています:85%の企業が「エージェント企業(agentic enterprises)」になりたいと考えており、約4分の3が自治エージェントを展開する計画を立てていますが、成熟したガバナンス体系を持つ企業は4分の1にも満たない;多くの企業がパイロットを大規模な生産展開に拡大するのが難しいと感じています。企業は平均して約十数のエージェントを運用しており、通常はそれぞれ孤立したシナリオに分散しています;多くの企業は、より良いオーケストレーションと協調能力がなければ、エージェントを増やすことは複雑さを増し、価値が逆に下がるだけだと考えています。
「OpenHandsでは、開発者がエージェントを使用して実際の実用的な問題を解決することを常にサポートしたいと考えています。」とOpenHandsのチーフサイエンティスト兼共同創設者Graham Neubigは述べています。「私たちは、参加者がこれらの複雑な課題に取り組むためにOpenHands Software Agent SDKを使用することをサポートできることを嬉しく思います。」
OpenRouterの共同創設者兼CEO、Alex Atallahは次のように述べています。「ArenaはオープンソースAIを前進させるためのプログラムであり、研究者が公開環境で競争し、反復し、革新することを可能にします。私たちはSentientとの協力を深め、実験をより早く、より簡単にスケールさせるためのインフラを提供することを楽しみにしています。」
Arenaは世界中で開始され、数千人のAI開発者に第一期の限定隊列への参加を呼びかけ、2026年3月からサンフランシスコでオフラインイベントを開催します。
Sentient Labsについて
Sentient Labsは、オープンソースAIの発展を推進することに専念する先進的な技術研究および製品組織です。Sentient Foundationの下にあるイノベーションエンジンとして、Sentient LabsはAI推論、整合性、エージェント協力などの分野で最前線の研究を行っています。Sentientは、ROMAなどの高性能フレームワークやDobbyなどのオープンソースモデルの核心的な研究開発者です。Sentientの使命は、オープンソースAIを「実験」から「必需品」へと進化させることです。強力で組み合わせ可能なエージェントシステムを構築するためのインフラを提供することで、Sentientは開発者がオープンソースツールを商業化し、企業レベルの可用性を達成できるようにします。Sentientは、オープンソースが世界の重要なミッションAI運用のデフォルト基準となることを目指しています。
関連記事

わずか数日で急騰した「ミームコイン」を見つけた。何かアドバイスはありますか?

TAOはOpenAIに投資したElon Muskであり、SubnetはSam Altmanです。

パブリックチェーンにおける「大量のコイン配布」の時代は終わりを告げる

Muskの「Western WeChat」Xチャットを使用する前に、この3つの質問を理解する必要があります
X Chatは今週金曜日にApp Storeでダウンロード可能になります。メディアはすでに機能リストを取り上げ、自滅メッセージ、スクリーンショット防止、481人グループチャット、Grok統合、電話番号なしの登録など 、 「 西側のWeChat」と位置づけている。しかし、どの報告でもほとんど取り上げられていない疑問が3つある。
Xの公式ヘルプにまだかかっている一文があります:「悪意のある内部関係者やX自身が、法的な手続きによって暗号化された会話が暴露された場合、送信者と受信者の双方にまったく気付かれない」
いいえ。違いは鍵の保存場所にあります。
Signalのエンドツーエンド暗号化では、鍵がデバイスから離れることはありません。X、裁判所、または外部のいかなる当事者もあなたの鍵を保持しません。シグナルのサーバーは あなたのメッセージを解読するものがない たとえ召喚されたとしても 過去の召喚記録から 証明されるように 登録タイムスタンプと 最後の接続時間しか提供できない
X ChatはJuiceboxプロトコルを使用している。このソリューションでは、キーを3つの部分に分け、それぞれXが運営する3つのサーバーに格納します。PINコードでキーを回復する際に、システムはXのサーバーからこの3つのシャードを取り出して再結合します。どんなに複雑な暗証番号であっても、Xはユーザーではなく鍵の実際の保管者です。
これが「ヘルプページの文章」の技術的背景である:鍵はXのサーバー上にあるため、Xはユーザーが意識することなく法的手続きに対応する能力を持っている。Signalにはこの機能はありません。ポリシーが原因ではなく、単にキーがないためです。
次の図は、Signal、WhatsApp、Telegram、X Chatのセキュリティメカニズムを6つの次元で比較したものです。Xチャットは、プラットフォームが鍵を保持している4つの唯一のものであり、Forward Secrecyがない唯一のものである。
Forward Secrecy の意義は、ある時点で鍵が漏洩したとしても、各メッセージは一意の鍵を持っているため、過去のメッセージを解読できないという点である。SignalのDouble Ratchetプロトコルは、X Chatに欠けているメカニズムで、メッセージごとにキーを自動的に更新します。
2025年6月にXChatアーキテクチャを分析した後、ジョンズ・ホプキンス大学の暗号学教授マシュー・グリーンは「XChatをエンドツーエンドの暗号化スキームとして判断した場合、これはかなりゲームオーバータイプの脆弱性のように思える」とコメントしている。彼は後に「現在の暗号化されていないDMを信用するのと同様に、私はこれを信用しない」と付け加えた。
2025年9月のTechCrunchのレポートから、2026年4月に運用を開始するまで、このアーキテクチャに変更はありませんでした。
Musk氏は2026年2月9日のツイートで、X Chatのローンチ前にX Chatの厳格なセキュリティテストを受け、すべてのコードをオープンソース化すると約束した。
4月17日のローンチ日時点では、独立した第三者監査は完了しておらず、GitHub上に公式コードリポジトリも存在せず、App Storeのプライバシーラベルでは、X Chatが位置情報、連絡先情報、検索履歴を含む5つ以上のカテゴリーのデータを収集していることが明らかになっており 、 「 広告なし、トラッカーなし」というマーケティング上の主張と真っ向から矛盾しています。
継続的な監視ではなく、明確なアクセスポイント。
Xチャットのすべてのメッセージについて、ユーザーは長押しして「グロクに尋ねる」を選択できます。このボタンをクリックすると、メッセージはプレーンテキストで Grok に配信され、この段階で暗号化された状態から暗号化されていない状態に移行します。
この設計は脆弱性ではなく特徴である。ただし、X Chatのプライバシーポリシーには、このプレーンテキストデータがGrokのモデルトレーニングに使用されるのか、Grokがこの会話コンテンツを保存するのかは記載されていません。「グロクに尋ねる」を積極的にクリックすることで、ユーザーはそのメッセージの暗号化保護を自発的に解除している。
構造的な問題もあります。このボタンは「オプション機能」から「既定の習慣」にどれだけ早く移行しますか?Grok の返信の品質が高いほど、ユーザがそれに依存する頻度が高くなり、暗号化保護から流出するメッセージの割合が増加する。X Chatの実際の暗号化強度は、長期的にはJuiceboxプロトコルの設計だけでなく、ユーザーが「Ask Grok」をクリックする頻度にも依存する。
X Chatの初期リリースはiOSのみをサポートしており、Android版はタイムラインなしで「近日公開」と表示されるだけです。
世界のスマートフォン市場では、Androidが約73 % 、 iOSが約27%のシェアを占めている(IDC/Statista、2025年 ) 。WhatsAppの月間アクティブユーザー数31億4000万人のうち、73%がAndroidを利用している(Demand Sage調べ ) 。インドでは、WhatsAppは8億5400万人のユーザーをカバーし、Androidの普及率は95%を超えています。ブラジルでは1億4800万人のユーザーがおり、そのうち81%がAndroid、インドネシアでは1億1200万人のユーザーがおり、87%がAndroidを利用している。
世界の通信市場におけるWhatsAppの優位性は、Android上に構築されています。Signalは月間アクティブユーザー数が約8500万人で、Androidが優勢な国のプライバシー意識の高いユーザーにも主に依存しています。
Xチャットはこの戦場を回避し、2つの解釈が可能であった。1つは技術的な負債で、X ChatはRustで構築されており、クロスプラットフォーム対応の実現は容易ではないため、iOSを優先することがエンジニアリング上の制約になる可能性がある。もう1つは戦略的な選択です。iOSが米国で55%近いシェアを占めている中、Xのコアユーザーベースは米国です。iOSを優先するということは、Androidが支配する新興市場やWhatsAppと直接競争するのではなく、コアユーザーベースに集中することを意味します。
この2つの解釈は互いに排他的ではなく、同じ結果をもたらします。X Chatのデビューは、世界のスマートフォンユーザーベースの73%を喜んで没収した。
この問題については、次のような意見も聞かれます。X Chatは、X Money、Grokとともに、既存のインフラに平行してクローズドループ型のデータシステムを作る3連綿を形成し、WeChatエコシステムとコンセプトが似ている。この評価は新しいものではありませんが、X Chatの提供開始により、回路図を見直す価値があります。
X Chatは、誰が誰とどのくらいの時間、どのくらいの頻度で話しているかなどの情報を含むコミュニケーションメタデータを生成します。このデータはXのIDシステムに流れ込んでくる。メッセージコンテンツの一部は Ask Grok 機能を通過し、Grok の処理チェーンに入ります。金融取引はX Moneyで処理され、3月に外部公開テストが完了し、4月に一般公開され、Visa Direct経由で法定ピアツーピアの送金が可能となった。Fireblocksの幹部は、現在米国の40以上の州で送金ライセンスを保持しており、年末までに暗号通貨決済を稼働させる計画を確認した。
WeChatの機能はどれも中国の規制の枠組みの中で動いています。マスク氏のシステムは欧米の規制の枠組みの中で運営されているが、政府効率局(DOGE)の長官も務めている。これは微信のレプリカではありません 同じ論理を異なる政治的条件下で再現したのです
違いは、WeChatがメインインターフェイスで「エンドツーエンド暗号化」を明示的に主張したことがないのに対し、X Chatはそう主張している点だ。ユーザーの認識における「エンドツーエンド暗号化」とは、プラットフォームさえ誰もあなたのメッセージを見ることができないことを意味します。X Chatのアーキテクチャ設計はこのユーザーの期待に沿わないが、この用語を使用している。
X Chatは 、 「 この人は誰で、誰と話していて、そのお金はどこから来て、どこへ行くのか」という3つのデータラインを1つの企業の手に集約する。
ヘルプページの文章は、技術的な指示だけを示したものではありません。

50倍の急騰、FDVが100億USDを超える中で、なぜRaveDAOなのか?

エッジ・ランド・リグレス:海洋勢力、エネルギー、そしてドルをめぐる再考

10億DOTが無から生み出されたが、ハッカーの収入はわずか23万ドルだった。

ホルムズ海峡封鎖後、戦争はいつ終結するのか?

ノイズの新しく立ち上げられたベータ版を解析するには、どのようにしてこの熱を「オンチェーン」にするのか?

ロブスターは過去のものか?あなたのスループットを100倍にするヘルメス・エージェント・ツールを解剖する

AIに対して宣戦布告する?ウルトラマンの炎の中の居住に関する終末論的な物語

暗号資産ベンチャーキャピタルは終わったのか?市場の消滅サイクルが始まった

図解で見るクロードの愚かへの道:倹約の代償、あるいはAPIの請求額が100倍になった経緯

アーサー・ヘイズ最新インタビュー:個人投資家はイラン紛争をどうナビゲートすべきか

つい先ほど、サム・アルトマンが再び襲撃され、今度は銃撃された。

海峡封鎖、ステーブルコインのまとめ | リワイヤ・ニュース・モーニング・エディション

「高い期待から物議を醸す方針転換へ――『Genius』のエアードロップがコミュニティの反発を招く」

北京の大興区にある小米の電気自動車工場は、アメリカのエリートたちにとって新たなエルサレムとなった
わずか数日で急騰した「ミームコイン」を見つけた。何かアドバイスはありますか?
TAOはOpenAIに投資したElon Muskであり、SubnetはSam Altmanです。
パブリックチェーンにおける「大量のコイン配布」の時代は終わりを告げる
Muskの「Western WeChat」Xチャットを使用する前に、この3つの質問を理解する必要があります
X Chatは今週金曜日にApp Storeでダウンロード可能になります。メディアはすでに機能リストを取り上げ、自滅メッセージ、スクリーンショット防止、481人グループチャット、Grok統合、電話番号なしの登録など 、 「 西側のWeChat」と位置づけている。しかし、どの報告でもほとんど取り上げられていない疑問が3つある。
Xの公式ヘルプにまだかかっている一文があります:「悪意のある内部関係者やX自身が、法的な手続きによって暗号化された会話が暴露された場合、送信者と受信者の双方にまったく気付かれない」
いいえ。違いは鍵の保存場所にあります。
Signalのエンドツーエンド暗号化では、鍵がデバイスから離れることはありません。X、裁判所、または外部のいかなる当事者もあなたの鍵を保持しません。シグナルのサーバーは あなたのメッセージを解読するものがない たとえ召喚されたとしても 過去の召喚記録から 証明されるように 登録タイムスタンプと 最後の接続時間しか提供できない
X ChatはJuiceboxプロトコルを使用している。このソリューションでは、キーを3つの部分に分け、それぞれXが運営する3つのサーバーに格納します。PINコードでキーを回復する際に、システムはXのサーバーからこの3つのシャードを取り出して再結合します。どんなに複雑な暗証番号であっても、Xはユーザーではなく鍵の実際の保管者です。
これが「ヘルプページの文章」の技術的背景である:鍵はXのサーバー上にあるため、Xはユーザーが意識することなく法的手続きに対応する能力を持っている。Signalにはこの機能はありません。ポリシーが原因ではなく、単にキーがないためです。
次の図は、Signal、WhatsApp、Telegram、X Chatのセキュリティメカニズムを6つの次元で比較したものです。Xチャットは、プラットフォームが鍵を保持している4つの唯一のものであり、Forward Secrecyがない唯一のものである。
Forward Secrecy の意義は、ある時点で鍵が漏洩したとしても、各メッセージは一意の鍵を持っているため、過去のメッセージを解読できないという点である。SignalのDouble Ratchetプロトコルは、X Chatに欠けているメカニズムで、メッセージごとにキーを自動的に更新します。
2025年6月にXChatアーキテクチャを分析した後、ジョンズ・ホプキンス大学の暗号学教授マシュー・グリーンは「XChatをエンドツーエンドの暗号化スキームとして判断した場合、これはかなりゲームオーバータイプの脆弱性のように思える」とコメントしている。彼は後に「現在の暗号化されていないDMを信用するのと同様に、私はこれを信用しない」と付け加えた。
2025年9月のTechCrunchのレポートから、2026年4月に運用を開始するまで、このアーキテクチャに変更はありませんでした。
Musk氏は2026年2月9日のツイートで、X Chatのローンチ前にX Chatの厳格なセキュリティテストを受け、すべてのコードをオープンソース化すると約束した。
4月17日のローンチ日時点では、独立した第三者監査は完了しておらず、GitHub上に公式コードリポジトリも存在せず、App Storeのプライバシーラベルでは、X Chatが位置情報、連絡先情報、検索履歴を含む5つ以上のカテゴリーのデータを収集していることが明らかになっており 、 「 広告なし、トラッカーなし」というマーケティング上の主張と真っ向から矛盾しています。
継続的な監視ではなく、明確なアクセスポイント。
Xチャットのすべてのメッセージについて、ユーザーは長押しして「グロクに尋ねる」を選択できます。このボタンをクリックすると、メッセージはプレーンテキストで Grok に配信され、この段階で暗号化された状態から暗号化されていない状態に移行します。
この設計は脆弱性ではなく特徴である。ただし、X Chatのプライバシーポリシーには、このプレーンテキストデータがGrokのモデルトレーニングに使用されるのか、Grokがこの会話コンテンツを保存するのかは記載されていません。「グロクに尋ねる」を積極的にクリックすることで、ユーザーはそのメッセージの暗号化保護を自発的に解除している。
構造的な問題もあります。このボタンは「オプション機能」から「既定の習慣」にどれだけ早く移行しますか?Grok の返信の品質が高いほど、ユーザがそれに依存する頻度が高くなり、暗号化保護から流出するメッセージの割合が増加する。X Chatの実際の暗号化強度は、長期的にはJuiceboxプロトコルの設計だけでなく、ユーザーが「Ask Grok」をクリックする頻度にも依存する。
X Chatの初期リリースはiOSのみをサポートしており、Android版はタイムラインなしで「近日公開」と表示されるだけです。
世界のスマートフォン市場では、Androidが約73 % 、 iOSが約27%のシェアを占めている(IDC/Statista、2025年 ) 。WhatsAppの月間アクティブユーザー数31億4000万人のうち、73%がAndroidを利用している(Demand Sage調べ ) 。インドでは、WhatsAppは8億5400万人のユーザーをカバーし、Androidの普及率は95%を超えています。ブラジルでは1億4800万人のユーザーがおり、そのうち81%がAndroid、インドネシアでは1億1200万人のユーザーがおり、87%がAndroidを利用している。
世界の通信市場におけるWhatsAppの優位性は、Android上に構築されています。Signalは月間アクティブユーザー数が約8500万人で、Androidが優勢な国のプライバシー意識の高いユーザーにも主に依存しています。
Xチャットはこの戦場を回避し、2つの解釈が可能であった。1つは技術的な負債で、X ChatはRustで構築されており、クロスプラットフォーム対応の実現は容易ではないため、iOSを優先することがエンジニアリング上の制約になる可能性がある。もう1つは戦略的な選択です。iOSが米国で55%近いシェアを占めている中、Xのコアユーザーベースは米国です。iOSを優先するということは、Androidが支配する新興市場やWhatsAppと直接競争するのではなく、コアユーザーベースに集中することを意味します。
この2つの解釈は互いに排他的ではなく、同じ結果をもたらします。X Chatのデビューは、世界のスマートフォンユーザーベースの73%を喜んで没収した。
この問題については、次のような意見も聞かれます。X Chatは、X Money、Grokとともに、既存のインフラに平行してクローズドループ型のデータシステムを作る3連綿を形成し、WeChatエコシステムとコンセプトが似ている。この評価は新しいものではありませんが、X Chatの提供開始により、回路図を見直す価値があります。
X Chatは、誰が誰とどのくらいの時間、どのくらいの頻度で話しているかなどの情報を含むコミュニケーションメタデータを生成します。このデータはXのIDシステムに流れ込んでくる。メッセージコンテンツの一部は Ask Grok 機能を通過し、Grok の処理チェーンに入ります。金融取引はX Moneyで処理され、3月に外部公開テストが完了し、4月に一般公開され、Visa Direct経由で法定ピアツーピアの送金が可能となった。Fireblocksの幹部は、現在米国の40以上の州で送金ライセンスを保持しており、年末までに暗号通貨決済を稼働させる計画を確認した。
WeChatの機能はどれも中国の規制の枠組みの中で動いています。マスク氏のシステムは欧米の規制の枠組みの中で運営されているが、政府効率局(DOGE)の長官も務めている。これは微信のレプリカではありません 同じ論理を異なる政治的条件下で再現したのです
違いは、WeChatがメインインターフェイスで「エンドツーエンド暗号化」を明示的に主張したことがないのに対し、X Chatはそう主張している点だ。ユーザーの認識における「エンドツーエンド暗号化」とは、プラットフォームさえ誰もあなたのメッセージを見ることができないことを意味します。X Chatのアーキテクチャ設計はこのユーザーの期待に沿わないが、この用語を使用している。
X Chatは 、 「 この人は誰で、誰と話していて、そのお金はどこから来て、どこへ行くのか」という3つのデータラインを1つの企業の手に集約する。
ヘルプページの文章は、技術的な指示だけを示したものではありません。
