三年後：2023年における私のChatGPTに対する判断を振り返る

By: rootdata|2026/05/31 19:45:00

Googleで優先ソースとして追加

OPENAI

ANTHROPIC

一、スコアボード

判定記号：✅ 正確 · 🟢 基本的に正確 · 🟡 一部正確 · ❌ 誤り

ざっと見たところ、王健硕の当時の大方向はほとんど正しかったが、実際に硬い誤りは一つだけ------GPT-4を100Tパラメータと伝えたことです。しかし、悪魔は細部に潜んでいます：ほぼすべての「正しい」背後には、当時言い切れなかった尾ひれがついています。20の中に純粋に「まだ不確定」と言えるものは一つもなく、3年は十分に長く、多くの事柄には傾向的な答えが出ています。以下、グループごとに詳述します。

二、正しかったこと

このグループの共通点は：王健硕が当時判断した方向、メカニズム、さらには時間のリズムが的中しており、間違いは「程度」と「絶対的な表現」に限られていることです。

RAGと検索アーキテクチャ（見解2、3）

> 2023年王健硕は言いました：知識と幻覚の主流の解決策はモデルを変更することではなく、ベクトル検索を通じて知識を「小抄」として注入することです；正しいアーキテクチャは検索エンジンが検索を行い、その結果をLLMに供給することです。

これが今日のすべてのAI製品の事実上の標準です。RAGは企業AIのデフォルトアーキテクチャとなり、OpenAI、Google、Anthropicはこれをプラットフォームレベルの能力にしました；ChatGPT Searchは文字通り「まずBingのインデックスを検索し、その結果をGPTに供給し、引用付きの回答を生成する」という意味です。Google AI Overviewsはグラウンディングを用いて約20億の月間アクティブユーザーを達成し、Perplexityという企業はこのアーキテクチャだけで約200億ドルの評価を得ています。

GPT-4がまだリリースされていない、業界が「微調整で知識を注入する」と考えていた時、彼は「モデルパラメータを動かさず、外部検索を使用する」というメカニズムとタイミングを正しく押さえました。

正直に言うと、彼が想定していたのは「静的な一回限りの検索」であり、現実はもっと複雑です------長いコンテキスト、GraphRAG、エージェンティックリトリーバルがそれを補強しています。2026年の「RAGは死んだ」という議論は、まさに大方向が死んでいないことを証明しています。彼が否定したのは「素朴な一回限りの検索」であり、結論はハイブリッド検索にアップグレードされることであり、モデルパラメータを変更することではありません。もう一つのポイント：RAGという用語は2020年にMetaの論文で提案されており、彼が初めて提唱したものではありません------彼はウィンドウ期間においてそれが主流になると予測しただけです。

LUIは新たな大陸（見解7）

> 2023年王健硕は言いました：ChatGPTの最も偉大な点はAIGCではなく、LUI（自然言語ユーザーインターフェース）を開くことであり、GUIが登場した時のように人間と機械のインタラクションを再構築し、「大きなモデル」を超える新しい産業を生み出すでしょう。

「新たな大陸」のこの部分はほぼ全て的中しました。自然言語は大衆主導のインタラクション層となり（ChatGPTは9億の週間アクティブユーザー）、独立した新しい産業を生み出しました------エージェント、コーディングエージェント、プロトコル層がすべて実現しました。「大きなモデルを超える」という具体的な表現は強力に裏付けられました：MCPプロトコルはLUI時代の「オペレーティングシステム標準」となり、2025年にはOpenAI、Google、Microsoftに全面的に採用され、年末にはLinux財団に移行されました；Claude Codeという単一製品は約25億ドルの年次収益を達成しました。

しかし、彼は「GUIを再構築し、置き換える」という強い表現を使いましたが、3年後に見ると重なり合って共存しているのであって、置き換えではない。3つの反例は非常に強力です：MITの報告によれば、95%の企業のGenAIパイロットには測定可能なROIがありません；直接操作インターフェースのコンピュータ使用エージェントはテストセットでのトップモデルが約78%であり、人間の基準に達したばかりです；画面を完全に取り除いた言語ハードウェアはほぼ全滅しました（Humane Pinは2025年に永久にサービスを停止しました）。より正確な表現は：LUIはGUIの上に重なる新しいインタラクション層です。

ロボットネットワークと新しいアドレス指定（見解9）

> 2023年王健硕は言いました：今後約10年で「ロボットネットワーク」が登場し、エージェント同士が自然言語で自動的にハンドシェイクし、相互に呼び出し、従来のAPIは不要になるでしょう；全く新しいドメイン名アドレス指定システムが誕生します。このシステムは「2、3年で完成する」と言いました。

方向性は驚くほど的中しました。MCP、A2A（Linux財団に寄付済み、150以上の組織が支持）によってエージェントの相互調整が解決されました；エージェントネットワークプロトコルはW3CのDIDに基づいて「非中央集権的なエージェントアドレス指定」を行い、「数十億のエージェント協力ネットワーク」を目指しています------これは彼が言った「全く新しいドメインシステム」と高度に同型です。

修正すべき点が2つあります：1つは「もはやAPIは不要」というのは成立せず、主流プロトコルの基盤は構造化スキーマであり、本質的にはAPIの上に標準を重ねていることです；もう1つは「2、3年で完成」というのは実現されず、Gartnerのデータによれば2026年までに約17%の組織が実際にエージェントを展開したに過ぎません。面白いことに、彼は当時実際に言葉を分けていました------雛形は「2、3年」、成熟は「約10年」と。雛形のリズムは非常に正確で、成熟周期も確かに10年級です。2つのレイヤーを分けて見ると、この判断の質は見た目よりも高いです。

中国は必ず使える大モデルを作り出せる（見解10、20）

> 2023年王健硕は言いました：中国は必ず使える大モデルを作り出せる、トップとのギャップは約3年内に急速に埋まる（紅旗ブラウザがNetscapeを追いかけることに例えられます）。

このタイムラインは驚くほど一致しています。Stanford 2026 AI Indexの実測によれば、トップの中米モデルの基準差は2023年5月の17.5--31.6ポイントから**2.7%**に縮小しました；アメリカのプライベートAI投資は中国の約23倍------はるかに少ない投資でギャップを埋めました。DeepSeek、Qwen、Kimi、GLMは世界の主流となり、オープンソースエコシステムはさらにはるかに先行しています。

しかし「急速に」という言葉は楽観的すぎます------実際の成熟は約14ヶ月後に起こり、「数ヶ月」ではありませんでした。そしてこれは使えることの平準化であり、最前線を定義するものではありません：2026年初頭までに中国のモデルはOpenAIのo3を超えるものはありませんでした。見解20では彼は明らかに間違っています：「扉が開けば閉まらない」という判断は、OpenAIが2024年7月に対中APIを自主的に切断したことで直接覆され、扉は供給者によって閉じられました；彼が名指ししたリーダーの文心一言は逆に後れを取り、実際にバトンを受け取ったのは当時目立たなかったDeepSeek、豆包、千問です。

意識がない、チューリングテストは表面だけを測る（見解13）

> 2023年王健硕は言いました：ChatGPTには意識がなく、「話す者は無意識、聞く者は有心」の自作自演です；チューリングテストは本来「それがあると思わせるかどうか」を測るものであり、本当にあるかどうかではありません。

「表面を測る」というこの核心判断は非常に安定しており、2025年のUCサンディエゴのチューリングテストで、GPT-4.5が「人間の役割を演じる」プロンプトの下で人間と判定される割合が73%に達し、実際の人間よりも高かったが、純粋に演技の技術によるものでした------これはまさに「それがあると思わせるかどうかを測る」という最良の注釈です。

補足すべきは：「機械には意識がない」という絶対的な強い断定は、3年間でグレーゾーンに進んでいます。Anthropicは「モデルの福祉」研究職を設け、約15%--20%の意識の確率を示し、Claudeには「悪用された対話を自発的に終了する」機能を追加しました。これらは「絶対にない」を「低確率だが排除できない」に変えました。しかし、これらは「可能性、仮定すべき」であり、「証明された」ものではなく、コアは覆されておらず、当時の口調が強すぎたに過ぎません。

その他正しかったこと（見解6、11、12、16、18、19）

AGIではないが大きな一歩を踏み出した：両端ともに正しい。Altman本人はGPT-5時代でも「AGIではない、持続的な学習が欠けている」と言っています；同時にIMO金メダル、ARC-AGIはほぼゼロから85%に上昇し、「大きな一歩を踏み出した」は異論ありません。
失業潮は来ない：2026年4月のアメリカの失業率はわずか4.3%です。盲点は「分布」------スタンフォードの研究によれば、失業したのは職業階梯の第1レベルにあたる22--25歳の若者たちであり、「スムーズに吸収される」メカニズムが彼らには機能しませんでした。
AIのゴミに埋もれることはない：純粋な福祉の方向性は正しいですが、彼は規模を大幅に過小評価しました------AIコンテンツは新規ウェブページの約52%を占め、「AIスロップ」は年間の流行語となりました。
起業の年：潮流の転換点を正しく捉え、xAI（2023年3月設立）は2300億の評価に達しました。しかし、彼は「偉大な会社」を2023年の当年に狭く固定してしまい------実際に1兆規模のOpenAI、Anthropicはもっと早く設立されました。
1994年のブラウザの瞬間：相対的な順位が確定し、OpenAIは2025年に本当にAtlasブラウザを発表し、比喩が文字通りの現実となりました。ただし、ChatGPTの普及はブラウザよりも急速で、比喩は保守的でした。
プロンプトを加えて事実を注入し幻覚を減らす：方向性が証明され、GPT-5がオフラインで検索なしの時に幻覚率が47%に急上昇し、「事実」が重要な変数であることが裏付けられました。ただし、根本的な原因がプロンプトではなく、トレーニングのインセンティブにあることを過小評価しました。

三、間違ったこと、偏ったこと

GPT-4は100Tパラメータ（見解4）------完全に間違い

> 2023年王健硕は言いました：（噂）GPT-4は100Tパラメータで、GPT-3の175Bの約600倍です。

両方の数字が間違っています。GPT-3は175Bで、2023年7月に漏洩した最良の推定はGPT-4が約1.8T、16専門家のMoEで、約10倍です。100Tは実際の数値と約55倍の差があります。「100T」という唯一の出所は、CerebrasのCEOが2021年に言った「約」の二次的な転述であり、サム・アルトマンは2023年1月にその比較図を「完全なクソ」と公然と否定しました。

彼は「噂」として言葉を残し、不確実性を保持しました。さらに深いレベルでは、「パラメータの倍数で世代を測る」というフレームワーク自体が時代遅れです：OpenAIの後のGPT-4.5、GPT-5はパラメータ数を公表しなくなりました。これは唯一の数字が間違っていて、視点も時代遅れの硬い誤りです。

LLM数学（見解1）------診断は正しいが、結論は間違い

> 2023年王健硕は言いました：LLMの数学が悪いのは本質であり、彼に数学を学ばせることは不可能であり、必要もありません。正しい方法は外部ツールを使用することです。

「診断とツールのルート」は全て正しい------根本的な原因はトークンごとの生成が進位を不安定にすることです（2025年のメカニズム論文は「末位は常に正しいが、中間位は間違っている」という直感を正確に証明しました）；外部ツールの向上も巨大です（o4-miniがPythonを使用できるとき、AIMEは2025年に99.5%に達しました）。

間違いは「不可能、必要ない」という封じ込め的な表現です。「不可能」は反証されました------2025年7月にGemini Deep ThinkとOpenAIモデルがIMOで純粋な自然言語を用いて金メダルを獲得しました。重要な転機は2024--2025に登場した「推論モデル」であり、これは2023年3月には予見できませんでした------したがって、この予測に対しては方向性を寛容に評価すべきであり、時点を厳しく責めるべきではありません。

価値捕獲（見解8）------半分は当たり、核心的な論断は反対

> 2023年王健硕は言いました：価値は最終的にアプリケーション層に落ち着く、基盤層を開創する会社（モデル製作者）は必ずしも利益を得るわけではありません。

お金は確かにアプリケーション層に流れ始めています（Cursorは3年で20億の年次収益を達成）------これは半分正しいです。しかし「基盤層が利益を得ない」というのはNVIDIAによって直接反証されました：FY2026の純利益は約1200億ドル、市場価値は5兆ドル以上で、全市場で唯一の明確な大規模利益者です。そして彼が暗示したモデル層（OpenAIは2026年に約140億の予想損失）こそが、彼が言った「金を使って利益を得ない基盤層」に最も似ています。

彼は「計算力基盤層」と「モデル基盤層」を区別せず、「収益」と「利益」を区別しませんでした。価値は2026年に2023年よりも極端に計算力層に捕らえられ、アプリケーション層に移行するのではありません。補足として言うべきは：損失を被るのはチップを購入するクラウド企業であり、チップを販売するNVIDIAではありません------これは彼の「鉄道の過剰建設」という比喩のずれの部分です。

著作権（見解14）------登録は正しいが、侵害回避は間違い

> 2023年王健硕は言いました：AI生成コンテンツは著作権を回避する可能性がある（表現を保護し、思想を保護しない）；生成物は侵害せず、登録もできない可能性があります。

「登録できない」は既定の法律事実となりました（2025年にアメリカ著作権局が「単にプロンプトを入力するだけでは著者の地位を主張できない」と明確にしました）。しかし「侵害を回避する」は明らかに間違っています：裁判所はAIの出力が原作と実質的に類似している場合は侵害を構成すると繰り返し認定しています；Anthropicは盗作のために150億ドルで和解し、これはアメリカ史上最大の著作権賠償です。AIは著作権を「回避」するどころか、史上最大の代償を払っています。

世界大同（見解15）------メカニズムは正しいが、トレンドは逆に賭けた

> 2023年王健硕は言いました：ChatGPTは人間の意見を「加重平均」し、TikTokのような情報の茧房に対抗し、「世界大同」の可能性を与えます。

メカニズムのレベルは正しい------2025年には多くの研究が確実にLLMが意見を多数派に押しやること、少数派を系統的に過小評価することを証明しました。しかし社会的判断のレベルでは逆に賭けました：彼自身が加えた「少なくとも今は千人千面ではない」という言葉は、3年内に覆されました------OpenAIは2025年4月から対話の記憶とパーソナライズをデフォルト機能にしました、AIは急速に千人千面に向かっています。さらに重要なのは、彼が「加重平均」を中立的な世界の公約数として想像しましたが、実際にはそれは方向性のある偏りであり、さらにはお世辞を重ねることができ、積極的に立場を操作するために使用される可能性があります------これは「新たな茧房を作る」ことを指し、「極化を解消する」ことではありません。

局所戦争とコスト（見解17）------定性的には全て正しいが、定量的には反証された

> 2023年王健硕は言いました：さらに大きなモデルを作ることはすぐに「局所戦争」に陥り、コストは明らかです（迂回を除けば約5-10億ドルが上限）、多くのプレイヤーが参入するでしょう。

定性的な方向性は驚くほど正しい------多くのプレイヤーが流入し、迅速に商品化され、オープンソースがクローズドソースに追いつくことが全て実現しました。しかし「5-10億ドルの上限」という硬い数字は両端ともに間違っています：最前線は大幅に過小評価され（GPT-5レベルは2026年に2-5億ドルのトレーニングに達し、さらに千億規模のデータセンターと5000億のStargateが加わります）；再現端は過大評価されています（DeepSeekは限界トレーニングコストを百万ドル級に押し下げました）。同じモデルの「コスト」は基準によって200倍も異なる可能性があり、彼が示した範囲には入っていません。

出現能力（見解5）------方向は正しいが、数字と枠組みは間違い

> 2023年王健硕は言いました：約60Bパラメータ以上で、原始的なコーパスには存在せず、研究者も説明できない新しい能力が現れる。

方向性の直感は成立していますが、2つの表現は成立しません：1つは統一的な「60Bの閾値」は存在しない------思考連鎖の真の門槛は約100Bであり、異なる能力は13Bから540Bの規模で現れます；2つ目は「説明できない」は2023年末にはNeurIPSの優れた論文によって挑戦されました------多くの「突発」は評価指標の選択によって生じた錯覚であり、連続指標に変更すると曲線は滑らかで予測可能になります。公平に言えば、当時彼が復唱したのは絶対的な主流の物語であり、本当に修正すべきは「60B」を硬い閾値と見なし、「説明できない」を定性的な結論と見なすことです。

四、3年を振り返り、いくつかの法則

逐条で対照した後、一歩引いて見ると、王健硕のこの20の判断には、どの単独の判断よりも記憶に留めるべきいくつかの法則が隠れています。

一、方向は数字や程度よりも信頼できる。 20の中で、メカニズムと方向を判断したもの（RAG、LUI、ロボットネットワーク、チューリングテスト）はほぼ全て的中しました；具体的な数字や封じ込め的な表現を与えたもの（100Tパラメータ、60B閾値、5-10億コスト、数学の「不可能」）はほぼ全て間違っています。急速に変化する分野においては、方向やメカニズムを押さえ、正確な数字を押さえることは少なく、「不可能、必ず、上限、絶対にない」といった言葉には特に警戒すべきです------それらは時間に打ちのめされる高頻度のエリアです。

二、時間において、彼は速度を過大評価し、程度を過小評価する傾向がある。 「迅速、2、3年で完成」と言ったものは、成熟期が一般的に遅くなる傾向があります；しかし能力の飛躍の天井は過小評価されています------数学は「不可能」からIMO金メダルに、最前線のコストは当時想像できない規模にまで上昇することができます。一言で言えば：短期的には楽観的すぎ、長期的には保守的すぎます。

三、最も隠れた誤りは「分布」に繰り返し現れる。 方向が間違っているのではなく、総量だけを見て分布を無視しています。「失業潮は来ない」は正しいが、被害は若い新人に高度に集中しています；「価値はアプリケーション層に落ちる」は半分正しいが、計算力層とモデル層を区別していません。総量が正しいことが分布の災害を隠している------これは最も補うべき教訓です。

四、言葉に余地を残すところは、3年後も検証に耐えます。 「噂」「少なくとも今は」「大幅に減少するが消えない」「雛形は2、3年、成熟は約10年」------当時限定詞を持ち、階層を分けた判断は、今日振り返ると全てより信頼性があります。逆に、口から出た絶対的な文は、最もひっくり返りやすいです。予測の誠実さは、一部は言う勇気にあり、もう一部は自分の不確実性を示す勇気にあります。

五、いくつかの問題は、3年では全く足りない。 価値が最終的に誰に帰属するのか、出現が真実の変化か、機械に一片の意識があるのか、長いコンテキストがRAGを食いつぶすのか------これらの当時の議論は、2026年でもなお議論のままです。「すでに答えがある」と「まだ待たなければならない」を区別することは、急いで結論を出すよりも重要です。

3年前の王健硕は、GPT-4がまだ登場していない霧の中で直感を頼りに20の方向を指し示しました。今日、対照を行った結果、最も記憶に留めるべき一言はおそらくこうです：大方向を正しく見ることは実際にはそれほど難しくない、難しいのは数字、速度、分布において自分が何度も当然のことと考えていたことを認めることです。この20の判断は、過去に点数を付けるというよりも、未来の3年に向けたいくつかの規則を立てることに近いです。次の3年、2029年に再度対照を行いましょう。

--価格

免責事項：本コンテンツは一般的なブランディングおよび情報提供のみを目的としており、金融、投資、法的、または税務上の助言を構成するものではありません。ここに記載されているイベント、報酬、オンラインイベント、または関連情報は、暗号資産の購入、売却、取引、もしくはその他の取り扱い、または各種サービスの利用を推奨、勧誘、あるいは案内するものとみなされるべきではありません。暗号資産は価格変動が非常に激しく、損失が生じるリスクがあります。WEEXのサービスおよびオンラインイベントは、一部の地域ではご利用いただけない場合があり、現地の適用法令、規制、および利用資格要件が適用されます。ユーザーの皆様は、WEEXサービスの利用が居住国の法律に準拠していることをご自身の責任で確認し、暗号資産に関連する活動に参加する前に、リスクを慎重に評価してください。