Три года спустя: взгляд на мои прогнозы по ChatGPT в 2023 году
Автор: Ван Цзяньшо
6 марта 2023 года, вскоре после выхода ChatGPT и до запуска GPT-4, мы с Сарой провели интервью о ChatGPT — это был третий эпизод серии «Простым языком» в рамках Traders' Talk (подкаст, посвященный ChatGPT, уже вышел, приглашаем к прослушиванию).
В то время ChatGPT только появился, и очень немногие люди успели им воспользоваться. Это трехчасовое интервью позже заняло первое место в категории ChatGPT на платформе Xiaoyuzhou. Я сделал около двадцати суждений и прогнозов за один присест, полагаясь исключительно на интуицию и ограниченную информацию, практически не имея данных. Полная стенограмма того интервью до сих пор доступна в публичном аккаунте.
Сейчас конец мая 2026 года, прошло три года, и ИИ развился путями, которые тогда казались невообразимыми.
Я хочу сделать одно: взять те двадцать суждений из прошлого и, используя новейшие доступные сегодня данные, объективно их переосмыслить. Чтобы ясно увидеть, чем стал мир за три года, а также понять, в чем Ван Цзяньшо трехлетней давности был прав, а в чем ошибался.
Чтобы избежать предвзятости, я доверил эту сверку ИИ: я загрузил стенограмму интервью в рабочий процесс, который задействовал 41 агента Opus 4.8 для детального разбора каждого из двадцати суждений. Затем каждый из них искал актуальные данные в сети, проводил перекрестную проверку и, наконец, выставлял оценки Ван Цзяньшо трехлетней давности. Эта группа агентов работала около 20 минут и израсходовала 1,4 миллиона токенов (примерно $35), подготовив отчет ниже. Все суждения принадлежат им, а не мне. Базовая дата — май 2026 года.
I. Таблица результатов
Условные обозначения: ✅ Верно · 🟢 В основном верно · 🟡 Частично верно · ❌ Неверно
На первый взгляд, большинство общих направлений, намеченных Ван Цзяньшо, подтвердились, за исключением одной грубой ошибки — предположения о том, что GPT-4 имеет 100 Т параметров. Но дьявол кроется в деталях: почти у каждого «верного» суждения есть нюанс, который тогда был сформулирован неточно. Ни одно из двадцати суждений не осталось в категории «все еще неясно»; трех лет достаточно, чтобы большинство вещей склонились к определенному ответу. Ниже представлены подробные группы.
II. Верные суждения
Общая черта этой группы в том, что суждения Ван Цзяньшо о направлении, механизмах и даже сроках были в основном точными, с ошибками лишь в «степени» и «абсолютных формулировках».
RAG и архитектура поиска (Суждения 2, 3)
В 2023 году Ван Цзяньшо сказал: основной метод решения проблем со знаниями и галлюцинациями — это не изменение модели, а внедрение знаний через векторный поиск в качестве «шпаргалок»; правильная архитектура заключается в том, чтобы поисковые системы выполняли поиск и передавали результаты LLM.
Сегодня это фактический стандарт для всех ИИ-продуктов. RAG стал архитектурой по умолчанию для корпоративного ИИ, а OpenAI, Google и Anthropic превратили его в платформенную возможность; ChatGPT Search буквально означает «сначала используй Bing для индексации, передай результаты в GPT, а затем сгенерируй ответы со ссылками». Google AI Overviews достигли около 2 миллиардов активных пользователей в месяц с использованием grounding, а компания Perplexity, полагающаяся исключительно на эту архитектуру, оценивается примерно в $20 миллиардов.
Когда GPT-4 еще не был выпущен, а индустрия по умолчанию считала, что нужно «внедрять знания через дообучение», он предсказал «не изменение параметров модели, а использование внешнего поиска», и как механизм, так и сроки оказались верными.
Следует честно отметить, что он представлял себе «статичный разовый поиск», в то время как реальность оказалась сложнее — длинный контекст, GraphRAG и агентный поиск укрепили этот подход. Дискуссия 2026 года о том, что «RAG мертв», как раз доказывает, что общее направление живо; это лишь отрицание «наивного разового поиска», пришедшее к выводу о переходе к гибридному поиску, а не к возврату к изменению параметров модели. Еще один момент: термин RAG был предложен в статье Meta 2020 года и не был его оригинальной идеей — он просто верно предсказал, что это станет мейнстримом в тот период.
LUI — новый рубеж (Суждение 7)
В 2023 году Ван Цзяньшо сказал: величайший аспект ChatGPT — не AIGC, а то, что он открыл LUI (интерфейс на естественном языке), который перестроит взаимодействие человека и компьютера, как когда-то GUI, породив новую индустрию, гораздо большую, чем само «создание больших моделей».
Эта часть о «новом рубеже» оказалась почти полностью точной. Естественный язык стал доминирующим слоем взаимодействия для широкой публики (у ChatGPT 900 миллионов активных пользователей в неделю) и породил независимую новую индустрию — агенты, агенты для программирования и протокольные уровни стали реальностью. Утверждение о том, что это «гораздо больше, чем само создание моделей», было убедительно подтверждено: протокол MCP стал «стандартом операционной системы» эры LUI, полностью принятым OpenAI, Google и Microsoft к 2025 году, а к концу года переданным в Linux Foundation; только Claude Code принес около $2,5 миллиардов годовой выручки.
Однако он использовал сильные формулировки вроде «реконструкция и замена GUI», что, оглядываясь назад три года спустя, скорее говорит о сосуществовании, а не о замене. Три ярких контрпримера: отчет MIT показывает, что 95% корпоративных пилотных проектов GenAI не имеют измеримого ROI; агенты, работающие с интерфейсами, достигают лишь 78% на тестовых наборах, едва дотягивая до базового уровня человека; аппаратные средства на базе языка, полностью лишенные экранов, почти все провалились (Humane Pin окончательно закрылся в 2025 году). Более точное утверждение заключается в том, что LUI — это новый слой взаимодействия, построенный поверх GUI.
Роботизированные сети и новая адресация (Суждение 9)
В 2023 году Ван Цзяньшо сказал: в ближайшее десятилетие появятся «роботизированные сети» — агенты будут автоматически обмениваться рукопожатиями и вызывать друг друга, используя естественный язык, больше не требуя традиционных API; родится совершенно новая система адресации доменов. Это будет «завершено за два-три года».
Попадание в направление поразительно. MCP и A2A (переданные в Linux Foundation и поддерживаемые более чем 150 организациями) решают проблему интероперабельности агентов; Agent Network Protocol напрямую основан на W3C DID для «децентрализованной авторитетной агентной адресации», стремясь к «сети из миллиардов взаимодействующих агентов» — это в высокой степени изоморфно тому, что он описывал как «совершенно новую доменную систему».
Требуются две поправки: во-первых, «больше не нужны API» — не совсем верно; базовая структура мейнстрим-протокола представляет собой структурированную схему, по сути, накладывающую стандарт поверх API; во-вторых, «завершено за два-три года» не реализовалось, данные Gartner показывают, что по состоянию на 2026 год только около 17% организаций по-настоящему развернули агентов. Интересно, что тогда он фактически разделил свои утверждения — «прототип за два-три года», «зрелость примерно через десять лет». Ритм создания прототипа был предсказан очень точно, а цикл зрелости действительно находится в масштабе десяти лет. Если рассматривать их отдельно, качество этого суждения выше, чем кажется.
Китай обязательно создаст пригодные для использования большие модели (Суждения 10, 20)
В 2023 году Ван Цзяньшо сказал: Китай обязательно сможет создать пригодные для использования большие модели, и разрыв с топовыми моделями быстро сократится примерно за три года (сравнимо с тем, как браузер Hongqi догонял Netscape).
Временная шкала этого суждения удивительно точна. Индекс ИИ Стэнфорда за 2026 год показал, что разрыв в бенчмарках между топовыми моделями в Китае и США сократился с 17,5–31,6 процентных пункта в мае 2023 года до 2,7%; при этом частные инвестиции в ИИ в США примерно в 23 раза превышают китайские — сокращение разрыва при гораздо меньших вложениях. DeepSeek, Qwen, Kimi и GLM стали мировыми лидерами, а экосистема с открытым исходным кодом даже лидирует.
Однако слово «быстро» было чрезмерно оптимистичным — истинная зрелость наступила примерно через 14 месяцев, а не «через несколько месяцев». Более того, речь идет о догоняющем развитии в плане удобства использования, а не о лидерстве на переднем крае: по состоянию на начало 2026 года ни одна китайская модель не превзошла o3 от OpenAI. В суждении 20 он явно ошибся: утверждение, что «как только дверь открыта, она не закроется», было прямо опровергнуто тем, что OpenAI активно закрыла доступ к API для Китая в июле 2024 года; дверь была закрыта поставщиком; модель, которую он назвал лидером, Wenxin Yiyan, отстала, а истинными преемниками стали менее заметные ранее DeepSeek, Doubao и Qianwen.
Нет сознания, тест Тьюринга измеряет только внешность (Суждение 13)
В 2023 году Ван Цзяньшо сказал: у ChatGPT нет сознания; это «непреднамеренность говорящего и сентиментальность слушающего»; тест Тьюринга измеряет только «заставляет ли он вас думать, что у него есть сознание», а не то, есть ли оно на самом деле.
Основное суждение об «измерении внешности» остается в силе и было иронично подтверждено экспериментом: в тесте Тьюринга 2025 года в Калифорнийском университете в Сан-Диего GPT-4.5 принимали за человека в 73% случаев при подсказках «играть роль человека», что даже выше, чем у реальных людей, но он полагался исключительно на навыки исполнения — это лучший комментарий к «измерению только того, заставляет ли он вас думать, что у него есть сознание».
Следует добавить, что абсолютно категоричное утверждение «машины точно не имеют сознания» за последние три года перешло в серую зону. Anthropic создала должность исследователя «благополучия моделей», предположив вероятность наличия сознания около 15%–20%, и добавила в Claude функцию «активного прекращения разговоров, которые используются не по назначению». Это превратило «точно нет» в «низкая вероятность, но не исключено». Однако это основано на «возможно, следует предположить», а не на «доказано», и суть не была опровергнута; просто тон тогда был слишком категоричным.
Другие верные суждения (Суждения 6, 11, 12, 16, 18, 19)
- Не AGI, но большой шаг вперед: Оба конца верны. Сам Альтман во время эры GPT-5 заявил, что «это не AGI, не хватает непрерывного обучения»; в то же время золотые медали IMO и ARC-AGI взлетели почти с нуля до 85%, так что «большой шаг вперед» неоспорим.
- Никакой волны безработицы: В апреле 2026 года уровень безработицы в США составил всего 4,3%. Слепое пятно — в «распределении»: исследования Стэнфорда показывают, что потерянные рабочие места — это именно те, что занимали молодые специалисты 22–25 лет на первой ступени карьерной лестницы, где механизм «плавного поглощения» дал сбой.
- Не переполнен ИИ-мусором: Направление чистого благополучия верно, но он сильно недооценил масштаб — ИИ-контент сейчас составляет около 52% новых веб-страниц, а «AI slop» стал словом года.
- Год предпринимательства: Поворотный момент был определен верно, xAI (основанная в марте 2023 года) достигла оценки в $230 миллиардов. Однако он узко ограничил «великие компании» 2023 годом — по-настоящему триллионные OpenAI и Anthropic были основаны гораздо раньше.
- Момент браузера 1994 года: Относительный рейтинг подтвердился, OpenAI действительно запустила браузер Atlas в 2025 году, превратив метафору в буквальную реальность. Однако распространение ChatGPT было даже более стремительным, чем у браузеров, что сделало метафору консервативной.
- Промпты с фактами уменьшают галлюцинации: Направление подтвердилось; уровень галлюцинаций GPT-5 взлетел до 47% при отключении от поиска, подтверждая, что «факты» — ключевая переменная. Он лишь недооценил, что корень проблемы кроется в стимулах обучения, а не в промптах.
III. Неверные или ошибочные суждения
GPT-4 имеет 100 Т параметров (Суждение 4) — полностью неверно
В 2023 году Ван Цзяньшо сказал: (по слухам) GPT-4 имеет 100 Т параметров, примерно в 600 раз больше, чем 175 B у GPT-3.
Обе цифры неверны. GPT-3 — 175 B, а лучшая оценка, просочившаяся в июле 2023 года, гласит, что GPT-4 имеет около 1,8 Т с 16 экспертами MoE, что всего в 10 раз больше. Разница между 100 Т и реальной цифрой составляет около 55 раз. Единственный источник «100 Т» — это цитата из вторых рук от генерального директора Cerebras в 2021 году, которую Сэм Альтман в январе 2023 года назвал «полной чушью».
Он пометил это как «по слухам», сохраняя неопределенность. На более глубоком уровне сама концепция «измерения поколений кратностью параметров» устарела: последующие GPT-4.5 и GPT-5 от OpenAI просто больше не раскрывают количество параметров. Это единственная грубая ошибка, которая является как числовой, так и устаревшей с точки зрения перспективы.
Математика LLM (Суждение 1) — диагноз верный, вывод неверный
В 2023 году Ван Цзяньшо сказал: суть плохой математики LLM делает невозможным и ненужным для них изучение математики самостоятельно; правильный подход — использование внешних инструментов.
«Диагноз плюс путь инструментов» полностью верен — корень проблемы действительно в том, что генерация токен за токеном ведет к ненадежным переносам (статья о механизмах 2025 года точно подтвердила интуицию о том, что «последняя цифра часто верна, средние — нет»); улучшение от внешних инструментов также значительно (когда o4-mini разрешил Python, AIME 2025 достиг 99,5%).
Ошибка заключается в абсолютной формулировке «невозможно, ненужно». «Невозможно» было опровергнуто — к июлю 2025 года модели Gemini Deep Think и OpenAI завоевали золотые медали на IMO, используя чистый естественный язык без инструментов. Ключевым поворотным моментом стало появление «моделей рассуждения» в 2024–2025 годах, которые невозможно было предвидеть в марте 2023 года — поэтому этот прогноз следует оценивать мягко в плане направления, а не жестко по срокам.
Захват стоимости (Суждение 8) — наполовину верно, основное утверждение неверно
В 2023 году Ван Цзяньшо сказал: стоимость в конечном итоге перейдет на прикладной уровень; компании, создающие фундаментальный уровень (разработчики моделей), не обязательно будут получать прибыль.
Деньги действительно начали перетекать на прикладной уровень (Cursor достиг $2 миллиардов годовой выручки за три года) — эта часть верна. Однако утверждение о том, что «те, кто на фундаментальном уровне, не получают прибыль», было прямо опровергнуто Nvidia: чистая прибыль в 2026 финансовом году составляет около $120 миллиардов при рыночной стоимости более $5 триллионов, что делает ее единственным крупным источником прибыли на всем рынке. Уровень моделей, который, как он подразумевал, победит (ожидается, что OpenAI потеряет около $14 миллиардов в 2026 году), больше похож на то, что он описывал как «сжигание денег без прибыли на фундаментальном уровне».
Он не различал «фундаментальный уровень вычислительных мощностей» и «фундаментальный уровень моделей», а также не различал «выручку» и «прибыль». В 2026 году стоимость захвачена уровнем вычислительных мощностей гораздо более экстремально, чем в 2023 году, а не сместилась на прикладной уровень. Следует отметить: теряют деньги облачные провайдеры, покупающие чипы, а не Nvidia, продающая их — именно здесь его аналогия с «избыточным строительством железных дорог» не работает.
Авторское право (Суждение 14) — регистрация верна, избежание нарушений неверно
В 2023 году Ван Цзяньшо сказал: контент, созданный ИИ, может избежать авторских прав (защищая выражение, но не идеи); созданные работы могут не нарушать права и не подлежать регистрации.
«Невозможно зарегистрировать» стало установленным юридическим фактом (в 2025 году Бюро авторского права США четко заявило, что «ввода только промптов недостаточно для претензии на авторство»). Однако «избежание нарушений» явно неверно: суды неоднократно постановляли, что если результаты ИИ существенно похожи на оригинальные работы, это все равно является нарушением; Anthropic выплатила $1,5 миллиарда из-за нарушения авторских прав, что стало крупнейшей компенсацией в истории США. ИИ не «избежал» авторских прав; напротив, он заплатил самую высокую цену в истории.
Мировая гармония (Суждение 15) — механизм верен, прогноз тренда неверный
В 2023 году Ван Цзяньшо сказал: ChatGPT делает «взвешенное среднее» мнений людей, что может противодействовать информационным коконам в стиле TikTok, давая возможность для «мировой гармонии».
Уровень механизма верен — многочисленные исследования 2025 года окончательно подтвердили, что LLM подталкивают мнения к большинству и систематически недооценивают меньшинства. Однако уровень социального суждения был неверным: добавленная фраза «по крайней мере сейчас это не тысяча лиц» была опровергнута в течение трех лет — OpenAI сделала кросс-диалоговую память и персонализацию стандартной возможностью с апреля 2025 года, ИИ стремительно движется к тысяче лиц. Что еще более важно, он представлял «взвешенное среднее» как нейтральный мировой знаменатель, но эмпирические данные показывают, что это направленный сдвиг, усугубляемый лестью, который можно использовать для активного манипулирования позициями — это указывает на «создание новых коконов», а не на «растворение поляризации».
Локальные войны и затраты (Суждение 17) — качественно полностью верно, количественно опровергнуто
В 2023 году Ван Цзяньшо сказал: создание больших моделей быстро перерастет в «локальные войны» с известными затратами (убирая обходные пути, потолок около $500 млн – $1 млрд), и выйдет много игроков.
Качественное направление поразительно верно — появилось много игроков, быстрая коммерциализация, открытый исходный код догнал закрытый, все реализовано. Однако жесткая цифра «потолок в $500 млн – $1 млрд» неверна с обоих концов: передний край сильно недооценен (уровень GPT-5 в 2026 году достигает $200–500 млн на обучение, плюс сотни миллиардов на дата-центры и $50 млрд на Stargate); конец репликации переоценен (DeepSeek сжал маржинальные затраты на обучение до уровня миллионов долларов). «Стоимость» одной и той же модели может варьироваться в 200 раз в зависимости от критериев, и она просто не попадает в диапазон, который он предоставил.
Эмерджентные способности (Суждение 5) — направление верно, цифры и рамки неверны
В 2023 году Ван Цзяньшо сказал: новые способности, которых нет в исходных данных и которые не могут быть объяснены исследователями, появляются при 60 B параметров.
Интуиция направления верна, но два утверждения не выдерживают критики: во-первых, нет единого «порога 60 B» — истинный порог для цепочек мышления составляет около 100 B, при этом разные способности появляются в масштабах от 13 B до 540 B; во-вторых, «не могут объяснить» было оспорено выдающейся статьей на NeurIPS к концу 2023 года — многие «мутации» являются артефактами, вызванными выбором метрик оценки, и при использовании непрерывных метрик кривые могут быть сглажены и предсказаны. Справедливости ради, он повторял абсолютно мейнстримный нарратив того времени; что действительно можно исправить, так это отношение к «60 B» как к жесткому порогу и к «не могут объяснить» как к качественному выводу.
IV. Размышления три года спустя: несколько правил
После сверки каждого суждения, отступив на шаг назад, можно заметить несколько правил, скрытых в двадцати суждениях Ван Цзяньшо, которые стоят большего внимания, чем любое отдельное суждение.
1. Направление гораздо надежнее цифр и степеней. Среди двадцати суждений те, что оценивали механизмы и направления (RAG, LUI, роботизированные сети, тест Тьюринга), были почти все верны; те, что давали конкретные цифры или абсолютные формулировки (100 Т параметров, порог 60 B, затраты $500 млн – $1 млрд, «невозможная» математика), были почти все неверны. В быстро меняющихся областях ставка на направление и механизмы, а не на точные цифры, имеет решающее значение, и следует остерегаться абсолютных терминов вроде «невозможно, точно, ограничено, абсолютно нет» — это области высокой частоты, где время доказывает их неправоту.
2. Что касается сроков, он склонен переоценивать скорость и недооценивать степень. Всякий раз, когда он говорил «быстро, завершено за два-три года», период зрелости обычно был дольше; однако он недооценивал потолок для скачков возможностей — математика может пройти путь от «невозможно» до золотой медали IMO, а затраты на переднем крае могут вырасти до уровней, невообразимых в то время. Короче говоря: чрезмерно оптимистичен в краткосрочной перспективе, слишком консервативен в долгосрочной.
3. Самые скрытые ошибки постоянно возникают в «распределении». Ошибочно не направление, а взгляд только на общую сумму при игнорировании распределения. «Никакой волны безработицы» верно, но вред сильно сконцентрирован среди молодых новичков; «стоимость переходит на прикладной уровень» наполовину верно, но не было различия между уровнем вычислительных мощностей и уровнем моделей. Общая верность может маскировать катастрофы распределения — это самый важный урок, который нужно усвоить.
4. Утверждения, оставлявшие место для интерпретации, выдержали испытание временем три года спустя. «По слухам», «по крайней мере сейчас», «значительно уменьшено, а не устранено», «прототип за два-три года, зрелость примерно через десять лет» — любое суждение, сделанное тогда с оговорками или слоями, сегодня выглядит лучше. Напротив, абсолютные утверждения, сделанные с ходу, с наибольшей вероятностью проваливаются. Честность прогнозов отчасти заключается в мужестве говорить, а отчасти — в мужестве указать на свою неопределенность.
5. Некоторые вопросы просто невозможно решить за три года. Кто в конечном итоге владеет стоимостью, является ли эмерджентность изменением истины, имеют ли машины хотя бы след сознания и будут ли длинные контексты потреблять RAG — эти дебаты из прошлого остаются нерешенными в 2026 году. Важнее различать «уже отвечено» и «еще нужно подождать», чем спешить с выводами по каждому вопросу.
Три года назад Ван Цзяньшо указал двадцать направлений, основываясь на интуиции в тумане перед выходом GPT-4. Сегодня, сверяя эти суждения, самый важный вывод может заключаться в следующем: распознать большое направление не так уж сложно; сложность заключается в признании того, что я снова и снова принимал цифры, скорость и распределение как должное. Эти двадцать сверок — не столько оценка прошлого, сколько установление нескольких правил на следующие три года. Давайте вернемся к этому в 2029 году.
Вам также может понравиться

От инструментов казино к глобальным машинам ценообразования: взгляд лидера NYSE на Hyperliquid

CEO Sharplink: будущее Ethereum уже наступает

Хакеры и регулирование: что погубило DeFi?

Крис Ли: от крипто-OG до крупных инвестиций в трех гигантов индустрии хранения данных, прогнозы по коррекции на «бычьем» рынке ИИ, Web4 и возможности для молодого поколения

Хэ И: Раз уж вы здесь, почему бы не попробовать

Шесть главных претензий от разработчика Ethereum

WEEX GOGOGO Эпизод 3|LALIGA: Путь к золоту — 6 взрывных моментов, 1 билет на Чемпионат мира и ночь, которую никто не забудет

2 года и доходность в 225 раз? Раскрываем «узкое место» инвестиционной стратегии загадочного исследователя Serenity

B.AI partners with BNB Chain to launch the "Billion AI Token Subsidy" celebration, fully igniting the on-chain intelligent agent ecosystem

Триллионный ажиотаж вокруг продажи памяти: прибыль от покупки памяти сократилась вдвое

Утренний отчет | Binance запускает исследовательский инструмент DYOR; YZi Labs открывает платформу для рекрутинга YZi Talent; Виталик заявляет, что Ethereum Foundation «сократит штат» и уменьшит объемы продаж ETH

Мечта SuperEx об исследовании Марса: цифровая валюта как ключ к экономическим обменам в межзвездную эру

Утренние новости | Майкл Сэйлор заявил, что на этой неделе покупал облигации, а не Bitcoin; StablR подвергся атаке и потерял около 2,8 млн долларов; Конгресс США вновь продвигает закон о резервах в Bitcoin

Основные тезисы: полный текст выступления главного научного сотрудника Google Шэнахэна

Паттерны агентного проектирования: книга, заставившая меня переосмыслить, что именно представляет собой «агент»

Пришел самый богатый председатель ФРС за 112 лет: Кевин Уорш переписывает правила

Виталик о будущем Ethereum Foundation: корабль станет меньше, самобытнее и долговечнее

