logo

3 приветствий лимит, куда делся ваш лимит Claude Code? 28-дневная ошибка кэша и официальный ответ, который призывает вас "использовать его экономно."

By: blockbeats|2026/04/03 13:21:53
0
Поделиться
copy

4-17%. Это коэффициент попадания кэша для Claude Code за последний месяц. Нормальный уровень составляет 97-99%.

Это означает, что когда вы возобновляете предыдущую сессию, Claude Code не использует ранее обработанный контекст, а обрабатывает все с нуля каждый раз, потребляя кредиты в 10-20 раз быстрее, чем обычно. Вы можете думать, что продолжаете разговор, но на самом деле вы каждый раз начинаете совершенно новый разговор по полной цене.

3 приветствий лимит, куда делся ваш лимит Claude Code? 28-дневная ошибка кэша и официальный ответ, который призывает вас

Эти данные получены от независимого разработчика ArkNill, который проводил мониторинг прокси. Настроив прозрачный прокси, он записал каждый запрос между Claude Code и API Anthropic, выявив как минимум две ошибки кэширования на стороне клиента, которые не позволяли серверу API сопоставлять кэшированные префиксы разговоров, вынуждая каждый раз полностью восстанавливать токены.

График выше показывает сравнение коэффициентов попадания кэша на трех этапах. В версиях с v2.1.69 по v2.1.89 (период ошибки) коэффициент попадания кэша в автономной версии составлял всего 4-17%. После исправления критической ошибки в версии v2.1.90 коэффициент попадания кэша при холодном старте вернулся к 47-99.7%. К версии v2.1.91 стабильный коэффициент попадания кэша восстановился до 97-99%.

Одной из примечательных деталей из графика является то, что диапазон в v2.1.90 довольно широкий (от 47% до 99.7%), потому что кэш все еще нуждается в "разогреве", когда сессия только возобновляется, что приводит к низким коэффициентам попадания в первые несколько раундов, но быстро возвращается к норме. В ошибочной версии этот разогрев никогда не происходит — коэффициент попадания кэша всегда остается на уровне 14,500 токенов системного запроса, при этом вся история разговора полностью оплачивается каждый раз.

28 дней, 20 версий

Эта ошибка не является типом, который вводится в одном обновлении и исправляется в следующем. Согласно записям о релизах реестра npm, версия v2.1.69, которая ввела ошибку, была выпущена 4 марта, а версия v2.1.90, которая исправила ошибку, была выпущена 1 апреля. Между ними прошло 28 дней, охватывающих 20 версий.

Хронология раскрыла интригующую деталь. После того как ошибка была введена 4 марта, пользователи не сразу начали массово жаловаться. Только 23 марта жалобы вспыхнули массово, почти через три недели. Причина в том, что, согласно анализу проблемы на GitHub #41930, с 13 по 28 марта у Anthropic была активна акция по увеличению квоты в 2 раза (удваивание в нерабочие часы), что объективно скрывало влияние ошибки. После окончания акции потребление кэш-ошибки вернулось к нормальным базовым показателям, и квоты пользователей мгновенно "исчезли".

Ответ Anthropic не был быстрым. 26 марта, через три дня после вспышки жалоб пользователей, инженер Тариq Шихипар объявил на своем личном аккаунте в X, что лимит в часы пик (будние дни с 5 до 11 утра по Тихоокеанскому времени) был ужесточен. 30 марта Anthropic признал на Reddit, что "скорость, с которой пользователи исчерпывали свои квоты, значительно превышала ожидания", указав это как главную приоритет команды. Только 1 апреля член команды Лидия Халли опубликовала официальные результаты расследования.

На протяжении всего процесса Anthropic не публиковал никаких блогов, не отправлял уведомления по электронной почте и не обновлял страницу статуса. Вся официальная коммуникация осуществлялась исключительно через личные посты инженеров в социальных сетях и несколько комментариев на Reddit.

Сколько вы заплатили и как долго можете это использовать?

Проблема на GitHub #41930 собрала сотни отчетов пользователей. Самый крайний случай был у пользователя подписки Max 20x ($200/месяц), чье 5-часовое окно было полностью исчерпано за 19 минут. Пользователи Max 5x ($100/месяц) сообщили, что их 5-часовое окно было использовано за 90 минут. Согласно The Letter Two, некоторые пользователи утверждали, что простое "привет" потребляло 13% их квоты сессии. Пользователь Pro ($20/месяц) в Discord упомянул, что его квота "заканчивалась каждую понедельник и сбрасывалась только в субботу", с только 12 днями нормального использования за 30 дней.

Согласно бенчмаркинговым тестам ArkNill, в версии ошибки v2.1.89 100% квота плана Max 20x будет исчерпана примерно за 70 минут. Он также рассчитал стоимость одной операции --resume для сессии контекста на 500K токенов, которая составляет примерно $0.15, так как система полностью воспроизводит весь контекст.

«Вы держите это неправильно»

Расследование Лидии Холли подтвердило два момента: во-первых, действительно произошло ужесточение лимитов в часы пик, и, во-вторых, увеличилось потребление токенов в контексте в 1 миллион токенов. Она упомянула, что команда исправила некоторые ошибки, но подчеркнула, что «ни одна из ошибок не привела к переплате».

Затем она предоставила четыре рекомендации по экономии:
1. Используйте Sonnet 4.6 вместо Opus (Opus потребляет примерно в два раза больше);

2. Снизьте глубину рассуждений или отключите расширенное мышление, когда глубокие рассуждения не нужны;

3. Не возобновляйте длительные бездействия более чем на час; начните новую сессию вместо этого;

4. Установите переменную окружения CLAUDE_CODE_AUTO_COMPACT_WINDOW=200000, чтобы ограничить размер контекстного окна.

Не было упомянуто о какой-либо форме сброса квот или компенсации.

Ведущий AI-подкаста Алекс Волков резюмировал этот ответ как «Вы держите это неправильно», указав на то, что сама Anthropic установила контекст в 1 миллион токенов по умолчанию, продвигала Opus как флагманскую модель и подчеркивала расширенное мышление как преимущество, но теперь советует платным пользователям не использовать эти функции.

Утверждение о «без переплат» также создает напряженность с историей обновлений Claude Code. Всего за день до ответа Лидии версия 2.1.90 исправила ошибку регрессии кэша, которая присутствовала с версии 2.1.69: при использовании --resume для возобновления сессии запросы, которые должны были попасть в кэш, вызывали полное промахивание кэша подсказок, что приводило к полной оплате. Ответ Лидии не упоминал об этом подтвержденном аномальном биллинге.

Для сравнения, Codex от OpenAI ранее сталкивался с аналогичными проблемами аномального потребления квот. Подход OpenAI заключался в сбросе квот пользователей, выдаче кредитных возвратов и объявлении о снятии лимита на использование Codex в марте. Подход Anthropic заключается в том, чтобы советовать пользователям понижать модели, отключать функции, ограничивать контекст и возлагать ответственность на использование пользователями.

Компания Anthropic продает подписку на "самую мощную модель + максимальный контекст + высшие способности к рассуждению", взимая плату от 20 до 200 долларов в месяц. Ошибка кэширования, продолжавшаяся 28 дней, привела к тому, что квоты платных пользователей истощались в 10-20 раз быстрее, при этом официальным ответом было рекомендовано использовать это экономно.

Цена --

--

Вам также может понравиться

Circle Настоятельно Призывает ЕС Ослабить Пороги Криптовалюты в Предложенной Рыночной Структуре

Circle обратилась к Еврокомиссии с просьбой снизить порог капитализации для евро-стейблкоинов в рамках предложенного Пакета Рыночной Интеграции. Текущие…

Арбитрум Sepolia остановил производство блоков из-за частичной остановки

Сеть Arbitrum Sepolia, основной тестнет Ethereum Layer-2, прекратила блочную генерацию из-за серьёзного отказа в консенсусе на блоке 204606366.…

Прогноз цен на Solana: сможет ли Solana преодолеть медвежью структуру?

Solana торгуется около критической отметки в $90,92, между медвежьими сигналами и надеждами на восстановление в 2026 году. Важная…

Открытый интерес Hyperliquid HIP-3 достигает $1,74 млрд на фоне роста токенизированных товаров

Открытый интерес HIP-3 платформы Hyperliquid достиг рекордных $1,74 миллиардов, отразив рост на 25% за неделю. Основной драйвер роста…

Анализ Цены Серебра: Падение Соотношения XAG к XAU на Фоне Снижения Металлов

За последние 48 часов серебро резко упало в цене, чему способствовала сила доллара и рост реальных доходностей. Соотношение…

Цена Биткоина Реагирует: Трамп Откладывает Удар по Ирану, Нефть и Золото Волатильны

Цена биткоина резко выросла, достигнув отметки в $71,000 после новости об отсрочке удара США по иранской энергетике. На…

Популярные монеты

Последние новости криптовалют

Еще