محدودیت ۳ سلام، محدودیت کد کلود شما کجا رفت؟ یک اشکال در حافظه پنهان ۲۸ روزه، و یک پاسخ رسمی که شما را به «استفاده‌ی کم از آن» تشویق می‌کند.

By: blockbeats|2026/04/03 13:18:46

اشتراک‌گذاری

۴-۱۷٪. این نرخ بازدید از حافظه پنهان سریع برای کلود کد در ماه گذشته است. سطح طبیعی ۹۷-۹۹٪ است.

این یعنی وقتی شما یک جلسه قبلی را از سر می‌گیرید، کلود کد از متن پردازش‌شده قبلی دوباره استفاده نمی‌کند، بلکه هر بار همه چیز را از ابتدا پردازش می‌کند و با سرعتی ۱۰ تا ۲۰ برابر بیشتر از حالت عادی، اعتبار مصرف می‌کند. ممکن است فکر کنید که در حال ادامه دادن به یک مکالمه هستید، اما در واقع، هر بار یک مکالمه کاملاً جدید و پرهزینه را شروع می‌کنید.

محدودیت ۳ سلام، محدودیت کد کلود شما کجا رفت؟ یک اشکال در حافظه پنهان ۲۸ روزه، و یک پاسخ رسمی که شما را به «استفاده‌ی کم از آن» تشویق می‌کند.

این داده‌ها از مانیتورینگ پروکسی توسط توسعه‌دهنده مستقل ArkNill گرفته شده است. او با راه‌اندازی یک پروکسی شفاف، هر درخواست بین کلود کد و رابط برنامه‌نویسی کاربردی آنتروپیک را ثبت کرد و حداقل دو اشکال ذخیره‌سازی سمت کلاینت را کشف کرد که باعث می‌شد سرور رابط برنامه‌نویسی کاربردی نتواند پیشوندهای مکالمه ذخیره‌سازی‌شده را مطابقت دهد و در هر دور مجبور به بازسازی کامل توکن شود.

نمودار بالا مقایسه‌ای از نرخ موفقیت حافظه پنهان را در سه مرحله نشان می‌دهد. در طول نسخه‌های v2.1.69 تا v2.1.89 (دوره بروز این اشکال)، نرخ موفقیت در کش نسخه مستقل تنها ۴ تا ۱۷ درصد بود. پس از رفع یک اشکال بحرانی در نسخه v2.1.90، میزان موفقیت در شروع سرد (cold start) به 47-99.7٪ بازگشت. در نسخه ۲.۱.۹۱، نرخ موفقیت در کش پایدار به ۹۷ تا ۹۹ درصد بهبود یافت.

یک نکته قابل توجه در نمودار: محدوده تغییرات در نسخه ۲.۱.۹۰ بسیار گسترده است (۴۷٪ تا ۹۹.۷٪) زیرا حافظه پنهان (cache) هنوز نیاز به "گرم شدن" دارد، زمانی که یک جلسه تازه از سر گرفته می‌شود، که منجر به نرخ ضربه پایین در چند دور اول می‌شود، اما به سرعت به حالت عادی برمی‌گردد. در نسخه دارای باگ، این گرم شدن هرگز رخ نمی‌دهد - نرخ ضربه به حافظه پنهان همیشه در ۱۴۵۰۰ توکن از اعلان سیستم باقی می‌ماند، و هر بار کل تاریخچه مکالمه به طور کامل محاسبه می‌شود.

۲۸ روز، ۲۰ نسخه

این اشکال از آن نوعی نیست که در یک به‌روزرسانی معرفی و در به‌روزرسانی بعدی برطرف شود. طبق سوابق انتشار رجیستری npm، نسخه v2.1.69 که این اشکال را معرفی کرده بود، در ۴ مارس و نسخه v2.1.90 که این اشکال را برطرف کرده بود، در ۱ آوریل منتشر شد. ۲۸ روز بین این دو فاصله بود که شامل ۲۰ نسخه می‌شد.

جدول زمانی جزئیات وسوسه‌انگیزی را آشکار کرد. پس از اینکه این اشکال در ۴ مارس معرفی شد، کاربران بلافاصله در مقیاس بزرگ شکایت نکردند. تقریباً سه هفته بعد، در ۲۳ مارس بود که شکایات به طور گسترده فوران کرد. دلیلش این است که طبق تحلیل شماره ۴۱۹۳۰ گیت‌هاب، از ۱۳ تا ۲۸ مارس، آنتروپیک به صورت زنده سهمیه‌اش را دو برابر می‌کرد (دو برابر شدن در ساعات غیر اوج مصرف)، که به طور عینی تأثیر این اشکال را پنهان می‌کرد. پس از پایان طرح تشویقی، میزان مصرف ناشی از اشکال حافظه پنهان به حالت عادی برگشت و سهمیه کاربران فوراً "تبخیر" شد.

پاسخ آنتروپیک سریع نبود. در ۲۶ مارس، سه روز پس از اوج گرفتن شکایات کاربران، مهندس طاهر شیهیپار در حساب شخصی X خود اعلام کرد که محدودیت ساعات اوج مصرف (روزهای هفته ۵ صبح تا ۱۱ صبح به وقت PT) تشدید شده است. در تاریخ ۳۰ مارس، شرکت آنتروپیک در ردیت اعتراف کرد که «میزان دسترسی کاربران به سهمیه تعیین‌شده بسیار فراتر از انتظارات بوده است» و آن را به عنوان اولویت اصلی تیم خود ذکر کرد. تا اول آوریل طول کشید تا لیدیا هالی، یکی از اعضای تیم، یافته‌های رسمی تحقیقات را منتشر کند.

در طول این فرآیند، آنتروپیک هیچ پست وبلاگی منتشر نکرد، ایمیل اطلاع‌رسانی نفرستاد، یا صفحه وضعیت را به‌روزرسانی نکرد. تمام ارتباطات رسمی صرفاً از طریق پست‌های شخصی مهندسان در شبکه‌های اجتماعی و چند کامنت در ردیت انجام می‌شد.

چقدر هزینه کردید و تا چه مدت می‌توانید از آن استفاده کنید؟

شماره گیت‌هاب شماره ۴۱۹۳۰ صدها گزارش از کاربران جمع‌آوری کرده است. شدیدترین مورد، یک کاربر اشتراک Max 20x (200 دلار در ماه) بود که پنجره‌ی زمانی ۵ ساعته‌اش به‌طور کامل در ۱۹ دقیقه مصرف شد. کاربران حداکثر ۵x (۱۰۰ دلار در ماه) گزارش دادند که فرصت ۵ ساعته آنها در ۹۰ دقیقه تمام شده است. طبق گزارش The Letter Two، برخی از کاربران ادعا کرده‌اند که یک «سلام» ساده ۱۳٪ از سهمیه نشست آنها را مصرف کرده است. یک کاربر حرفه‌ای (۲۰ دلار در ماه) در دیسکورد اشاره کرد که سهمیه‌اش «هر دوشنبه تمام می‌شد و فقط شنبه‌ها دوباره تنظیم می‌شد» و در ۳۰ روز، فقط ۱۲ روز استفاده عادی داشته است.

بر اساس آزمایش بنچمارک ArkNill، در نسخه باگ v2.1.89، سهمیه ۱۰۰٪ طرح Max 20x در حدود ۷۰ دقیقه تمام می‌شود. او همچنین هزینه یک عملیات --resume را برای یک جلسه متن توکن ۵۰۰K محاسبه کرد که تقریباً ۰.۱۵ دلار است، زیرا سیستم کل متن را به طور کامل بازپخش می‌کند.

「داری اشتباه نگهش می‌داری」

تحقیقات لیدیا هالی دو نکته را تأیید کرد: اول اینکه، در واقع محدودیت‌های ساعات اوج مصرف تشدید شده است، و دوم اینکه، افزایش مصرف توکن در چارچوب ۱ میلیون توکن وجود داشته است. او اشاره کرد که تیم برخی از اشکالات را برطرف کرده است، اما تأکید کرد که «هیچ یک از اشکالات منجر به دریافت هزینه بیش از حد نشده است.»

او سپس چهار توصیه برای صرفه‌جویی ارائه داد:
۱. به جای Opus از Sonnet 4.6 استفاده کنید (Opus تقریباً دو برابر مصرف می‌کند)؛

۲. وقتی به استدلال عمیق نیازی نیست، عمق استدلال را کاهش دهید یا تفکر گسترده را خاموش کنید.

۳. جلسات طولانی و بدون استفاده بیش از یک ساعت را از سر نگیرید؛ در عوض، جلسات جدیدی را شروع کنید.

۴. متغیر محیطی CLAUDE_CODE_AUTO_COMPACT_WINDOW=200000 را برای محدود کردن اندازه پنجره زمینه تنظیم کنید.

هیچ اشاره‌ای به هیچ شکلی از تنظیم مجدد سهمیه یا جبران خسارت نشده است.

الکس ولکوف، مجری پادکست هوش مصنوعی، این پاسخ را با عبارت «اشتباه برداشت می‌کنید» خلاصه کرد و خاطرنشان کرد که خود شرکت آنتروپیک، زمینه ۱ میلیون توکن را به عنوان پیش‌فرض تعیین کرده، اوپوس را به عنوان مدل پرچمدار تبلیغ کرده و تفکر توسعه‌یافته را به عنوان یک نقطه قوت برجسته کرده است، اما اکنون به کاربران پولی توصیه می‌کند که از این ویژگی‌ها استفاده نکنند.

ادعای «عدم دریافت هزینه اضافی» همچنین باعث ایجاد تنش با تاریخچه به‌روزرسانی‌های خود کلود کد می‌شود. درست یک روز قبل از پاسخ لیدیا، نسخه ۲.۱.۹۰ یک اشکال رگرسیون حافظه پنهان را که از نسخه ۲.۱.۶۹ وجود داشت، برطرف کرد: هنگام استفاده از --resume برای از سرگیری یک جلسه، درخواست‌هایی که باید به حافظه پنهان می‌رسیدند، باعث از دست رفتن کامل حافظه پنهان می‌شدند و در نتیجه صورتحساب کامل صادر می‌شد. پاسخ لیدیا به این ناهنجاری تایید شده در صورتحساب اشاره‌ای نکرد.

برای مقایسه، Codex از OpenAI قبلاً مشکلات مصرف سهمیه غیرعادی مشابهی را تجربه کرده بود. رویکرد OpenAI این بود که سهمیه کاربران را مجدداً تنظیم کند، اعتبار را بازپرداخت کند و حذف سقف استفاده در Codex را در ماه مارس اعلام کند. رویکرد آنتروپیک این است که به کاربران توصیه کند مدل‌ها را به نسخه پایین‌تری ارتقا دهند، ویژگی‌ها را غیرفعال کنند، زمینه را محدود کنند و مسئولیت را به استفاده کاربر نسبت دهند.

شرکت آنتروپیک اشتراکی با عنوان «قوی‌ترین مدل + حداکثر زمینه + بالاترین قابلیت‌های استدلال» می‌فروشد که هزینه‌ای بین ۲۰ تا ۲۰۰ دلار در ماه دریافت می‌کند. یک اشکال در ذخیره‌سازی ۲۸ روزه باعث شد سهمیه کاربران پولی با سرعت ۱۰ تا ۲۰ برابر سریع‌تر تمام شود، و واکنش رسمی این بود که از آن به طور محدود استفاده شود.

قیمت --

ممکن است شما نیز علاقه‌مند باشید

رتبه‌بندی هه ییدنگ: حالا که اینجایی، بهتر است امتحانش کنی

هه یی از Binance در فهرست «قدرتمندترین زنان در کسب‌وکار» مجله فورچون قرار گرفت. او ضمن ابراز قدردانی از جامعه، چشم‌انداز جدید Binance را اعلام کرد: ایجاد زیرساخت مالی برای خدمت به ۳ میلیارد نفر در سراسر جهان.

قسم سوم WEEX GOGOGO｜مسیر لالیگا به سوی طلا – ۶ لحظه انفجاری، ۱ بلیت جام جهانی و شبی که هرگز فراموش نخواهد شد

WEEX در ۲۴ مه با لالیگا، معاملات هوش مصنوعی، طلای بدون کارمزد و ۱۰۰٪ APR آغاز به کار کرد. چت‌ها منفجر شد، پاداش‌ها سرازیر شد و یک هوادار خوش‌شانس بلیت جام جهانی را برد. در اینجا اتفاقات آن شب را مرور می‌کنیم.

اخبار صبح | همکاری Coinbase با بانک Standard Chartered برای گسترش کانال‌های فیات چند ارزی؛ ورود Sharplink و Forward به شاخص راسل؛ احتمال صدور استیبل‌کوین توسط جی‌پی‌مورگان در آینده

مروری بر رویدادهای مهم بازار در ۲۷ مه

چگونه Micron به ارزش بازار یک تریلیون دلاری دست یافت، در حالی که Samsung به چرخه‌های فناوری و Hynix به HBM متکی است؟

ارزش بازار غول تراشه‌سازی، Micron Technology، از ۱۰۰ میلیارد دلار فراتر رفته است. این شرکت با کنترل هزینه‌های تولید از چندین دور تغییرات ساختاری صنعت عبور کرده و اکنون با چرخه جدیدی از رقابت در بخش HBM پیشرفته، رقابت در بازار میان‌رده و پایین‌رده و تعدیلات مواجه است...

۲ سال، ۲۲۵ برابر بازدهی؟ رونمایی از تکنیک سرمایه‌گذاری «گلوگاه» هوش مصنوعی توسط پژوهشگر مرموز، Serenity

Serenity، معامله‌گر سابق WSB، طی دو سال در پلتفرم X به بازدهی خیره‌کننده ۲۲۵ برابری دست یافته است. نظریه اصلی او درباره «گلوگاه‌های زنجیره تأمین» و چندین مطالعه موردی کلاسیک از شرکت‌های کوچک (Micro-cap)، توجه شدید بازار را به خود جلب کرده است.

همکاری B.AI با BNB Chain برای راه‌اندازی جشن «یارانه توکن هوش مصنوعی میلیاردی» و شعله‌ور کردن اکوسیستم عامل‌های هوشمند درون‌زنجیره‌ای

B.AI با همکاری BNB Chain برنامه یارانه صد میلیاردی را راه‌اندازی می‌کند. این برنامه شامل یک پاداش ویژه ۸,۰۰۰ USDT در مجموع جوایز است که به کاربران Web3 کمک می‌کند بدون مانع به مدل‌های زبانی بزرگ دسترسی پیدا کرده و زیرساخت مالی کامل هوش مصنوعی را تجربه کنند.

جنون تریلیون دلاری فروش حافظه؛ سود حاصل از خرید حافظه نصف شد

تقاضای هوش مصنوعی برای قدرت پردازشی و ذخیره‌سازی ممکن است ساختاری باشد و قراردادهای بلندمدت (LTA) واقعاً قوانین صنعت را بازنویسی کرده باشند؛ ارزش بازار یک تریلیون دلاری شاید تنها نقطه شروع باشد.

رویای اکتشاف مریخ توسط SuperEx: ارز دیجیتال، کلید گشایش مبادلات اقتصادی در عصر بین‌ستاره‌ای

SuperEx همواره از صرافی‌ها خواسته است که به جای تمرکز بر نزاع و رقابت‌های داخلی، بر ترویج مشترک توسعه ارزهای دیجیتال تمرکز کنند و به نیروی محرکه‌ای برای عصر بین‌ستاره‌ای آینده تبدیل شوند.

اخبار صبح | مایکل سیلر اعلام کرد که این هفته به جای بیت‌کوین، اوراق قرضه خریده است؛ StablR مورد حمله قرار گرفت و حدود ۲.۸ میلیون دلار از دست داد؛ کنگره آمریکا دوباره لایحه ذخیره بیت‌کوین را پیگیری می‌کند

مروری بر رویدادهای مهم بازار در ۲۴ مه

نکات کلیدی: متن کامل سخنرانی شاناهان، دانشمند ارشد Google

سخنرانی شاناهان، دانشمند ارشد Google DeepMind در لندن: کالبدشکافی ویژگی‌های ذهنی مدل‌های زبانی بزرگ (LLM) با استفاده از چارچوب ویتگنشتاین و تحلیل روند «هویت بیگانه» در بستر عامل‌های همه‌جانبه.

الگوهای طراحی عاملی: کتابی که باعث شد در مورد «عامل (Agent) دقیقاً چیست؟» بازنگری کنم

کتاب جدید مدیر مهندسی گوگل به تحلیل عمیق ۲۱ الگوی طراحی برای عوامل هوش مصنوعی می‌پردازد. این مقاله مسیر اصلی تکامل از «مدل زبانی خام» به عوامل هوشمند پیشرفته را آشکار کرده و جزئیاتی از مهندسی زمینه (Context Engineering)، مکانیسم بازتابی دوگانه عامل (تولیدکننده-منتقد) و مدل حافظه سه‌لایه ارائه می‌دهد...

ثروتمندترین رئیس فدرال رزرو در ۱۱۲ سال اخیر از راه رسید: کوین وارش در حال بازنویسی قوانین است

«ثروتمندترین» رئیس جدید فدرال رزرو، کوین وارش، رسماً کار خود را آغاز کرد. پیشنهاد جایگزین او مبنی بر «کاهش ترازنامه + کاهش نرخ بهره» نه تنها با هدف تغییر ساختار تصمیم‌گیری، بلکه برای ایجاد تحولی عمیق در خزانه‌داری آمریکا، دلار و ...

ویتالیک درباره آینده بنیاد اتریوم صحبت می‌کند: کشتی کوچک‌تر، متمایزتر و در عین حال ماندگارتر

ویتالیک دیدگاه‌های شخصی خود را درباره جهت‌گیری تحول بنیاد اتریوم تشریح کرد: EF «مرکز اتریوم» نیست، بلکه یکی از گره‌های متعدد آن است. با منابع محدود، EF به جای پراکنده‌کاری، «بلندمدت‌نگری» را انتخاب کرده و بر وظایف کلیدی تمرکز می‌کند که «بدون EF انجام نمی‌شدند»—...

انواع جدید پولشویی اطلاعاتی در بازارهای پیش‌بینی: چگونه اسرار در سیگنال‌های سرمایه‌گذاری ادغام می‌شوند

واقعیت تلخ این است که پولشویی اطلاعاتی یک حفره ساخته دست بشر در بازار پیش‌بینی نیست، بلکه یک اثر جانبی از مکانیسم عملیاتی اصلی آن است.

روز پیتزای بیت‌کوین در WEEX: کارمزد صفر، کش‌بک BTC و ۱۵۰,۰۰۰ USDT برای گرامیداشت تاریخ ارزهای دیجیتال

به جشن روز پیتزای WEEX بپیوندید! از کارمزد صفر گرفته تا کش‌بک BTC، اولین تراکنش واقعی بیت‌کوین را گرامی بدارید. استخر جایزه ۱۵۰,۰۰۰ USDT، روش WEEX برای پاداش به کاربران و ارج نهادن به تاریخ ارزهای دیجیتال است.

a16z: ۷ تصویر برای درک اینکه چگونه توکنی‌سازی ماهیت دارایی‌ها را تغییر می‌دهد

این موضوع بسیار فراتر از انتقال صرف دارایی‌های سنتی به بلاک‌چین است.

راز موفقیت Hyperliquid؛ تحلیل لایه به لایه زیرساخت مالی

Hyperliquid یک صرافی غیرمتمرکز (DEX) نیست که صرفاً به طور مداوم قابلیت‌های جدید اضافه کند، بلکه یک سیستم‌عامل مالی است که با ترتیبی دقیق ساخته شده است.

After Futu Securities was banned, will buying stocks on-chain be the new remedy?

If it moves steadily, it may be an important stop for financial assets on the blockchain; if treated as a detour tool, it will become the next risk site.