سه نمودار قابل توجه در کنفرانس GTC انویدیا: محاسبات ارزانتر، هزینهی بیشتر
شب گذشته، هوانگ رنشون در GTC 2026 از پلتفرم ورا روبین رونمایی کرد و ادعا نمود که مصرف توان به ازای هر عملکرد استنتاج ۱۰ برابر کمتر از بلکول است، هزینه هر توکن استنتاج به یکدهم کاهش یافته و اشاره کرد که نسبت ادغام بین بلکول و ورا روبین تا سال ۲۰۲۷ از ۱ تریلیون دلار فراتر خواهد رفت.
در دو سال گذشته، هزینه استنتاج APIهای سطح GPT-4 با کاهش ۹۴ درصدی از ۳۶ دلار به ازای هر یک میلیون توکن به کمتر از ۲ دلار رسیده است. به طور شهودی، با کاهش هزینههای رایانش، کسبوکارها باید هزینههای کمتری صرف کنند. با این حال، مجموع هزینههای سرمایهای چهار ارائهدهنده ابری آمازون، آلفابت، متا و مایکروسافت از ۱۵۴ میلیارد دلار به ۴۱۶ میلیارد دلار افزایش یافته است که تقریباً سه برابر شده است.
اشاره تریلیوندلاری هوانگ رنشون صرفاً یک شعار بازاریابی نیست؛ بلکه پشتوانهٔ آن منحنیای است که میتوان آن را با دادهها ترسیم کرد.
هر نسل، نسل قبل را مضحک جلوه میدهد.
قدرت محاسباتی تراکمیافته inferencing FP8 پردازندههای گرافیکی هوش مصنوعی انویدیا، از H100 سال ۲۰۲۲ تا ورا روبین که قرار است در نیمه دوم ۲۰۲۶ به تولید انبوه برسد، در عرض چهار سال ۸ برابر افزایش یافته است. طبق مشخصات رسمی انویدیا، کارت تکی H100 دارای قدرت ۲.۰ پتافلاپس است، B200 به ۴.۰ پتافلاپس میرسد و ورا روبین مستقیماً به ۱۶ پتافلاپس جهش میکند.

با این حال، هر جهش نسلی از یک نقطه یکسان سرچشمه نمیگیرد. طبق گزارش Wccftech، هستههای محاسباتی H200 با H100 یکسان هستند و در قدرت محاسبات FP8 تغییری ایجاد نشده است؛ تمام ارتقاءهای آن از پهنای باند حافظه (افزایش از ۳.۳۵ ترابایت بر ثانیه به ۴.۸ ترابایت بر ثانیه) ناشی میشود که منجر به افزایش تقریباً ۴۵ درصدی در throughput استنتاج میشود.
گذار معماری واقعی بین B200 و ورا روبین رخ داد. ورا روبین از فرآیند ۳ نانومتری TSMC استفاده میکند که دارای طراحی دو چیپلِت با ۳۳۶ میلیارد ترانزیستور است و در دقت FP4 به قدرت محاسباتی ۵۰ پیکوفلپس دست مییابد. به گفته تامز هاردویر، اولین سیستم ورا روبین هماکنون روی مایکروسافت آژور در حال اجراست.
یک تمایز ظریف وجود دارد که بهراحتی نادیده گرفته میشود. وقتی هوانگ رنشون در GTC از «ده برابر» صحبت کرد، منظور او کاهش هزینه توکن به ازای هر استنتاج بود، نه چند برابر شدن قدرت محاسباتی اولیه. هزینه توکن شامل بهینهسازی موتور ترانسفورمر، دقت FP4، استنتاج دستهای بزرگتر و سایر عوامل سطح سیستمی است. با نگاهی به TFLOPS فشرده استاندارد FP8، ورا روبین چهار برابر بزرگتر از بلکول و هشت برابر بزرگتر از H100 است.
شیب این منحنی هرگز کاهش نیافته است. هر نسل از پردازندههای گرافیکی نسل قبلی را ناکافی جلوه داده است، و این دقیقاً نقطهٔ شروع داستانی است که در ادامه گفته خواهد شد.
پارادوکس جِوونز: هرچه قدرت محاسباتی ارزانتر باشد، مصرف آن بیشتر است.
در مارس ۲۰۲۳، زمانی که GPT-4 به تازگی عرضه شده بود، هزینه فراخوانی API حدود ۳۶ دلار برای هر میلیون توکن بود. طبق تاریخچه قیمتگذاری رسمی OpenAI، تا اواسط سال ۲۰۲۴ با معرفی GPT-4o، قیمت به حدود ۷ دلار کاهش یافت و تا پایان سال ۲۰۲۵، قیمت واقعی موجود به زیر ۲ دلار سقوط کرد. کاهش بیش از ۹۴٪ در دو سال.
منطقی است که با کاهش چشمگیر هزینههای استنتاج، کسبوکارها باید هزینههای کمتری صرف کنند. با این حال، واقعیت کاملاً برعکس است. بر اساس گزارشهای مالی شرکتهای مختلف و دادههای ردیابیشده توسط پلتفورمونومیکس، مجموع هزینههای سرمایهای سالانه چهار ارائهدهنده ابری آمازون، آلفابت، متا و مایکروسافت از ۱۵۴ میلیارد دلار در سال ۲۰۲۳ به ۴۱۶ میلیارد دلار در سال ۲۰۲۵ افزایش یافت که رشدی ۱۷۰ درصدی را نشان میدهد. تنها گوگل از ۳۲ میلیارد دلار به ۹۱.۵ میلیارد دلار (حدود ۲.۹ برابر) جهش کرد، در حالی که افزایش مایکروسافت حتی بیشتر بود.

این پدیده در اقتصاد نامی دارد که به آن «پارادوکس جوونز» گفته میشود. در سال ۱۸۶۵، اقتصاددان بریتانیایی ویلیام جِوونز دریافت که بهبودهای وات در موتور بخار بهرهوری مصرف زغالسنگ را بهطور قابلتوجهی افزایش داد، اما مصرف زغالسنگ در بریتانیا کاهش نیافت؛ بلکه افزایش یافت. دلیل ساده است: بهبود بهرهوری، موتور بخار را مقرونبهصرفهتر کرد، بنابراین صنایع بیشتری شروع به استفاده از موتورهای بخار کردند و تقاضای کل بسیار فراتر از آن بخشی که از طریق بهرهوری صرفهجویی شده بود، افزایش یافت.
امروز وضعیت استنتاج هوش مصنوعی دقیقاً به همین شکل است. با سقوط قیمتهای API به ۶٪ از ارزش اولیه، شرکتها صرفهجویی در بودجه نکردند، اما شروع به بهکارگیری هوش مصنوعی در سناریوهایی کردند که پیشتر اقتصادی نبودند. هر سناریوی جدید مانند خدمات مشتری، بازبینی کد، تولید محتوا، مرتبسازی مجدد جستجو و مزایده تبلیغات، قدرت استنتاج بیشتری مصرف میکند. افزایش تقاضا بهمراتب از نرخ کاهش هزینهها فراتر است. در اوایل سال ۲۰۲۵، دیپسیک R1 قیمت ورودی را به ۰.۵۵ دلار برای هر میلیون توکن افزایش داد و این چرخه را بیش از پیش تسریع کرد. دو خطی که در نمودار در جهتهای مخالف حرکت میکنند، دو روی یک سکه را نشان میدهند.
سه سال، افزایش یازدهبرابری، و هیچ نشانهای از سقف
اگر پارادوکس جِوونز بیشترین بهرهمند مستقیم را داشته باشد، آن کسی است که بیل میفروشد.
طبق گزارش مالی انویدیا، درآمد سالانه کسبوکار مراکز داده از ۱۰.۶ میلیارد دلار در سال مالی ۲۰۲۲ (پایان ژانویه ۲۰۲۲) به ۱۱۵.۲ میلیارد دلار در سال مالی ۲۰۲۵ (پایان ژانویه ۲۰۲۵) افزایش یافت که رشدی ۱۰.۹ برابری را در طول سه سال مالی نشان میدهد. این منحنی رشد تقریباً در تاریخ فناوری بیسابقه است. برای مقایسه، پس از عرضه آیفون در سال ۲۰۰۷، اپل حدود شش سال طول کشید تا به افزایش مشابهی در مقیاس درآمد دست یابد.

سپس، جنسن هوانگ در GTC 2026 گفت: «تا سال ۲۰۲۷، سفارشهای قابل رؤیتی که میبینم حداقل یک تریلیون دلار است.» در واقع، ظرفیت ما کافی نخواهد بود. من مطمئن هستم که تقاضای محاسباتی بسیار فراتر از این عدد خواهد بود.
پیشبینی او سال گذشته در GTC حدود ۵۰۰ میلیارد دلار سفارشهای قابل مشاهده تا سال ۲۰۲۶ بود. یک سال بعد، تعداد دو برابر شد، در حالی که بازه زمانی تنها یک سال افزایش یافت. پیشبینی درآمد تحلیلگران برای سالهای مالی ۲۰۲۶-۲۰۲۷ به ترتیب بین ۱۶۰ تا ۲۲۰ میلیارد دلار و بین ۲۵۰ تا ۴۰۰ میلیارد دلار است. با این حال، خود هوانگ اظهار داشت که این عدد یک سقف نیست و «تقاضای محاسباتی بسیار فراتر از این عدد خواهد بود.» در روزی که GTC به پایان رسید، قیمت سهام انویدیا ۴.۳٪ افزایش یافت. بازار آشکارا تصمیم گرفت به او باور بیاورد.
هر نسل از پردازندههای گرافیکی نسل قبلی را مضحک جلوه میدهد و هر دور کاهش قیمت، دور بعدی هزینههای سرمایهای را طبیعی جلوه میدهد. انویدیا در حال حاضر در شیرینترین نقطه این پارادوکس قرار دارد.
ممکن است شما نیز علاقهمند باشید

هایپر بیت، برای راه اندازی یک "بانک" در هایپر مایع

تحقیقات کلان بازار ارزهای دیجیتال: آتشبس ایران و آمریکا، زمان ارزیابی مجدد داراییهای ریسک

تحقیقات ببر: تحلیل جامعی از سودآورترین کسبوکارها و مدلهای کسبوکار آنها در حوزه کریپتو

ارزش استیبل کوینها در سال ۲۰۲۶ به ۳۱۵ میلیارد دلار رسید: چرا این بزرگترین روند در حال حاضر در کریپتو است؟
بیت کوین ممکن است در حال تشکیل کف قیمتی خود در سال ۲۰۲۶، نزدیک به ۶۵ هزار دلار باشد. ببینید چگونه شوکهای تعرفهای، ورود ETFها و سیگنالهای ژئوپلیتیکی میتوانند جهش بعدی بیتکوین به سمت ۷۵ هزار دلار را شکل دهند.

آیا بیتکوین در حال شکلگیری کف خود در سال 2026 است؟ چگونه شوک تعرفه و آتشبس میتواند BTC را به سمت 75 هزار دلار سوق دهد
بیتکوین ممکن است در حال شکلگیری کف خود در سال 2026 نزدیک به 65 هزار دلار باشد. ببینید چگونه شوکهای تعرفه، ورود ETF و آتشبس ایران میتواند شکلدهندهی شکست بعدی BTC به سمت 75 هزار دلار باشد.

چرا آتشبس بین ایالات متحده و ایران به طور حتمی ناپایدار است؟

چرا آتشبس آمریکا و ایران محکوم به شکست است؟

سفر ۳۰ روزه هوش مصنوعی یک صاحب باشگاه سنگنوردی

از دنیای ارزهای دیجیتال که شروع کنیم، چه چیزی Hermes Agent را به بزرگترین رقیب OpenClaw تبدیل میکند؟

آیا بازیکن خاورمیانهایِ کمتر شناختهشده، ستاره بازار پیشبینی جام جهانی ۲۰۲۶ خواهد بود؟

تبدیل هوش مصنوعی به یک سیستم اجرایی فردی، جدیدترین راهنمای بهترین شیوههای عاملهای مدیریتشده کلود

انتشار امروز | فهرست کامل دموهای مهمان در «سوپر کریتور لایو»

کریپتو او جی، چرا عامل هرمس به عنوان بزرگترین رقیب اوپن کلاو ظاهر شده است؟

تاریخچه کارآفرینی هشتساله کالشی: یک بوکسور در کت و شلوار روی صحنه قدم میگذارد.

شرط 950 میلیون دلاری دولت ترامپ بر روی کاهش قیمت نفت قبل از آتشبس، بازار نفت خام را به بهشت معاملات داخلی تبدیل کرد

چرا ترامپ ایالات متحده را به جنگ با ایران کشاند؟

از تهدید تا آتشبس: چگونه ایالات متحده سلطه خود را از دست بدهد؟

اخبار صبح | یی لیهوا صندوق هوش مصنوعی OpenX Labs را تأسیس کرد؛ شبکه فاروس تأمین مالی سری A به مبلغ ۴۴ میلیون دلار را کامل کرد؛ ایران خواستار پرداخت بیتکوین به عنوان عوارض توسط نفتکشهای هرمز است
هایپر بیت، برای راه اندازی یک "بانک" در هایپر مایع
تحقیقات کلان بازار ارزهای دیجیتال: آتشبس ایران و آمریکا، زمان ارزیابی مجدد داراییهای ریسک
تحقیقات ببر: تحلیل جامعی از سودآورترین کسبوکارها و مدلهای کسبوکار آنها در حوزه کریپتو
ارزش استیبل کوینها در سال ۲۰۲۶ به ۳۱۵ میلیارد دلار رسید: چرا این بزرگترین روند در حال حاضر در کریپتو است؟
بیت کوین ممکن است در حال تشکیل کف قیمتی خود در سال ۲۰۲۶، نزدیک به ۶۵ هزار دلار باشد. ببینید چگونه شوکهای تعرفهای، ورود ETFها و سیگنالهای ژئوپلیتیکی میتوانند جهش بعدی بیتکوین به سمت ۷۵ هزار دلار را شکل دهند.
آیا بیتکوین در حال شکلگیری کف خود در سال 2026 است؟ چگونه شوک تعرفه و آتشبس میتواند BTC را به سمت 75 هزار دلار سوق دهد
بیتکوین ممکن است در حال شکلگیری کف خود در سال 2026 نزدیک به 65 هزار دلار باشد. ببینید چگونه شوکهای تعرفه، ورود ETF و آتشبس ایران میتواند شکلدهندهی شکست بعدی BTC به سمت 75 هزار دلار باشد.
