سه نمودار قابل توجه در کنفرانس GTC انویدیا: محاسبات ارزانتر، هزینهی بیشتر
شب گذشته، هوانگ رنشون در GTC 2026 از پلتفرم ورا روبین رونمایی کرد و ادعا نمود که مصرف توان به ازای هر عملکرد استنتاج ۱۰ برابر کمتر از بلکول است، هزینه هر توکن استنتاج به یکدهم کاهش یافته و اشاره کرد که نسبت ادغام بین بلکول و ورا روبین تا سال ۲۰۲۷ از ۱ تریلیون دلار فراتر خواهد رفت.
در دو سال گذشته، هزینه استنتاج APIهای سطح GPT-4 با کاهش ۹۴ درصدی از ۳۶ دلار به ازای هر یک میلیون توکن به کمتر از ۲ دلار رسیده است. به طور شهودی، با کاهش هزینههای رایانش، کسبوکارها باید هزینههای کمتری صرف کنند. با این حال، مجموع هزینههای سرمایهای چهار ارائهدهنده ابری آمازون، آلفابت، متا و مایکروسافت از ۱۵۴ میلیارد دلار به ۴۱۶ میلیارد دلار افزایش یافته است که تقریباً سه برابر شده است.
اشاره تریلیوندلاری هوانگ رنشون صرفاً یک شعار بازاریابی نیست؛ بلکه پشتوانهٔ آن منحنیای است که میتوان آن را با دادهها ترسیم کرد.
هر نسل، نسل قبل را مضحک جلوه میدهد.
قدرت محاسباتی تراکمیافته inferencing FP8 پردازندههای گرافیکی هوش مصنوعی انویدیا، از H100 سال ۲۰۲۲ تا ورا روبین که قرار است در نیمه دوم ۲۰۲۶ به تولید انبوه برسد، در عرض چهار سال ۸ برابر افزایش یافته است. طبق مشخصات رسمی انویدیا، کارت تکی H100 دارای قدرت ۲.۰ پتافلاپس است، B200 به ۴.۰ پتافلاپس میرسد و ورا روبین مستقیماً به ۱۶ پتافلاپس جهش میکند.

با این حال، هر جهش نسلی از یک نقطه یکسان سرچشمه نمیگیرد. طبق گزارش Wccftech، هستههای محاسباتی H200 با H100 یکسان هستند و در قدرت محاسبات FP8 تغییری ایجاد نشده است؛ تمام ارتقاءهای آن از پهنای باند حافظه (افزایش از ۳.۳۵ ترابایت بر ثانیه به ۴.۸ ترابایت بر ثانیه) ناشی میشود که منجر به افزایش تقریباً ۴۵ درصدی در throughput استنتاج میشود.
گذار معماری واقعی بین B200 و ورا روبین رخ داد. ورا روبین از فرآیند ۳ نانومتری TSMC استفاده میکند که دارای طراحی دو چیپلِت با ۳۳۶ میلیارد ترانزیستور است و در دقت FP4 به قدرت محاسباتی ۵۰ پیکوفلپس دست مییابد. به گفته تامز هاردویر، اولین سیستم ورا روبین هماکنون روی مایکروسافت آژور در حال اجراست.
یک تمایز ظریف وجود دارد که بهراحتی نادیده گرفته میشود. وقتی هوانگ رنشون در GTC از «ده برابر» صحبت کرد، منظور او کاهش هزینه توکن به ازای هر استنتاج بود، نه چند برابر شدن قدرت محاسباتی اولیه. هزینه توکن شامل بهینهسازی موتور ترانسفورمر، دقت FP4، استنتاج دستهای بزرگتر و سایر عوامل سطح سیستمی است. با نگاهی به TFLOPS فشرده استاندارد FP8، ورا روبین چهار برابر بزرگتر از بلکول و هشت برابر بزرگتر از H100 است.
شیب این منحنی هرگز کاهش نیافته است. هر نسل از پردازندههای گرافیکی نسل قبلی را ناکافی جلوه داده است، و این دقیقاً نقطهٔ شروع داستانی است که در ادامه گفته خواهد شد.
پارادوکس جِوونز: هرچه قدرت محاسباتی ارزانتر باشد، مصرف آن بیشتر است.
در مارس ۲۰۲۳، زمانی که GPT-4 به تازگی عرضه شده بود، هزینه فراخوانی API حدود ۳۶ دلار برای هر میلیون توکن بود. طبق تاریخچه قیمتگذاری رسمی OpenAI، تا اواسط سال ۲۰۲۴ با معرفی GPT-4o، قیمت به حدود ۷ دلار کاهش یافت و تا پایان سال ۲۰۲۵، قیمت واقعی موجود به زیر ۲ دلار سقوط کرد. کاهش بیش از ۹۴٪ در دو سال.
منطقی است که با کاهش چشمگیر هزینههای استنتاج، کسبوکارها باید هزینههای کمتری صرف کنند. با این حال، واقعیت کاملاً برعکس است. بر اساس گزارشهای مالی شرکتهای مختلف و دادههای ردیابیشده توسط پلتفورمونومیکس، مجموع هزینههای سرمایهای سالانه چهار ارائهدهنده ابری آمازون، آلفابت، متا و مایکروسافت از ۱۵۴ میلیارد دلار در سال ۲۰۲۳ به ۴۱۶ میلیارد دلار در سال ۲۰۲۵ افزایش یافت که رشدی ۱۷۰ درصدی را نشان میدهد. تنها گوگل از ۳۲ میلیارد دلار به ۹۱.۵ میلیارد دلار (حدود ۲.۹ برابر) جهش کرد، در حالی که افزایش مایکروسافت حتی بیشتر بود.

این پدیده در اقتصاد نامی دارد که به آن «پارادوکس جوونز» گفته میشود. در سال ۱۸۶۵، اقتصاددان بریتانیایی ویلیام جِوونز دریافت که بهبودهای وات در موتور بخار بهرهوری مصرف زغالسنگ را بهطور قابلتوجهی افزایش داد، اما مصرف زغالسنگ در بریتانیا کاهش نیافت؛ بلکه افزایش یافت. دلیل ساده است: بهبود بهرهوری، موتور بخار را مقرونبهصرفهتر کرد، بنابراین صنایع بیشتری شروع به استفاده از موتورهای بخار کردند و تقاضای کل بسیار فراتر از آن بخشی که از طریق بهرهوری صرفهجویی شده بود، افزایش یافت.
امروز وضعیت استنتاج هوش مصنوعی دقیقاً به همین شکل است. با سقوط قیمتهای API به ۶٪ از ارزش اولیه، شرکتها صرفهجویی در بودجه نکردند، اما شروع به بهکارگیری هوش مصنوعی در سناریوهایی کردند که پیشتر اقتصادی نبودند. هر سناریوی جدید مانند خدمات مشتری، بازبینی کد، تولید محتوا، مرتبسازی مجدد جستجو و مزایده تبلیغات، قدرت استنتاج بیشتری مصرف میکند. افزایش تقاضا بهمراتب از نرخ کاهش هزینهها فراتر است. در اوایل سال ۲۰۲۵، دیپسیک R1 قیمت ورودی را به ۰.۵۵ دلار برای هر میلیون توکن افزایش داد و این چرخه را بیش از پیش تسریع کرد. دو خطی که در نمودار در جهتهای مخالف حرکت میکنند، دو روی یک سکه را نشان میدهند.
سه سال، افزایش یازدهبرابری، و هیچ نشانهای از سقف
اگر پارادوکس جِوونز بیشترین بهرهمند مستقیم را داشته باشد، آن کسی است که بیل میفروشد.
طبق گزارش مالی انویدیا، درآمد سالانه کسبوکار مراکز داده از ۱۰.۶ میلیارد دلار در سال مالی ۲۰۲۲ (پایان ژانویه ۲۰۲۲) به ۱۱۵.۲ میلیارد دلار در سال مالی ۲۰۲۵ (پایان ژانویه ۲۰۲۵) افزایش یافت که رشدی ۱۰.۹ برابری را در طول سه سال مالی نشان میدهد. این منحنی رشد تقریباً در تاریخ فناوری بیسابقه است. برای مقایسه، پس از عرضه آیفون در سال ۲۰۰۷، اپل حدود شش سال طول کشید تا به افزایش مشابهی در مقیاس درآمد دست یابد.

سپس، جنسن هوانگ در GTC 2026 گفت: «تا سال ۲۰۲۷، سفارشهای قابل رؤیتی که میبینم حداقل یک تریلیون دلار است.» در واقع، ظرفیت ما کافی نخواهد بود. من مطمئن هستم که تقاضای محاسباتی بسیار فراتر از این عدد خواهد بود.
پیشبینی او سال گذشته در GTC حدود ۵۰۰ میلیارد دلار سفارشهای قابل مشاهده تا سال ۲۰۲۶ بود. یک سال بعد، تعداد دو برابر شد، در حالی که بازه زمانی تنها یک سال افزایش یافت. پیشبینی درآمد تحلیلگران برای سالهای مالی ۲۰۲۶-۲۰۲۷ به ترتیب بین ۱۶۰ تا ۲۲۰ میلیارد دلار و بین ۲۵۰ تا ۴۰۰ میلیارد دلار است. با این حال، خود هوانگ اظهار داشت که این عدد یک سقف نیست و «تقاضای محاسباتی بسیار فراتر از این عدد خواهد بود.» در روزی که GTC به پایان رسید، قیمت سهام انویدیا ۴.۳٪ افزایش یافت. بازار آشکارا تصمیم گرفت به او باور بیاورد.
هر نسل از پردازندههای گرافیکی نسل قبلی را مضحک جلوه میدهد و هر دور کاهش قیمت، دور بعدی هزینههای سرمایهای را طبیعی جلوه میدهد. انویدیا در حال حاضر در شیرینترین نقطه این پارادوکس قرار دارد.
ممکن است شما نیز علاقهمند باشید

Morning Report | Coinbase Ventures makes its first investment in ENA; SpaceX plans to set the IPO price at $135 per share

متن کامل و تحلیل سخنرانی مدیرعامل SanDisk در چهل و دومین کنفرانس سالانه تصمیمگیری استراتژیک برنشتاین

پیشبینی قیمت بیتکوین در سال ۲۰۳۰: پیشبینی ۷۱۰ هزار دلاری Ark Invest

قیمت لحظهای SOL: قیمت زنده، نمودارها و دادههای بازار Solana

ETF بیتکوین چیست: بررسی تفاوتهای اسپات و فیوچرز

Why Is Bitcoin Dropping 15% While Nasdaq Hits Record Highs?

والاستریت ژورنال: Hyperliquid در حال تبدیل شدن به «فروشگاه رفاه» ارزهای دیجیتال در والاستریت است

سهام توکنیزه شده ایالات متحده «قاتل نقدینگی» بازار کریپتو نیستند
TradFi چیست و چرا در سال ۲۰۲۶ همه درباره آن صحبت میکنند؟

گزارش صبحگاهی | Strategy هفته گذشته ۳۲ BTC و بیش از ۸۰۰ هزار سهم MSTR فروخت؛ Binance رسماً پورتال معاملاتی سهام ایالات متحده خود را معرفی کرد؛ Polymarket به همکاری انحصاری با OneFootball دست یافت

ژو هانگ: ارزش واقعی SpaceX چقدر است؟

بوتکمپ معاملاتی WEEXPERIENCE در لهستان: چگونه WEEX و FireCrew معاملهگری ارزهای دیجیتال را برای همه در دسترس قرار میدهند

سلطنت پاریس: چگونه PSG رویای آرسنال را در فینال تاریخی و هیجانانگیز لیگ قهرمانان اروپا در هم کوبید

TaiJi با جذب سرمایه از Castrum Capital، Becker Ventures و Coinvestor Ventures، موفق به تکمیل دور تأمین مالی استراتژیک ۳.۵ میلیون دلاری شد

بیتکوین در محدوده ۷۳ هزار دلار گیر کرده است؟ معاملهگران چگونه در بازار خنثی ماه ژوئن به سود میرسند

ETF بیتکوین چیست؟ راهنمای ساده برای سال ۲۰۲۶

راهنمای گامبهگام استیک کردن Solana در سال ۲۰۲۶

