logo

سه نمودار قابل توجه در کنفرانس GTC انویدیا: محاسبات ارزان‌تر، هزینه‌ی بیشتر

By: بلوک‌بیتس|2026/03/17 13:08:12
0
اشتراک‌گذاری
copy

شب گذشته، هوانگ رن‌شون در GTC 2026 از پلتفرم ورا روبین رونمایی کرد و ادعا نمود که مصرف توان به ازای هر عملکرد استنتاج ۱۰ برابر کمتر از بلک‌ول است، هزینه هر توکن استنتاج به یک‌دهم کاهش یافته و اشاره کرد که نسبت ادغام بین بلک‌ول و ورا روبین تا سال ۲۰۲۷ از ۱ تریلیون دلار فراتر خواهد رفت.

در دو سال گذشته، هزینه استنتاج APIهای سطح GPT-4 با کاهش ۹۴ درصدی از ۳۶ دلار به ازای هر یک میلیون توکن به کمتر از ۲ دلار رسیده است. به طور شهودی، با کاهش هزینه‌های رایانش، کسب‌وکارها باید هزینه‌های کمتری صرف کنند. با این حال، مجموع هزینه‌های سرمایه‌ای چهار ارائه‌دهنده ابری آمازون، آلفابت، متا و مایکروسافت از ۱۵۴ میلیارد دلار به ۴۱۶ میلیارد دلار افزایش یافته است که تقریباً سه برابر شده است.

اشاره تریلیون‌دلاری هوانگ رن‌شون صرفاً یک شعار بازاریابی نیست؛ بلکه پشتوانهٔ آن منحنی‌ای است که می‌توان آن را با داده‌ها ترسیم کرد.

هر نسل، نسل قبل را مضحک جلوه می‌دهد.

قدرت محاسباتی تراکم‌یافته inferencing FP8 پردازنده‌های گرافیکی هوش مصنوعی انویدیا، از H100 سال ۲۰۲۲ تا ورا روبین که قرار است در نیمه دوم ۲۰۲۶ به تولید انبوه برسد، در عرض چهار سال ۸ برابر افزایش یافته است. طبق مشخصات رسمی انویدیا، کارت تکی H100 دارای قدرت ۲.۰ پتافلاپس است، B200 به ۴.۰ پتافلاپس می‌رسد و ورا روبین مستقیماً به ۱۶ پتافلاپس جهش می‌کند.

سه نمودار قابل توجه در کنفرانس GTC انویدیا: محاسبات ارزان‌تر، هزینه‌ی بیشتر

با این حال، هر جهش نسلی از یک نقطه یکسان سرچشمه نمی‌گیرد. طبق گزارش Wccftech، هسته‌های محاسباتی H200 با H100 یکسان هستند و در قدرت محاسبات FP8 تغییری ایجاد نشده است؛ تمام ارتقاءهای آن از پهنای باند حافظه (افزایش از ۳.۳۵ ترابایت بر ثانیه به ۴.۸ ترابایت بر ثانیه) ناشی می‌شود که منجر به افزایش تقریباً ۴۵ درصدی در throughput استنتاج می‌شود.

گذار معماری واقعی بین B200 و ورا روبین رخ داد. ورا روبین از فرآیند ۳ نانومتری TSMC استفاده می‌کند که دارای طراحی دو چیپلِت با ۳۳۶ میلیارد ترانزیستور است و در دقت FP4 به قدرت محاسباتی ۵۰ پیکوفلپس دست می‌یابد. به گفته تامز هاردویر، اولین سیستم ورا روبین هم‌اکنون روی مایکروسافت آژور در حال اجراست.

یک تمایز ظریف وجود دارد که به‌راحتی نادیده گرفته می‌شود. وقتی هوانگ رن‌شون در GTC از «ده برابر» صحبت کرد، منظور او کاهش هزینه توکن به ازای هر استنتاج بود، نه چند برابر شدن قدرت محاسباتی اولیه. هزینه توکن شامل بهینه‌سازی موتور ترانسفورمر، دقت FP4، استنتاج دسته‌ای بزرگ‌تر و سایر عوامل سطح سیستمی است. با نگاهی به TFLOPS فشرده استاندارد FP8، ورا روبین چهار برابر بزرگ‌تر از بلک‌ول و هشت برابر بزرگ‌تر از H100 است.

شیب این منحنی هرگز کاهش نیافته است. هر نسل از پردازنده‌های گرافیکی نسل قبلی را ناکافی جلوه داده است، و این دقیقاً نقطهٔ شروع داستانی است که در ادامه گفته خواهد شد.

پارادوکس جِوونز: هرچه قدرت محاسباتی ارزان‌تر باشد، مصرف آن بیشتر است.

در مارس ۲۰۲۳، زمانی که GPT-4 به تازگی عرضه شده بود، هزینه فراخوانی API حدود ۳۶ دلار برای هر میلیون توکن بود. طبق تاریخچه قیمت‌گذاری رسمی OpenAI، تا اواسط سال ۲۰۲۴ با معرفی GPT-4o، قیمت به حدود ۷ دلار کاهش یافت و تا پایان سال ۲۰۲۵، قیمت واقعی موجود به زیر ۲ دلار سقوط کرد. کاهش بیش از ۹۴٪ در دو سال.

منطقی است که با کاهش چشمگیر هزینه‌های استنتاج، کسب‌وکارها باید هزینه‌های کمتری صرف کنند. با این حال، واقعیت کاملاً برعکس است. بر اساس گزارش‌های مالی شرکت‌های مختلف و داده‌های ردیابی‌شده توسط پلتفورمونومیکس، مجموع هزینه‌های سرمایه‌ای سالانه چهار ارائه‌دهنده ابری آمازون، آلفابت، متا و مایکروسافت از ۱۵۴ میلیارد دلار در سال ۲۰۲۳ به ۴۱۶ میلیارد دلار در سال ۲۰۲۵ افزایش یافت که رشدی ۱۷۰ درصدی را نشان می‌دهد. تنها گوگل از ۳۲ میلیارد دلار به ۹۱.۵ میلیارد دلار (حدود ۲.۹ برابر) جهش کرد، در حالی که افزایش مایکروسافت حتی بیشتر بود.

این پدیده در اقتصاد نامی دارد که به آن «پارادوکس جوونز» گفته می‌شود. در سال ۱۸۶۵، اقتصاددان بریتانیایی ویلیام جِوونز دریافت که بهبودهای وات در موتور بخار بهره‌وری مصرف زغال‌سنگ را به‌طور قابل‌توجهی افزایش داد، اما مصرف زغال‌سنگ در بریتانیا کاهش نیافت؛ بلکه افزایش یافت. دلیل ساده است: بهبود بهره‌وری، موتور بخار را مقرون‌به‌صرفه‌تر کرد، بنابراین صنایع بیشتری شروع به استفاده از موتورهای بخار کردند و تقاضای کل بسیار فراتر از آن بخشی که از طریق بهره‌وری صرفه‌جویی شده بود، افزایش یافت.

امروز وضعیت استنتاج هوش مصنوعی دقیقاً به همین شکل است. با سقوط قیمت‌های API به ۶٪ از ارزش اولیه، شرکت‌ها صرفه‌جویی در بودجه نکردند، اما شروع به به‌کارگیری هوش مصنوعی در سناریوهایی کردند که پیش‌تر اقتصادی نبودند. هر سناریوی جدید مانند خدمات مشتری، بازبینی کد، تولید محتوا، مرتب‌سازی مجدد جستجو و مزایده تبلیغات، قدرت استنتاج بیشتری مصرف می‌کند. افزایش تقاضا به‌مراتب از نرخ کاهش هزینه‌ها فراتر است. در اوایل سال ۲۰۲۵، دیپ‌سیک R1 قیمت ورودی را به ۰.۵۵ دلار برای هر میلیون توکن افزایش داد و این چرخه را بیش از پیش تسریع کرد. دو خطی که در نمودار در جهت‌های مخالف حرکت می‌کنند، دو روی یک سکه را نشان می‌دهند.

سه سال، افزایش یازده‌برابری، و هیچ نشانه‌ای از سقف

اگر پارادوکس جِوونز بیشترین بهره‌مند مستقیم را داشته باشد، آن کسی است که بیل می‌فروشد.

طبق گزارش مالی انویدیا، درآمد سالانه کسب‌وکار مراکز داده از ۱۰.۶ میلیارد دلار در سال مالی ۲۰۲۲ (پایان ژانویه ۲۰۲۲) به ۱۱۵.۲ میلیارد دلار در سال مالی ۲۰۲۵ (پایان ژانویه ۲۰۲۵) افزایش یافت که رشدی ۱۰.۹ برابری را در طول سه سال مالی نشان می‌دهد. این منحنی رشد تقریباً در تاریخ فناوری بی‌سابقه است. برای مقایسه، پس از عرضه آیفون در سال ۲۰۰۷، اپل حدود شش سال طول کشید تا به افزایش مشابهی در مقیاس درآمد دست یابد.

سپس، جنسن هوانگ در GTC 2026 گفت: «تا سال ۲۰۲۷، سفارش‌های قابل رؤیتی که می‌بینم حداقل یک تریلیون دلار است.» در واقع، ظرفیت ما کافی نخواهد بود. من مطمئن هستم که تقاضای محاسباتی بسیار فراتر از این عدد خواهد بود.

پیش‌بینی او سال گذشته در GTC حدود ۵۰۰ میلیارد دلار سفارش‌های قابل مشاهده تا سال ۲۰۲۶ بود. یک سال بعد، تعداد دو برابر شد، در حالی که بازه زمانی تنها یک سال افزایش یافت. پیش‌بینی درآمد تحلیلگران برای سال‌های مالی ۲۰۲۶-۲۰۲۷ به ترتیب بین ۱۶۰ تا ۲۲۰ میلیارد دلار و بین ۲۵۰ تا ۴۰۰ میلیارد دلار است. با این حال، خود هوانگ اظهار داشت که این عدد یک سقف نیست و «تقاضای محاسباتی بسیار فراتر از این عدد خواهد بود.» در روزی که GTC به پایان رسید، قیمت سهام انویدیا ۴.۳٪ افزایش یافت. بازار آشکارا تصمیم گرفت به او باور بیاورد.

هر نسل از پردازنده‌های گرافیکی نسل قبلی را مضحک جلوه می‌دهد و هر دور کاهش قیمت، دور بعدی هزینه‌های سرمایه‌ای را طبیعی جلوه می‌دهد. انویدیا در حال حاضر در شیرین‌ترین نقطه این پارادوکس قرار دارد.

قیمت --

--

ممکن است شما نیز علاقه‌مند باشید

هایپر بیت، برای راه اندازی یک "بانک" در هایپر مایع

زنجیره‌ای که برای تراکنش‌ها ساخته شده، اکنون می‌خواهد شما حقوق خود را در آن ذخیره کنید.

تحقیقات کلان بازار ارزهای دیجیتال: آتش‌بس ایران و آمریکا، زمان ارزیابی مجدد دارایی‌های ریسک

آتش‌بس ایران و آمریکا چگونه بر دارایی‌های ریسک تأثیر می‌گذارد؟

تحقیقات ببر: تحلیل جامعی از سودآورترین کسب‌وکارها و مدل‌های کسب‌وکار آنها در حوزه کریپتو

هزینه‌های پرداخت، زیرساخت‌های مشترک و تقاضای فراساحلی به میدان‌های نبرد جدیدی تبدیل شده‌اند.

ارزش استیبل کوین‌ها در سال ۲۰۲۶ به ۳۱۵ میلیارد دلار رسید: چرا این بزرگترین روند در حال حاضر در کریپتو است؟

بیت کوین ممکن است در حال تشکیل کف قیمتی خود در سال ۲۰۲۶، نزدیک به ۶۵ هزار دلار باشد. ببینید چگونه شوک‌های تعرفه‌ای، ورود ETFها و سیگنال‌های ژئوپلیتیکی می‌توانند جهش بعدی بیت‌کوین به سمت ۷۵ هزار دلار را شکل دهند.

آیا بیت‌کوین در حال شکل‌گیری کف خود در سال 2026 است؟ چگونه شوک تعرفه و آتش‌بس می‌تواند BTC را به سمت 75 هزار دلار سوق دهد

بیت‌کوین ممکن است در حال شکل‌گیری کف خود در سال 2026 نزدیک به 65 هزار دلار باشد. ببینید چگونه شوک‌های تعرفه، ورود ETF و آتش‌بس ایران می‌تواند شکل‌دهنده‌ی شکست بعدی BTC به سمت 75 هزار دلار باشد.

چرا آتش‌بس بین ایالات متحده و ایران به طور حتمی ناپایدار است؟

تحلیل عمیق: چرا آتش‌بس ایالات متحده و ایران به عنوان "صوری" مورد انتقاد قرار می‌گیرد؟ وقتی هر دو طرف به قرار دادن قدرت خود بالاتر از توافق‌ها عادت کرده‌اند، این صلح کوتاه‌مدت که فاقد اعتماد است، به جز ویرانی چیزی نخواهد بود.

رمزارزهای محبوب

آخرین اخبار رمز ارز

ادامه مطلب