شیائومی و مینی‌مکس هر دو اقدامات نهایی خود را آغاز کردند و این نشان از آغاز جنگ قیمت‌گذاری عامل (Agent Priceing War) دارد.

By: بلاک بیتس|2026/03/20 13:25:43
0
اشتراک‌گذاری
copy

در ۱۸ و ۱۹ مارس، دو شرکت چینی به ترتیب مدل‌های بزرگ خود را که بر اساس پلتفرم Agent طراحی شده بودند، منتشر کردند. استارتاپ هوش مصنوعی داخلی MiniMax، مدل M2.7 را عرضه کرد و تیم بزرگ مدل‌سازی شیائومی، MiMo، مدل V2-Pro را معرفی کرد. هر دو مدل در بنچمارک Agent وارد رده برتر جهانی شدند، اما قیمت خروجی API آنها به ترتیب ۱/۲۱ و ۱/۸ Claude Opus 4.6 است.

هر دو شرکت در یک هفته، اما با دست‌های کاملاً متفاوت، کارت‌های خود را بازی کردند. آنها دو مسیر فنی کاملاً متفاوت را نشان می‌دهند و روی دو آینده از دوران Agent شرط می‌بندند.

همان امتحان، شهریه ۱/۱۷

اول، بیایید به شهودی‌ترین مقایسه نگاهی بیندازیم.

شیائومی و مینی‌مکس هر دو اقدامات نهایی خود را آغاز کردند و این نشان از آغاز جنگ قیمت‌گذاری عامل (Agent Priceing War) دارد.

طبق اطلاعات OpenRouter و صفحات قیمت‌گذاری رسمی مختلف این شرکت، بر اساس قیمت خروجی API (به ازای هر میلیون توکن)، MiniMax M2.7 1.2 دلار و MiMo-V2-Pro 3 دلار قیمت دارند. به عنوان مرجع، قیمت خروجی Claude Opus 4.6، 25 دلار، GPT-5.2، 14 دلار و Claude Sonnet 4.6، 15 دلار است.

اختلاف قیمت خیلی زیاده، اما اختلاف عملکرد نه. در SWE-bench Verified (معیار اصلی فعلی برای اندازه‌گیری توانایی مهندسی کد)، MiMo-V2-Pro امتیاز 78 درصد و Sonnet 4.6 امتیاز 79.6 درصد را کسب کرد که اختلافی کمتر از دو درصد است. امتیاز SWE-Pro مربوط به M2.7، 56.22 درصد است که با GPT-5.3-Codex برابری می‌کند. در VIBE-Pro (قابلیت تحویل پروژه از ابتدا تا انتها)، M2.7 امتیاز 55.6٪ را کسب کرد که به سطح Opus 4.6 نزدیک می‌شود.

تمرکز این نمودار بر روی این نیست که چه کسی بالاتر یا پایین‌تر است - سیستم‌های معیار شرکت‌های مختلف کاملاً همسو نیستند، بنابراین مقایسه‌های مستقیم باید با احتیاط انجام شود. تمرکز بر روی «تفاوت قیمت-عملکرد» است: مدل‌های داخلی Agent در یک محدوده عملکرد قرار گرفته‌اند، اما در محدوده‌های قیمتی کاملاً متفاوتی هستند.

تریلیون پارامتر در مقابل خود-تکاملی

قیمت فقط ظاهر قضیه است. این دو شرکت دو مجموعه کاملاً متفاوت از برگ برنده‌ها را ارائه داده‌اند.

MiMo-V2-Pro از مسیر «یا کار بزرگی انجام بده یا به خانه برگرد» پیروی می‌کند. طبق اعلام رسمی شیائومی، V2-Pro در مجموع بیش از ۱ تریلیون پارامتر، ۴۲ میلیارد پارامتر فعال‌سازی دارد و از یک بافت فوق طولانی شامل ۱ میلیون توکن پشتیبانی می‌کند. نوآوری اصلی آن، مکانیزم توجه ترکیبی (Hybrid Attention) است که نسبت توجه پنجره کشویی (SWA) به توجه کلی (GA) را به 7:1 تنظیم می‌کند - نسبت V2-Flash قبلی آن 5:1 بود. این معماری، مدل را در سناریوهایی که اسناد طولانی پردازش می‌شوند و چندین ابزار به طور موازی در صحنه‌ی عامل فراخوانی می‌شوند، پایدارتر می‌کند. در PinchBench (ارزیابی قابلیت فراخوانی ابزار عامل)، MiMo-V2-Pro امتیاز ۸۴٪ را کسب کرد.

M2.7 مسیر کاملاً متفاوتی را در پیش گرفت. طبق پست رسمی وبلاگ فناوری MiniMax در ۱۸ مارس، تعداد پارامترهای M2.7 فاش نشده است، اما یک مکانیسم «تکامل خود-تکرارشونده» را نشان می‌دهد: این مدل به طور خودکار بیش از ۱۰۰ حلقه بهینه‌سازی را اجرا می‌کند، از جمله تجزیه و تحلیل مسیرهای شکست، برنامه‌ریزی اصلاحات، اصلاح معماری کد خود، اجرای ارزیابی‌ها و تکرار مجدد حلقه، و در نهایت به بهبود عملکرد ۳۰ درصدی در یک مجموعه ارزیابی داخلی دست می‌یابد. در MLE Bench Lite (ارزیابی سختی مسابقه یادگیری ماشین)، از بین ۲۲ مسئله چالش‌برانگیز، M2.7 با میانگین نرخ مدال ۶۶.۶٪، ۹ مدال طلا، ۵ نقره و ۱ برنز کسب کرد.

از پنج بُعد، این دو مسیر در جهات کاملاً متفاوتی قرار دارند: MiMo-V2-Pro به وضوح از نظر طول متن و ابعاد مهندسی کد برتری دارد، در حالی که M2.7 شکاف را در اتوماسیون اداری و قابلیت خود-تکرارشوندگی افزایش می‌دهد. طبق همان پست وبلاگ فناوری MiniMax، M2.7 در GDPval-AA (ارزیابی پردازش اسناد آفیس) امتیاز ELO 1495 را کسب کرد و در بین مدل‌های متن‌باز رتبه اول را کسب کرد و در آزمون MM-Claw که بیش از 40 مهارت پیچیده را پوشش می‌دهد، نرخ انطباق مهارت 97 درصدی را حفظ کرد.

چهار نسخه در پنج ماه

نه تنها مسیرهای فنی این دو شرکت متفاوت است، بلکه ریتم تکرار آنها نیز کاملاً متفاوت است.

طبق سوابق انتشار عمومی، از انتشار M2 در اکتبر 2025 تا انتشار M2.7 در مارس 2026، MiniMax چهار نسخه را در عرض پنج ماه منتشر کرد که به طور متوسط ​​هر 49 روز یک نسخه اصلی بود. فاصله بین M2.5 و M2.7 تنها حدود 30 روز بود.

ریتم MiMo شیائومی متفاوت است: MiMo-7B در آوریل ۲۰۲۵ (یک مدل استنتاج متن‌باز با ۷ پارامتر)، V2-Flash در دسامبر همان سال (با مجموع ۳۰۹ پارامتر) و V2-Pro در مارس ۲۰۲۶ (با مجموع ۱T پارامتر) منتشر شدند. مقیاس پارامتر بین هر نسل بسیار بزرگتر است، اما فواصل بین نسخه‌ها نیز طولانی‌تر است.

MiniMax گام‌های کوچک و مکرر را انتخاب کرد، به طوری که در هر تکرار، جهش‌های بزرگی ایجاد نمی‌کرد، اما با فرکانس بسیار بالا. خودِ سازوکار خودتکرارشونده‌ی M2.7 برای «تکامل مداوم» طراحی شده است. شیائومی رویکرد تأثیرگذارتری را انتخاب کرد و هر نسخه شامل تغییرات قابل توجهی در مقیاس پارامترها و معماری بود.

قیمت --

--

ناشناس ۸ روزه، اجلاس OpenRouter

علاوه بر نقشه راه فنی، استراتژی انتشار شیائومی نیز عرف‌های صنعت را زیر پا گذاشته است.

به گزارش رویترز، در ۱۱ مارس، یک مدل ناشناس به نام Hunter Alpha در بزرگترین پلتفرم تجمیع API جهان، OpenRouter، ظاهر شد. نه حمایت از برند، نه مراسم رونمایی از محصول، نه وبلاگ فنی. قیمت API آن بسیار پایین بود، با این حال عملکرد آن به طرز شگفت‌آوری قوی بود.

جامعه شروع به گمانه‌زنی در مورد ریشه‌های آن کرد. طبق گزارش Republic World و چندین رسانه فناوری، رایج‌ترین گمانه‌زنی‌ها مربوط به DeepSeek V4 بود، زیرا لوو فولی، رهبر تیم MiMo، پیش از این در DeepSeek روی تحقیقات کار کرده بود. تعداد فراخوانی‌های API به سرعت افزایش یافت و تعداد کل فراخوانی‌ها در دوره ناشناس از ۱ تریلیون توکن فراتر رفت و به صدر رتبه‌بندی هفتگی OpenRouter رسید.

اوایل ۱۹ مارس، شیائومی فاش کرد: هانتر آلفا در واقع همان MiMo-V2-Pro است. طبق همان گزارش رویترز، سهام شیائومی در هنگ کنگ پس از این افشاگری، یک بار ۵.۸ درصد افزایش یافت.

این اولین باری است که یک مدل بزرگ داخلی از طریق آزمایش کاملاً کور، خود را در یک پلتفرم جهانی اثبات کرده است. بدون تکیه بر برند، بدون تکیه بر تبلیغات، ۸ روز طول کشید تا به توسعه‌دهندگان اجازه داده شود با پای خود رأی دهند.

ممکن است شما نیز علاقه‌مند باشید

Morning Report | Coinbase Ventures makes its first investment in ENA; SpaceX plans to set the IPO price at $135 per share

Overview of Important Market Events on June 3rd

متن کامل و تحلیل سخنرانی مدیرعامل SanDisk در چهل و دومین کنفرانس سالانه تصمیم‌گیری استراتژیک برنشتاین

ارزش اصلی سخنرانی گوکلر در ارائه یک چارچوب روایی بسیار شفاف و منطقی برای تحول سازمانی نهفته است.

پیش‌بینی قیمت بیت‌کوین در سال ۲۰۳۰: پیش‌بینی ۷۱۰ هزار دلاری Ark Invest

پیش‌بینی‌های قیمت بیت‌کوین در سال ۲۰۳۰ از سوی Ark Invest و Standard Chartered، به همراه ریسک‌های کلیدی و نحوه مدیریت سبد دارایی خود را بررسی کنید. تحلیل کامل در WEEX.

قیمت لحظه‌ای SOL: قیمت زنده، نمودارها و داده‌های بازار Solana

قیمت امروز SOL را با داده‌های لحظه‌ای، به همراه عوامل کلیدی تغییرات Solana و نکات معاملاتی کاربردی پیدا کنید. تحلیل کامل را در WEEX بخوانید.

ETF بیت‌کوین چیست: بررسی تفاوت‌های اسپات و فیوچرز

با مفهوم ETF بیت‌کوین، نحوه عملکرد ETFهای اسپات و فیوچرز و دلیل تغییر شکل بازار BTC توسط جریان‌های ورودی نهادی در سال ۲۰۲۶ آشنا شوید. تحلیل WEEX.

Why Is Bitcoin Dropping 15% While Nasdaq Hits Record Highs?

بیت‌کوین در میان ترس از تنش‌های ژئوپلیتیک ۱۵ درصد سقوط کرد و به ۶۶ هزار دلار رسید، در حالی که نزدک به رکوردهای تاریخی خود صعود کرد. تحلیلی بر محرک‌های کلان اقتصادی، جریان‌های ETF، رفتار معامله‌گران خرد در برابر نهنگ‌ها و همبستگی پنهان بین رمزارزها و سهام.

رمزارزهای محبوب

آخرین اخبار رمز ارز

ادامه مطلب
iconiconiconiconiconicon
پشتیبانی مشتری:@weikecs
همکاری تجاری:@weikecs
معاملات کمّی و بازارسازی:bd@weex.com
برنامه VIP:support@weex.com