صندوق بنیانگذاران، پنترا و فرانکلین تمپلتون به "Arena" شرکت Sentient میپیوندند تا عوامل هوش مصنوعی در سطح سازمانی را تحت فشار قرار دهند.
در دو سال گذشته، شرکتها ادغام عوامل هوش مصنوعی را در گردشهای کاری واقعی تسریع کردهاند: از خدمات مشتری و عملیات پشت صحنه گرفته تا فرآیندهای مالی و انطباق که نیاز به تصمیمگیریهای پرمخاطره دارند. همچنان که این سیستمها به طور فزایندهای در عملیات تجاری واقعی گنجانده میشوند، مسئله جدیدی در حال ظهور است: در حالی که عاملها میتوانند اطلاعات را بازیابی کنند، اغلب در ارائه فرآیندهای استدلال پایدار، قابل تفسیر و تکرارپذیر، زمانی که کار "نامرتب"، چند مرحلهای یا پرخطر میشود، با مشکل مواجه میشوند.
امروز، آزمایشگاه هوش مصنوعی متنباز Sentient رسماً Arena را راهاندازی کرد - یک محیط آماده برای تولید و بلادرنگ برای هزاران توسعهدهنده هوش مصنوعی در سراسر جهان تا بر روی سختترین مسائل استدلالی که شرکتها با آن مواجه هستند، آزمایش استرس انجام دهند و به صورت تکراری با هم رقابت کنند. ترکیب اولیه شرکتکنندگان در فاز اول آرنا شامل صندوق بنیانگذاران، پنترا و فرانکلین تمپلتون میشود که بیش از ۱۵ تریلیون دلار دارایی را مدیریت میکند - که نشان میدهد مؤسسات علاقه اولیه و آشکاری به «ارزیابیهای ساختاریافته از عوامل هوش مصنوعی قبل از استقرار» نشان میدهند.
جولیان لاو، شریک مدیریتی در Franklin Templeton Digital Assets، گفت: «وقتی شرکتها از هوش مصنوعی در تحقیقات، عملیات و گردشهای کاری مرتبط با مشتری استفاده میکنند، دیگر سوال این نیست که آیا این سیستمها به اندازه کافی قدرتمند هستند یا خیر... بلکه سوال این است که آیا در گردشهای کاری واقعی قابل اعتماد هستند یا خیر.» لاو افزود که محیطهای ساختاریافتهای مانند آرنا به صنعت کمک میکنند تا بین «ایدههای امیدوارکننده» و «قابلیتهایی که واقعاً میتوانند در تولید مورد استفاده قرار گیرند» تمایز قائل شوند.
هیمانشو تیاگی، یکی از بنیانگذاران سنتینت، اظهار داشت: «عوامل هوش مصنوعی دیگر فقط آزمایشهایی در شرکتها نیستند؛ آنها وارد فرآیندهای حیاتی میشوند که با مشتریان، بودجه و نتایج عملیاتی در ارتباط هستند.» این تغییر، معیارهای ارزیابی را تغییر میدهد. کافی نیست که سیستمها در دموها چشمگیر به نظر برسند. شرکتها باید بدانند: در محیطهای تولیدی، که هزینه شکست بالا و اعتماد شکننده است، آیا عوامل هنوز میتوانند به طور قابل اعتمادی استدلال کنند؟ کسبوکارها به قابلیت مقایسه، تکرارپذیری و روشی برای پیگیری بهبود قابلیت اطمینان در درازمدت نیاز دارند که به مدل یا مجموعه ابزار زیربنایی وابسته نباشد.
آرنا هرج و مرج واقعی گردشهای کاری سازمانی را شبیهسازی میکند: اطلاعات ناقص، متن طولانی، دستورالعملهای مبهم و منابع متناقض. آرنا نه تنها ارزیابی میکند که آیا عاملها «پاسخهای صحیح» ارائه میدهند یا خیر، بلکه ردپاهای استدلال کامل را ثبت میکند تا تیمهای مهندسی بتوانند علل شکست را مشخص کرده و پیشرفتها را در طول زمان اعتبارسنجی کنند.
این یک معیار بیطرفانه و مستقل از فروشنده برای ارزیابی استدلال در مدلها و پشتههای فناوری فراهم میکند. آرنا به جای عملکرد نمایشی، بر عملکرد در سطح تولید تأکید دارد و بدین ترتیب قابلیتهای عامل قابل تأییدی را ایجاد میکند که برای سناریوهای پرخطر قابل اجرا هستند و کسبوکارها میتوانند آنها را به دادههای خصوصی و ابزارهای داخلی خود نیز منتقل کنند.
در اولین چالش، توسعهدهندگانی که به Arena میپیوندند، بر یک مشکل اساسی در سطح سازمانی تمرکز خواهند کرد: استدلال اسنادی. عوامل هوش مصنوعی باید روی دادههای پیچیده و بدون ساختار استدلال و محاسبه کنند - این نوع کار زیربنای سناریوهایی مانند تحلیل مالی، بررسی ریشهای علت، نوشتن یادداشتهای سرمایهگذاری و خدمات مشتری است.
سایر شرکتکنندگان در فاز اولیه شامل alphaXiv، Fireworks، OpenHands و OpenRouter هستند؛ با گسترش Arena در وظایف، صنایع و ادغام مدلها، انتظار میرود شرکتکنندگان بیشتری به آن بپیوندند.
تحقیقات اخیر همچنین شکافی را که آرنا قصد دارد به آن بپردازد، برجسته میکند: ۸۵ درصد شرکتها تمایل خود را برای تبدیل شدن به «شرکتهای عاملمحور» ابراز میکنند و تقریباً سهچهارم آنها در حال برنامهریزی برای استقرار عاملهای خودکار هستند، اما کمتر از یکچهارم آنها در واقع سیستمهای مدیریتی بالغی دارند؛ بسیاری از شرکتها برای مقیاسبندی پروژههای آزمایشی به استقرارهای تولیدی در مقیاس بزرگ با مشکل مواجه هستند. به طور متوسط، شرکتها حدود دوازده عامل را اداره میکنند که اغلب در سناریوهای جداگانه پراکنده هستند؛ بسیاری معتقدند که بدون هماهنگی و قابلیتهای همکاری بهتر، افزودن عوامل بیشتر تنها پیچیدگی را افزایش و ارزش را کاهش میدهد.
گراهام نویبیگ، دانشمند ارشد و یکی از بنیانگذاران OpenHands، گفت: «در OpenHands، ما همیشه مشتاق بودهایم که از توسعهدهندگان در استفاده از عاملها برای حل مشکلات واقعی و عملی حمایت کنیم.» ما همچنین از حمایت از شرکتکنندگان در استفاده از OpenHands Software Agent SDK برای مقابله با این چالشهای پیچیده، هیجانزدهایم.
الکس عطاالله، یکی از بنیانگذاران و مدیرعامل OpenRouter، اظهار داشت: «Arena دقیقاً همان نوع ابتکاری است که میتواند هوش مصنوعی متنباز را به جلو سوق دهد - این به محققان اجازه میدهد تا در یک محیط باز رقابت کنند، تکرار کنند و نوآوری کنند.» ما مشتاقانه منتظر تعمیق همکاری خود با Sentient و فراهم کردن زیرساختهایی برای انجام سریعتر و آسانتر آزمایشها در مقیاس بزرگ هستیم.
آرنا به صورت جهانی راهاندازی خواهد شد و از هزاران توسعهدهنده هوش مصنوعی دعوت میکند تا برای اولین گروه محدود درخواست دهند، و رویدادهای آفلاین قرار است از مارس ۲۰۲۶ در سانفرانسیسکو برگزار شوند.
درباره آزمایشگاههای سنتینت
آزمایشگاههای سنتینت (Sentient Labs) یک سازمان پیشرو در تحقیقات و تولید فناوری است که به پیشرفت هوش مصنوعی متنباز اختصاص دارد. آزمایشگاههای سنتینت، به عنوان موتور نوآوری بنیاد سنتینت، تحقیقات پیشرفتهای را در زمینه استدلال، همترازی و همکاری عاملها در هوش مصنوعی انجام میدهند. Sentient توسعهدهنده اصلی چارچوبهای با کارایی بالا مانند ROMA و مدلهای متنباز مانند Dobby است. ماموریت سنتینت، تبدیل هوش مصنوعی متنباز از «آزمایش» به «ضرورت» است. با فراهم کردن زیرساخت لازم برای ساخت سیستمهای عامل قدرتمند و قابل ترکیب، Sentient به توسعهدهندگان این امکان را میدهد که ابزارهای متنباز را تجاریسازی کرده و به قابلیت استفاده در سطح سازمانی دست یابند. سنتینت متعهد است که متنباز بودن را به استاندارد پیشفرض برای عملیات هوش مصنوعی حیاتی جهانی تبدیل کند.
ممکن است شما نیز علاقهمند باشید

از وحشت تا پمپ: چگونه معاملهگران بیتکوین آتشبس دو هفتهای آمریکا و ایران را بازی میکنند
برای اکثر مردم، آتشبس دو هفتهای آمریکا و ایران مربوط به مسائل ژئوپلیتیک، قیمت نفت و احتمال به تعویق افتادن جنگ جهانی سوم است. اما برای معاملهگران ارزهای دیجیتال که اواخر یکشنبه شب به صفحات نمایش خود خیره شده بودند، ماجرا کاملاً چیز دیگری بود: واضحترین سیگنال ریسکپذیری در ماههای اخیر.

توافق آتشبس آمریکا و ایران باعث سقوط قیمت نفت، جهش بیتکوین و صعود قیمت طلا شد.
با وجود جهش شدید، احتیاط لازم است. منطقه ۷۰٬۰۰۰ تا ۷۲٬۰۰۰ دلار از نظر تاریخی مقاومت قوی بوده است. این آتشبس تنها موقتی است (دو هفته)، و هرگونه شکست در مذاکرات میتواند موج فروش را به سمت ناحیه حمایتی ۶۲٬۰۰۰ تا ۶۵٬۰۰۰ دلار برانگیزد. در حال حاضر، بیتکوین برای تأیید یک شکست واقعی، باید بهطور قاطع بالای ۷۲٬۵۰۰ دلار بسته شود؛ عدم تحقق این امر طی ۴۸ تا ۷۲ ساعت میتواند به یک اصلاح سریع منجر شود.

اوپنایآی هیچ «توافقنامه جدید»ی ندارد، طرحی برای هوش مصنوعی که از پرداخت سر باز میزند.

فرار فلش ماب وال استریت؟ سقوط سهام شرکتهای بزرگ، فرار بزرگ گلدمن ساکس، راهنمای مصور بحران اعتبار خصوصی

اختلاف نظر در مورد OpenAI: قدرت، اعتماد و مرزهای غیرقابل کنترل هوش مصنوعی عمومی (AGI)

«فرقه آخرالزمانی هوش مصنوعی» مأمورانش را به تنگه هرمز میفرستد: آنها چه یافتند؟

همه منتظر پایان جنگ هستند، اما آیا قیمت نفت نشان دهنده یک درگیری طولانی مدت است؟

تحلیل دادهها: شکاف نقدینگی بین نفت خام هایپرلیکوئید و CME چقدر است؟

پس از تعدیل ۴۰ درصدی کارکنان، بنیانگذار توییتر ۱ میلیون دلار بیت کوین اهدا میکند

تجارت.xyz: قیمتگذاری جهان؟ بازارهای درون زنجیرهای در حال تبدیل شدن به بازار هستند

مهارت تجاری XXYY: ربات معاملاتی الگوریتمی هوش مصنوعی ۲۴/۷ | معرفی پروژه

تیم امنیتی آوه، برترین پروتکل دیفای، خارج میشود؛ چه کسی در بازار خرسی، رویداد قو سیاه بعدی را تاب خواهد آورد؟

آیا فردی که در پیشبینی قیمت طلا در طول تاریخ دقیقترین بوده است، میتواند قیمتهای آینده طلا را پیشبینی کند؟

محاسبات کوانتومی بیتکوین را از بین نمیبرد، اما خطر واقعی در حال نزدیک شدن است

وقتی فینتک با کریپتوی اصلی ادغام میشود: دهه بعدی امور مالی دیجیتال

ممکن است با مشتریان ثروتمندی روبرو شوید که احتمالاً "مزدور" هکرهای کره شمالی هستند.

خروج آزمایشگاههای هرج و مرج، آوه آخرین دروازهبان ریسک خود را از دست میدهد

محاسبات کوانتومی بیتکوین را از بین نمیبرد، اما خطرات واقعی در حال نزدیک شدن هستند
از وحشت تا پمپ: چگونه معاملهگران بیتکوین آتشبس دو هفتهای آمریکا و ایران را بازی میکنند
برای اکثر مردم، آتشبس دو هفتهای آمریکا و ایران مربوط به مسائل ژئوپلیتیک، قیمت نفت و احتمال به تعویق افتادن جنگ جهانی سوم است. اما برای معاملهگران ارزهای دیجیتال که اواخر یکشنبه شب به صفحات نمایش خود خیره شده بودند، ماجرا کاملاً چیز دیگری بود: واضحترین سیگنال ریسکپذیری در ماههای اخیر.
توافق آتشبس آمریکا و ایران باعث سقوط قیمت نفت، جهش بیتکوین و صعود قیمت طلا شد.
با وجود جهش شدید، احتیاط لازم است. منطقه ۷۰٬۰۰۰ تا ۷۲٬۰۰۰ دلار از نظر تاریخی مقاومت قوی بوده است. این آتشبس تنها موقتی است (دو هفته)، و هرگونه شکست در مذاکرات میتواند موج فروش را به سمت ناحیه حمایتی ۶۲٬۰۰۰ تا ۶۵٬۰۰۰ دلار برانگیزد. در حال حاضر، بیتکوین برای تأیید یک شکست واقعی، باید بهطور قاطع بالای ۷۲٬۵۰۰ دلار بسته شود؛ عدم تحقق این امر طی ۴۸ تا ۷۲ ساعت میتواند به یک اصلاح سریع منجر شود.
