logo

فلسفة التوفير في عصر الذكاء الاصطناعي: كيف تنفق كل عملة رقمية بحكمة

By: blockbeats|2026/04/03 13:48:43
0
مشاركة
copy
بقلم Sleepy.md

في عصر البرقيات، حيث كانت كل كلمة تكلف مالاً، كانت الكلمات ثمينة كالذهب. اعتاد الناس على تلخيص الرسائل الطويلة في عبارات موجزة، حيث يمكن لعبارة بسيطة مثل «عودة آمنة» أن تحل محل رسالة طويلة، وكان «السلامة أولاً» هو التذكير الأكثر تكراراً.

في وقت لاحق، ومع دخول الهاتف إلى المنازل، أصبحت المكالمات البعيدة المدى تُحسب بالثانية. كانت مكالمات الوالدين عبر الخطوط البعيدة دائماً قصيرة ومباشرة. وبمجرد الانتهاء من مناقشة الموضوع الرئيسي، كانوا يغلقون المكالمة على عجل. وإذا ما طالت المحادثة قليلاً، فإن التفكير في تكلفة المكالمة الباهظة كان يقطع أي حديث عابر على الفور.

وبعد ذلك، دخلت خدمة الإنترنت عريض النطاق إلى المنازل، حيث أصبح الاستخدام يُحسب بالساعة. كان الناس يحدقون في المؤقت الذي يظهر على شاشاتهم، ويغلقون صفحات الويب فور فتحها، ولا يجرؤون على تنزيل مقاطع الفيديو إلا نادراً، حيث كان البث المباشر يُعتبر في ذلك الوقت ترفاً. وراء كل شريط تقدم للتنزيل يكمن توق الناس إلى «التواصل مع العالم» وخوفهم من «عدم كفاية الرصيد».

كانت وحدة الفوترة تتغير باستمرار، لكن الرغبة في توفير المال ظلت ثابتة عبر الزمن.

أصبحت التوكنات اليوم العملة السائدة في عصر الذكاء الاصطناعي. ومع ذلك، لم يتعلم معظم الناس بعد كيفية إدارة ميزانياتهم في هذا العصر، لأننا لم نستوعب بعد كيفية حساب المكاسب والخسائر في ظل خوارزميات غير مرئية.

عندما ظهر ChatGPT في عام 2022، لم يكن أحد تقريبًا يهتم بمعنى مصطلح «التوكنات». كانت تلك حقبة "ولائم الذكاء الاصطناعي"، حيث كان بإمكانك الدردشة بقدر ما تشاء مقابل 20 دولارًا شهريًا.

ولكن منذ ظهور وكلاء الذكاء الاصطناعي مؤخرًا، أصبحت تكاليف الرموز الرقمية أمرًا يجب على كل من يستخدم وكيل الذكاء الاصطناعي الانتباه إليه.

على عكس المحادثات البسيطة التي تتألف من أسئلة وأجوبة، فإن وراء سير العمل هذه توجد مئات أو آلاف من طلبات واجهة برمجة التطبيقات (API). التفكير المستقل الذي يتحلى به الوكيل له ثمنه. كل عملية تصحيح ذاتي، وكل استخدام لأداة ما، يتوافق مع تقلبات في الفاتورة. فجأة، تجد أن المال الذي أودعته لم يعد كافياً، ولا تملك أدنى فكرة عما كان الوكيل يفعله.

في الواقع، الجميع يعرف كيف يدخر المال. عند شراء البقالة من السوق، نعلم أنه يجب تنظيفها من الطين والأوراق الذابلة قبل وزنها. عند ركوب سيارة أجرة إلى المطار، يدرك السائقون المتمرسون ضرورة تجنب الطرق المرتفعة خلال ساعات الذروة.

منطق توفير المال في العالم الرقمي مشابه، باستثناء أن وحدة الحساب قد تغيرت من «الكيلوغرامات» و«الكيلومترات» إلى «التوكنات».

فلسفة التوفير في عصر الذكاء الاصطناعي: كيف تنفق كل عملة رقمية بحكمة

في الماضي، كان الادخار ناجماً عن الندرة؛ أما في عصر الذكاء الاصطناعي، فإن الادخار هو من أجل الدقة.

نأمل من خلال هذا المقال أن نساعدك في وضع منهجية لتوفير المال في عصر الذكاء الاصطناعي، حتى تتمكن من إنفاق كل قرش بحكمة.

تخلص من الأوراق المتعفنة قبل الوزن

في عصر الذكاء الاصطناعي، لم تعد قيمة المعلومات تتحدد بنطاقها، بل بنقاوتها.

تعتمد طريقة احتساب تكلفة الذكاء الاصطناعي على عدد الكلمات التي يقرأها. سواء زودته برؤى عميقة أو بمصطلحات لا معنى لها، فما دام يقرأها، فعليك أن تدفع.

لذلك، فإن أول ما يجب أن تضعه في اعتبارك عند تجميع التوكنات هو أن تثبت مفهوم "نسبة الإشارة إلى الضوضاء" في عقلك الباطن.

كل كلمة، وكل صورة، وكل سطر من التعليمات البرمجية التي تزود بها الذكاء الاصطناعي له ثمنه. لذا، قبل أن تسلم أي شيء إلى الذكاء الاصطناعي، تذكر أن تسأل نفسك: ما مدى حاجة الذكاء الاصطناعي إلى هذا الأمر حقًا؟ ما مدى اتساخها وتعفنها؟

على سبيل المثال، التحيات الافتتاحية المطولة مثل "مرحبًا، أرجو مساعدتي في..."، والمقدمات التوضيحية المتكررة، وتعليقات الكود التي لم يتم حذفها بشكل صحيح، كلها بمثابة أوراق متعفنة ومتساقطة.

علاوة على ذلك، فإن الخطأ الأكثر شيوعًا هو تزويد الذكاء الاصطناعي مباشرةً بملف PDF أو لقطة شاشة لصفحة ويب. ورغم أن هذا قد يوفر عليك الجهد، إلا أن «توفير الجهد» في عصر الذكاء الاصطناعي غالبًا ما يعني «تكلفة أعلى».

لا يقتصر ملف PDF المُصمم بشكل جيد على المحتوى الرئيسي فحسب، بل يشمل أيضًا الرأس والتذييل وتسميات المخططات والعلامات المائية المخفية، بالإضافة إلى كمية كبيرة من أكواد التنسيق الخاصة بالطباعة. هذه العناصر لا تساعد الذكاء الاصطناعي على فهم سؤالك، ولكن سيتم احتساب تكلفة كل منها عليك.

في المرة القادمة، تذكر تحويل ملف PDF إلى نص Markdown خالٍ من العناصر الزائدة قبل إدخاله إلى الذكاء الاصطناعي. عندما تحول ملف PDF بحجم 10 ميغابايت إلى نص عادي بحجم 10 كيلوبايت، فإنك لا توفر 99% من التكلفة فحسب، بل تسرع أيضًا من عملية معالجة الذكاء الاصطناعي بشكل ملحوظ.

الصور هي مصدر آخر يلتهم المال.

وفقًا لمنطق النماذج البصرية، لا يهم الذكاء الاصطناعي ما إذا كانت صورتك جميلة أم لا؛ بل يهمه فقط حجم المساحة التي تشغلها بالبكسلات.

باستخدام منطق الحساب الرسمي الخاص بـ«كلود»: استهلاك رموز الصورة = عدد وحدات البكسل في العرض × عدد وحدات البكسل في الارتفاع ÷ 750.

بالنسبة لصورة بحجم 1000×1000 بكسل، تستهلك حوالي 1334 توكن، وهو ما يعادل، وفقًا لأسعار Claude Sonnet 4.6، حوالي 0.004 دولار لكل صورة؛

ومع ذلك، إذا تم ضغط الصورة نفسها إلى 200×200 بكسل، فإنها تستهلك 54 توكنًا فقط، مما يخفض التكلفة إلى 0.00016 دولار، أي بفارق يصل إلى 25 ضعفًا.

يقوم الكثير من الناس بتزويد الذكاء الاصطناعي مباشرةً بصور عالية الدقة التقطوها بهواتفهم أو لقطات شاشة بدقة 4K، مما يؤدي دون قصد إلى استهلاك عملات رقمية قد تكفي الذكاء الاصطناعي لقراءة أكثر من نصف رواية قصيرة. إذا كانت المهمة تقتصر على التعرف على النص الموجود في الصورة أو إجراء عمليات تقييم بصرية بسيطة، مثل جعل الذكاء الاصطناعي يتعرف على المبلغ الوارد في فاتورة، أو قراءة النص الموجود في دليل التعليمات، أو تحديد ما إذا كانت الصورة تحتوي على إشارة مرور، فإن دقة 4K تكون ببساطة مضيعة للوقت. يكفي ضغط الصورة إلى أدنى دقة قابلة للاستخدام.

ومع ذلك، فإن أسهل طريقة لإهدار الرموز في مرحلة الإدخال ليست في الواقع تنسيق الملف، بل الطريقة غير الفعالة في التعبير.

يعامل الكثيرون الذكاء الاصطناعي كجار بشري، وقد اعتادوا على التواصل معه بأسلوب اجتماعي وودود، حيث يبدأون بجملة مثل «ساعدني في كتابة صفحة ويب»، وينتظرون حتى يقدم لهم الذكاء الاصطناعي منتجًا غير مكتمل، ثم يضيفون التفاصيل، ويكررون هذه العملية مرارًا وتكرارًا. ستؤدي هذه المحادثة التي تشبه عصر معجون الأسنان إلى قيام الذكاء الاصطناعي بإنشاء المحتوى بشكل متكرر، حيث تزيد كل جولة من التعديلات من استهلاك الرموز.

اكتشف المهندسون في Tencent Cloud من خلال التجربة العملية أنه بالنسبة للمتطلبات نفسها، غالبًا ما تستهلك المحادثات المتعددة الجولات التي تشبه عصر معجون الأسنان عددًا من الرموز (Tokens) يزيد بمقدار 3 إلى 5 أضعاف عما يمكن تفسيره في جولة واحدة.

الطريقة الحقيقية لتوفير المال هي التخلي عن هذا الاستقصاء الاجتماعي غير الفعال، وبيان المتطلبات وشروط الحدود والأمثلة المرجعية بوضوح دفعة واحدة. لا تضيع وقتك في شرح "ما لا يجب فعله"، لأن الصيغ النفيّة غالبًا ما تتطلب جهدًا أكبر في الفهم مقارنة بالصيغ الإيجابية؛ بل اشرح "كيفية القيام بذلك" بشكل مباشر، وقدم شرحًا عمليًا واضحًا وصحيحًا.

كذلك، إذا كنت تعرف مكان الهدف، فأخبر الذكاء الاصطناعي بذلك مباشرةً، ولا تدعه يحاول اكتشافه بنفسه.

عندما تطلب من الذكاء الاصطناعي "البحث عن بعض الأكواد المتعلقة بالمستخدم"، فإنه يضطر إلى إجراء عمليات مسح وتحليل وتخمين واسعة النطاق في الخلفية؛ أما عندما تطلب منه مباشرةً "الاطلاع على ملف src/services/user.ts"، فإن الفرق في استهلاك الرموز يكون كالفرق بين الليل والنهار. في العالم الرقمي، يُعد التوازن في المعلومات هو أفضل ما يضمن الكفاءة.

لا تدفع ثمن "لباقة" الذكاء الاصطناعي

هناك قاعدة غير معلنة في نظام الفوترة الخاص بالنماذج الكبيرة لا يدركها الكثيرون: عادةً ما تكون تكلفة الرموز الناتجة أعلى بثلاث إلى خمس مرات من تكلفة الرموز المدخلة.

بعبارة أخرى، ما تقوله الذكاء الاصطناعي يكلف أكثر بكثير مما تقوله أنت له. إذا أخذنا سعر "كلود سونيت 4.6" كمثال، فإن تكلفة إدخال كل مليون توكن تبلغ 3 دولارات فقط، في حين أن تكلفة الإخراج تقفز فجأة إلى 15 دولارًا، وهو فارق هائل في السعر يصل إلى 5 أضعاف.

كل تلك العبارات الافتتاحية المهذبة من قبيل «حسنًا، لقد فهمت متطلباتك تمامًا وسأبدأ الآن في تلبية احتياجاتك...» وتلك الخاتمات المهذبة مثل «آمل أن تكون المعلومات الواردة أعلاه مفيدة لك» هي قواعد آداب اجتماعية في التواصل البشري، ولكن في فاتورة واجهة برمجة التطبيقات (API)، فإن هذه الشكليات التي لا تحمل أي قيمة إعلامية ستكلفك أيضًا أموالاً.

إن الطريقة الأكثر فعالية للتعامل مع النفايات الناتجة عن محطات الإخراج هي وضع قواعد للذكاء الاصطناعي. استخدم أوامر النظام لتوجيهه صراحةً: لا للثرثرة، ولا للتفسيرات، ولا لإعادة صياغة الطلبات، بل اكتفِ بتقديم الإجابة فحسب.

يكفي تعيين هذه القواعد مرة واحدة فقط، وستسري على كل محادثة، مما يجسد حقًا مبدأ "إدخال مرة واحدة، فائدة دائمة" في عالم المال. ومع ذلك، عند وضع هذه القواعد، يقع الكثيرون في فخ آخر، وهو إصدار تعليمات مطولة باللغة الطبيعية.

تشير البيانات التي تم اختبارها من قبل المهندسين إلى أن فعالية التعليمات لا تكمن في عدد الكلمات، بل في كثافتها. من خلال اختصار موجه النظام المكون من 500 كلمة إلى 180 كلمة، وإزالة عبارات المجاملة التي لا معنى لها، وتوحيد التعليمات المتكررة، وإعادة تنظيم الفقرات في شكل قائمة موجزة ومفصلة، تظل جودة مخرجات الذكاء الاصطناعي دون تغيير تقريبًا، ومع ذلك يمكن أن ينخفض استهلاك الرموز لكل استدعاء بنسبة 64%.

وهناك وسيلة أخرى أكثر فعالية للتحكم تتمثل في تحديد طول النص الناتج. كثير من الناس لا يضعون حدًا أقصى للمخرجات، مما يتيح للذكاء الاصطناعي حرية التصرف، وهو ما يؤدي غالبًا إلى ارتفاع شديد في التكاليف. قد لا تحتاج سوى إلى جملة قصيرة ومباشرة، لكن الذكاء الاصطناعي، في محاولة لإظهار نوع من «الصدق الفكري»، ينتج دون تردد مقالاً من 800 كلمة.

إذا كنت تبحث عن بيانات خالصة، فيجب أن تجبر الذكاء الاصطناعي على تقديم النتائج في صيغة منظمة بدلاً من الوصف الطويل باللغة الطبيعية. عند وجود نفس الكمية من المعلومات، يستهلك تنسيق JSON عددًا أقل بكثير من الرموز مقارنةً بالنص العادي. وذلك لأن البيانات المنظمة تزيل جميع أدوات العطف والجزيئات والمعدلات التوضيحية الزائدة عن الحاجة، ولا تحتفظ سوى بتركيز عالٍ من الجوهر المنطقي. في عصر الذكاء الاصطناعي، يجب أن تدرك تمامًا أن ما يستحق الدفع مقابله هو قيمة النتيجة، وليس ذلك التفسير الذاتي الذي لا معنى له الصادر عن الذكاء الاصطناعي.

علاوة على ذلك، فإن "الإفراط في التفكير" الذي تمارسه الذكاء الاصطناعي يستنزف رصيد حسابك بسرعة كبيرة.

تحتوي بعض الطرز المتطورة على وضع "التفكير الموسع" الذي يجري عملية تفكير داخلية مكثفة قبل الرد. كما أن عملية الاستدلال هذه تنطوي على تكاليف تُحسب على أساس سعر الناتج، وهو ما قد يكون مكلفًا للغاية.

تم تصميم هذا الوضع أساسًا من أجل "المهام المعقدة التي تتطلب دعمًا منطقيًا عميقًا". ومع ذلك، يختار معظم الناس هذا النمط أيضًا عند طرح أسئلة بسيطة. بالنسبة للمهام التي لا تتطلب تفكيرًا عميقًا، فإن إعطاء تعليمات صريحة للذكاء الاصطناعي بـ«تخطي التفسيرات وتقديم الإجابة مباشرة» أو إيقاف «التفكير الموسع» يدويًّا يمكن أن يوفر عليك مبلغًا كبيرًا من المال.

تجنب أن يركز الذكاء الاصطناعي على الأمور القديمة

النماذج الكبيرة لا تمتلك ذاكرة حقيقية؛ فهي لا تفعل سوى التفكير في الأمور القديمة بلا نهاية.

هذه آلية أساسية لا يدركها الكثير من الناس. في كل مرة ترسل فيها رسالة جديدة في نافذة المحادثة، لا يبدأ الذكاء الاصطناعي في فهم الموضوع من تلك الجملة فحسب؛ بل يعيد قراءة جميع تفاعلاتك السابقة، بما في ذلك كل جولة من الحوار، وكل جزء من الكود، وكل وثيقة تمت الإشارة إليها، قبل أن يرد عليك.

فيما يتعلق بفوترة الرموز الرقمية، فإن هذا "التعلم من الماضي" ليس مجانيًا بأي حال من الأحوال. مع تراكم جولات المحادثة، حتى لو كنت تسأل عن كلمة بسيطة، فإن تكلفة إعادة قراءة الذكاء الاصطناعي للسجل القديم بأكمله تزداد بشكل كبير. تنص هذه الآلية على أنه كلما زاد حجم سجل المحادثات، ارتفعت تكلفة كل سؤال من أسئلتك.

قام أحدهم بتحليل 496 محادثة حقيقية تحتوي كل منها على أكثر من 20 رسالة، ووجد أن متوسط حجم الرسالة الأولى بلغ 14,000 وحدة، بتكلفة تبلغ حوالي 3.6 سنتات للرسالة الواحدة؛ وبحلول الرسالة الخمسين، بلغ متوسط الحجم 79,000 وحدة، بتكلفة تبلغ حوالي 4.5 سنتات للرسالة الواحدة، أي بزيادة هائلة تبلغ 80٪. علاوة على ذلك، مع ازدياد طول السياق، يصبح السياق الذي يتعين على الذكاء الاصطناعي إعادة معالجته، عند الرسالة الخمسين، أكبر بـ 5.6 أضعاف من سياق الرسالة الأولى.

ولمعالجة هذه المشكلة، فإن أبسط عادة يمكن اتباعها هي: مهمة واحدة، مربع حوار واحد.

عندما يتم مناقشة موضوع ما، ابدأ حوارًا جديدًا على الفور؛ ولا تعامل الذكاء الاصطناعي كنافذة دردشة مفتوحة دائمًا. تبدو هذه العادة بسيطة، لكن الكثيرين لا يستطيعون اتباعها، حيث يظلون يفكرون: "ماذا لو احتجت إلى الرجوع إلى المحتوى السابق؟" في الواقع، في معظم الأحيان، لا تحدث تلك "الاحتمالات" التي تقلق بشأنها أبدًا، وبسبب هذا "الاحتمال"، ينتهي بك الأمر إلى دفع مبالغ أعلى بكثير مقابل كل رسالة جديدة.

عندما يكون من الضروري مواصلة المحادثة ولكن أصبح السياق طويلاً، يمكننا استخدام وظائف الضغط المتوفرة في بعض الأدوات. يحتوي برنامج Claude Code على أمر /compact يمكنه تلخيص سجل المحادثات الطويل في ملخص قصير، مما يساعدك على تنظيم ملفاتك الرقمية.

هناك أيضًا آلية لتوفير المال تُسمى «التخزين المؤقت الفوري». إذا كنت تستخدم نفس المطالبة النظامية بشكل متكرر أو تحتاج إلى الإشارة إلى نفس المستند في كل محادثة، فسيقوم الذكاء الاصطناعي بتخزين هذا المحتوى مؤقتًا. وعند استدعائها في المرة التالية، لن تُفرض سوى رسوم قراءة ذاكرة التخزين المؤقت الدنيا، بدلاً من فرض الرسوم الكاملة في كل مرة.

تُظهر الأسعار الرسمية لشركة Anthropic أن سعر التوكن للزيارات المخزنة مؤقتًا يبلغ 1/10 من السعر العادي. وبالمثل، تقلل تقنية "تخزين المطالبات المؤقت" (Prompt Caching) من OpenAI تكاليف الإدخال بنسبة 50٪ تقريبًا. بحثت دراسة نُشرت في يناير 2026 على موقع arXiv المهام الطويلة عبر منصات متعددة للذكاء الاصطناعي، ووجدت أن التخزين المؤقت للموجهات يمكن أن يقلل تكاليف واجهة برمجة التطبيقات (API) بنسبة تتراوح بين 45% و80%.

بعبارة أخرى، بالنسبة لنفس المحتوى، تدفع السعر الكامل عند إدخاله إلى الذكاء الاصطناعي للمرة الأولى، أما في المرات اللاحقة، فلا تدفع سوى 1/10 من السعر. بالنسبة للمستخدمين الذين يحتاجون إلى استخدام نفس مجموعة وثائق المواصفات أو مطالبات النظام بشكل متكرر كل يوم، يمكن لهذه الميزة توفير قدر كبير من الرصيد.

ومع ذلك، هناك شرط أساسي واحد لتفعيل ميزة "التخزين المؤقت للمطالبات": يجب أن تظل صياغة مطالبات النظام ومحتوى المستند المرجعي وترتيبه متسقين، وأن يردا في بداية المحادثة. بمجرد تغيير المحتوى بأي شكل من الأشكال، تصبح ذاكرة التخزين المؤقتة غير صالحة، ويتم تطبيق الفوترة بالسعر الكامل مرة أخرى. لذا، إذا كانت لديك مجموعة من قواعد العمل الثابتة، فقم بتثبيتها بشكل دائم وتجنب إجراء تعديلات عشوائية عليها.

تقنية إدارة السياق الأخيرة هي التحميل عند الطلب. يحب الكثير من الناس إدخال جميع المواصفات والوثائق والملاحظات في حقول النظام، تحسبًا لأي طارئ.

ومع ذلك، فإن ثمن ذلك هو أنه عندما تقوم بمهمة بسيطة، تضطر إلى تحميل آلاف الكلمات من القواعد، مما يؤدي إلى إهدار عدد كبير من الرموز دون داعٍ. تنصح الوثائق الرسمية لـ Claude Code بإبقاء ملف CLAUDE.md أقل من 200 سطر، وتقسيم القواعد المخصصة لمختلف السيناريوهات إلى ملفات مهارات منفصلة، وتحميل القواعد الخاصة بالسيناريو قيد الاستخدام فقط. الحفاظ على نقاء السياق التام هو أسمى أشكال احترام القوة الحاسوبية.

سعر --

--

لا تستقل سيارة بورش لشراء الخضار

تختلف أسعار نماذج الذكاء الاصطناعي بشكل كبير.

تبلغ تكلفة Claude Opus 4.6 دولارًا أمريكيًا لكل مليون توكن عند الإدخال و25 دولارًا أمريكيًا عند الإخراج، في حين لا تتطلب Claude Haiku 3.5 سوى 0.8 دولار أمريكي عند الإدخال و4 دولارات أمريكية عند الإخراج، وهو فرق يقارب ستة أضعاف. إن تكليف النموذج الأعلى مستوى بأداء المهام الروتينية المتمثلة في جمع المعلومات وتنسيقها ليس أمراً بطيئاً فحسب، بل إنه مكلف للغاية أيضاً.

النهج الذكي هو تطبيق المفهوم المجتمعي الشائع المتمثل في «تقسيم العمل» على مجتمع الذكاء الاصطناعي، بحيث تُسند مهام ذات مستويات صعوبة مختلفة إلى نماذج بأسعار متفاوتة.

تمامًا كما هو الحال في العالم الواقعي عندما توظف شخصًا ما لشغل وظيفة ما، فلن تقوم على وجه التحديد بتعيين خبير في البناء براتب يبلغ مليون دولار للقيام بأعمال يدوية في موقع بناء. الذكاء الاصطناعي يعمل بنفس الطريقة. كما توصي الوثائق الرسمية لـ«كلود كود» صراحةً بما يلي: استخدام «سونيت» لمعظم مهام البرمجة، وتخصيص «أوبوس» للقرارات المعمارية المعقدة والاستدلال متعدد الخطوات، وتخصيص «هايكو» للمهام الفرعية البسيطة.

ويتمثل الحل العملي الأكثر تحديدًا في إنشاء «مسار عمل من مرحلتين». في المرحلة الأولى، استخدم نماذج أساسية مجانية أو منخفضة التكلفة للقيام بالأعمال التمهيدية، مثل جمع البيانات، وتنقية التنسيقات، وإعداد المسودات الأولية، والتصنيف البسيط، والتلخيص. ثم، في المرحلة الثانية، قم بتغذية النواة المُحسّنة في نماذج من الدرجة الأولى من أجل اتخاذ القرارات الأساسية والتحسين العميق.

على سبيل المثال، إذا كنت بحاجة إلى تحليل تقرير صناعي من 100 صفحة، يمكنك أولاً استخدام Gemini Flash لاستخراج البيانات والاستنتاجات الرئيسية من التقرير، وتلخيصها في ملخص من 10 صفحات، ثم إحالة هذا الملخص إلى Claude Opus لإجراء تحليل متعمق وإصدار تقييم. يمكن لهذا المسار العملي المكون من مرحلتين أن يقلل التكاليف بشكل كبير مع ضمان الجودة.

وبعيدًا عن مجرد تقسيم النص إلى فقرات، هناك نهج أكثر تقدمًا يتمثل في تقسيم العمل بشكل عميق بناءً على المهام. يمكن تقسيم المهمة الهندسية المعقدة إلى عدة مهام فرعية مستقلة، بحيث يتم ربط كل منها بالنموذج الأنسب.

على سبيل المثال، في مهمة البرمجة، يمكن للنموذج الاقتصادي أن يكتب أولاً الهيكل الأساسي والرموز النمطية، ثم يُعهد بتنفيذ المنطق الأساسي إلى نموذج أكثر تكلفة. تتميز كل مهمة فرعية بسياق واضح ومحدد، مما يؤدي إلى نتائج أكثر دقة وتكاليف أقل.

لست بحاجة فعليًا إلى إنفاق الرموز

تتناول جميع المناقشات السابقة بشكل أساسي المسائل التكتيكية المتعلقة بـ«كيفية توفير المال»، لكن الكثيرين أغفلوا فرضية منطقية أكثر جوهرية: هل يتطلب هذا الإجراء بالفعل إنفاق الرموز؟

إن الشكل الأكثر تطرفاً للتوفير ليس تحسين الخوارزميات، بل هو عملية تبسيط عملية اتخاذ القرار. لقد اعتدنا على البحث عن إجابات شاملة من الذكاء الاصطناعي، متناسين أن اللجوء إلى نموذج ضخم ومكلف في العديد من الحالات يشبه استخدام مدفع لقتل بعوضة.

على سبيل المثال، عندما يُترك للذكاء الاصطناعي التعامل مع رسائل البريد الإلكتروني تلقائيًا، فإن ذلك يؤدي إلى تفسير كل رسالة وتصنيفها والرد عليها باعتبارها مهمة مستقلة، مما يؤدي إلى استهلاك كبير للرموز. ومع ذلك، إذا قضيت أولاً 30 ثانية في فحص صندوق الوارد الخاص بك، وقمت يدويًّا بتصفية الرسائل الإلكترونية التي من الواضح أنها لا تحتاج إلى معالجة بالذكاء الاصطناعي، ثم سلمت الباقي إلى الذكاء الاصطناعي، فإن التكلفة تنخفض على الفور إلى جزء بسيط من التكلفة الأصلية. إن الحكم البشري في هذه الحالة ليس عائقاً، بل هو أفضل أداة للتصفية.

كان الناس في عصر البرقيات يدركون التكلفة الإضافية التي يتطلبها إرسال كلمة واحدة إضافية، لذا كانوا يفكرون في الأمر جيدًا، مما يدل على حسهم البديهي في استخدام الموارد. وعصر الذكاء الاصطناعي ليس استثناءً. عندما تدرك حقًا التكلفة التي يتكبدها الذكاء الاصطناعي لقول جملة واحدة إضافية، فإنك بطبيعة الحال تزن ما إذا كان الأمر يستحق أن يقوم الذكاء الاصطناعي به، وما إذا كانت المهمة تتطلب نموذجًا من الدرجة الأولى أم نموذجًا فعالاً من حيث التكلفة، وما إذا كان السياق لا يزال مناسبًا.

هذا النوع من الاعتبارات هو الأكثر فعالية من حيث التكلفة. في عصر أصبحت فيه القوة الحاسوبية أكثر تكلفة، فإن الاستخدام الأذكى لا يكمن في السماح للذكاء الاصطناعي بأن يحل محل البشر، بل في السماح لكل من الذكاء الاصطناعي والبشر بالقيام بما يتفوقون فيه. عندما تصبح هذه الحساسية تجاه الرموز عملية لا إرادية، فإنك تنتقل فعليًا من كونك تابعًا للحساب إلى أن تصبح سيدًا عليه.

قد يعجبك أيضاً

عمليات اندماج العملات المستقرة: لن يكون هناك "فائز يأخذ كل شيء"

حوار مع مؤسس شركة دايناميك: تعرف على كيفية قيام المحافظ المدمجة والعملات المستقرة بكسر الحواجز التقنية، مما يسمح للشركات بإنشاء "نسخة عالمية من Venmo" في غضون ساعات، وإعادة تشكيل البنية التحتية للدفع التي تبلغ قيمتها تريليون دولار.

الحوثيون يفرضون نقطة تفتيش | موجز أخبار ريواير الصباحي

أكثر من 40 دبلوماسياً أجنبياً يناقشون إعادة فتح طريق التجارة، الولايات المتحدة يرفض الحضور

240 مليار دولار: الغابة المظلمة، سقوط التمويل الحديدي

تمت مرافقة لي شيونغ، العضو الرئيسي في مجموعة برينس، إلى الصين، مما وضع حداً لإمبراطورية مالية سرية كانت تزدهر على تطبيق تيليجرام.

3 حدود التحيات، أين ذهبت حدود كود كلود الخاصة بك؟ خطأ في التخزين المؤقت لمدة 28 يومًا، واستجابة رسمية تشجعك على "استخدامه بحذر."

تتبخر حدود الائتمان للمستخدمين المميزين بمعدل أسرع من 10-20 مرة، والاستجابة الرسمية هي أن تطلب منك استخدامه بحذر أكبر.

كيفية الربح من منصة Polymarket باستخدام الذكاء الاصطناعي؟

بولي ماركت هي المحفظة، وكلود هو العقل، وبيربلكسيتي هي العين

تقرير الصباح | تزيد YZi Labs استثماراتها بشكل استراتيجي في Predict.fun؛ يتعرض بروتوكول Drift لهجوم بخسائر لا تقل عن 200 مليون دولار؛ ينضم بروتوكول الدفع الذكي x402 من Coinbase إلى مؤسسة Linux

نظرة عامة على الأحداث السوقية المهمة في 2 أبريل

العملات الرائجة

أحدث أخبار العملات المشفرة

قراءة المزيد
iconiconiconiconiconiconiconiconicon

برنامج خدمة العملاء@WEEX_support_smart_Bot

خدمات (VIP)support@weex.com