العقود الآجلة
وصول إلى مئات العقود الدائمة
TradFi
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
منصة الإطلاق
كن من الأوائل في الانضمام إلى مشروع التوكن الكبير القادم
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
تشرح هذه الورقة من ستانفورد وهارفارد سبب شعور معظم أنظمة "الذكاء الاصطناعي الوكيلة" بالإعجاب في العروض التقديمية ثم تدهورها تمامًا عند الاستخدام الحقيقي.
اسمها "تكييف الذكاء الاصطناعي الوكيل" وهي أهم ورقة قرأتها هذا العام.
في الوقت الحالي، الجميع مهووس ببناء وكلاء مستقلين. نعطيهم أدوات وذاكرة وهدفًا، ونتوقع منهم أداء مهامنا.
لكن عند نشرهم في العالم الحقيقي، يتوهمون استدعاءات الأدوات. يفشلون في التخطيط على المدى الطويل. يتعطلون.
إليك السبب:
نحاول أن نضغط كل التعلم في دماغ الذكاء الاصطناعي.
عندما يحاول المطورون إصلاح وكيل معطل، عادةً ما يقومون فقط بضبط النموذج الرئيسي لإنتاج إجابات نهائية أفضل.
اكتشف الباحثون عيبًا قاتلًا في هذا النهج.
إذا قمت فقط بمكافأة الذكاء الاصطناعي على الحصول على الإجابة النهائية صحيحة، فإنه يتكاسل.
يتعلم حرفيًا التوقف عن استخدام أدواته. يحاول تخمين الإجابة بدلاً من القيام بالعمل. يتجاهل الآلة الحاسبة ويحاول إجراء الحساب في رأسه.
لإصلاح ذلك، وضع الباحثون إطار عمل جديد مكون من 4 أجزاء لكيفية تعلم الوكلاء فعليًا.
وأهم استنتاج يقلب تمامًا المفهوم الحالي.
بدلاً من إعادة تدريب الدماغ الضخم والمكلف للوكيل باستمرار، فإن الأنظمة الأكثر موثوقية تفعل العكس.
يجمّدون الدماغ. ويقومون بتكييف الأدوات.
يسمونه تكييف الأدوات تحت إشراف الوكيل.