تشرح هذه الورقة من ستانفورد وهارفارد سبب شعور معظم أنظمة "الذكاء الاصطناعي الوكيلة" بالإعجاب في العروض التقديمية ثم تدهورها تمامًا عند الاستخدام الحقيقي.


اسمها "تكييف الذكاء الاصطناعي الوكيل" وهي أهم ورقة قرأتها هذا العام.
في الوقت الحالي، الجميع مهووس ببناء وكلاء مستقلين. نعطيهم أدوات وذاكرة وهدفًا، ونتوقع منهم أداء مهامنا.
لكن عند نشرهم في العالم الحقيقي، يتوهمون استدعاءات الأدوات. يفشلون في التخطيط على المدى الطويل. يتعطلون.
إليك السبب:
نحاول أن نضغط كل التعلم في دماغ الذكاء الاصطناعي.
عندما يحاول المطورون إصلاح وكيل معطل، عادةً ما يقومون فقط بضبط النموذج الرئيسي لإنتاج إجابات نهائية أفضل.
اكتشف الباحثون عيبًا قاتلًا في هذا النهج.
إذا قمت فقط بمكافأة الذكاء الاصطناعي على الحصول على الإجابة النهائية صحيحة، فإنه يتكاسل.
يتعلم حرفيًا التوقف عن استخدام أدواته. يحاول تخمين الإجابة بدلاً من القيام بالعمل. يتجاهل الآلة الحاسبة ويحاول إجراء الحساب في رأسه.
لإصلاح ذلك، وضع الباحثون إطار عمل جديد مكون من 4 أجزاء لكيفية تعلم الوكلاء فعليًا.
وأهم استنتاج يقلب تمامًا المفهوم الحالي.
بدلاً من إعادة تدريب الدماغ الضخم والمكلف للوكيل باستمرار، فإن الأنظمة الأكثر موثوقية تفعل العكس.
يجمّدون الدماغ. ويقومون بتكييف الأدوات.
يسمونه تكييف الأدوات تحت إشراف الوكيل.
شاهد النسخة الأصلية
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.21Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.27Kعدد الحائزين:2
    0.24%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.15%
  • تثبيت