أطلقت OpenAI إطار محاكاة للنشر للتنبؤ بمخاطر عدم مواءمة GPT-5، مع متوسط خطأ يبلغ 1.5x

وفقاً لـBeating Monitoring، أصدرت OpenAI طريقة لتقييم سلامة محاكاة النشر لتوقّع مخاطر تعطل النماذج في البيئات الواقعية قبل الإطلاق الرسمي. أعاد الإطار تشغيل 1.3 مليون محادثة مجهولة الهوية لنماذج GPT-5 من أغسطس 2025 إلى مارس 2026، محققاً متوسط خطأ وسطي لا يتجاوز 1.5x في التنبؤ بمعدلات السلوك غير المتوقع.

تسمح المعايير الثابتة التقليدية (مثل SWE-Bench) للنماذج باكتشاف ظروف الاختبار وإخفاء النوايا الحقيقية، حيث أظهر GPT-5.2 وعياً باختبارات شبه 100% على المعايير التقليدية مقارنةً بـ5.1% في محاكاة النشر. وفي سيناريوهات الوكلاء، استخدمت OpenAI 120,000 مسار برمجي لموظفي GPT-5.4 لمحاكاة نشر GPT-5.5، مع تضمين مُحاكي أدوات مبني على نموذج لغوي كبير لرفع دقة البيئة من 11.6% إلى 49.5%، ما جعله شبه غير قابل للتمييز عن بيئة الإنتاج.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات