تحليل Berkeley GEPA: يمكن للذكاء الاصطناعي تعلم مهام جديدة دون تحديث الأوزان، بتكلفة تدريب أقل بـ35 مرة مقارنة بالتعلم التعزيزي (RL)

قدّمت فرق بحثية من جامعة كاليفورنيا في بيركلي طريقة جديدة لتدريب نماذج الذكاء الاصطناعي؛ حيث تم قبول GEPA في ICLR 2026 كبحث Oral. لا تقوم GEPA بتحديث أوزان النموذج ولا تتطلب تدريبًا على وحدات معالجة الرسوميات (GPU)، بل تستخدم LLM واحدًا “يقوم بقراءة سجلات التدريب” لإعادة كتابة مطالبات نظام الذكاء الاصطناعي بشكل متكرر، ما يتيح التفوق بمتوسط 6% على أساليب التعلم المعزز السائدة في 6 مهام، مع تحقيق تفوقٍ يصل إلى 20%، وبتراجع عدد محاولات التدريب المطلوبة (rollouts) بمقدار 35 مرة. بعد أن قامت مجتمعات هندسة الذكاء الاصطناعي بتنظيم نتائج البحث ونشرها، أثارت نقاشًا على منصة X، وقد تم دمجها حاليًا في DSPy كمحسّن من الدرجة الأولى.

GEPA ما الذي تفعله: تحويل سجلات التدريب إلى مواد تعليمية بدل الاكتفاء بالنظر إلى الدرجات

تتمثل سير العمل في طرق التعلم المعزز التقليدية (مثل GRPO) في: جعل الذكاء الاصطناعي ينفّذ المهمة مرة واحدة، ثم إعطاء درجة “+1 أو -1” بناءً على النتائج، وبعدها تعديل أوزان النموذج بشكل متكرر باستخدام هذه الدرجة. المشكلة هي أن تشغيل الذكاء الاصطناعي للمهمة مرة واحدة غالبًا ما يتضمن خطوات استدلال تصل إلى آلاف الرموز (tokens)، واستدعاءات للأدوات، ورسائل أخطاء—وكل هذه التفاصيل الغنية يتم ضغطها في درجة واحدة، بينما تُهمل معلومات العملية. لذلك يحتاج التعلم المعزز إلى تكرار التشغيل لآلاف المرات حتى يصل إلى التقارب.

نهج GEPA عكس ذلك: بعد أن ينهي الذكاء الاصطناعي المهمة في كل مرة، يقوم بتسليم كامل تسلسل العملية (الاستدلال، استدعاءات الأدوات، سجلات الإبلاغ عن الأخطاء) حرفيًا إلى LLM آخر “يقوم بالتأمل” ليقرأه. يقوم LLM الخاص بالتأمل بدور مهندس معماري يقرأ سجلات التشغيل (log)؛ إذ يحدد أين وقع الخطأ، ولماذا وقع، وكيف ينبغي تعديل المطالبات، ثم يعيد كتابة المطالبات الخاصة بذلك الجزء مباشرة. في النهاية، رغم أن تشغيل المهمة يتم مرة واحدة فقط، فإن كمية الإشارة التي تستخلصها GEPA تكون أكبر بكثير من الدرجة الواحدة التي يحصل عليها التعلم المعزز.

لماذا تُحقق نتائج أفضل: تحويل “إعطاء الدرجة” إلى “قراءة كامل تسلسل العملية”

تتفوق GEPA في 6 مهام على GRPO بمتوسط 6%، وبحد أقصى 20%. وبالمقارنة مع مُحسّن مطالبات رئيسي آخر MIPROv2، فإنها تتفوق أيضًا بأكثر من 10% (مع تحسن 12% على معيار المسائل الرياضية AIME-2025). والأهم من ذلك هو تكلفة التدريب: للوصول إلى أداء مماثل، تحتاج GEPA إلى عدد rollouts (تشغيل كامل للمهمة) أقل بمقدار 35 مرة.

ومن بيانات أخرى أيضًا: بعد دمج GEPA مع DSPy، يمكن لـ “Full Program Adapter” تحسين كامل برنامج DSPy (بما في ذلك signature والأجزاء والمخطط التحكمي)، وعند معيار الرياضيات MATH تحقق GEPA نسبة دقة تبلغ 93%، متجاوزة بشكل كبير طريقة ChainOfThought الأصلية في DSPy التي بلغت 67%. كما تُظهر GEPA أداءً ممتازًا بشكل خاص في سير عمل متعدد الوحدات (agents متعددة الوحدات مترابطة)—إذ يمكنها بدقة تحديد وحدة بعينها عند حدوث خطأ وإعادة كتابة مطالباتها، بدلًا من ضبط النظام بالكامل.

من سيبدأ بالاستفادة أولًا: DSPy كمواطن من الدرجة الأولى، وGitHub مفتوح المصدر

تم نشر كود GEPA مفتوحًا على GitHub، وتم دمجه ضمن إطار عمل DSPy بصيغة dspy.GEPA، كما تم نشره بشكل مستقل كمكتبة Python. يضم فريق البحث باحثين عبر مؤسسات مثل UC Berkeley وStanford وNotre Dame وAnthropic وغيرها، ومن بين مؤلفي الورقة Matei Zaharia (المؤسس المشارك لـ Databricks، وهو المؤلف الرئيسي لـ DSPy) وOmar Khattab (المؤلف الرئيسي لـ DSPy).

بالنسبة لمجتمع المطورين، تقدم GEPA حلًا جديدًا لمعضلة “لدينا عدد كبير من rollouts لكننا لا نعرف كيفية الاستفادة منها”—إذ إن معظم الفرق قد راكمت عشرات الآلاف من سجلات تشغيل الـ agents للمهام، لكن بخلاف تصفح بضع سجلات عند حدوث خطأ لمعرفة سبب الخلل، لا توجد طريقة منهجية لتحويل هذه السجلات إلى تحسينات في النموذج. الملاحظة التالية تتمثل في مدى تطبيق GEPA فعليًا داخل سير عمل agents على مستوى الشركات (مثل أتمتة خدمة العملاء، أو الإصلاح التلقائي للبرمجيات)، وما إذا كانت ستظهر تطبيقات مناظر لـ GEPA خارج إطار DSPy.

ظهر تحليل Berkeley GEPA: لا تُحدِّث الأوزان لكي يتعلم الذكاء الاصطناعي مهمة جديدة، بتكلفة تدريب أقل 35 مرة مقارنةً بالتعلم المعزز—بأول مرة على موقع سلسلة الأخبار ABMedia.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

مُنصة MoonPay تطلق بطاقة MoonAgents، وهي ماستركارد افتراضية لوكلاء الذكاء الاصطناعي، يوم الجمعة

ووفقاً لما ذكرته The Block، أطلقت MoonPay بطاقة MoonAgents Card، وهي بطاقة خصم افتراضية من ماستركارد، يوم الجمعة. صُممت البطاقة لتخدم كلًا من وكلاء الذكاء الاصطناعي والمستخدمين، إذ تحوّل العملات المستقرة إلى عملة ورقية عند نقطة الدفع، وتمكّن من الإنفاق لدى أي تاجر عبر الإنترنت في أنحاء العالم يقبل ماستركارد. البطاقة هي

GateNewsمنذ 4 س

أطلقت OpenAI «Codex Pets»، رفيقًا افتراضيًا مدعومًا بالذكاء الاصطناعي مع توليد مخصص

بحسب Beating، أضافت OpenAI ميزة جديدة بعنوان "Codex Pets" إلى تطبيق Codex لسطح المكتب، تتيح للمستخدمين إنشاء رفيق افتراضي متحرك والتفاعل معه. يمكن للمستخدم تفعيل حيوان أليف عبر كتابة /pet في المحرر. تعمل هذه الميزة كمؤشر لحالة الوكيل، وتعرض

GateNewsمنذ 13 س

يطلق MoonPay بطاقة MoonAgents لوكلاء الذكاء الاصطناعي على شبكة Mastercard

وفقاً لـ The Block، أطلقت MoonPay MoonAgents Card يوم الجمعة، وهي بطاقة خصم رقمية من ماستركارد تحوّل العملات المستقرة إلى عملات ورقية فوراً في الوقت الحقيقي عند نقطة الدفع. تُصدر البطاقة عبر Monavate، وهي منصة مدفوعات منظمة وعضو رئيسي في Mastercard، بالشراكة مع Exodus M

GateNewsمنذ 17 س

تطلق xAI واجهة برمجة تطبيقات لاستنساخ الصوت تدعم أكثر من 80 صوتاً عبر 28 لغة

وفقاً لـPANews، أطلقت xAI واجهة برمجة تطبيقات استنساخ الصوت في 2 مايو، ما يتيح للمستخدمين إنشاء أصوات مخصصة خلال حوالي دقيقتين أو الاختيار من بين أكثر من 80 صوتاً مُعداً مسبقاً تمتد على 28 لغة لتطبيقات تشمل المساعدات الصوتية والكتب الصوتية وشخصيات الألعاب. وتأتي هذه الميزة حالياً

GateNewsمنذ 17 س

يطلق MoonPay بطاقة MoonAgents، وهي ماستركارد افتراضية لوكلاء الذكاء الاصطناعي والمستخدمين، يوم الجمعة

بحسب The Block، أطلقت MoonPay بطاقة MoonAgents Card، وهي بطاقة خصم رقمية من ماستركارد لوكلاء الذكاء الاصطناعي والمستخدمين، يوم الجمعة. تحوّل البطاقة العملات المستقرة إلى عملات ورقية عند نقطة الدفع ويمكن استخدامها لدى أي تاجر عبر الإنترنت في جميع أنحاء العالم يقبل ماستركارد. وتُصدر البطاقة عبر Monavate، وهي جهة مدفوعات منظَّمة

GateNews05-01 15:41

MoonPay تطلق بطاقة MoonAgents على شبكة Mastercard يوم الجمعة

بحسب The Block، أطلقت MoonPay بطاقة MoonAgents Card يوم الجمعة، وهي بطاقة خصم افتراضية من نوع Mastercard تُمكّن وكلاء الذكاء الاصطناعي والمستخدمين من إنفاق العملات المستقرة مباشرةً من محافظ onchain. تُصدر البطاقة عبر Monavate، وهي منصة مدفوعات عالمية منظّمة وعضو رئيسي في Mastercard، في

GateNews05-01 13:01
تعليق
0/400
لا توجد تعليقات