#Anthropic发布Fable5模型 نموذج، اسمين: أنتروبك تصدر فابل 5 وميثوس 5، أقوى النماذج المتاحة للجمهور لأول مرة


9 يونيو، أطلقت شركة أنتروبك في وقت واحد نموذجين جديدين—كلود فابل 5 وكلود ميثوس 5. ومن المثير للاهتمام، أنهما في الواقع يعتمدون على نفس النموذج الأساسي، مع الاختلاف الوحيد في مدى "حماية السلامة". هذه هي المرة الأولى التي يتوفر فيها نموذج أنتروبك الأكثر قدرة للجمهور، وهي أيضًا تجربة نادرة لـ "إصدار متعدد المستويات".
سيساعدك هذا المقال على فهم: ما الذي يجعله قويًا، ولماذا له اسمين، وكيفية استخدامه الآن.
1. أولاً، توضيح: ما هو نموذج "ميثوس المستوى"؟
هل أنت معتاد على كلود؟ يعرف القراء أن نماذج أنتروبك دائمًا مقسمة إلى ثلاثة مستويات: هايكو (سريع)، سونيت (متوازن)، أوبوس (الأكثر قوة). في أبريل من هذا العام، قدمت أنتروبك بهدوء مستوى جديد فوق أوبوس—مستوى ميثوس. النموذج الأول من مستوى ميثوس (عرض كلود ميثوس) لم يُباع للجمهور مباشرة، بل أُطلق من خلال مشروع يُدعى Project Glasswing، بالتعاون مع الحكومة الأمريكية، وكان متاحًا فقط لعدد محدود من وكالات الأمن السيبراني ومزودي البنية التحتية الحيوية.
السبب بسيط: هذا المستوى من النموذج قوي جدًا، وقادر على سوء الاستخدام في مجالات مثل الهجمات الإلكترونية والأبحاث البيولوجية، لذلك تعتقد أنتروبك أنه لا ينبغي إصداره مباشرة.
النموذجان اللذان تم إصدارهما هذه المرة هما النسختان الرسميتان لمستوى ميثوس:
◆ كلود فابل 5: نسخة مفتوحة للجميع مع مجموعة جديدة من حمايات السلامة؛
◆ كلود ميثوس 5: نسخة مع بعض الحمايات التي تم رفعها، ومتاحة فقط للشركاء الموثوق بهم مثل Glasswing. كلاهما يعتمد على نفس النموذج الأساسي. كما تم اختيار الأسماء بعناية: فابل تأتي من اللاتينية fabula ("قصة تُروى")، وتشارك الجذور مع الميثوس اليوناني—نفس الأصل—وتختلف فقط في "القدرة على التحدث بحرية".
2. كم هو قوي؟
وفقًا لأنتروبك، يتفوق فابل 5 على أي نموذج أطلقته الشركة علنًا من قبل، وهو أحدث ما توصلت إليه التكنولوجيا (SOTA) في معظم معايير الذكاء الاصطناعي، ويتفوق بشكل خاص في هندسة البرمجيات، والعمل المعرفي، والفهم البصري، والبحث العلمي. كلما كانت المهمة أطول وأكثر تعقيدًا، زادت تفوقه على النماذج الأقدم.
البرمجة: يختصر شهرين إلى يوم واحد. أبلغت شركة الدفع Stripe في الاختبارات المبكرة أن فابل 5 أكمل ترحيل كامل لقاعدة بيانات Ruby تحتوي على 50 مليون سطر في يوم واحد—وهو شيء عادةً يستغرق فريقًا أكثر من شهرين من العمل اليدوي. في تقييم Cognition (مطور Devin) لـ FrontierCode، حصل فابل 5 على أعلى الدرجات بين النماذج المتطورة واستخدم عددًا أقل من الرموز.
البصر: يتفوق على Pokémon FireRed بدون مساعدة. كانت نماذج كلود السابقة تحتاج إلى أدوات مساعدة معقدة (خرائط، تنقل، معلومات حالة اللعبة) للتقدم بصعوبة في Pokémon، لكن فابل 5 أنهى اللعبة بمجرد النظر إلى شاشة اللعبة الخام. كما يمكنه إعادة بناء رمز المصدر لتطبيق ويب مباشرة من لقطات الشاشة.
الذاكرة: يدوّن الملاحظات أثناء لعب Slay the Spire. في المهام التي تحتوي على ملايين الرموز، يمكن لفابل 5 الحفاظ على التركيز وتحسين الأداء باستخدام ملاحظاته الخاصة. في اختبارات لعبة الورق Slay the Spire، بعد تزويده بذاكرة مستمرة، تحسن أداؤه ثلاث مرات مقارنة بأوبوس 4.8.
البحث العلمي: يسرع تصميم الأدوية حوالي 10 مرات. استخدم خبراء تصميم البروتين الداخلي في أنتروبك ميثوس 5 لتسريع أجزاء من عمليات تطوير الأدوية بنحو عشرة أضعاف—أنشأت النماذج بشكل مستقل مهامًا مثل اختيار مواقع الربط، وتشغيل أدوات تصميم البروتين، والتعافي من الإخفاقات، كل ذلك بدون مساعدة بشرية. من بين 14 هدف بروتين، أنتج 9 مرشحين واعدين للأدوية لمزيد من التطوير. كما اقترح فرضية ميكانيكية جديدة حول بروتينات E. coli، تم تأكيدها لاحقًا بواسطة مختبر أبحاث مستقل.
3. كيف تعمل حماية السلامة: تؤدي إلى "خفض مستوى" إلى أوبوس 4.8
هذه هي الجانب الأكثر إثارة للاهتمام في الإصدار. فابل 5 مزود بمجموعة جديدة من المصنفات—نظام ذكاء اصطناعي منفصل عن النموذج الرئيسي—مصمم للكشف عن سوء الاستخدام المحتمل. عندما يكتشف المصنف أن طلبك يتضمن أيًا من المجالات الثلاثة الحساسة التالية، لن يأتي الرد من فابل 5 بل سينتقل تلقائيًا إلى نموذج أقل قوة، كلود أوبوس 4.8 (مع تنبيه للمستخدم):
1. الأمن السيبراني: نماذج ميثوس عالية القدرة على اكتشاف واستغلال ثغرات البرمجيات، ويمكنها "الاختراق الذاتي"—الاستطلاع والتنقل الجانبي في حزمة واحدة. تقلل هذه القدرات بشكل كبير من تكلفة الهجمات الإلكترونية، ولهذا السبب يركزون على الدفاع.
2. البيولوجيا والكيمياء: يمكن الآن للنموذج أداء مهام علمية حقيقية (مثل التنبؤ بتجميع غطاء الفيروسات). هذه القدرات ذات الاستخدام المزدوج خطيرة في أيدي خبيثة، لذلك يتم خفض معظم الطلبات في مجال التكنولوجيا الحيوية إلى أوبوس.
3. هجمات التقطير: لمنع "استخراج" قدرات فابل 5 على نطاق واسع لتدريب نماذج منافسة.
الأرقام الرئيسية: يطلق المصنف في أقل من 5% من الجلسات، مما يعني أن أكثر من 95% من المستخدمين يختبرون تقريبًا كامل قدرات ميثوس 5. تعترف أنتروبك أن الحماية محكمة بشكل محافظ وقد تنتج إنذارات كاذبة، وتخطط لتقليل الإنذارات الكاذبة قريبًا. فيما يخص الاختراقات، لم يتم العثور على "اختراق شامل" بعد أكثر من 1000 ساعة من اختبار الثغرات الخارجية.
تغيير آخر ملحوظ: سيتم الاحتفاظ بجميع البيانات من نماذج ميثوس لمدة 30 يومًا (بما في ذلك عملاء المؤسسات) للدفاع ضد طرق هجوم جديدة وعمليات الاختراق—وتعد أنتروبك أن هذه البيانات لن تُستخدم للتدريب ولديها حماية خصوصية مثل تدقيق الوصول.
4. ميثوس 5: نسخة "موثوقة" بدون حمايات
ميثوس 5 هو في الأساس فابل 5 مع بعض الحمايات التي أُزيلت، وتدعي أن لديها أقوى قدرات الأمن السيبراني على مستوى العالم. حاليًا، متاح فقط من خلال مشروع Glasswing لوكالات الأمن السيبراني، كتحديث من عرض ميثوس. تخطط أنتروبك للتوسع تدريجيًا: التفاوض مع الحكومة الأمريكية لزيادة الشركاء؛ إطلاق برنامج وصول موثوق أكثر منهجيًا لمنظمات الأمن السيبراني؛ وفتح خطة أبحاث بيولوجية موثوقة (إزالة حمايات التكنولوجيا الحيوية مع الاحتفاظ بحمايات الأمن السيبراني) لتسريع العلاجات الجديدة. هذا النهج "نفس النموذج، فتح متعدد المستويات حسب الهوية" هو الأول من نوعه في إصدارات الذكاء الاصطناعي المتقدمة.
5. التسعير والوصول: نافذة API مجانية حتى 22 يونيو
تسعير API خلال النافذة المجانية: 10 دولارات لكل مليون رمز للإدخال، و50 دولارًا لكل مليون رمز للإخراج—أقل من نصف عرض ميثوس المسبق. معرف النموذج هو claude-fable-5، وخطط API والدفع حسب الاستخدام متاحة بدءًا من اليوم. يجب على المشتركين ملاحظة:
◆ من الآن وحتى 22 يونيو: حزم Pro، Max، Team، والمؤسسات تتضمن فابل 5 مجانًا؛
◆ بدءًا من 23 يونيو: سيتم إزالته من الحزم، وسيحتاج الاستخدام المستمر إلى شراء أرصدة الاستخدام؛ إذا سمح السعة، قد يتم تمديد النافذة المجانية؛
◆ بعد ذلك: مع توافر القدرة الحاسوبية، تخطط أنتروبك لإعادة دمج فابل 5 في حزم الاشتراك القياسية. بمعنى آخر، الأسبوعان المقبلان هما أفضل فرصة لتجربة النموذج الأقوى مجانًا، لذا يجب على القراء المهتمين اغتنام الفرصة.
6. الأفكار النهائية: "نهج جديد" للقدرة والسلامة
في السنوات الأخيرة، واجهت مختبرات الطليعة خيارين فقط لـ "ماذا لو كان النموذج قويًا جدًا": تأخير الإصدار أو تقليل القدرات. تقدم أنتروبك حلاً ثالثًا—إصدار كامل مع حمايات ديناميكية للنسخة العامة، مع الاحتفاظ بالإصدار الكامل للمؤسسات الموثوقة.
هذا النهج ليس مثاليًا: قد تزعج بعض المستخدمين المحترفين (خصوصًا الباحثين الأمنيين والأحياء) نسبة 5% من الإنذارات الكاذبة، وقد يثير الاحتفاظ بالبيانات لمدة 30 يومًا مخاوف تتعلق بالخصوصية. لكنه يسمح بـ "أقوى قدرة" ألا تكون محجوبة خلف مشاريع حكومية، بل تدخل حوار الجميع بطريقة مراقبة. عندما يمكن للذكاء الاصطناعي إكمال شهرين من جهود الفريق في يوم واحد، أو تصميم مرشحين للأدوية البروتينية بشكل مستقل، يصبح "كيفية الإصدار" بنفس أهمية "ماذا نبني". قد تضع الجذور المشتركة بين فابل وميثوس سابقة لاستراتيجيات إصدار النماذج المستقبلية في مجال الطليعة.
شاهد النسخة الأصلية
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت