أنثروبيك تطلق Claude Fable 5 وMythos 5 بأداء متقدم في البرمجة والعمل المؤسسي

أعلنت أنثروبيك عن طرح نموذجين جديدين من الذكاء الاصطناعي تحت اسمَي Claude Fable 5 وClaude Mythos 5، في خطوة تمثل أول تعميم واسع لقدرات كانت الشركة قد أبقتها سابقاً ضمن برنامج محدود يركز على الأمن السيبراني وبعض الاستخدامات البحثية الحساسة. ويعكس الإطلاق الجديد اتجاهاً واضحاً لدى الشركة نحو تقديم نماذج أكثر قوة للمؤسسات، مع الحفاظ على طبقات مختلفة من الحماية بحسب طبيعة المستخدم والمجال.

وتضع أنثروبيك Fable 5 في الواجهة بوصفه النموذج الموجّه إلى الجمهور الأوسع والمطورين، بينما تبقى نسخة Mythos 5 أكثر تقييداً من حيث الإتاحة، لكنها تمنح المستخدمين المصرح لهم وصولاً أوسع إلى القدرات الأساسية نفسها. بهذا التقسيم، تحاول الشركة موازنة معادلة أصبحت مركزية في صناعة الذكاء الاصطناعي: كيف يمكن إطلاق نموذج قوي جداً دون فتح الباب بالكامل أمام الاستخدامات عالية المخاطر.

أداء أعلى في البرمجة والمعرفة والرؤية

تقول أنثروبيك إن Fable 5 يتجاوز كل النماذج السابقة التي طرحتها بشكل عام، مع تحسن ملحوظ في مجالات هندسة البرمجيات، والمهام المعرفية، وفهم الصور والرسوم، والبحث العلمي، والمهام الطويلة متعددة الخطوات. ووفقاً للشركة، فإن النموذج الجديد لا يحقق نتائج أفضل في الاختبارات المعيارية فحسب، بل يظهر أيضاً قدرة أكبر على الاستمرار في العمل لفترات أطول من دون تدخل بشري مستمر.

أما Mythos 5 فيمثل النسخة الأكثر انفتاحاً من حيث القدرات داخل نطاق الاستخدامات المصرح بها، إذ ترفع الشركة بعض القيود عنه ليخدم الباحثين والشركاء المعتمدين في مجالات الأمن الحيوي والسيبراني. ومع ذلك، فإن إتاحته تبقى محدودة مقارنةً بـFable 5، الذي صُمم ليكون الواجهة التجارية الأساسية لهذه الفئة الجديدة من النماذج.

اللافت في هذا الإطلاق أن أنثروبيك لا تقدم النموذجين باعتبارهما نسختين مختلفتين جذرياً من حيث الذكاء، بل باعتبارهما طبقتين مختلفتين من الوصول والضبط. الفكرة الأساسية هنا ليست زيادة القدرات فقط، بل التحكم في كيفية استخدامها ومن قبل من.

التسعير يضع النموذج بين الأغلى في السوق

حددت أنثروبيك سعر 10 دولارات لكل مليون رمز إدخال و50 دولاراً لكل مليون رمز إخراج لكل من Fable 5 وMythos 5. ورغم أن الشركة تشير إلى أن هذا السعر أقل من نصف تكلفة النسخة السابقة Mythos Preview، فإنه يظل مرتفعاً جداً مقارنةً بالعديد من النماذج المنافسة في السوق العالمي.

هذا التسعير يوضح أن أنثروبيك تراهن على شريحة من العملاء الذين لا يبحثون عن أرخص نموذج، بل عن نموذج قادر على إنجاز مهام أعقد، حتى لو كان ذلك بسعر أعلى. بالنسبة للمؤسسات، قد يكون الفرق الحقيقي ليس في تكلفة الوحدة فقط، بل في مقدار العمل الذي يمكن للنموذج إنجازه من دون إعادة توجيه أو تصحيح متكرر.

وتوفر الشركة النموذج Fable 5 عبر واجهة Claude API تحت الاسم claude-fable-5، كما أصبح متاحاً أيضاً عبر الموقع والتطبيقات وخطط المؤسسات المعتمدة على الاستهلاك. أما بالنسبة لمشتركي الخطط الشهرية، فقد وضعت الشركة سياسة إطلاق مؤقتة تتيح استخدام النموذج من دون رسوم إضافية لفترة محدودة، قبل أن يتحول إلى نموذج قائم على الاعتمادات.

حماية مدمجة للطلبات الحساسة

أحد أبرز الفروق بين Fable 5 وMythos 5 يتعلق بطريقة التعامل مع الطلبات المصنفة عالية المخاطر. فـFable 5 يضم طبقة جديدة من الضوابط، وإذا رصد النظام طلبات مرتبطة بمجالات مثل الأمن السيبراني أو البيولوجيا أو الكيمياء أو حتى محاولات استخراج قدرات النموذج إلى أنظمة أخرى، فإنه يعيد توجيهها إلى نموذج أقل حساسية هو Claude Opus 4.8. وتقوم المنصة بإبلاغ المستخدم عند حدوث ذلك.

في المقابل، لا يطبق Mythos 5 الآلية نفسها بنفس الدرجة، لأن الوصول إليه أصلاً محكوم بموافقة مسبقة وحالة استخدام محددة. ووفقاً لأنثروبيك، فإن هذا التصميم يتيح لها تقديم نموذج قوي للمستخدمين العاديين من جهة، وتوفير نسخة أكثر مرونة للفرق المتخصصة من جهة أخرى، من دون جعل القدرات الحساسة متاحة للجميع.

وتقول الشركة إن أكثر من 95% من جلسات استخدام Fable 5 لا تحتاج إلى تحويل إلى نموذج آخر، كما تشير إلى أنها أجرت اختبارات داخلية وخارجية مكثفة من دون العثور على طرق اختراق شاملة للضوابط الجديدة. ورغم ذلك، تعترف أنثروبيك بأن هذه الحواجز قد تكون حذرة أكثر من اللازم أحياناً، ما قد يؤدي إلى تصنيف بعض الطلبات المشروعة على أنها حساسة.

قفزة في البرمجة الذاتية والمهام الطويلة

الجانب الأكثر أهمية بالنسبة للمؤسسات يبدو مرتبطاً بالبرمجة. فالشركة تؤكد أن Fable 5 قادر على العمل باستقلالية أكبر ولفترات أطول من النماذج السابقة، وهو ما يجعله أقرب إلى وكيل برمجي فعلي وليس مجرد مساعد لإكمال الأكواد أو الإجابة عن الأسئلة التقنية. هذا التحول مهم لأن كثيراً من فرق الهندسة لا تحتاج فقط إلى اقتراحات سريعة، بل إلى أنظمة تستطيع متابعة مهمة من البداية إلى النهاية.

وفي اختبارات معيارية متقدمة، حقق النموذجان نتائج لافتة. وتذكر أنثروبيك أنهما سجلا 80.3% في اختبار SWE-bench Pro الخاص بمهام هندسة البرمجيات الصعبة، وهو أعلى بكثير من نتائج بعض النماذج المنافسة الحديثة. كما حققا أداء قوياً في قياس آخر يركز على جودة البرمجة الوكيلة والقابلة للصيانة، ما يشير إلى أن التحسن لا يقتصر على إنتاج الشيفرة فقط، بل يمتد إلى تنظيمها والاستمرار في بنائها عبر خطوات متعددة.

وشددت الشركة على أن هذه القدرة قد تترجم عملياً إلى استخدامات مثل ترحيل قواعد البيانات البرمجية، وإعادة هيكلة التطبيقات، وإنشاء الاختبارات، وتصحيح الأخطاء عبر أدوات غير مألوفة، والمراجعة الأولية لطلبات الدمج، وبناء النماذج الأولية للواجهات، وتنفيذ مشاريع داخلية معقدة تتطلب سلسلة من القرارات المتتابعة.

أمثلة من العملاء تعزز رهانات السوق

قدمت أنثروبيك مجموعة من الأمثلة المبكرة من شركاء وشركات تقنية قالت إنها اختبرت Fable 5 في مهام حقيقية. بعض هذه الأمثلة ركز على قدرته على التعامل مع قواعد شيفرة ضخمة، وآخرون أشادوا بقدرته على العمل في مهام طويلة الأفق، مثل بناء تطبيق كامل أو إدارة خطوات متعددة من دون أن يفقد السياق.

هذا النوع من الشهادات مهم لأن السوق لم يعد يقيس النماذج فقط عبر الاختبارات النظرية، بل عبر مدى قدرتها على تقليص وقت العمل في الواقع. بالنسبة لمسؤولي التقنية والمديرين التنفيذيين، السؤال لا يتعلق فقط بما إذا كان النموذج «أذكى»، بل بما إذا كان قادراً على تسريع العمل وتقليل الاعتماد على التدخل اليدوي.

تحسن في تحليل الوثائق والعمل المعرفي

إلى جانب البرمجة، تقول أنثروبيك إن Fable 5 يقدم أداءً أقوى في العمل المعرفي المؤسسي، خصوصاً عند التعامل مع ملفات PDF والجداول والرسوم والمستندات غير المنظمة. هذه نقطة بالغة الأهمية لأن جزءاً كبيراً من العمل داخل الشركات ما يزال يعتمد على ملفات مشتتة وصور وشرائح وعروض وتقارير ونسخ ممسوحة ضوئياً.

وتشير الشركة إلى أن النموذج حقق نتائج أعلى من النماذج السابقة في اختبارات تقيس الفهم البصري للمستندات والقدرة على تفسير الجداول والرسوم واتخاذ قرارات مبنية على معلومات جزئية. وهذا يفتح الباب أمام استخدامات مثل تحليل البيانات المالية، ومراجعة العقود، وقراءة تقارير الأداء، وتجهيز المذكرات التشغيلية، وتنظيم المستندات الداخلية.

كما أبرزت أنثروبيك أمثلة من شركات تعمل في التحليل المالي والتشغيلي والقانوني، قالت إنها لاحظت تحسناً في دقة الاستدلال، وفهم السياق، ومتابعة المشكلات حتى نهايتها. وتكمن أهمية هذه النقطة في أن الذكاء الاصطناعي المؤسسي لم يعد يُطلب منه فقط تلخيص النصوص، بل أيضاً تفسيرها وربطها ببعضها واتخاذ خطوات عملية بناءً عليها.

رؤية أقوى وتفاعل أفضل مع الواجهات

بحسب أنثروبيك، فإن Fable 5 هو أيضاً أقوى نموذج رؤية لديها حتى الآن. ويعني ذلك قدرة أعلى على قراءة الصور، واستخراج البيانات من الأشكال البيانية، والتعامل مع الواجهات البصرية المعقدة، بل وحتى إعادة بناء عناصر تقنية اعتماداً على لقطات الشاشة. هذه القدرة مهمة في بيئات العمل التي لا تعتمد كلياً على واجهات برمجية حديثة، بل ما تزال تستخدم أنظمة قديمة وشاشات ولوحات تحكم وصوراً ومستندات ممسوحة.

وتلمح الشركة إلى أن هذا التطور قد يجعل النماذج أكثر فاعلية في الأتمتة عبر واجهات المستخدم نفسها، من دون الحاجة إلى بناء تكاملات مخصصة في كل مرة. كما تطرح فكرة أن النموذج يستطيع فهم البيئة البصرية، تذكر ما أنجزه، ثم اختيار الخطوة التالية بشكل متسق خلال سلسلة طويلة من التفاعلات.

توازن جديد بين القوة والرقابة

الإطلاق الجديد يكشف بوضوح الطريقة التي تريد أنثروبيك أن تدخل بها المرحلة التالية من الذكاء الاصطناعي: نموذج عام للمستخدمين العاديين، ونسخة أكثر تخصصاً للمجالات الحساسة، مع طبقات رقابة تُفعَّل تلقائياً عندما يصبح الطلب مرتبطاً بالاستخدامات الخطرة. هذا ليس مجرد قرار منتجي، بل نموذج حوكمة أيضاً، وقد يصبح مثالاً تحتذي به شركات أخرى إذا نجح في الواقع.

لكن التحدي سيبقى في التنفيذ. فالمؤسسات ستختبر ليس فقط قوة النموذج، بل أيضاً دقة الضوابط، ونسبة الطلبات التي تُحوَّل خطأً، وتكلفة التشغيل على نطاق واسع، وسياسة الاحتفاظ بالبيانات. وقد أعلنت أنثروبيك بالفعل عن متطلب جديد للاحتفاظ بالبيانات لمدة 30 يوماً على هذه النماذج، وهو ما قد يثير أسئلة لدى الشركات العاملة في قطاعات منظمة.

في المحصلة، يمثل Claude Fable 5 خطوة جديدة في سباق النماذج المؤسسية، بينما يمنح Claude Mythos 5 لمحة عن الطبقة الأعلى من القدرات التي تريد أنثروبيك إبقاءها تحت الضبط الصارم. وبين الاثنين، ترسم الشركة ملامح مرحلة يصبح فيها الذكاء الاصطناعي أكثر قدرة على الإنجاز الذاتي، وأكثر حساسية في الوقت نفسه من حيث الحوكمة والاستخدام.