تتجه سوق الذكاء الاصطناعي في السنوات الأخيرة إلى سباق واضح نحو النماذج الأكبر حجماً، حيث تراهن الشركات الكبرى على زيادة عدد المعاملات وتوسيع البنية التحتية الحاسوبية للحصول على أداء أعلى. لكن هذا المسار ليس الوحيد. فهناك اتجاه آخر يكتسب زخماً بين المختبرات الناشئة والمجتمع المفتوح المصدر، يقوم على بناء نماذج أصغر وأكثر كفاءة وقابلة للتشغيل بتكلفة أقل. في هذا السياق، أعلنت شركة Zyphra عن نموذجها الجديد ZAYA1-8B، وهو نموذج استدلال مفتوح يركز على تحقيق توازن بين الأداء واستهلاك الموارد.
النموذج الجديد يأتي بعدد إجمالي يزيد قليلاً على 8 مليارات معامل، لكن عدد المعاملات النشطة أثناء التشغيل لا يتجاوز نحو 760 مليوناً، وهو رقم منخفض مقارنة بنماذج ضخمة أخرى تعتمد على عشرات أو مئات المليارات. ورغم هذا الحجم المحدود نسبياً، تقول الشركة إن النموذج حقق نتائج تنافسية في اختبارات خارجية أمام نماذج أكبر بكثير في فئات الرياضيات والبرمجة والاستدلال.
ما الذي يميز ZAYA1-8B
أهم ما يلفت الانتباه في ZAYA1-8B ليس فقط كونه نموذجاً مفتوحاً، بل الطريقة التي صُمم بها لتحقيق ما تصفه الشركة بـكثافة الذكاء، أي الحصول على أكبر قدر ممكن من القدرة الاستدلالية من كل معامل وكل وحدة حساب. ويعتمد النموذج على بنية MoE أو الخبراء المتعددين، وهي مقاربة تسمح بتفعيل جزء محدود فقط من النموذج عند معالجة كل جزء من المدخلات، ما يقلل التكلفة الحسابية ويحسن الكفاءة.
هذا التوجه يجعل النموذج مناسباً أكثر للتشغيل المحلي أو على خوادم أقل تكلفة، وهو أمر مهم للشركات التي تريد تقليل الاعتماد على واجهات برمجة التطبيقات السحابية أو الحفاظ على البيانات داخل بيئاتها الخاصة.
تدريب كامل على عتاد AMD
أحد أبرز عناصر الإعلان هو أن ZAYA1-8B تم تدريبه على حزمة كاملة من وحدات AMD Instinct MI300. هذه النقطة تحمل دلالة تتجاوز النموذج نفسه، لأنها تشير إلى إمكانية بناء نماذج متقدمة باستخدام بدائل عملية لهيمنة Nvidia في سوق تدريب الذكاء الاصطناعي.
بالنسبة للمطورين والشركات، فإن نجاح نموذج مفتوح وذي أداء قوي على عتاد AMD قد يدعم تنويع خيارات البنية التحتية مستقبلاً، خصوصاً مع استمرار ارتفاع الطلب على المعالجات المتخصصة. كما يمنح ذلك AMD ورقة مهمة في منافسة سوق تسارع الذكاء الاصطناعي، ليس فقط من زاوية العتاد، بل من زاوية إثبات القدرة على تشغيل تدريب فعلي لنماذج متقدمة.
الابتكارات التقنية داخل النموذج
اعتمدت Zyphra على مجموعة من التعديلات المعمارية لرفع الكفاءة. من بينها آلية انتباه مضغوطة تقلل استهلاك الذاكرة عند التعامل مع سياقات طويلة، وهو ما ينعكس مباشرة على حجم الذاكرة المؤقتة المطلوبة أثناء الاستدلال. وتشير الشركة إلى أن هذا النهج يقلص حجم ذاكرة KV-cache بنحو ثمانية أضعاف مقارنة ببعض صيغ الانتباه التقليدية.
كما استخدمت الشركة موجهاً أكثر تعقيداً لاختيار الخبراء المناسبين بدلاً من الأساليب الأبسط الشائعة في نماذج MoE. وتمت إضافة آلية موازنة مستوحاة من أنظمة التحكم الكلاسيكية للمساعدة في الحفاظ على استقرار التدريب، وهي مشكلة معروفة في هذا النوع من النماذج. كذلك جرى إدخال أسلوب للتحكم في النمو المتراكم للإشارات عبر طبقات النموذج الأربعين، بما يساعد على منع تلاشي التدرجات أو انفجارها.
هذه التفاصيل قد تبدو تقنية جداً، لكنها تصب في نتيجة عملية واضحة: نموذج أصغر يمكنه التعامل مع الاستدلال الطويل بكفاءة أفضل وموارد أقل.
الاستدلال منذ مرحلة ما قبل التدريب
بدلاً من التعامل مع الاستدلال كقدرة تضاف لاحقاً بعد اكتمال التدريب الأساسي، تقول Zyphra إنها أدخلت هذا الجانب منذ البداية في مرحلة ما قبل التدريب. الفكرة هنا أن النموذج لا يتعلم فقط اللغة أو استكمال النص، بل يتعرض مبكراً لأنماط مسائل تعتمد على التفكير المنهجي وربط المقدمات بالنتائج.
وللتعامل مع سلاسل التفكير الطويلة التي قد تتجاوز سعة السياق المتاحة في المراحل الأولى، استخدمت الشركة أسلوباً يحافظ على السؤال والإجابة النهائية مع اختصار الأجزاء الوسطية من مسار التفكير. هذا يسمح للنموذج بتعلم العلاقة بين المشكلة وحلها حتى عندما لا يمكن حفظ كل الخطوات التفصيلية داخل الذاكرة المتاحة في تلك المرحلة.
تقنية Markovian RSA وتقليل تضخم السياق
القفزة الأكبر في الأداء، بحسب الشركة، جاءت من أسلوب أطلقت عليه اسم Markovian RSA. في العادة، عندما يريد المطورون من النموذج أن يقدم إجابات أكثر عمقاً، يتركون له مساحة لإنتاج سلسلة تفكير أطول. لكن هذا يؤدي غالباً إلى تضخم السياق، أي امتلاء النافذة النصية بتفاصيل تجعل النموذج أقل تركيزاً مع مرور الوقت.
النهج الجديد يحاول فصل عمق التفكير عن حجم السياق. وبدلاً من الاحتفاظ بكل خطوات التفكير السابقة، يولد النموذج عدة مسارات استدلالية متوازية، ثم يحتفظ بجزء قصير من نهايات هذه المسارات ويعيد دمجها في مطالبة جديدة للوصول إلى إجابة أفضل. بهذه الطريقة يمكنه مواصلة التحليل من دون أن تتضخم نافذة السياق باستمرار.
وتقول Zyphra إن هذا الأسلوب ساعد النموذج على تحقيق 91.9% في اختبار AIME '25، رغم أن عدد المعاملات النشطة فيه أقل بكثير من نماذج أخرى تفوقه حجماً بعشرات المرات.
أداء تنافسي في الرياضيات والبرمجة
بحسب النتائج التي نشرتها الشركة، سجل ZAYA1-8B 85.58 في اختبار IFEval الخاص باتباع التعليمات، كما حقق 43.12 على مقياس τ² و39.22 على BFCL-v4 في المهام المرتبطة بالأدوات والتفاعل متعدد الخطوات.
وفي سيناريوهات التقييم المباشر من دون وقت إضافي للتفكير، تفوق النموذج على بعض النماذج المفتوحة الصغيرة الأخرى في مهام الرياضيات والبرمجة. وعند تفعيل أسلوب Markovian RSA، ارتفعت نتائجه بشكل لافت، إذ وصل إلى 89.6% في HMMT '25 للرياضيات، متقدماً على نماذج معروفة في هذا النوع من الاختبارات. كما حقق 69.2% في LiveCodeBench للبرمجة، متجاوزاً بعض النماذج المتخصصة في هذا المجال.
مع ذلك، تشير البيانات نفسها إلى أن النموذج لا يزال أقل من النماذج الأكبر في المهام المعتمدة على المعرفة العامة المكثفة واسترجاع المعلومات الواسعة. وهذا يوضح نقطة مهمة في سباق النماذج: يمكن ضغط مهارات الاستدلال بدرجة كبيرة، لكن الذاكرة المعرفية الواسعة ما زالت تستفيد عادة من الحجم الأكبر.
ترخيص مفتوح وفرص للاستخدام التجاري
أطلقت Zyphra النموذج بترخيص Apache 2.0، وهو من التراخيص المفتوحة المرنة التي تسمح باستخدام النموذج وتعديله وتوزيعه داخل التطبيقات التجارية من دون إلزام المطورين بفتح الكود الخاص بهم. هذه الخطوة تعزز جاذبية النموذج للشركات الناشئة والمؤسسات التي تبحث عن أساس تقني قابل للتخصيص مع وضوح قانوني أفضل.
لكن تشغيل ZAYA1-8B يتطلب بعض التهيئة الخاصة، لأن بنيته ليست مطابقة تماماً للمسارات التقليدية في مكتبات التشغيل الشائعة. ولهذا توصي الشركة باستخدام فروع مخصصة من بعض المكتبات الأساسية، إضافة إلى إعدادات تشغيل محددة للتعامل مع الاستدلال واستدعاء الأدوات. وفي البيئات متعددة المعالجات، تنصح الشركة بالاعتماد على التوازي عبر البيانات مع التوازي عبر الخبراء بدلاً من بعض أساليب التوازي الأخرى غير المدعومة حالياً.
لماذا قد يهم هذا السوق
أهمية ZAYA1-8B لا ترتبط فقط بأرقامه، بل بالرسالة التي يحملها للسوق. فالنموذج يقدم دليلاً إضافياً على أن مستقبل الذكاء الاصطناعي قد لا يكون محصوراً في بناء نماذج عملاقة تعتمد على مراكز بيانات هائلة. هناك مسار آخر يقوم على تحسين البنية والخوارزميات وطرق الاستدلال للحصول على نتائج قوية بأحجام أصغر.
هذا المسار مهم خصوصاً للتشغيل المحلي وعلى الحافة، حيث تحتاج الشركات إلى تقليل زمن الاستجابة، والحفاظ على خصوصية البيانات، وخفض تكاليف التشغيل المستمرة. كما أنه مهم للمطورين المستقلين، لأن النماذج الصغيرة المفتوحة تمنحهم فرصة أكبر للتجريب والتخصيص من دون الحاجة إلى ميزانيات ضخمة.
في الوقت نفسه، يضيف الإعلان بُعداً تنافسياً في سوق العتاد، إذ يبين أن منظومة AMD يمكن أن تكون منصة حقيقية لتدريب نماذج متقدمة، وليس مجرد خيار ثانوي. وإذا تبعت ذلك نماذج أخرى بنتائج مماثلة، فقد نشهد تغيراً تدريجياً في توزيع الحصة بين مزودي البنية التحتية للذكاء الاصطناعي.
اتجاه أوسع نحو الكفاءة بدلاً من الحجم فقط
خلف هذا الإطلاق يقف نقاش أوسع داخل القطاع: هل وصلت زيادة الحجم وحدها إلى حدود عائدها العملي؟ كثير من المختبرات ما زال يرى أن التوسع ضروري، لكن نماذج مثل ZAYA1-8B تقدم حجة مختلفة. فالتقدم قد يأتي أيضاً من إدارة أفضل للموارد، وتصميم معماري أكثر ذكاءً، وآليات استدلال تسمح للنموذج بالتفكير بعمق من دون مضاعفة التكلفة على نحو مستمر.
لذلك يمكن النظر إلى ZAYA1-8B باعتباره أكثر من مجرد نموذج جديد. إنه مثال على مرحلة جديدة في تطوير الذكاء الاصطناعي، حيث تصبح الكفاءة، وقابلية النشر، والانفتاح، عناصر أساسية في المنافسة إلى جانب الحجم الخام. وإذا استمر هذا الاتجاه، فقد تتغير الطريقة التي تبني بها الشركات منتجاتها المعتمدة على الذكاء الاصطناعي خلال السنوات المقبلة.