دخلت شركة Cohere الكندية سباق نماذج الذكاء الاصطناعي المؤسسية بخطوة جديدة لافتة، بعدما كشفت عن نموذج Command A+ بوصفه نسخة كبيرة ومرنة صُممت للتعامل مع مهام الاستدلال المعقد، ومعالجة المستندات متعددة الوسائط، وسير العمل الوكيلة التي تعتمد على أدوات وخدمات خارجية.
اللافت في هذا الإصدار لا يقتصر على القدرات التقنية، بل يمتد إلى طريقة توزيعه أيضاً. فالشركة أتاحت أوزان النموذج مجاناً عبر منصة Hugging Face، وطرحتها تحت ترخيص Apache 2.0، وهو تحول مهم في سياسة Cohere التي كانت تميل سابقاً إلى تراخيص أكثر تقييداً للاستخدام التجاري.
هذا التوجه يضع الشركة في قلب نقاش أوسع داخل سوق الذكاء الاصطناعي حول معنى “الانفتاح”، وكيف يمكن للمؤسسات تشغيل نماذج متقدمة داخل بيئاتها الخاصة من دون الاعتماد الكامل على مزود خدمة خارجي أو التضحية بالتحكم في البيانات والأمن والتكلفة.
نموذج ضخم لكن بحجم تشغيل أقل
Command A+ مبني على معمارية Sparse Mixture-of-Experts، وهي بنية تُفعّل جزءاً فقط من النموذج في كل مرة بدل تشغيل جميع أجزائه. ووفق البيانات التي أعلنتها Cohere، يضم النموذج 218 مليار معامل إجمالي، لكن 25 ملياراً فقط تكون نشطة أثناء التوليد في أي لحظة.
هذا الفارق بين الحجم الكلي والحجم الفعلي أثناء التشغيل هو ما يمنح النموذج ميزة واضحة في الكفاءة. فبدلاً من الحاجة إلى موارد حوسبة هائلة لتشغيل كل شيء دفعة واحدة، يوجه النظام الطلب إلى “الخبراء” الأنسب داخله، ما يساعد على خفض استهلاك الذاكرة والطاقة وتحسين سرعة الاستجابة.
وتحاول Cohere من خلال ذلك إثبات أن النماذج الكبيرة لا يجب أن تكون بالضرورة ثقيلة التشغيل أو محصورة داخل بنى سحابية ضخمة. الفكرة الأساسية هي تقديم أداء متقدم يمكن تشغيله في بيئات أكثر مرونة، بما في ذلك الخوادم الداخلية أو البيئات المعزولة التي تفضلها قطاعات مثل المال والصحة والقانون.
الترميز 4 بت يقلص العبء الحسابي
أحد أبرز عناصر Command A+ هو التركيز على الضغط الحاسوبي عبر تقنيات التكميم. ويتوفر النموذج بصيغ 16 بت و8 بت، إضافة إلى صيغة شديدة الضغط 4 بت تحمل اسم W4A4. وتعد هذه الصيغة العنصر التقني الأهم في الإطلاق الجديد.
عادةً ما تواجه النماذج الاستدلالية الكبيرة ما يشبه “ضريبة التكميم”، أي أن تقليل دقة الأوزان يسبب أحياناً تراجعاً ملحوظاً في الأداء. لكن Cohere تقول إنها خففت هذا الأثر عبر تكميم خبراء MoE فقط إلى 4 بت، مع إبقاء مسارات الانتباه الأساسية بدقة كاملة، إلى جانب استخدام أسلوب distillation-aware للتدريب.
والنتيجة، بحسب الشركة، هي ضغط شبه غير مؤذٍ للأداء يسمح بتشغيل النموذج على بطاقة NVIDIA Blackwell B200 واحدة أو على بطاقتي H100 فقط. وهذه نقطة مهمة في سوق ترتفع فيه تكاليف العتاد والقدرة الكهربائية باستمرار.
كما تشير Cohere إلى أن صيغة W4A4 تحقق سرعة إخراج تصل إلى 375 رمزاً في الثانية عند الأحمال المنخفضة، مع زمن وصول أول رمز لا يتجاوز 113 ميلي ثانية، وهو تحسن واضح مقارنة بالنموذج السابق للشركة المخصص للاستدلال.
دعم أفضل للغات العالمية ومن بينها العربية
لم تكتف Cohere بتحسين التشغيل والسرعة، بل أعادت بناء أداة تقسيم النصوص أو Tokenizer لتكون أكثر ملاءمة للاستخدام العالمي. وتقول الشركة إن النظام الجديد يدعم بصورة أصلية 48 لغة.
الأهم أن هذا التحديث يرفع كفاءة التعامل مع اللغات غير الأوروبية، ما يقلل عدد الرموز المطلوبة لإنتاج إجابة بلغات مثل العربية واليابانية والكورية. ووفق الأرقام المعلنة، انخفض عدد الرموز اللازمة في العربية بنسبة 20% تقريباً، وفي اليابانية 18%، وفي الكورية 16%.
هذا النوع من التحسين قد يبدو فنياً للوهلة الأولى، لكنه يحمل أثراً مباشراً على التكلفة. فمعظم أنظمة التسعير والتشغيل في النماذج اللغوية ترتبط بعدد الرموز، ما يعني أن الكفاءة اللغوية يمكن أن تتحول سريعاً إلى وفر مالي ملموس للمؤسسات التي تدير تطبيقات متعددة اللغات.
استدلال مع الاستشهاد بالمصادر
من الجوانب التي تمنح Command A+ قيمة مؤسسية واضحة دعمه لما تسميه Cohere الاستشهادات الأصلية. فعندما يسترجع النموذج معلومة من أداة خارجية أو من قاعدة بيانات أو من مستند داخلي، فإنه لا يقدّم النتيجة فقط، بل يربطها أيضاً بالمصدر الذي استند إليه.
وتصف الشركة هذا السلوك بأنه “مقاطع إسناد” أو grounding spans، أي أجزاء داخل المخرجات تشير مباشرة إلى السطر أو السجل أو الوثيقة التي أنتجت المعلومة. وفي البيئات المنظمة، مثل الخدمات المالية والرعاية الصحية والمجال القانوني، يمكن لهذه الخاصية أن تقلل من مخاطر الهلوسة وتسهّل المراجعة والتدقيق.
بمعنى آخر، لا يعود النموذج مجرد واجهة توليد نصوص، بل يصبح أداة عمل يمكن تتبع نتائجها والتحقق منها، وهو أمر أساسي عندما تستخدمه الفرق لإنتاج تقارير داخلية أو ملخصات أعمال أو إجابات مرتبطة ببيانات حساسة.
نتائج قوية في الرياضيات والمهام الوكيلة
على مستوى الأداء، أعلنت Cohere عن قفزات كبيرة في عدة اختبارات معيارية. ففي اختبار 𝜏²-Bench Telecom ارتفعت النتيجة من 37% إلى 85%، وفي Terminal-Bench Hard قفز الأداء من 3% إلى 25%، بينما سجل النموذج 90% في اختبار AIME 25 للرياضيات المتقدمة، بعد أن كانت النسبة 57% في الجيل السابق.
هذه الأرقام تضع Command A+ ضمن فئة النماذج القوية في الاستدلال الرياضي وبعض مهام الوكالة البرمجية، خصوصاً بالنظر إلى أن عدد المعاملات النشطة فيه أقل بكثير من نماذج أكبر حجماً. ومع ذلك، تبقى المنافسة مفتوحة مع نماذج أخرى في سوق المصدر المفتوح، لا سيما في مهام البرمجة الوكيلة الشاملة وقياس الذكاء العام واسع النطاق.
لكن Cohere تبدو وكأنها تراهن على نقطة مختلفة: ليس فقط من الأقوى نظرياً، بل من الأسهل نشره وتشغيله والتحكم فيه داخل المؤسسات. وهذه المقاربة قد تكون أكثر إقناعاً للمديرين التقنيين الذين يفكرون في التكلفة والأمان وسيادة البيانات قبل التفكير في الأرقام المجردة على لوحات الاختبار.
Apache 2.0 يغير معادلة الاعتماد المؤسسي
إصدار Command A+ تحت ترخيص Apache 2.0 يمثل التحول الأبرز في استراتيجية Cohere. فهذا الترخيص يتيح الاستخدام والتعديل وإعادة التوزيع والتشغيل التجاري من دون قيود غير تجارية، على عكس التراخيص التي تربط الاستفادة من النموذج بشروط إضافية أو استخدامات محددة.
بالنسبة للمطورين والشركات، يعني ذلك قدراً أكبر من الاستقلالية. يمكن لأي جهة تنزيل الأوزان، ثم إعادة تدريب النموذج على بيانات داخلية، ونشره على خوادمها الخاصة أو في بيئات معزولة، من دون الارتباط بواجهة برمجة تطبيقات خارجية أو بتسعير متغير أو بسياسات استخدام قد تتبدل بمرور الوقت.
هذه النقطة تهم المؤسسات التي تضع سيادة البيانات في مرتبة متقدمة، لأنها تتيح لها استخدام نموذج متقدم مع الحفاظ على السيطرة الكاملة على البنية التحتية والمعلومات والتوزيع الداخلي.
ما الذي يعنيه ذلك لسوق الذكاء الاصطناعي المؤسسي؟
إطلاق Command A+ يشير إلى أن سوق الذكاء الاصطناعي المؤسسي دخل مرحلة جديدة، لم يعد فيها كافياً أن يكون النموذج قوياً فقط. المؤسسات تريد اليوم نموذجاً سريعاً، أقل كلفة، متعدد اللغات، قابلاً للتشغيل المحلي، وقادراً على إظهار مصادره بوضوح عند كل إجابة مهمة.
ومن هنا تأتي أهمية الجمع بين البنية الخفيفة نسبياً، والتكميم شبه غير المؤذٍ، ودعم العربية واللغات العالمية، والاستشهادات المدمجة. هذه العناصر مجتمعة تجعل النموذج أقرب إلى أداة إنتاج حقيقية منه إلى مجرد إنجاز بحثي.
وفي سوق ما زالت فيه تكاليف الحوسبة تحدد ما يمكن نشره فعلياً، قد يكون الرهان الأكبر لـ Cohere هو إقناع الشركات بأن الذكاء الاصطناعي المتقدم لا يحتاج دائماً إلى بنية مركزية ضخمة، بل يمكن أن يعمل بكفاءة داخل بيئة المؤسسة نفسها، مع قدر أعلى من التحكم والشفافية.