علي بابا تطلق Qwen3.7-Plus متعدد الوسائط بسعر منخفض عبر API مغلق

أعلنت علي بابا عن أحدث نماذجها اللغوية Qwen3.7-Plus، في خطوة تعكس استمرار المنافسة المحتدمة في سوق الذكاء الاصطناعي متعدد الوسائط. ويأتي النموذج الجديد بقدرات تتجاوز النصوص التقليدية، إذ يستطيع التعامل مع الصور والفيديو ولقطات الشاشة، إلى جانب دعم التفاعل النصي المعتاد، مع خفض واضح في الكلفة مقارنة بالإصدار السابق Qwen3.7-Max.

ورغم هذا التقدم التقني، فإن النموذج لا يتبع النهج المفتوح الذي اشتهرت به بعض إصدارات عائلة Qwen خلال الفترة الماضية. فالإتاحة الحالية تتم فقط عبر واجهات برمجة التطبيقات التجارية الخاصة بعلي بابا وضمن منصة Qwen Chat، ما يعني أن المؤسسات لا تستطيع تنزيل الأوزان وتشغيله محلياً داخل بيئاتها الخاصة.

هذه المقاربة تمثل تحولاً مهماً في استراتيجية الشركة، التي بنت جزءاً كبيراً من حضورها العالمي على نماذج مفتوحة جذبت مطورين وشركات كبرى. لكن التحول إلى نموذج مغلق يشير إلى أن علي بابا باتت تراهن على تحقيق توازن بين الانتشار التقني والعائد التجاري، خصوصاً مع تصاعد الطلب على النماذج القادرة على تنفيذ مهام معقدة في بيئات الأعمال.

قدرات متعددة الوسائط وتكلفة أقل

الميزة الأبرز في Qwen3.7-Plus هي دعمه المتعدد للمدخلات، إذ لا يقتصر على فهم النصوص بل يمتد إلى تحليل الصور والفيديو وواجهات الاستخدام. هذا يجعله مناسباً لمهام مثل تفسير الشاشات، قراءة المستندات المصورة، تحليل لقطات العمل، أو مساعدة الأنظمة المؤتمتة التي تحتاج إلى فهم السياق البصري إلى جانب اللغة.

ومن ناحية التسعير، حددت علي بابا كلفة الإدخال عند 0.40 دولار لكل مليون رمز، بينما يبلغ سعر الإخراج 1.60 دولار لكل مليون رمز. ويضع ذلك Qwen3.7-Plus ضمن فئة النماذج القوية منخفضة الكلفة نسبياً، خاصة إذا ما قورن بنماذج أخرى أعلى سعراً في السوق. كما أن الشركة توفر سعراً أقل بكثير للبيانات المخزنة مؤقتاً، ما يمنح الشركات فرصة خفض الفاتورة في حالات الاستخدام المتكررة.

هذا النوع من التسعير مهم للمؤسسات التي تعتمد على سلاسل عمل طويلة ومتعددة الخطوات، مثل الأتمتة البرمجية، والتحقق من جودة المحتوى، وتحليل البيانات، وتشغيل الوكلاء الذكيين. فكلما زاد عدد الاستدعاءات داخل سير العمل، أصبحت تكلفة الاستنتاج عاملاً حاسماً في قرار التبني.

ذاكرة أطول ومعالجة أعمق

يمتلك النموذج نافذة سياق تصل إلى مليون رمز، وهي سعة كبيرة تسمح له باستيعاب كميات ضخمة من المعلومات في جلسة واحدة. كما يخصص جزءاً من هذه السعة لعمليات التفكير الداخلي، ما يساعده على التعامل مع المهام الطويلة والمعقدة دون فقدان التسلسل المنطقي أثناء التنفيذ.

وتكتسب هذه السعة أهمية خاصة في بيئات الوكلاء الذكيين، حيث لا يكفي أن يفهم النموذج السؤال الأول فقط، بل يجب أن يحافظ على اتساق قراراته عبر عدة خطوات متتالية. وهنا يظهر عنصر يسمى preserve_thinking، وهو إعداد يسمح بالحفاظ على مسارات التفكير الداخلية بين الجولات الحوارية المتتابعة.

عملياً، يفيد هذا الإعداد في تقليل ما يعرف بتآكل الحالة، أي فقدان النموذج لتفاصيل المهمة أثناء تنفيذ عمليات طويلة. ففي مشاريع مثل الترحيل السحابي، أو التعامل مع قواعد بيانات ضخمة، أو تنفيذ أوامر برمجية متسلسلة، يحتاج النظام إلى ذاكرة تشغيلية مرنة تمنعه من إعادة الحساب أو نسيان الخطوة السابقة.

وتشير هذه الخاصية أيضاً إلى تطور أوسع في الصناعة، حيث تسعى مختبرات الذكاء الاصطناعي الكبرى إلى بناء نماذج قادرة على الاستمرار في التفكير عبر سلسلة من الأدوات والاستدعاءات، وليس مجرد إنتاج رد فوري على سؤال منفرد.

أداء تنافسي في الاختبارات

على مستوى الاختبارات المعيارية، حقق Qwen3.7-Plus نتائج لافتة في بعض المجالات، خاصة تلك المرتبطة بالتفاعل مع الطرفيات والواجهات البصرية. ففي اختبار Terminal Bench 2.0-Terminus سجل 70.3 نقطة، متقدماً على عدد من النماذج المنافسة في هذا النوع من المهام. كما سجل 79.0 نقطة في اختبار ScreenSpot Pro، وهو معيار يقيس قدرة النموذج على فهم الواجهات المحلية والتعامل مع العناصر المعروضة على الشاشة.

هذه النتائج تعني أن النموذج ليس مجرد أداة لغوية تقليدية، بل منصة قادرة على تنفيذ مهام عملية تتطلب قراءة بصرية، وتفسيراً تعليمياً، واستجابة برمجية في آن واحد. ومع ذلك، فإن الأداء العام لا يضعه في صدارة السوق بشكل مطلق، إذ ما تزال بعض النماذج الأمريكية المنافسة تتفوق عليه في اختبارات معينة.

لكن في سوق الذكاء الاصطناعي الحالي، لا تقاس القيمة بالنتائج وحدها، بل أيضاً بمزيج الأداء مقابل التكلفة. ومن هذه الزاوية، يبدو Qwen3.7-Plus منافساً مغرياً للشركات التي تحتاج إلى قدرات قوية دون تكلفة تشغيلية مرتفعة.

ماذا يعني ذلك للشركات؟

بالنسبة للفرق التقنية، قد يكون السؤال الأهم هو: أين يوضع هذا النموذج داخل البنية الحالية؟ الإجابة الأقرب أنه موجه ليكون بديلاً اقتصادياً لبعض النماذج الرائدة في الاستخدامات المتكررة التي تعتمد على الأتمتة، وتحليل الواجهات، واستخراج البيانات، وكتابة الشيفرات.

كما أن توافقه مع واجهات قريبة من أنظمة OpenAI يسهل عملية الدمج، ما يقلل الحاجة إلى تغييرات جذرية في البنية التحتية. وهذا عامل مهم للشركات التي تعتمد بالفعل على سير عمل مؤتمتة أو أدوات مبنية على وكلاء ذكاء اصطناعي وتبحث عن خفض التكاليف من دون إعادة بناء المنظومة من الصفر.

في المقابل، يفرض النموذج المغلق أسئلة تتعلق بالامتثال وحوكمة البيانات. فعدم إمكانية تشغيله محلياً يعني أن كل عمليات الاستدلال تمر عبر سحابة علي بابا، وهو ما قد لا يناسب المؤسسات العاملة في قطاعات حساسة أو تلك التي تلتزم بقواعد صارمة بشأن سيادة البيانات ومكان تخزينها ومعالجتها.

لذلك، قد يجد بعض العملاء في Qwen3.7-Plus خياراً مثالياً للمهام السحابية العامة، بينما تفضل مؤسسات أخرى البقاء مع نماذج مفتوحة تمنحها سيطرة أكبر على البيانات والبنية التنفيذية. وفي الحالتين، يعكس إطلاق النموذج الجديد اتجاهاً واضحاً في السوق: لم يعد العامل الحاسم هو الذكاء الخام فقط، بل القدرة على تقديم أداء متعدد الوسائط بأسعار قابلة للتوسع في بيئات الإنتاج.

ومع استمرار اشتداد المنافسة بين الشركات الصينية والأمريكية في الذكاء الاصطناعي التوليدي، يبدو أن Qwen3.7-Plus يضيف ورقة جديدة إلى معادلة السوق: نموذج قوي نسبياً، متعدد الوسائط، ومخفض التكلفة، لكن ضمن إطار تجاري مغلق يغير قواعد اللعبة بالنسبة لمستخدمي Qwen القدامى.