SubQ يثير جدلاً حول كفاءة الذكاء الاصطناعي

أطلقت شركة Subquadratic الناشئة من ميامي نموذجاً لغوياً جديداً باسم SubQ 1M-Preview، وقالت إنه يعتمد على بنية مختلفة عن النماذج الشائعة في سوق الذكاء الاصطناعي. جوهر هذا الإعلان هو أن كلفة المعالجة لا ترتفع بالطريقة نفسها التي ترتفع بها في نماذج المحولات التقليدية، بل تنمو بصورة أقرب إلى الخطية مع زيادة طول السياق. وإذا ثبتت هذه المزاعم عملياً، فقد يعني ذلك تغييراً مهماً في طريقة بناء الأنظمة الذكية وتشغيلها.

لكن الإعلان لم يُستقبل على أنه اختراق محسوم. فبينما أبدى بعض الباحثين اهتماماً واضحاً، طالب آخرون بأدلة مستقلة ونتائج أوسع قبل التعامل مع الأرقام المنشورة باعتبارها حقيقة نهائية. وهذا التباين مفهوم، لأن الشركة لا تتحدث عن تحسين محدود، بل عن خفض كبير جداً في كلفة الانتباه عند التعامل مع سياقات طويلة للغاية.

لماذا تمثل مشكلة التوسع التربيعي عقبة رئيسية

معظم النماذج اللغوية الحديثة تعتمد على آلية تعرف باسم الانتباه. في هذا الأسلوب، تتم مقارنة كل جزء من النص بأجزاء كثيرة أخرى لفهم العلاقات بينها. المشكلة أن عدد هذه المقارنات يرتفع بسرعة كبيرة كلما طال الإدخال. عملياً، مضاعفة طول النص لا تؤدي إلى مضاعفة الكلفة فقط، بل قد تجعلها أعلى بكثير.

هذه المشكلة أثرت مباشرة في اقتصاديات الذكاء الاصطناعي. فعلى الرغم من أن بعض النماذج باتت تعلن عن نوافذ سياق ضخمة، فإن الاستفادة الفعلية من هذا الحجم تظل مكلفة وصعبة. ولهذا ظهرت طبقات كاملة من الحلول المساندة مثل أنظمة الاسترجاع، وتقسيم المستندات إلى أجزاء، وبناء مسارات معقدة لاختيار المعلومات الأكثر صلة قبل إرسالها إلى النموذج.

بمعنى آخر، كثير من البنية التحتية الحديثة في تطبيقات الذكاء الاصطناعي ليست مجرد إضافة لتحسين الأداء، بل محاولة للالتفاف على قيد أساسي في طريقة عمل النماذج نفسها.

ما الذي تدعي Subquadratic أنها حلته

تقول الشركة إن نموذجها يعتمد على أسلوب تسميه الانتباه المتناثر دون التربيعي، وهو نهج يقوم على فكرة بسيطة نظرياً: ليس من الضروري حساب جميع المقارنات بين كل الرموز النصية وكل ما يجاورها أو يبعد عنها داخل السياق الطويل. بدلاً من ذلك، يحاول النموذج تحديد المقارنات المهمة فقط، ثم يوجه الحوسبة نحوها.

الفارق هنا أن الاختيار لا يعتمد فقط على مواقع ثابتة داخل النص، بل على معنى المحتوى نفسه. ووفقاً لوصف الشركة، يسمح هذا للنموذج بالوصول إلى معلومات بعيدة داخل سياق طويل جداً من دون دفع الكلفة الكاملة التي تفرضها البنية التقليدية.

وتقول Subquadratic إن هذا النهج يحقق مكاسب متزايدة كلما ازداد طول السياق. فعند أحجام كبيرة جداً، تزعم الشركة أن كلفة الانتباه يمكن أن تنخفض بما يقارب 1000 مرة مقارنة ببعض النماذج المتقدمة الحالية. كما تشير إلى أن نموذجها يمكنه التعامل مع ما يصل إلى 12 مليون رمز في السياق، وهو رقم لافت إذا كان قابلاً للاستخدام العملي وليس مجرد حد نظري.

منتجات جديدة وتمويل مبكر كبير

بالتزامن مع الإعلان عن النموذج، كشفت الشركة عن ثلاثة منتجات في مرحلة تجريبية خاصة: واجهة برمجة تطبيقات توفر نافذة السياق الكاملة، وأداة برمجية موجهة للمطورين باسم SubQ Code، وأداة بحث باسم SubQ Search. هذا التوسع السريع في المنتجات يوحي بأن الشركة لا تريد تقديم نفسها كمختبر أبحاث فقط، بل كمزود تقنيات جاهزة للاستخدام التجاري.

كما حصلت الشركة على تمويل تأسيسي بقيمة 29 مليون دولار، في جولة استثمارية قيل إنها منحتها تقييماً يقارب 500 مليون دولار. هذا التقييم المرتفع لشركة ما زالت في مرحلة مبكرة يعكس رهانات واضحة على أن معالجة مشكلة السياق الطويل قد تفتح سوقاً كبيرة في البرمجيات والبحث والتحليل المؤسسي.

الأرقام المنشورة تبدو قوية لكن الصورة ليست مكتملة

قدمت الشركة مجموعة من النتائج المعيارية التي تركز على البرمجة واسترجاع المعلومات من سياقات طويلة. وبحسب الأرقام التي نشرتها، حقق النموذج أداءً تنافسياً أو متقدماً في اختبارات مثل SWE-Bench Verified وRULER وMRCR v2. في بعض هذه الاختبارات، ظهر النموذج قريباً من أفضل النماذج المعروفة أو متفوقاً عليها في مهام محددة.

مع ذلك، فإن اختيار هذه الاختبارات أثار ملاحظات مهمة. فهي تركز على الجوانب التي يفترض أن يستفيد فيها هذا النوع من البنية أكثر من غيرها، أي فهم السياق الطويل والبحث داخل كتل ضخمة من النصوص. لكن الشركة لم تنشر حتى الآن تقييماً واسعاً يشمل مجالات أخرى مثل الرياضيات، والاستدلال العام، والأداء متعدد اللغات، والسلامة، وثبات الإجابات.

هناك أيضاً نقطة لافتة تتعلق بالفجوة بين نتائج البحث ونتائج المنتج الفعلي. ففي أحد الاختبارات، سجلت النسخة البحثية نتيجة أعلى بكثير من النسخة الإنتاجية التي تم التحقق منها من طرف خارجي. هذه الفجوة لا تعني بالضرورة أن التقنية غير فعالة، لكنها تطرح أسئلة عن مدى انتقال الأداء من المختبر إلى الخدمة الفعلية.

الجدل داخل المجتمع البحثي

الردود على الإعلان انقسمت بسرعة إلى معسكرين. الأول يرى أن الفكرة معقولة من حيث الاتجاه العام، لأن السوق يبحث منذ سنوات عن بدائل تقلل عبء الانتباه في النماذج الكبيرة. والثاني يرى أن حجم الادعاءات كبير جداً مقارنة بما نُشر حتى الآن من تفاصيل تقنية مستقلة.

بعض المطورين والباحثين شككوا في اتساق أرقام الكفاءة المعلنة مع ما هو معروف عن هذا النوع من البنى. كما أشار آخرون إلى أن الاعتماد على برنامج وصول مبكر بدلاً من إتاحة أوسع للخدمة قد يحد من قدرة المجتمع على التحقق السريع من هذه الوعود. في المقابل، قال باحثون آخرون إن التحسينات في آليات الانتباه ليست فكرة خيالية، وإن الوصول إلى مكاسب حقيقية في أعباء السياق الطويل أمر ممكن، حتى لو احتاج إلى تدقيق مستقل قبل إصدار حكم نهائي.

ومن النقاط التي زادت النقاش سخونة أن الشركة أقرت باستخدام أوزان من نماذج مفتوحة المصدر كنقطة انطلاق، وهو أمر شائع في السوق، لكنه يجعل السؤال الأساسي أكثر تحديداً: هل الاختراق موجود فعلاً في البنية الجديدة وطريقة التدريب، أم أن الإعلان يبالغ في تصوير حجم الفارق؟

لماذا تبدو المقارنة مع محاولات سابقة مهمة

السوق شهد من قبل وعوداً كبيرة حول توسيع نافذة السياق وخفض الكلفة بشكل جذري. بعض الشركات والمشروعات البحثية قدمت مزاعم مشابهة عن كفاءة أعلى بكثير، لكنها لم تتحول لاحقاً إلى استخدام واسع أو نتائج مستقرة على مستوى الإنتاج. لهذا السبب يتعامل كثيرون بحذر مع أي إعلان يتحدث عن قفزة ضخمة في الأداء قبل توفر أوراق علمية محكمة أو اختبارات مستقلة واسعة.

كذلك فإن مجال البنى البديلة للمحولات يضم تاريخاً طويلاً من الأفكار التي تبدو ممتازة من الناحية النظرية، لكنها تواجه صعوبات عند التطبيق العملي على نطاق واسع. أحياناً تنجح هذه الأساليب في تقليل التعقيد الحسابي على الورق، لكنها تخسر جزءاً من جودة الفهم أو الاستدلال مقارنة بالنماذج التقليدية. وفي حالات أخرى، تضطر الشركات إلى استخدام بنية هجينة تعيد بعض عناصر الانتباه الكثيف، فتتراجع المكاسب المتوقعة.

ما الذي قد يتغير إذا ثبتت المزاعم

إذا نجحت Subquadratic في إثبات أن نموذجها يحافظ على الجودة مع خفض كلفة معالجة السياق الطويل فعلاً، فالأثر لن يقتصر على شركة واحدة. ستتغير عندها طريقة تصميم كثير من تطبيقات الذكاء الاصطناعي المؤسسية. بدلاً من بناء مسارات معقدة لاستخراج أجزاء صغيرة من المعرفة قبل تمريرها إلى النموذج، قد يصبح ممكناً معالجة مجموعات ضخمة من الملفات أو المستندات أو قواعد الشيفرة دفعة واحدة.

هذا السيناريو قد يقلل الاعتماد على بعض طبقات البنية التحتية التي أصبحت اليوم جزءاً أساسياً من تطبيقات الذكاء الاصطناعي، مثل أنظمة الاسترجاع وقواعد البيانات المتجهية وتقنيات تقسيم المستندات. كما قد ينعكس على كلفة التشغيل، وعلى تصميم أدوات البرمجة، وعلى تحليل العقود والسجلات والملفات الطبية والمستندات التنظيمية.

لكن في المقابل، إذا تبيّن أن الأرقام مبالغ فيها أو أن التحسينات لا تصمد خارج سيناريوهات ضيقة، فسيُنظر إلى الإعلان على أنه مثال جديد على الفجوة بين الرسائل التسويقية والنتائج القابلة للتكرار.

الاختبار الحقيقي لم يبدأ بعد

حتى الآن، تبدو قصة SubQ مزيجاً من فرضية تقنية جادة ووعود كبيرة تحتاج إلى إثبات. الفريق يضم باحثين من خلفيات معروفة، والتمويل المتاح يمنحه القدرة على جذب الاهتمام، لكن هذا لا يكفي وحده لإثبات أن المشكلة الأساسية في تكلفة الانتباه قد حُلّت بشكل نهائي.

المعيار الحاسم في المرحلة المقبلة سيكون بسيطاً: هل يمكن لجهات مستقلة إعادة اختبار النموذج والتحقق من كفاءته وجودته على نطاق واسع؟ إذا كانت الإجابة نعم، فقد نكون أمام خطوة مهمة في تطور النماذج اللغوية. وإذا كانت الإجابة لا، فسيبقى الإعلان ضمن قائمة طويلة من الوعود الجريئة التي لفتت الانتباه أكثر مما غيّرت الواقع.

في كل الأحوال، يسلط هذا الإعلان الضوء على واحدة من أهم القضايا في الذكاء الاصطناعي حالياً: ليس كافياً أن تقبل النماذج سياقاً أطول على الورق، بل يجب أن تستفيد منه فعلياً وبكلفة معقولة. وهذه هي النقطة التي سيُبنى عليها الحكم الحقيقي على SubQ في الشهور المقبلة.