أعلنت شركة Sakana AI عن إطلاق Fugu، وهو نظام تنسيق متعدد الوكلاء يقدّم نفسه كطبقة تشغيلية جديدة فوق نماذج الذكاء الاصطناعي التقليدية، مع واجهة متوافقة مع OpenAI وهدف واضح يتمثل في تقديم أداء قريب من مستوى النماذج الرائدة عبر نقطة وصول واحدة.
الطرح الجديد لا يركز على بناء نموذج تأسيسي واحد أكبر من السابق، بل على إدارة مجموعة من النماذج المتخصصة وتوزيع المهام بينها بشكل ديناميكي. وبهذا النهج، تسعى الشركة إلى تقليل الاعتماد على مزود واحد، وتوفير قدر أكبر من المرونة للمؤسسات التي تحتاج إلى استمرارية الخدمة، خاصة في بيئات العمل الحساسة أو الخاضعة لقيود تنظيمية وجيوسياسية.
ما الذي يميز Fugu عن أدوات التوجيه التقليدية
في السنوات الأخيرة، انتشرت حلول توجيه الطلبات التي تختار النموذج الأنسب لكل مهمة بناءً على تحليل سريع للنص المدخل. لكن Fugu يتجاوز هذا المنطق البسيط، لأنه لا يكتفي بإحالة الطلب إلى نموذج واحد ثم انتظار النتيجة، بل يتعامل مع المسألة كعملية تنسيق متعددة الخطوات.
النظام يفكك المهمة المعقدة إلى أجزاء، ثم يوزعها على مجموعة من الوكلاء أو النماذج، ويتحقق من المخرجات، ويعيد تركيبها في إجابة نهائية. هذا الأسلوب يجعله أقرب إلى مدير مشروع ذكي منه إلى مجرد موجه للطلبات.
وبحسب ما أوضحته Sakana، فإن تفاصيل اختيار النماذج وطريقة التنسيق نفسها ليست معلنة للمستخدم النهائي، لأن الشركة تعتبر هذا الجانب جزءاً من ملكيتها الفكرية. لذلك، يرى المستخدم واجهة برمجة تطبيقات موحدة، بينما تعمل في الخلفية منظومة تنسيق غير مرئية.
دافع تجاري وسيادي في الوقت نفسه
تطرح Sakana Fugu بوصفه منتجاً يخدم المطورين والمؤسسات والجهات التي تبحث عن بديل أكثر مرونة من الارتباط بنموذج واحد أو مزود واحد. هذا التوجه يكتسب أهمية خاصة في ظل المخاوف المتزايدة من انقطاع الوصول إلى النماذج المتقدمة بسبب قرارات تنظيمية أو ضوابط تصدير أو توقفات مفاجئة في الخدمة.
وترى الشركة أن الاعتماد على نموذج واحد لتشغيل تطبيقات أو بنى تحتية حساسة يمثل مخاطرة تشغيلية. لذلك، فإن فكرة التنسيق بين عدة نماذج قابلة للاستبدال تمنح الطبقة التطبيقية نوعاً من التكرار والمرونة، بحيث يمكن للنظام أن يواصل العمل إذا تغيّر توفر أحد المزودين.
هذا المنطق لا يتعلق بالأداء فقط، بل بموضوع أوسع هو مقاومة الاحتكار التقني وتخفيف تبعات الاعتماد على سلسلة توريد واحدة في الذكاء الاصطناعي.
نسختان: Fugu وFugu Ultra
قدمت Sakana نسختين من النظام لتلبية احتياجات مختلفة. النسخة الأساسية Fugu تستهدف الاستخدامات اليومية منخفضة التأخير، مثل المساعدات الحوارية وبيئات البرمجة التفاعلية. أما Fugu Ultra فهي النسخة الأكثر تقدماً، والمخصصة للمهام الثقيلة التي تتطلب تفكيراً متعدد المراحل، مثل الأبحاث المعقدة، وتحليل الأمن السيبراني، والتحقيقات المتعلقة بالملكية الفكرية أو البراءات.
الفرق بين النسختين لا يقتصر على السرعة والسعة، بل يشمل عمق التنسيق وعدد النماذج أو الوكلاء المشاركين في المهمة. الفكرة هنا أن النظام لا يعامل جميع الطلبات بالآلية نفسها، بل يخصص موارد أعلى عندما تكون المهمة أكثر تعقيداً أو حساسية.
وفي التطبيقات اليومية، يمكن أن يعمل Fugu كطبقة خفيفة وسريعة، بينما يتحول Fugu Ultra إلى منسق أكثر ثقلًا في السيناريوهات التي تحتاج إلى مراجعة واستدلال وتجميع وتحقق متعدد المستويات.
أداء قوي في الاختبارات المعيارية
استندت Sakana في الترويج لـ Fugu إلى نتائج معيارية تشير إلى تفوقه في بعض الاختبارات على نماذج منافسة بارزة. ووفقاً للأرقام التي شاركتها الشركة، تمكن النظام من تسجيل نتائج أعلى في اختبار LiveCodeBench، وهو معيار يقيس الأداء البرمجي على مشكلات تتغير بانتظام.
كما أظهرت النتائج تفوقاً في اختبار GPQA-Diamond، وهو اختبار صعب في أسئلة المستوى الجامعي المتقدم في مجالات مثل الفيزياء والكيمياء والأحياء. هذه النتائج تدعم الفكرة الأساسية للشركة: التنسيق بين عدة نماذج قد ينتج أداءً تنافسياً، وأحياناً أفضل، من نموذج منفرد في بعض أنواع المهام.
في اختبار SWE-Bench Pro، وهو من المقاييس المهمة لتقييم القدرات على حل مشكلات هندسية وبرمجية واقعية، سجّل Fugu Ultra نتيجة مميزة تجاوزت عدداً من النماذج المتاحة تجارياً. لكن الصورة لم تكن أحادية الاتجاه، إذ بقيت بعض النماذج المغلقة أو محدودة الإتاحة متقدمة في مجالات أخرى مثل الاستدلال الطويل أو بعض اختبارات الأمن السيبراني.
الحدود التقنية والاقتصادية للنموذج
رغم الإنجازات المعلنة، فإن Fugu ليس حلاً سحرياً أو بديلاً شاملاً عن كل نموذج رائد. فالنظام يعتمد في النهاية على جودة النماذج الموجودة ضمن مجموعة الوكلاء، وعلى كفاءة التنسيق بينها. وهذا يعني أن الأداء قد يختلف بحسب نوع المهمة، ومدى تعقيدها، وتوفر النماذج التي يختارها النظام داخلياً.
كما أن نموذج الأعمال يبدو مرتفع التكلفة نسبياً، خصوصاً في النسخة Ultra. فالشركة تعرض تسعيراً ثابتاً للطلبات الكبيرة، مع معدلات تتماشى مع الفئة العليا من السوق، ما يضع المنتج في شريحة أقرب إلى الاستخدام المؤسسي أو الاحترافي وليس الاستخدام العام واسع النطاق.
وتشير الوثائق الفنية إلى أن الفوترة لا تشمل فقط النص الظاهر للمستخدم، بل أيضاً النشاط الداخلي الناتج عن التنسيق بين النماذج والتحقق من المخرجات وإعادة التجميع. وبعبارة أخرى، فإن تكلفة “العقل الجماعي” في الخلفية لا تُخفى عن فاتورة الاستخدام.
الخصوصية والامتثال ومحددات النشر
على الرغم من أن Fugu خدمة تجارية مغلقة المصدر، فإن Sakana تحاول تزويد الشركات ببعض عناصر التحكم الضرورية في بيئات الامتثال. يمكن للعملاء استبعاد مزودين أو نماذج معينة من مسار التنسيق، كما يمكنهم اختيار عدم استخدام مدخلاتهم في التدريب المستقبلي.
لكن هناك قيداً جغرافياً لافتاً، إذ لا يتوفر النظام في الاتحاد الأوروبي والمنطقة الاقتصادية الأوروبية بشكل مؤقت، ريثما تعمل الشركة على مواءمة بنية التوجيه والبيانات مع متطلبات اللائحة العامة لحماية البيانات. وهذا يعكس التحدي المتكرر الذي يواجه أدوات الذكاء الاصطناعي عندما تحاول الموازنة بين المرونة التقنية والامتثال القانوني.
في هذا السياق، تبدو Fugu مثالاً على الجيل الجديد من المنتجات التي لا تبيع “نموذجاً” فقط، بل تبيع أيضاً طريقة تشغيل، وسياسات توجيه، وآلية استمرارية للخدمة.
سياق أوسع في سوق الذكاء الاصطناعي
تأتي خطوة Sakana في وقت يتجه فيه سوق الذكاء الاصطناعي نحو مزيد من التعقيد في البنية التحتية، وليس فقط في حجم النماذج. فالمؤسسات لم تعد تبحث عن الإجابة الأفضل فحسب، بل عن النظام القادر على الجمع بين الجودة والاعتمادية والتكلفة والقدرة على التبديل عند الحاجة.
من هذه الزاوية، يعكس Fugu تحوّلاً مهماً: الانتقال من المنافسة على “أكبر نموذج” إلى المنافسة على “أذكى طبقة تشغيل” فوق مجموعة من النماذج. وإذا كان هذا الاتجاه سيصبح معياراً دائماً، فسيعتمد ذلك على ما إذا كانت الأسواق ستفضّل فعلاً المرونة الجماعية على التفوق الفردي الصافي.
لكن المؤكد حتى الآن أن Sakana وضعت نفسها في قلب نقاش مهم داخل قطاع الذكاء الاصطناعي: هل المستقبل للنماذج العملاقة المنفردة، أم للمنسقات القادرة على استثمار أفضل ما لدى عدة نماذج في بنية واحدة؟ Fugu هو أحد أكثر الأجوبة وضوحاً عن هذا السؤال حتى الآن.