تواجه الشركات التي تعتمد على نماذج اللغة الكبيرة معضلة معروفة: النموذج يتعلم أثناء التدريب، لكنه يصبح ثابتاً بعد ذلك، بينما تتغير البيانات والسياسات والمعرفة المؤسسية باستمرار. وكل محاولة لإضافة معلومات جديدة عبر إعادة التدريب الكامل تكون مكلفة زمنياً ومادياً، كما أن حلول الاسترجاع التقليدية لا تعمل دائماً بكفاءة عندما تتشعب المعلومات داخل مستندات كثيرة ومتداخلة.
ضمن هذا السياق، يطرح إطار MeMo نهجاً مختلفاً يقوم على فصل الذاكرة عن محرك الاستدلال. الفكرة الأساسية بسيطة في ظاهرها، لكنها مهمة عملياً: بدلاً من تحميل النموذج الأساسي بكل التحديثات الجديدة، يتم تخزين المعرفة الجديدة داخل نموذج ذاكرة أصغر، بينما يظل نموذج اللغة الرئيس مسؤولاً عن التفكير وصياغة الإجابة النهائية. هذا التصميم يمنح المؤسسات مساراً أكثر مرونة لإضافة المعرفة من دون المساس بالبنية الأساسية للنموذج المستخدم.
مشكلة تحديث المعرفة في نماذج اللغة الكبيرة
في التطبيقات المؤسسية، لا تكفي المعرفة العامة التي اكتسبها نموذج اللغة أثناء التدريب الأولي. فرق الامتثال تحتاج إلى تحديثات في اللوائح الداخلية، وفرق الدعم تحتاج إلى سياسات جديدة، وفرق الهندسة تحتاج إلى دمج وثائق متجددة ومعلومات تقنية متراكمة. لكن إعادة تدريب نموذج ضخم مع كل إضافة ليست خياراً عملياً، خصوصاً عندما يكون النموذج مغلق المصدر أو مكلف التشغيل.
اعتمدت الصناعة خلال السنوات الماضية على مسارين رئيسيين. الأول هو الاسترجاع المعزز بالتوليد، حيث يتم جلب المقاطع ذات الصلة من قاعدة بيانات خارجية وإدخالها في السياق. هذا النهج مفيد، لكنه يصطدم بحدود نافذة السياق وبمشكلات الضوضاء، لأن استرجاع مقاطع غير دقيقة أو غير مرتبطة قد يضعف جودة الإجابة. أما المسار الثاني فهو الضبط اللاحق أو التدريب المستمر، وهو يدمج المعرفة الجديدة مباشرة في الأوزان. غير أن هذا المسار يرفع الكلفة، ويخلق مخاطر نسيان معلومات سابقة، وقد لا يكون متاحاً أصلاً في النماذج التجارية عبر واجهات البرمجة.
هناك أيضاً مقاربة ثالثة هي ضغط السياق أو الذاكرة الكامنة، لكنها غالباً تبقى مرتبطة بالهيكلية نفسها التي أنتجتها، ما يجعل نقلها بين النماذج أمراً صعباً. وهنا يأتي MeMo بوصفه محاولة للجمع بين مزايا هذه المسارات من دون الوقوع في عيوبها الأساسية.
كيف يعمل MeMo
يبني MeMo معماريته على مكوّنين منفصلين. الأول هو نموذج الذاكرة، وهو نموذج أصغر يتعلم تمثيل المعرفة الجديدة داخل أوزانه. والثاني هو نموذج التنفيذ، وهو نموذج لغة كبير ثابت يعمل كمحرّك للاستدلال. وعندما يطرح المستخدم سؤالاً، لا يبحث النموذج الرئيس مباشرة في المستندات الخام، بل يتعامل مع نموذج الذاكرة بوصفه مصدراً معرفياً مساعداً يجيب عن أسئلة فرعية دقيقة.
المرحلة الأولى في هذا التفاعل تبدأ بتفكيك السؤال المعقّد إلى أسئلة ذرية أصغر. بعد ذلك يجيب نموذج الذاكرة عن كل جزء على حدة، ما يوفر حقائق أولية يمكن البناء عليها. ثم يستخدم نموذج التنفيذ هذه الإشارات لإرسال أسئلة متابعة تضيق نطاق البحث تدريجياً حتى يصل إلى الكيان أو المفهوم المقصود. وفي المرحلة الأخيرة، يطلب النموذج الرئيس أدلة داعمة ويؤلف منها إجابة متماسكة.
الأهم في هذا التصميم أن التمثيل المعرفي لا يبقى عالقاً داخل السياق المؤقت، بل يتحول إلى ذاكرة قابلة للاستدعاء والتحديث، ومعزولة عن طبقة الاستدلال. لذلك يمكن تشغيل MeMo مع نماذج مفتوحة المصدر أو عبر واجهات مغلقة المصدر، لأن طبقة الذاكرة لا تعتمد على نفس النموذج الذي ينتج الإجابة النهائية.
ميزة الذاكرة المنفصلة عن الاستدلال
إحدى نقاط القوة في MeMo أنه لا يفرض على الفريق إعادة بناء نظامه بالكامل كلما تغيّر نموذج الاستدلال. يمكن تدريب الذاكرة على البيانات الخاصة بالشركة، ثم تبديل نموذج التنفيذ لاحقاً إلى نسخة أحدث أو أقوى من دون إعادة تشغيل دورة التدريب من البداية. هذا يمنح المؤسسات مرونة مهمة في البيئات التي تتغير فيها واجهات النماذج التجارية بسرعة.
كما أن النهج الجديد يتجنب مشكلة شائعة في الضبط الدقيق المباشر، وهي النسيان الكارثي. عندما تُجبر النماذج الكبيرة على امتصاص بيانات جديدة بكثافة، قد تخسر أجزاء من قدراتها السابقة في الاستدلال أو تتراجع طبقات الأمان والسلوك المرغوب. أما في MeMo، فإن التحديثات تُحصر داخل نموذج الذاكرة الأصغر، ما يحمي النموذج التنفيذي من الاضطراب المباشر.
ومن زاوية التشغيل، يَعِد هذا الفصل أيضاً بتخفيض العبء الحسابي على المدى الطويل. بدلاً من التعامل مع قاعدة معرفية ضخمة في كل مرة، ينشئ النظام تمثيلاً معلوماً ومضغوطاً يمكن الاستعلام عنه بصورة أكثر تنظيمًا.
التحديثات المستمرة عبر دمج النماذج
تواجه المؤسسات تحدياً آخر لا يقل أهمية عن بناء الذاكرة نفسها: كيف يمكن تحديثها باستمرار مع دخول وثائق جديدة؟ الحل الذي يعتمده MeMo يقوم على تدريب نموذج ذاكرة جديد على المحتوى المضاف حديثاً فقط، ثم اشتقاق ما يشبه متجه المهمة الذي يلخص التغيرات التي تعلمها من البيانات الجديدة. بعد ذلك تُدمج هذه التحديثات رياضياً في نموذج الذاكرة الأصلي.
هذا الأسلوب يقلل الحاجة إلى إعادة التدريب الشامل، ويحدّ من تداخل التعلم بين النسخ القديمة والجديدة. لكنه ليس بلا ثمن. فعملية الدمج والتحديث تحمل تكلفة في الدقة مقارنة بإعادة التدريب الكامل، وقد أظهرت التجارب تراجعاً تراوح بين 11% و19% بحسب النموذج المستخدم في الاستدلال. ومع ذلك، يرى الباحثون أن هذه المقايضة قد تكون مقبولة في البيئات التي تكون فيها كلفة التدريب الكامل أعلى بكثير من كلفة فقدان جزء من الدقة.
نتائج الاختبار على البيانات المعقدة
اختبر الباحثون MeMo على بنشماركات تتطلب استدلالاً متعدد الخطوات عبر وثائق كثيرة. وأظهرت النتائج أن الإطار يتعامل بكفاءة ملحوظة مع الأسئلة التي تحتاج إلى ربط معلومات متفرقة بدل الاكتفاء بالعثور على مقطع واحد مباشر.
في أحد الاختبارات، حقق MeMo أداءً مرتفعاً على مهمة NarrativeQA عندما ارتبط بنموذج Gemini 3 Flash، متقدماً بفارق كبير على بعض أنظمة الاسترجاع الحديثة. كما أثبت ثباتاً لافتاً عندما أُغرقت مجموعة البيانات بوثائق غير ذات صلة؛ إذ بقي التراجع في الأداء محدوداً مقارنة بأنظمة البحث القائمة على الاسترجاع، التي تضررت بشكل أوضح من الضوضاء. هذه النتيجة مهمة في بيئات الشركات، حيث تكون المستودعات المعرفية غالباً ممتلئة بالمكررات والإصدارات القديمة والمستندات غير الدقيقة.
وتشير التجارب أيضاً إلى أن ترقية نموذج التنفيذ نفسه قد ترفع الأداء من دون أي إعادة تدريب لنموذج الذاكرة. بعبارة أخرى، يمكن تدريب الذاكرة مرة على بيانات خاصة، ثم توصيلها لاحقاً بنموذج استدلال أقوى أو أحدث لتحقيق تحسين فوري. هذا الفصل بين التعلّم والتفكير قد يصبح نقطة جذب أساسية لفرق الهندسة التي تريد تحديث أنظمتها دون إعادة بناء كامل البنية.
القيود العملية وما الذي يمنع الانتشار السريع
رغم مزاياه، لا يُعد MeMo حلاً فورياً لكل السيناريوهات. فهو يتطلب في البداية تكلفة تدريب مخصصة لكل مجموعة بيانات جديدة، كما أن توليد الأسئلة والأجوبة الاصطناعية اللازمة لبناء الذاكرة ليس مجانياً حسابياً. ووفقاً للتجارب، استهلك إعداد مجموعة البيانات ساعات GPU كثيرة، إلى جانب ساعات تدريب إضافية للنموذج.
هناك أيضاً حد بنيوي مهم: نموذج الذاكرة نفسه صغير نسبياً، ما يعني أن قدرته على تمثيل المعرفة ليست غير محدودة. كلما أصبحت القاعدة المعرفية أكبر أو أكثر كثافة من حيث المعلومات، قد تصل القدرة الاستيعابية إلى سقف عملي يصعب تجاوزه. أضف إلى ذلك أن النظام لا يقدّم دائماً اقتباسات دقيقة من المستندات الأصلية، لأن الإجابة تُبنى من ذاكرة مُرمّزة وليس من اقتباس حرفي. وهذه نقطة حساسة في البيئات التي تتطلب مسار تدقيق واضحاً ومصدراً مباشراً لكل معلومة.
لذلك لا يبدو MeMo بديلاً كاملاً عن أنظمة الاسترجاع التقليدية، بل خياراً مناسباً عندما تكون المهمة أقرب إلى التوليف والاستنتاج منها إلى العثور على سطر محدد. فإذا كانت الإجابة موجودة في مستند واحد أو كانت الحاجة إلى الاستشهاد الدقيق أساسية، يبقى الاسترجاع التقليدي أكثر ملاءمة. أما إذا كانت المعرفة موزعة على أجزاء كثيرة وتحتاج إلى تركيب منطقي، فإن الذاكرة المعيارية قد تكون أفضل.
ما الذي يعنيه ذلك لمستقبل بنية الذكاء الاصطناعي المؤسسي
تكشف MeMo عن اتجاه أوسع في تصميم أنظمة الذكاء الاصطناعي المؤسسي: الانتقال من نموذج واحد يقوم بكل شيء إلى بنية أكثر تخصصاً، حيث توجد طبقة للذاكرة، وطبقة للاستدلال، وطبقة للاسترجاع عند الحاجة. هذا النوع من التقسيم قد يصبح شبيهاً بما يحدث في أنظمة البيانات الحديثة، حيث تُستخدم الذاكرة المؤقتة والفهارس وقواعد البيانات المتخصصة كلٌ وفق وظيفته.
إذا نجح هذا الاتجاه على نطاق أوسع، فقد يصبح تحديث معرفة النماذج الكبيرة أقل ارتباطاً بإعادة التدريب الكامل وأكثر اعتماداً على وحدات معرفة قابلة للإدارة والتبديل. وفي بيئة تتسارع فيها وتيرة تغيّر البيانات، قد تكون هذه المرونة هي العامل الفاصل بين نموذج ذكي نظرياً ونظام قابل للتشغيل الفعلي داخل المؤسسة.