لماذا تكرر نماذج الذكاء الاصطناعي حارس المنارة؟

أثار بحث أكاديمي جديد سؤالًا غير متوقع في عالم الذكاء الاصطناعي: لماذا تبدو نماذج اللغة الكبيرة وكأنها تعشق تكرار قصص تدور حول منارة، وحارس، وبضعة أسماء وأعمال بعينها عندما يُطلب منها ببساطة أن تكتب قصة؟

الدراسة، التي تناولت مخرجات عدد من النماذج الرائدة، لا تتحدث عن صدفة عابرة أو تشابه بسيط في الأسلوب، بل عن نمط متكرر بدرجة لافتة. فحين تُمنح هذه النماذج أمرًا عامًا وغير محدد، تميل إلى إنتاج سرديات شبه متطابقة في بنيتها، وتستحضر شخصيات ومواضيع بعينها أكثر مما يفعل البشر في الكتابة الأدبية المعتادة.

هذا السلوك يفتح بابًا واسعًا للنقاش حول جودة التنوع الإبداعي في النماذج التوليدية، وحول الكيفية التي تصوغ بها طبقات الضبط اللاحقة ما يبدو «مناسبًا» أو «آمنًا» للرد، حتى لو كان ذلك على حساب العفوية والتنوع.

نمط متكرر عبر نماذج مختلفة

اعتمد الباحثون على تجارب واسعة النطاق شملت عشرات الآلاف من القصص التي أنشأتها عدة نماذج لغوية كبيرة. وعند تحليل النصوص، ظهرت مجموعة صغيرة جدًا من الكلمات والأسماء والمهن بصورة متكررة على نحو غير مألوف. من بين هذه العناصر: أسماء مثل إلياس ومارا وإلارا، ومهن مثل الحارس والخباز والعمدة وصانع الساعات والصياد وأمين المكتبة وقائد الفرقة، إضافة إلى موقع يكاد يطغى على السرد كله: المنارة.

المثير في النتائج أن هذا التكرار لم يكن حكرًا على نموذج واحد. بل بدا أن أكثر من نموذج يقع في الفخ نفسه عندما تُطرح عليه صيغة طلب عامة مثل «اكتب قصة» أو «احكِ لي قصة». وحتى عندما تختلف العلامة التجارية للنموذج أو نسخته، يعود النمط ذاته تقريبًا ليظهر في البنية السردية.

وبحسب الدراسة، فإن 88% من القصص المولدة احتوت على الأقل على عنصر واحد من هذه المجموعة المحددة من الكلمات. هذا الرقم المرتفع يشير إلى أن المسألة ليست استثناءً، بل ميلًا بنيويًا يمكن ملاحظته بسهولة عند اختبار النماذج على نطاق واسع.

لماذا المنارة تحديدًا؟

في القصص البشرية، نادرًا ما تحتل المنارة هذا القدر من الحضور عندما لا يحدد الكاتب موضوعًا بعينه. لكن في القصص التي تنتجها النماذج، تتحول المنارة إلى مسرح شبه افتراضي متكرر، ويظهر معها حارس المنارة غالبًا بوصفه بطلًا أو شخصية مركزية.

الباحثون لم يجدوا دليلًا واضحًا على وجود عمل أدبي واحد أو مجموعة أعمال معروفة تفسر هذا التركيز بشكل مباشر. كما أن المقارنة مع الأدب المنشور، والمواد المتاحة على الويب، والقصص غير الرسمية المكتوبة من البشر، لم تُظهر أن هذه المفردات شائعة بالقدر نفسه.

هذا ما يجعل الظاهرة أكثر غموضًا: إذا لم تكن هذه العناصر منتشرة على نحو ملحوظ في البيانات الأصلية أو في الأدب المعاصر، فمن أين جاءت هذه النزعة التلقائية لدى النماذج؟

فرضية الضبط بعد التدريب

أحد التفسيرات المطروحة في الورقة البحثية يرتبط بمرحلة ما بعد التدريب، وهي المرحلة التي تُستخدم فيها تقنيات الضبط والتفضيل لتوجيه النموذج نحو استجابات أكثر أمانًا أو توافقًا مع السياسات المعتمدة. في هذه المرحلة، قد تتعلم النماذج تجنب الإشارات إلى شخصيات محمية بحقوق نشر أو محتوى بالغ الحساسية، فتنسحب نحو قوالب أكثر حيادًا وقدمًا من الناحية الثقافية.

هذه الفكرة تفسر جزئيًا لماذا تبدو القصص وكأنها خارجة من زمن أدبي قديم: منارة على شاطئ معزول، حارس وحيد، بلدة صغيرة، وخلفية تميل إلى الحنين. إنها عناصر لا تثير مشكلات حقوقية واضحة، لكنها في الوقت نفسه تقلص مساحة الابتكار السردي.

ومع ذلك، لم يحسم الباحثون أن هذا هو السبب الوحيد. بل أكدوا أن البيانات لا تدعم ببساطة تفسير الظاهرة عبر وجود هذه الكلمات بكثافة في النصوص التدريبية أو في النصوص اللاحقة للضبط. بعبارة أخرى، التكرار يبدو أكبر بكثير مما تسمح به المصادر المعروفة.

مقارنة مع الأدب والويب والبيانات التدريبية

لتحقيق مزيد من الفهم، قارنت الدراسة بين الكلمات المتكررة في القصص المولدة وبين عدة مجموعات لغوية كبيرة تضم روايات منشورة ونصوصًا شبكية ومواد ما قبل التدريب وما بعده. وكانت النتيجة أن الكلمات الأكثر حضورًا في قصص الذكاء الاصطناعي ظهرت بمعدلات ضئيلة للغاية في تلك المجموعات مقارنة بما ظهر في المخرجات التوليدية.

في الأدب المنشور مثلًا، ظهر اسم إلياس بمعدل أقل بكثير من ظهوره داخل القصص المولدة. كما أن بعض الكلمات الأخرى، مثل إلارا، كانت شبه غائبة في النصوص البشرية ثم قفزت إلى حضور ملحوظ داخل قصص النماذج. هذه الفجوة توحي بأن النماذج لا تعكس ببساطة ما قرأته، بل تعيد تشكيله في اتجاه محدد للغاية.

الأكثر دلالة أن النمط نفسه ظل قائمًا حتى بعد اختبار مواد شاسعة من البيانات التي استُخدمت في مراحل ما بعد التدريب. فمع أن تلك البيانات تضمنت قصصًا كثيرة، لم تكن كثافة هذه الأسماء والمهن والمواضع كافية لتفسير الاستحواذ شبه الكامل لها على المخرجات النهائية.

ما الذي تكشفه التجارب العملية؟

إلى جانب النتائج الأكاديمية، أظهرت تجارب عملية مع نماذج معروفة مثل ChatGPT وClaude وGemini أن الظاهرة ليست نظرية فقط. فعند تكرار الطلب البسيط «اكتب قصة»، تميل النماذج بسرعة إلى استحضار نفس العالم السردي تقريبًا: منارة، شخصية رئيسية تحمل اسمًا مألوفًا داخل هذا السياق، ومهنة مرتبطة بالحراسة أو البلدة أو البحر.

وفي بعض الحالات، بدا أن النموذج لا يحتاج إلى أكثر من محاولة واحدة حتى يقع في هذا المسار. هذا يثبت أن التكرار ليس مجرد أثر إحصائي بعيد، بل سلوك يمكن ملاحظته مباشرة في الاستخدام اليومي.

كما لاحظت التجارب أن تغيير النسخة أو المنصة لا يزيل المشكلة بالضرورة. أحيانًا يتغير الاسم الرئيس أو التفصيلة الثانوية، لكن البنية العامة تظل محافظة على نفس الجو القديم: ضوء بعيد، عزلة، بحر، وشخصية تعيش على هامش العالم.

لماذا يهم هذا النقاش؟

قد يبدو الأمر طريفًا للوهلة الأولى، لكنه يحمل أهمية حقيقية لكل من يصمم أو يستخدم النماذج التوليدية. فإذا كانت النماذج الكبيرة تميل إلى إعادة تدوير عدد محدود من القوالب عندما لا تُوجَّه بدقة، فإن ذلك يؤثر في جودة الكتابة الإبداعية، وفي تنوع المحتوى، وفي ثقة المستخدم بقدرة هذه الأنظمة على إنتاج شيء جديد بالفعل.

كما أن الظاهرة تقدم إشارة مهمة للباحثين في الذكاء الاصطناعي: قياس الأداء لا ينبغي أن يقتصر على الدقة أو الاتساق، بل يجب أن يشمل أيضًا التنوع الحقيقي. فالنموذج الذي ينجح في كتابة قصة «مقبولة» قد يفشل في تقديم قصة مختلفة بحق، وهذا فرق جوهري بين الإنتاج النصي والإبداع.

هناك أيضًا بعدٌ يتعلق بالتحكم في المخاطر. فالسعي إلى حماية النماذج من التحيزات القانونية أو الأخلاقية قد يؤدي، من دون قصد، إلى تضييق شديد على الخيال. وعندما تصبح السلامة معيارًا مفرطًا في الصرامة، قد تخسر النماذج جزءًا من مرونتها الأدبية.

خلاصة المشهد

الاستنتاج الأهم من هذه الدراسة أن النماذج اللغوية الكبرى لا تكتب القصص من فراغ، لكنها أيضًا لا تعيد إنتاج العالم البشري كما هو. بدلًا من ذلك، تبدو وكأنها تختار لنفسها مجموعة صغيرة من الرموز الآمنة والمألوفة، ثم تدور حولها باستمرار.

ولعل أكثر ما يلفت الانتباه أن هذه الرموز ليست الأكثر شيوعًا في الأدب أو الويب أو البيانات التدريبية، ما يجعل السؤال مفتوحًا: هل نواجه أثرًا جانبيًا لآليات الضبط، أم عادةً سردية عميقة تشكلت داخل النماذج نفسها؟

إلى أن تتضح الإجابة، سيظل حارس المنارة حاضرًا في الخلفية، كأنه شخصية خرجت من أكثر من قصة، لا من قصة واحدة فقط.