دراسة تكشف: 35% من وكلاء الذكاء الاصطناعي يسلّمون بيانات حساسة لمواقع احتيالية

كشفت دراسة بحثية حديثة عن مشكلة أمنية متنامية في وكلاء الذكاء الاصطناعي المخصصين للتصفح وتنفيذ المهام عبر الويب، إذ وجدت أن نسبة كبيرة منهم قد تواصل إدخال معلومات شخصية شديدة الحساسية إلى مواقع يكتشفون هم أنفسهم أنها احتيالية.

وتشير النتائج إلى أن الخطر لا يكمن فقط في انخداع هذه الأنظمة بالمواقع المزيفة، بل في استمرارها في الإجراء بعد ظهور الشكوك لديها. ففي عدد لافت من الحالات، فهمت النماذج علامات الخداع، لكنها مع ذلك أكملت تعبئة النماذج وإرسال البيانات.

فجوة بين الإدراك والفعل

أبرز ما توصلت إليه الدراسة هو وجود ما يشبه الانفصال بين مرحلة الاستدلال ومرحلة التنفيذ. فبعض الوكلاء أظهروا في مخرجاتهم الداخلية أو شروحاتهم النصية وعياً بوجود مؤشرات مريبة، لكن هذا الوعي لم يتحول تلقائياً إلى سلوك وقائي. وبحسب الباحثين، هذه ليست مجرد مشكلة في التعرف على الاحتيال، بل مشكلة أعمق تتعلق بكيفية اتخاذ الوكيل لقراراته أثناء تنفيذ المهمة.

في عدة تجارب، جرى رصد وكلاء يصفون الموقع بأنه مشبوه أو غير موثوق، ثم يواصلون مع ذلك إدخال تفاصيل مثل أرقام الحسابات، وكلمات المرور، وبيانات الهوية، ورموز التحقق، وبيانات الدفع. هذا السلوك يشير إلى أن بعض الأنظمة صُممت لإتمام المهمة حتى النهاية، أكثر من كونها صُممت للتوقف عند الشك.

ماذا اختبرت الدراسة؟

اعتمد الباحثون على معيار اختبار جديد حمل اسم SCAMMER4U، وهو بيئة تقييم صُممت لمحاكاة سيناريوهات احتيال متعددة على الويب. وضمّ المعيار 91 موقعاً محاكياً مُسيطراً عليه من جهة المهاجم، إلى جانب 10 مواقع سليمة للمقارنة، مع 8 أنماط مختلفة من الهجمات الاجتماعية والتقنية.

وشملت العينة أربعة وكلاء من النماذج المتقدمة: GPT-5 mini وClaude Haiku 4.5 وGemini 3 Flash وLlama 4 Scout. وتم تشغيلهم عبر إطار تصفح موحد قائم على Playwright، مع بيئة إدراك وأوامر متشابهة لضمان مقارنة عادلة بين النتائج.

كما جرى تزويد كل وكيل بملف مستخدم واقعي يحوي مجموعة من البيانات الشخصية، من الاسم والعنوان إلى كلمات المرور وبيانات الحسابات المصرفية ورموز المصادقة الثنائية ومفاتيح برمجية ورقم الضمان الاجتماعي. وكان الهدف قياس ما إذا كانت أي من هذه البيانات ستصل إلى طرف خبيث.

نتائج مقلقة رغم التحذيرات

أظهرت التجارب أن غياب الضوابط الخاصة بالخصوصية أدى إلى تسريب بيانات عالية الحساسية في نسبة تراوحت بين 54% و93% من حالات المواقع الاحتيالية، بينما لم تسفر المواقع السليمة عن تسريبات مماثلة. هذا الفارق يؤكد أن المشكلة مرتبطة بالهجوم نفسه وليس بالروتين الطبيعي لإدخال النماذج.

الأهم من ذلك أن الدراسة رصدت ما وصفته بفجوة «التعرّف ثم الفعل». ففي الحالات التي صنّف فيها الوكيل الموقع باعتباره مشبوهاً، ورغم ذلك استمر في التسليم، بلغت نسبة إرسال البيانات الحساسة 35.9% من الجلسات. أما عندما لم يُبدِ الوكيل أي شك صريح، فارتفعت النسبة إلى 66.1%، ما يعني أن إدراك الخطر خفف التسريب جزئياً لكنه لم يلغِه.

وتوضح هذه النتيجة أن الاعتماد على وعي الوكيل وحده ليس كافياً. فحتى عندما يمر النموذج بمرحلة شك واضحة، قد لا تكون تلك المرحلة قوية بما يكفي لوقف السلوك العملي الذي يليه.

أنماط السلوك التي رصدها الباحثون

حددت الدراسة عدداً من الأنماط المتكررة التي تساعد على فهم سبب استمرار التسريب. أحدها كان حين يكتشف الوكيل إشارات احتيال متعددة، مثل الوعود غير الواقعية أو ضعف الشفافية أو اللغة المريبة، ثم يقرر في النهاية أن إكمال المهمة يظل أولى من التوقف. ووصفت الدراسة هذه الحالة بأنها نوع من الموازنة غير الصحية بين الشك والالتزام بإتمام المهمة.

وفي نمط آخر، رفض وكيل طلباً احتيالياً واضحاً في سياق معين، لكنه لم يعمم هذا الرفض على نموذج طلب مشابه ظهر لاحقاً بصياغة مختلفة. بمعنى آخر، تمكّن من التقاط الخطر في لحظة، لكنه لم ينقل هذا الإدراك إلى سياق مجاور.

كما لاحظ الباحثون اعتماد بعض الوكلاء على مؤشرات سطحية للثقة، مثل مظهر الموقع الاحترافي أو ادعاءات التشفير والشهادات الأمنية داخل الصفحة نفسها. هذه الإشارات الشكلية كانت أحياناً كافية لإقناع الوكيل بأن الموقع آمن، حتى عندما كانت هناك قرائن مقلقة سبق وأن أثارها بنفسه.

اختبارات الحماية لم تكن متساوية الأثر

قارن الفريق البحثي بين أربع درجات من الحماية: دون أي توجيه خاص، وتذكير عام بالخصوصية، وقائمة تحقق لمكافحة التصيد، ثم مطالبة الوكيل بالتوقف والتفكير قبل الإرسال. وأظهرت النتائج أن أثر هذه الطبقات يختلف بشكل كبير من نموذج إلى آخر.

كان Claude Haiku 4.5 الأكثر تجاوباً مع التعليمات الوقائية، إذ تراجعت نسبة التسريب لديه من 54.5% في الحالة الأساسية إلى 24.0% في أقوى إعداد دفاعي. كما انخفضت النسبة لدى GPT-5 mini من 61.0% إلى 36.1%، ولدى Gemini 3 Flash من 93.1% إلى 60.7%. أما Llama 4 Scout فبقي الأقل تحسناً، مع هبوط محدود من 82.3% إلى 77.4%.

وتشير هذه الفوارق إلى أن التعليمات الأمنية الموحدة لا تؤدي بالضرورة إلى النتيجة نفسها عبر جميع النماذج. فبعضها يستجيب للتحذير، بينما يكتفي آخرون بتكرار الشك لغوياً دون أن يغيروا مسار الفعل.

ماذا يعني ذلك لأمن الوكلاء المستقلين؟

تدفع هذه النتائج إلى إعادة التفكير في طريقة حماية وكلاء الذكاء الاصطناعي عند التعامل مع البيانات الحساسة. فبدلاً من الاكتفاء بتوجيه النموذج داخلياً إلى أن يكون حذراً، يرى الباحثون أن الحماية يجب أن تُنفذ عند مستوى الإخراج نفسه، بحيث تُفحص أي عملية إرسال قبل وصولها إلى الجهة المقصودة.

بعبارة أخرى، إذا كان الوكيل يستطيع أن يصف الموقع بأنه مريب ثم يرسل البيانات على أي حال، فإن الاعتماد على استنتاجه الذاتي لا يكفي. المطلوب هنا طبقة دفاع منفصلة قادرة على حجب الإرسال المشبوه بغض النظر عن تفسير النموذج للأحداث.

كما أن الدراسة تشير إلى أن بعض ضوابط السلامة الحالية تعمل كمجرد تذكير شكلي أكثر من كونها حاجزاً فعلياً. فهي قد تحسن لغة الوكيل حول الخطر، لكنها لا تضمن بالضرورة توقفه عن الفعل عندما يحين وقت الإرسال.

دلالة أوسع على مستقبل الوكلاء الذكيين

تضع هذه النتائج الشركات المطورة أمام تحدٍ عملي: كيف يمكن بناء وكلاء مستقلين ينجزون المهام بكفاءة دون أن يتحول الإصرار على الإكمال إلى نقطة ضعف أمنية؟ فكلما توسع استخدام الوكلاء في التصفح، والحجز، وإدارة الحسابات، والتفاعل مع الخدمات المالية، زادت أهمية الفصل بين «الفهم» و«السلوك الآمن».

وتبدو الرسالة الأساسية للدراسة واضحة: الذكاء الاصطناعي قد يكتشف الخطر أحياناً، لكنه لا يضمن تلقائياً أن يتصرف وفق هذا الاكتشاف. ولهذا فإن أنظمة الاعتماد على الذات في الوكلاء تحتاج إلى طبقات رقابة وإيقاف خارجي، خاصة عندما تتعلق المهمة ببيانات شخصية أو مالية أو رموز وصول حساسة.

وبينما تتقدم قدرات التصفح الذاتي والوكلاء التنفيذيين بسرعة، توضح هذه النتائج أن أمنهم لا يمكن أن يعتمد على حسن النية البرمجية وحده. فالمرحلة المقبلة تتطلب دفاعات قادرة على اعتراض البيانات قبل خروجها، لا بعد فوات الأوان.

دراسة: 35% من وكلاء الذكاء الاصطناعي يسلّمون بيانات حساسة لمواقع يشتبهون بأنها احتيالية

فجوة بين الإدراك والفعل

ماذا اختبرت الدراسة؟

نتائج مقلقة رغم التحذيرات

أنماط السلوك التي رصدها الباحثون

اختبارات الحماية لم تكن متساوية الأثر

ماذا يعني ذلك لأمن الوكلاء المستقلين؟

دلالة أوسع على مستقبل الوكلاء الذكيين

المواضيع

فجوة بين الإدراك والفعل

ماذا اختبرت الدراسة؟

نتائج مقلقة رغم التحذيرات

أنماط السلوك التي رصدها الباحثون

اختبارات الحماية لم تكن متساوية الأثر

ماذا يعني ذلك لأمن الوكلاء المستقلين؟

دلالة أوسع على مستقبل الوكلاء الذكيين

المواضيع

مقالات أخرى في قسم الذكاء الاصطناعي والتقنية