الذكاء الاصطناعي والتقنية 03-May-2026 6 دقائق قراءة

Anthropic تطلق ميزة Dreaming لتعليم وكلاء الذكاء الاصطناعي من أخطائهم السابقة

أعلنت Anthropic عن ميزة Dreaming ضمن منصة Claude Managed Agents، إلى جانب أدوات جديدة لتقييم النتائج وتنسيق عدة وكلاء، في خطوة تستهدف رفع دقة وكلاء الذكاء الاصطناعي وتحسين أدائهم بمرور الوقت.

أعلنت شركة Anthropic عن مجموعة تحديثات جديدة لمنصة Claude Managed Agents خلال مؤتمرها السنوي للمطورين في سان فرانسيسكو، وكان أبرزها ميزة تحمل اسم Dreaming. الفكرة الأساسية لهذه الميزة هي منح وكلاء الذكاء الاصطناعي القدرة على مراجعة أعمالهم السابقة، واستخراج أنماط متكررة من النجاحات والأخطاء، ثم استخدام هذه الدروس لتحسين أدائهم في الجلسات اللاحقة.

هذا الإعلان لا يتعلق فقط بإضافة تقنية جديدة، بل يعكس اتجاهاً أوسع في سوق الذكاء الاصطناعي المؤسسي: الانتقال من نماذج تجيب عن الأسئلة إلى وكلاء يمكنهم تنفيذ مهام متعددة الخطوات، ومراجعة نتائجهم، والتحسن تدريجياً من دون تعديل النموذج الأساسي نفسه.

ما الذي تقدمه ميزة Dreaming؟

تشرح Anthropic أن Dreaming تختلف عن أنظمة الذاكرة التقليدية التي تحتفظ بتفضيلات المستخدم أو بسياق المحادثة. فبدلاً من الاكتفاء بتخزين المعلومات، تقوم الميزة بعملية مجدولة تراجع خلالها جلسات العمل السابقة ومخازن الذاكرة، ثم تستخلص منها ملاحظات عملية و"كتيبات تشغيل" يمكن الرجوع إليها لاحقاً.

بمعنى آخر، لا يتذكر الوكيل فقط ما حدث، بل يحاول فهم ما الذي نجح، ما الذي فشل، وما هي الخطوات التي أدت إلى نتائج أفضل. وهذا يسمح له ببناء خبرة تشغيلية متراكمة، تشبه إلى حد ما الطريقة التي توثق بها فرق العمل أفضل الممارسات بعد إنهاء مشروع أو مهمة معقدة.

وتؤكد الشركة أن هذه العملية لا تعدل أوزان النموذج ولا تعيد تدريبه من الداخل. بدلاً من ذلك، تُكتب المعرفة المستخلصة في صورة ملاحظات واضحة ونصوص منظمة يمكن للبشر مراجعتها. هذا التفصيل مهم للشركات التي تريد أن تعرف بدقة لماذا اتخذ الوكيل قراراً معيناً، وكيف تطورت طريقته في العمل بمرور الوقت.

من الذاكرة إلى التحسين المستمر

الفرق الجوهري بين الذاكرة وDreaming هو مستوى الاستفادة من البيانات السابقة. الذاكرة تساعد الوكيل على تذكر تفاصيل الجلسة أو تفضيلات المستخدم، بينما تعمل Dreaming على مستوى أعلى، حيث تبحث عن أنماط مشتركة بين عدة جلسات ومهام. وقد يشمل ذلك أخطاء متكررة، أو أساليب عمل فعالة ظهرت أكثر من مرة، أو تفضيلات مشتركة بين فريق من الوكلاء.

هذا النهج قد يكون مهماً بشكل خاص في البيئات المهنية التي تتكرر فيها نفس أنواع الأعمال يومياً، مثل مراجعة المستندات، تحليل الطلبات القانونية، متابعة سجلات الأنظمة، أو تنفيذ خطوات برمجية متعددة. فبدلاً من بدء كل مهمة من الصفر، يصبح الوكيل قادراً على الاستفادة من خبرة تشغيلية تراكمية.

أدوات جديدة إلى جانب Dreaming

إلى جانب Dreaming، نقلت Anthropic ميزتين كانتا في وضع تجريبي إلى المرحلة العامة التجريبية، وهما Outcomes وMulti-Agent Orchestration. وتمثل الأداتان جزءاً من البنية نفسها التي تريد الشركة من خلالها جعل الوكلاء أكثر موثوقية في الأعمال الفعلية.

ميزة Outcomes تتيح للمطورين تحديد معيار واضح للنجاح، سواء كان ذلك في شكل بنية مستند، أو أسلوب عرض، أو التزام بمجموعة قواعد داخلية. بعد أن ينتهي الوكيل من العمل، يتولى وكيل آخر مستقل مهمة تقييم الناتج وفقاً لهذا المعيار. وإذا اكتشف نواقص أو أخطاء، يعيد الملاحظات ليجري الوكيل الأول محاولة جديدة.

أما Multi-Agent Orchestration فتمكن النظام من توزيع مهمة واحدة معقدة على عدة وكلاء متخصصين، لكل منهم سياق مستقل وأدوات خاصة. وبذلك لا يحتاج وكيل واحد إلى حمل كل التفاصيل في خيط عمل واحد طويل، وهو ما قد يضعف الجودة مع ازدياد التعقيد.

لماذا تستخدم الشركة وكيلاً منفصلاً للتقييم؟

من النقاط اللافتة في هذا التصميم أن التقييم لا يتم داخل الجلسة نفسها التي أُنجز فيها العمل. Anthropic ترى أن الوكيل الذي أمضى وقتاً طويلاً في تنفيذ المهمة قد يصبح أقل قدرة على اكتشاف أخطائه، لذلك يجري فحص النتيجة في نافذة مستقلة وبسياق جديد. هذه المقاربة تهدف إلى تقليل التحيز الداخلي وتحسين فرص رصد العيوب التي قد تمر من دون ملاحظة في سلسلة العمل الأصلية.

الفكرة هنا قريبة من مراجعة الزملاء في فرق الهندسة والمنتج: المنفذ لا يكون دائماً أفضل من يكتشف مشكلات التنفيذ، ولذلك تأتي قيمة المراجع المنفصل الذي ينظر إلى العمل من زاوية مختلفة.

عرض عملي لتحسن الوكلاء بمرور الوقت

خلال العرض الحي في المؤتمر، استخدمت الشركة مثالاً تخيلياً لشركة تعمل على إنزال طائرات مسيرة على سطح القمر. جرى تقسيم المهمة بين ثلاثة وكلاء: قائد للمهمة، ووكيل يحدد مواقع الهبوط المناسبة، وآخر مسؤول عن الملاحة والهبوط الآمن. كما وُضع معيار للنجاح يشمل سلامة الهبوط، ووضوح الأرض، والاحتفاظ بوقود كافٍ للعودة.

في البداية كانت النتائج جيدة لكنها غير مثالية. بعد ذلك فُعلت Dreaming لمراجعة الجلسات السابقة، فاستخرج النظام "دليل هبوط" جديداً من الأنماط المتكررة عبر المحاولات. وعند تشغيل المحاكاة مرة أخرى لاحقاً، ظهرت تحسينات أوضح في المواقع التي كانت نتائجها أضعف سابقاً. المثال كان تجريبياً، لكنه يوضح ما تريد Anthropic إثباته: أن الوكيل يمكنه التحسن من خلال مراجعة أدائه السابق، لا عبر تدخل يدوي مباشر في كل مرة.

نتائج أولية من شركات تستخدم المنصة

قالت Anthropic إن بعض العملاء الأوائل بدأوا يرصدون نتائج عملية من هذه الأدوات. شركة Harvey المتخصصة في الذكاء الاصطناعي القانوني أفادت بأن معدل إنجاز المهام ارتفع بنحو ستة أضعاف بعد استخدام Dreaming. كما ذكرت Wisedocs أنها خفضت وقت مراجعة المستندات بنسبة 50% باستخدام Outcomes. وأشارت الشركة أيضاً إلى أن Netflix أصبحت تعالج سجلات مئات عمليات البناء البرمجي في وقت متزامن عبر تنسيق عدة وكلاء.

هذه الأرقام تعكس ما تحاول Anthropic التركيز عليه في المنافسة: ليس فقط قوة النموذج نفسه، بل قدرته على العمل بشكل موثوق وقابل للمراجعة في بيئات إنتاج حقيقية.

نمو سريع وضغط متزايد على البنية التحتية

تزامن الإعلان مع أرقام نمو كبيرة كشفتها الشركة. وبحسب تصريحات مديرها التنفيذي داريو أمودي، سجلت Anthropic في الربع الأول من 2026 نمواً سنوياً محسوباً في الإيرادات والاستخدام وصل إلى 80 ضعفاً، مقارنة بخطة داخلية كانت تستهدف 10 أضعاف فقط. كما ارتفع حجم استخدام واجهة البرمجة على منصة Claude بنحو 70 ضعفاً على أساس سنوي.

هذا النمو السريع يفسر أيضاً تركيز الشركة على توسيع القدرة الحاسوبية. فقد أشارت إلى رفع حدود الاستخدام لعدد من الخطط، وزيادة حدود واجهات البرمجة، إضافة إلى شراكة مع SpaceX للاستفادة من السعة الكاملة لمركز بيانات Colossus من أجل تخفيف الضغط على موارد الحوسبة.

ما الذي يعنيه ذلك لسوق الذكاء الاصطناعي المؤسسي؟

تتنافس شركات مثل OpenAI وGoogle وAnthropic على إقناع المطورين والمؤسسات بأن منصاتها هي الأنسب لبناء وكلاء ذكيين. وفي هذا السياق، تبدو Anthropic وكأنها تراهن على نقطة مختلفة: الاعتمادية التشغيلية أكثر من مجرد الذكاء الخام للنموذج.

الشركات الكبيرة لا تحتاج فقط إلى نموذج يكتب نصاً جيداً أو يجيب عن سؤال برمجي بسرعة، بل تريد أنظمة يمكنها تنفيذ خطوات طويلة، ومراجعة النتائج، والالتزام بمعايير محددة، والتحسن مع الوقت من دون فقدان القدرة على التدقيق البشري. وهنا تحاول Dreaming أن تقدم طبقة جديدة بين "الذاكرة" و"التعلم الكامل"، وهي طبقة الخبرة التشغيلية القابلة للفحص.

كما أن تنسيق عدة وكلاء مع وجود وكيل تقييم منفصل يقترب من الطريقة التي تعمل بها المؤسسات البشرية فعلياً: منفذون، مراجعون، وتوثيق للخبرة المكتسبة. وإذا أثبت هذا النموذج نجاحه على نطاق واسع، فقد يصبح أحد الأساليب الأساسية في تصميم وكلاء الذكاء الاصطناعي داخل الشركات.

خطوة نحو وكلاء يعملون لساعات لا لدقائق

خلال المؤتمر، شددت الشركة على أن التقدم الحقيقي لا يقاس فقط بقدرات النموذج في الاختبارات، بل بما تسميه أفق المهمة، أي المدة التي يستطيع فيها الوكيل العمل بشكل مستقل مع الحفاظ على جودة المخرجات أو تحسينها. ووفق هذا المنظور، فإن التطور المطلوب في الأعوام المقبلة ليس مجرد إجابات أفضل، بل وكلاء قادرون على إدارة مهام طويلة ومعقدة دون أن ينهار الأداء أو يتشتت السياق.

ميزة Dreaming تأتي في هذا الإطار تحديداً. فهي لا تجعل الوكيل أكثر ذكاءً بين ليلة وضحاها، لكنها تمنحه وسيلة عملية لبناء خبرة خاصة به من خلال العمل المتكرر. وهذا قد يكون أحد الفروق الأساسية بين مساعد ذكي ينجز مهمة مؤقتة، ونظام يمكن الاعتماد عليه ضمن سير العمل اليومي في المؤسسات.

حالياً، تتوفر Dreaming في معاينة بحثية، بينما أصبحت ميزتا Outcomes وMulti-Agent Orchestration متاحتين في نسخة تجريبية عامة لمطوري منصة Claude. وما إذا كانت هذه الأدوات ستصبح معياراً جديداً في بناء الوكلاء، سيعتمد على قدرتها الفعلية على تقديم دقة أعلى وتكلفة أقل وثقة أكبر لدى الشركات التي تريد نقل الذكاء الاصطناعي من التجربة إلى التشغيل الفعلي.