Lovelace تقول إن وكيلها البحثي يضاهي Gemini Deep Research بتكلفة أقل من 1%

أعلنت شركة Lovelace الناشئة في مجال الذكاء الاصطناعي عن نتائج اختبار تقول إنها تضع كفاءة أنظمتها البحثية في مواجهة مباشرة مع أحد أكثر منتجات البحث المتقدم من Google، إذ أشارت إلى أن وكيلها المخصص للأبحاث المالية والتجارية وصل إلى مستوى أداء قريب من Gemini Deep Research Max، لكن بتكلفة تقل عن 1% من الكلفة المعتادة.

وتستند هذه النتيجة إلى Benchmark شمل 12 مهمة بحثية في مجالي المال والأعمال، من بينها مقارنة الشركات، ودراسة سيناريوهات الاستحواذ، وتحليل فرص الاستثمار. ووفق الشركة، جرى تقييم المخرجات بناءً على الدقة، وعمق التحليل، واستخدام الأدلة، وجودة الاستشهادات.

هذا الطرح لا يكتفي بتقديم مقارنة بين نموذجين، بل يعيد فتح سؤال أوسع يواجه قطاع الذكاء الاصطناعي المؤسسي: هل القيمة الحقيقية تأتي من النموذج نفسه، أم من البنية التي تحيط به، ولا سيما طبقة السياق والبيانات المنظمة؟

اختبار يركز على السياق أكثر من قوة النموذج

لإجراء التجربة، بنت Lovelace وكيلًا بحثيًا مخصصًا لأبحاث بنوك الاستثمار اعتمادًا على محرك السياق الخاص بها YottaGraph، إلى جانب نموذج Gemini 3.1 Flash Lite، من دون أي مصادر خارجية إضافية خارج YottaGraph. وتهدف هذه البنية إلى قياس قدرة النظام على إنتاج تقارير عميقة وموثوقة باستخدام إعداد تقني خفيف نسبيًا.

وتقول الشركة إن الوكيل استطاع، في مجموعة الاختبارات نفسها، تحقيق متوسط نقاط بلغ 9.67 مقابل 9.87 لـ Gemini Deep Research Max، مع تكلفة تقارب ستة سنتات للتقرير الواحد بدلاً من سبعة دولارات تقريبًا، وزمن تنفيذ يقل عن خمس دقائق، مقارنة بنحو 17 دقيقة للنتيجة المرجعية.

المغزى هنا يتجاوز فارق الأسعار وحده. فالنتائج، إذا صمدت أمام المراجعة المستقلة، توحي بأن تحسين طبقة السياق وربط النموذج بمعلومات أكثر تنظيمًا قد يكونان أكثر تأثيرًا من توسيع حجم النموذج نفسه في بعض حالات الاستخدام المؤسسية المحددة.

جدل متصاعد حول تكلفة الذكاء الاصطناعي

يرى مسؤولو Lovelace أن القطاع يدخل مرحلة جديدة من التفكير في الكلفة، لا سيما مع ارتفاع الإنفاق على البنية التحتية ومراكز البيانات والطاقة. وقال أندرو مور، الرئيس التنفيذي للشركة والرئيس السابق لـ Google Cloud AI، إن الصناعة تواجه أزمة قادمة مرتبطة بارتفاع تكلفة الذكاء الاصطناعي، وأن الإصرار على التوسع في النماذج الأكبر لا يمكن أن يكون الإجابة الوحيدة.

ويستند هذا الموقف إلى فكرة مفادها أن المؤسسات لن تتمكن من نشر الذكاء الاصطناعي على نطاق واسع إذا ظلت كل مهمة تحتاج إلى بنية ضخمة وتكلفة تشغيل مرتفعة. وبحسب هذا المنطق، فإن النجاح التجاري لن يأتي فقط من تحسين قدرات الاستدلال، بل من خفض تكلفة كل عملية كاملة من بداية السؤال إلى نهاية القرار.

ويضيف هذا الاتجاه بعدًا عمليًا مهمًا لمديري التقنية في الشركات: ما فائدة نظام قادر على إنتاج إجابات دقيقة إذا كانت كلفة تشغيله تمنع استخدامه في المهام اليومية المتكررة؟

منطق جديد: المشكلة في إدارة السياق

تؤكد Lovelace أن العنصر الحاسم في الجيل التالي من أنظمة الذكاء الاصطناعي المؤسسية لن يكون مجرد قوة الحوسبة، بل قدرة النظام على إدارة السياق بكفاءة. فكلما زادت العناصر التي يجب أن يحتفظ بها النموذج في ذاكرته العملية أثناء الاستدلال، ارتفعت الكلفة بشكل حاد. ومن هنا ترى الشركة أن معالجة مشكلة السياق قد تكون المفتاح المباشر لمعالجة مشكلة التكلفة.

هذا التصور يتقاطع مع رؤية عدد من المحللين الذين يعتبرون أن السوق ركز خلال السنوات الماضية على حجم النماذج وسباق القدرات العامة، بينما لم يمنح اهتمامًا كافيًا لاقتصاديات التشغيل. وفي المقابل، يبدو أن الاستخدام المؤسسي الحقيقي يتطلب حلولًا أكثر تخصصًا، حيث يكون السؤال الأساسي: ما هو أرخص نظام قادر على إنتاج نتيجة موثوقة ضمن نطاق عمل محدد؟

ومن منظور أعمال، تبدو أبحاث المال مثالًا مناسبًا لهذا النوع من الأنظمة. فهذه المهمة تعتمد على كيانات وشبكات وعلاقات يمكن تمثيلها على شكل رسم بياني معرفي، ما يجعل جودة تنظيم البيانات وربطها عاملًا حاسمًا في النتيجة النهائية.

ما الذي يعنيه ذلك لفرق التقنية في الشركات؟

يرى محللون أن هذه النتائج ينبغي ألا تُقرأ على أنها انتصار نهائي للنماذج الصغيرة على الكبيرة، بل كإشارة إلى أن بنية الحل أصبحت لا تقل أهمية عن النموذج نفسه. فالنظام المؤسسي الناجح لا يعتمد فقط على الذكاء الخام، بل على جودة البيانات التي يتلقاها، وآلية توجيه المهام إلى النموذج المناسب، وقواعد الحوكمة، ومستوى الشفافية في قياس التكلفة والمخرجات.

ويحذر خبراء من أن الوكيل الذكي الذي يتلقى سياقًا ضعيفًا لا يقدم إجابة ضعيفة فقط، بل قد يتخذ خطوة تشغيلية غير مناسبة. وهذا ما يجعل المعادلة أكثر حساسية في بيئات العمل التي تتعامل مع قرارات مالية أو قانونية أو تشغيلية لها تبعات مباشرة.

من هنا، قد تكون الرسالة الأهم لمديري المعلومات والتقنية أن تبني الذكاء الاصطناعي في المؤسسة لم يعد قرارًا يتعلق باختيار نموذج كبير أو صغير، بل بتصميم مسار كامل من البيانات إلى القرار. أي أن القيمة لم تعد في النموذج وحده، وإنما في منظومة كاملة تشمل المعرفة، والقياس، والتحكم في التكلفة، وتوزيع الأحمال على الأدوات المناسبة.

اختبار صغير برسالة أكبر للسوق

حتى لو بقيت هذه النتائج محصورة في نطاق محدد من أبحاث الأعمال، فإنها تمثل ضغطًا جديدًا على الفرضية السائدة في السوق، والتي تربط التقدم في الذكاء الاصطناعي بحجم النموذج وحده. فالرسالة التي تروج لها Lovelace هي أن الأداء الجيد في بعض السيناريوهات لا يتطلب بالضرورة إنفاقًا هائلًا، وأن توظيف السياق بذكاء قد يحقق فارقًا اقتصاديًا كبيرًا دون التضحية بالجودة.

وفي بيئة تتزايد فيها حساسية الشركات تجاه العائد على الاستثمار، قد يصبح هذا النوع من المقارنات أكثر تأثيرًا من العروض التي تركز فقط على السعة أو عدد المعاملات أو حجم النموذج. فالمؤسسات تريد نتيجة قابلة للتكرار، ويمكن دفع تكلفتها، وتصلح للتشغيل ضمن حدود واضحة.

وبذلك، لا يبدو اختبار Lovelace مجرد مقارنة تقنية بين نموذجين، بل إشارة إلى مرحلة جديدة في الذكاء الاصطناعي المؤسسي، مرحلة قد يصبح فيها السياق والكلفة والحوكمة هي العناصر الفاصلة، لا عدد المعاملات وحده.

Lovelace تكشف عن اختبار يضع Gemini Deep Research تحت ضغط التكلفة في أبحاث الأعمال

اختبار يركز على السياق أكثر من قوة النموذج

جدل متصاعد حول تكلفة الذكاء الاصطناعي

منطق جديد: المشكلة في إدارة السياق

ما الذي يعنيه ذلك لفرق التقنية في الشركات؟

اختبار صغير برسالة أكبر للسوق

المواضيع

اختبار يركز على السياق أكثر من قوة النموذج

جدل متصاعد حول تكلفة الذكاء الاصطناعي

منطق جديد: المشكلة في إدارة السياق

ما الذي يعنيه ذلك لفرق التقنية في الشركات؟

اختبار صغير برسالة أكبر للسوق

المواضيع

مقالات أخرى في قسم الذكاء الاصطناعي والتقنية