إنفينيون وd-Matrix تتعاونان على بنية ذكاء اصطناعي منخفضة الكمون لمراكز البيانات

أعلنت شركة إنفينيون تكنولوجيز عن تعاون مع شركة d-Matrix يهدف إلى تحسين أداء أنظمة استدلال الذكاء الاصطناعي ورفع كفاءتها في استهلاك الطاقة داخل مراكز البيانات الحديثة. ويتركز العمل المشترك على منصة Corsair الخاصة بـd-Matrix، إلى جانب وحدات الطاقة OptiMOS ثنائية الطور من إنفينيون، في خطوة تعكس التحول المتسارع في متطلبات البنية التحتية للذكاء الاصطناعي.

ويأتي هذا التعاون في لحظة تشهد فيها الصناعة انتقالاً واضحاً من التركيز شبه الكامل على تدريب النماذج الضخمة إلى الاهتمام المتزايد بمرحلة التشغيل الفعلي، أي الاستدلال. هذه المرحلة هي التي تتعامل معها تطبيقات المحادثة، والمساعدات الذكية، ومحركات البحث المعززة بالذكاء الاصطناعي، وأدوات التحليل المالي، وأنظمة دعم القرار في الرعاية الصحية. ومع توسع هذه التطبيقات، أصبح زمن الاستجابة واستهلاك الطاقة عنصرين حاسمين لا يقلان أهمية عن القدرة الحسابية الخام.

الاستدلال يفرض متطلبات مختلفة عن التدريب

في السنوات الماضية، ارتبط السباق في الذكاء الاصطناعي ببناء مراكز حوسبة تعتمد على شرائح الرسوميات الضخمة لتدريب النماذج. لكن تشغيل هذه النماذج في العالم الحقيقي يطرح تحديات أخرى أكثر تعقيداً. فالتطبيقات التفاعلية تحتاج إلى إجابات خلال أجزاء من الثانية، وليس خلال ثوانٍ، ما يجعل الكمون المنخفض شرطاً أساسياً لتجربة مستخدم مقبولة ولتشغيل الأنظمة على نطاق واسع.

وتعتمد d-Matrix على معمارية حوسبة رقمية داخل الذاكرة، وهي مقاربة تستهدف تقليل الاختناقات المرتبطة بنقل البيانات بين الذاكرة والمعالجة. وترى الشركة أن هذا التصميم يمنحها ميزة في تشغيل نماذج اللغة الكبيرة وتطبيقات الوكلاء الذكيين، خصوصاً عندما تكون سرعة توليد الرموز النصية عاملاً مباشراً في جودة الخدمة.

وتشير الشركة إلى أن منصة Corsair صُممت لتلبية احتياجات التطبيقات التي تتطلب استجابة شبه فورية، مع التركيز على خفض التأخير وتحسين معدل الإنجاز لكل واط مستهلك. هذا النوع من التحسينات أصبح أكثر أهمية مع دخول الذكاء الاصطناعي التفاعلي إلى بيئات العمل المؤسسية والمنتجات الموجهة للمستخدم النهائي.

الطاقة تصبح عنق الزجاجة الجديد في مراكز البيانات

لا تقتصر التحديات في البنية التحتية للذكاء الاصطناعي على المعالجة فقط، فمع زيادة كثافة الخوادم وتركيز المزيد من القدرة الحاسوبية في وحدات أصغر، أصبحت طريقة توزيع الطاقة عاملاً مؤثراً في التوسع. وكلما ارتفعت كثافة الحوسبة، زادت الحاجة إلى تقليل الفاقد الكهربائي وتحسين توزيع الحمل داخل الأنظمة.

هنا يأتي دور وحدات الطاقة OptiMOS من إنفينيون، التي صُممت لدعم المعماريات الرأسية لتوصيل الطاقة. هذه المقاربة تساعد على رفع كثافة القدرة وتقليل الخسائر الكهربائية داخل الخوادم المدمجة، وهو أمر مهم خاصة في بيئات الذكاء الاصطناعي التي تعمل على مدار الساعة وتستقبل كميات ضخمة من الطلبات اليومية.

وتسعى إنفينيون إلى توسيع حضورها في سوق البنية التحتية للذكاء الاصطناعي من خلال تقنيات تعتمد على السيليكون وSiC وGaN، مع تركيز متزايد على طبقة الطاقة التي تدعم المسرّعات الحاسوبية بدل الاكتفاء بالمشاركة في المعالجة نفسها. ويعكس التعاون الجديد كيف باتت شركات أشباه الموصلات ترتبط بشكل أوثق بشركات المسرعات الناشئة لتقديم حلول أكثر تكاملاً.

الذكاء الاصطناعي التفاعلي يغير أولويات التصميم

مع انتشار ما يمكن وصفه بـالذكاء الاصطناعي التفاعلي، تتغير معايير البناء في مراكز البيانات. لم يعد المطلوب فقط القدرة على تدريب نماذج أكبر، بل أيضاً ضمان أن تكون هذه النماذج قادرة على الاستجابة في الزمن الحقيقي تقريباً. ويشمل ذلك أنظمة المحادثة، والوكلاء القادرين على تنفيذ المهام، وأدوات الاستدلال متعددة الخطوات، وتطبيقات توليد النصوص بشكل مباشر أثناء التفاعل مع المستخدم.

وفي هذا السياق، قال المؤسس والرئيس التنفيذي لـd-Matrix، سيد شيث، إن المعمارية التي طورتها الشركة تستهدف زمناً يقل عن مليوني جزء من الثانية لكل رمز، وهو مستوى يعتبر مهماً عند نقل الذكاء الاصطناعي من المختبرات إلى الاستخدام التجاري. ورغم أن هذا الرقم يمثل هدفاً تقنياً أكثر منه معياراً عاماً في السوق، فإنه يوضح الاتجاه الذي تتبناه الشركة: بناء بنية تحتية تضع الاستجابة الفورية في قلب التصميم.

هذا التوجه ينسجم مع ما يحدث في السوق الأوسع، حيث بدأت الشركات المشغلة للبنية التحتية تدرك أن متطلبات الاستدلال تختلف جذرياً عن متطلبات التدريب. فبينما يعتمد التدريب على تجمعات ضخمة من وحدات المعالجة الرسومية، يميل الاستدلال إلى مكافأة الأنظمة التي تحسن عرض النطاق الذاكري، وتقلل التأخير، وتضبط استهلاك الطاقة، وتربط بين طبقات الحوسبة والشبكات والطاقة بشكل أكثر كفاءة.

منافسة أوسع على بنية الذكاء الاصطناعي

التعاون بين إنفينيون وd-Matrix يأتي أيضاً ضمن موجة أوسع من التجارب في سوق العتاد المتخصص للذكاء الاصطناعي. فهناك عدد متزايد من الشركات الناشئة يعمل على شرائح مخصصة للاستدلال، أو على بنى حوسبة داخل الذاكرة، أو على مكونات شبكات مصممة خصيصاً لتسريع حركة البيانات بين العقد.

وفي هذا المشهد، تحاول d-Matrix التميز عبر الجمع بين المعالجة داخل الذاكرة والتصميم منخفض الكمون، مع توسيع رؤيتها من الشريحة نفسها إلى منظومة كاملة تشمل الشبكات والبنية القابلة للتكوين وتحسين النظام ككل. ويعكس ذلك اتجاهاً عاماً في الصناعة نحو التعامل مع الذكاء الاصطناعي بوصفه نظاماً متكاملاً، لا مجرد معالج أسرع.

ومن المتوقع أن تستمر مراكز البيانات ومزودو السحابة في إعادة تقييم أولوياتهم خلال المرحلة المقبلة، مع تزايد الضغط لخفض التكاليف التشغيلية وتحسين الكفاءة الحرارية وتقليل زمن الاستجابة. ومع توسع استخدامات الذكاء الاصطناعي في القطاعات التجارية والصناعية والطبية، ستصبح البنية التحتية المصممة خصيصاً للاستدلال أحد أهم محاور المنافسة في السوق.

ويشير هذا التعاون إلى أن المرحلة التالية من تطور الذكاء الاصطناعي لن تُقاس فقط بحجم النماذج أو عدد الشرائح المثبتة في كل خادم، بل بقدرة المنظومة كاملة على تقديم أداء سريع ومستقر وموفر للطاقة. وفي عالم تتزايد فيه الطلبات التفاعلية كل يوم، قد تكون الكفاءة هي العامل الفاصل بين بنية تحتية قادرة على التوسع وأخرى تقترب من حدودها التشغيلية بسرعة.

إنفينيون وd-Matrix تتعاونان لتقليل زمن استجابة بنية الذكاء الاصطناعي في مراكز البيانات

الاستدلال يفرض متطلبات مختلفة عن التدريب

الطاقة تصبح عنق الزجاجة الجديد في مراكز البيانات

الذكاء الاصطناعي التفاعلي يغير أولويات التصميم

منافسة أوسع على بنية الذكاء الاصطناعي

المواضيع

الاستدلال يفرض متطلبات مختلفة عن التدريب

الطاقة تصبح عنق الزجاجة الجديد في مراكز البيانات

الذكاء الاصطناعي التفاعلي يغير أولويات التصميم

منافسة أوسع على بنية الذكاء الاصطناعي

المواضيع

مقالات أخرى في قسم الذكاء الاصطناعي والتقنية