أطلقت مؤسسة LF AI & Data، وهي إحدى مؤسسات منظومة Linux Foundation، مجموعة عمل جديدة تركز على تطوير مواصفة تحمل اسم DocLang، بهدف وضع أساس تقني لمستندات يمكن لأنظمة الذكاء الاصطناعي والوكلاء البرمجيين فهمها ومعالجتها بصورة مباشرة. ويأتي هذا التحرك في وقت تتزايد فيه حاجة الشركات إلى تحويل المستندات التقليدية إلى بيانات قابلة للاستخدام في سير عمل آلي يعتمد على النماذج التوليدية.
المبادرة، التي يقودها أعضاء بارزون مثل IBM وNvidia وRed Hat، تسعى إلى إنشاء تنسيق مفتوح ومشترك لا يرتبط بمورّد واحد، بحيث يصبح بإمكان المؤسسات إعداد المستندات وتبادلها وحوكمتها بطريقة أكثر اتساقاً مع احتياجات الذكاء الاصطناعي. كما تشارك ABBYY وHuman Signal في جهود التطوير، ما يعكس اتساع الاهتمام الصناعي بالفكرة.
لماذا تحتاج الشركات إلى معيار جديد للمستندات
الأنظمة المؤسسية اليوم تتعامل مع خليط واسع من صيغ الملفات، من ملفات PDF والصور الرقمية JPEG إلى تنسيقات أخرى صُممت أساساً لتكون مقروءة من البشر. المشكلة، وفقاً للطرح الذي يرافق DocLang، أن هذه الصيغ لم تُبنَ لتسهيل فهم الآلات للمحتوى أو لاستخراج المعنى منه بشكل موثوق وسريع.
ومع دخول الذكاء الاصطناعي التوليدي والوكلاء الذكيين إلى مزيد من المهام اليومية، أصبحت عملية قراءة المستندات وتحليلها واحدة من أكثر نقاط الاحتكاك كلفة وتعقيداً. فكل طبقة تحويل إضافية بين الملف الأصلي والنموذج قد ترفع النفقات، وتزيد احتمالات الخطأ، وتبطئ الوصول إلى النتائج، خصوصاً عندما تتعامل المؤسسة مع كميات كبيرة من العقود والفواتير والتقارير والملفات التشغيلية.
الفكرة الأساسية وراء DocLang هي تقليل هذا التوتر بين المستند المصمم للبشر والمستند القابل للمعالجة الآلية. وبدلاً من الاعتماد على تحويلات متفرقة أو حلول مغلقة، تسعى المواصفة إلى تقديم طبقة مشتركة تستطيع أدوات متعددة فهمها من دون الحاجة إلى إعادة بناء البنية نفسها في كل مرة.
ما الذي يميّز DocLang عن الصيغ التقليدية
بحسب التصور المطروح، لا يتعامل DocLang مع المستند بوصفه ملفاً قابلاً للتحويل فقط، بل بوصفه بنية معيارية يمكن للأنظمة قراءتها مباشرة. هذه المقاربة تجعل المعيار أقرب إلى لغة وصف مشتركة للمحتوى، لا مجرد أداة لتحويل الملفات بين الصيغ.
وتؤكد المجموعة أن DocLang ليس واجهة برمجية ولا محوّلاً للملفات، بل معيار مستقل يشبه في دوره الطريقة التي عمل بها JSON في تنظيم البيانات أو HTML في تنظيم الويب. هذا التشبيه مهم لأنه يوضح أن الهدف ليس بناء منتج تجاري، بل تأسيس قاعدة تقنية يمكن لأي طرف أن يطوّر فوقها أدواته الخاصة.
إذا نجح هذا النهج، فقد تتمكن المؤسسات من توحيد طريقة إعداد المستندات عند إدخالها إلى أنظمة الذكاء الاصطناعي، ما قد ينعكس على جودة الفهم، وسرعة المعالجة، وتقليل الاعتماد على الطبقات الوسيطة المكلفة. كما قد يسهل ذلك بناء خطوط عمل أكثر ثباتاً لتصنيف الوثائق واستخراج البيانات منها وربطها مع أنظمة التحليلات والأتمتة.
أسئلة الحوكمة والمسؤولية لا تقل أهمية عن الجانب التقني
رغم الجاذبية التقنية للفكرة، فإن إطلاق معيار من هذا النوع يفتح باباً واسعاً للنقاش حول الحوكمة والمساءلة ودور العاملين البشر. فكلما أصبحت المستندات أكثر اعتماداً على المعالجة الآلية، زادت الحاجة إلى تحديد من يملك صلاحية التعديل، ومن يتحمل مسؤولية الأخطاء، وكيف يمكن الحفاظ على الشفافية في الطبقات التي تعالج البيانات قبل وصولها إلى النموذج.
يرى محللون أن الشركات التي ستفكر في تبني مثل هذا المعيار ستحتاج إلى قواعد واضحة للامتثال، وسياسات متماسكة لإدارة البيانات، وتحديد دقيق لنطاقات الوصول والتدريب والاستخراج. فالمشكلة لا تتوقف عند بناء تنسيق جديد، بل تمتد إلى كيفية دمجه في دورة حياة المستند داخل المؤسسة، من لحظة الإنشاء إلى الأرشفة والاسترجاع والتحليل.
وتبرز هنا نقطة مهمة: إذا أصبح جزء من العملية مؤتمتاً على مستوى التحضير المسبق للمستندات، فقد يساعد ذلك في جعل الضوابط أكثر اتساقاً. لكن في المقابل، فإن أي غموض في طريقة تطبيق المعيار قد يضيف طبقة جديدة من التعقيد بدلاً من تبسيطها، خاصة في البيئات الخاضعة لرقابة صارمة مثل المال والصحة والخدمات القانونية.
تأثير محتمل على العاملين وسير العمل المؤسسي
التحول إلى مستندات مهيأة للذكاء الاصطناعي لا يعني فقط تحسين أداء الأنظمة، بل قد يعيد أيضاً توزيع الأدوار داخل فرق العمل. فبعض المهام التي كان ينفذها الموظفون يدوياً، مثل فرز الملفات أو تهيئتها أو إدخال البيانات الوصفية، قد تنتقل تدريجياً إلى طبقات آلية تعتمد على المعيار الجديد.
هذا التحول قد يخفف العبء التشغيلي، لكنه يفرض في المقابل حاجة أكبر إلى مهارات الإشراف والمراجعة وضبط الجودة. بمعنى آخر، لن تختفي الأدوار البشرية، لكنها قد تتجه إلى مهام أكثر إشرافاً وتحليلاً بدلاً من التعامل المباشر مع الملفات ذاتها.
كما أن اعتماد تنسيق موحد قد يسهّل على المؤسسات بناء عمليات أكثر قابلية للتكرار عبر فرق متعددة ومواقع مختلفة. فبدلاً من أن تطور كل إدارة داخل الشركة أسلوبها الخاص في التعامل مع الوثائق، يمكن أن تستند إلى بنية مشتركة تختصر التباين وتقلل الأخطاء وتسرّع التكامل بين التطبيقات.
رهان على طبقة أساسية للجيل القادم من الوثائق
توقيت إطلاق DocLang يعكس اتجاهاً أوسع في الصناعة نحو إعادة تعريف البنية التحتية الرقمية بما يتناسب مع الذكاء الاصطناعي. فكما احتاجت الشبكات والويب والحوسبة السحابية إلى معايير مفتوحة لتنتشر على نطاق واسع، يرى المطورون أن المستندات نفسها قد تحتاج اليوم إلى طبقة معيارية جديدة حتى تصبح صالحة لعصر النماذج والوكلاء الذكيين.
لكن نجاح أي معيار لا يعتمد على الفكرة وحدها، بل على قابلية التطبيق والتبني والتوافق بين الأطراف المختلفة. ولهذا، ستظل الأسئلة العملية حاضرة: هل تستطيع المؤسسات تغيير أنظمتها الحالية بسهولة؟ هل سيقبل المزودون بفتح جزء من البنية التقنية؟ وهل يمكن تحقيق توازن بين الانفتاح والضبط والأمان؟
الجواب لم يُحسم بعد، لكن الواضح أن DocLang يضيف نقطة جديدة إلى النقاش حول مستقبل الوثائق في عصر الذكاء الاصطناعي. وإذا نجح في كسب ثقة المطورين والمؤسسات، فقد يصبح أحد الأسس التي تُبنى عليها أدوات العمل المعرفي القادمة.