محليات

“سدايا” تطلق “النماذج اللغوية الكبيرة”

تغطيات – الرياض:
قدمت الهيئة السعودية للبيانات والذكاء الاصطناعي “سدايا” معلومات عن الذكاء الاصطناعي التوليدي والنماذج اللغوية الكبيرة وكيفية استخدامها والتحديات التي تواجهه في تقرير أعدته وكشفت عنه اليوم (الثلاثاء).

وعرفت الهيئة النموذج اللغوي بأنه نموذج ذكاء اصطناعي يحدد احتمالية وجود سلسلة معينة من الكلمات في جملة ما وعندما يتكون النموذج من عدد كبير من المعاملات يطلق عليه نموذج لغوي كبير، وتندرج هذه النماذج الكبيرة تحت مجموعة من النماذج تُعرف بالنماذج التأسيسية وهي نماذج مدربة على بيانات مختلفة ويمكن تكييفها بأداء مجموعة واسعة من المهام.

وأضافت أن النماذج اللغوية الكبيرة تتميز بقدرتها على القيام بعدة مهام مقارنة بالنماذج المتخصصة التي تقوم بمهمة معينة ومن أبرز حالات استخدامها: كتابة النصوص والمقالات، وتلخيص وتبسيط النصوص، والترجمة من لغة إلى لغة أخرى، والإجابة عن الأسئلة، وتحليل المشاعر، وتصنيف العناصر إلى فئات، وكتابة الأكواد البرمجية، واستخراج الكلمات الافتتاحية، وكتابة الإعلانات التجارية، والتدقيق النحوي، كما تعد هذه النماذج فاعلة جدًا وقادرة على تنفيذ أنواع مختلفة من المهام مثل: إنشاء النصوص، والترجمة والتلخيص بلغات متعددة.

وذكرت أن النماذج اللغوية الكبيرة تختلف عن نماذج اللغات الطبيعية التقليدية من جانبين وهما حجم بيانات التدريب وعدد المعاملات، في حين يتضمن تطوير النماذج اللغوية الكبيرة ثلاث خطوات رئيسة هي: جمع مجموعة بيانات من مستندات نصية وتدريب الخوارزميات لفهم العلاقة بين الكلمات وتقييم النماذج بصورة متكررة وضبطها

ولفتت إلى أن هذه النماذج اللغوية قد ظهرت في أوائل الثمانينيات من النماذج الاحتمالية لتوليد اللغات الطبيعية التي طورت لأنظمة التعرف الآلي على الكلام (ASR)، وتطورت خلال السنوات الأخيرة حتى وصلت في وقتنا الحاضر إلى ما يسمى بالنماذج اللغوية الكبيرة، والتي زاد الاهتمام بها بعد أن أطلقت شركة Open AI خدمة لتجربة نموذج Chat GBT مجانًا عام 2022م وبلغ عدد مستخدمي الخدمة وقتها أكثر من مليون مستخدم في أول 5 أيام من إطلاقها.

وأكدت أن الكثير من الشركات التقنية الكبيرة تسابقت على إصدار نماذج لغوية كبيرة مثل شركة جوجل التي أطلقت “Bard”، وشركة ميتا التي أطلقت “liama 2″، مضيفة أن هناك عدة تحديات تواجه عملية تطوير هذه النماذج، ومنها ارتفاع التكلفة المادية، وغياب الحوكمة، وشح الموارد والكفاءات، والتعدي على الملكية الفكرية.

وأشارت إلى أن هناك مخاطر تظهر مع تبني هذه النماذج كتسريب المعلومات، وإصدار معلومات خاطئة، فضلا عن أضرار بيئية إذ تعتمد النماذج على موارد حوسبة ضخمة تستهلك كمية هائلة من الموارد الطبيعية، وبعضها ينتج قدرا كبيرا من الكربون.

وتوقعت أن تشكل حالات استخدام النماذج التأسيسية بشكل عام 50% من حالات استخدام معالجة اللغات الطبيعية في عام 2026م بينما كانت تمثل أقل من 5% من حالات الاستخدام في عام 2021م، في حين أن 37 مليار ريال ستستثمر في الشركات الناشئة التي تعتمد على هذه النماذج بحلول 2026.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

مقالات ذات صلة

زر الذهاب إلى الأعلى