نماذج لغة أصغر للأجهزة المحمولة

بينما تستمر نماذج الذكاء الاصطناعي ذات اللغات الكبيرة في تصدر عناوين الأخبار، فإن نماذج اللغات الصغيرة هي التي تتواجد في مكان العمل. على الأقل، هذا ما يبدو أن شركة ميتا تراهن عليه، وفقًا لورقة بحثية أصدرها مؤخرًا فريق من علماء الأبحاث التابعين لها.

يمكن لنماذج اللغات الكبيرة، مثل ChatGPT، وGemini، وLlama، استخدام مليارات، بل تريليونات، من المعلمات للحصول على نتائجها. حجم هذه النماذج يجعلها كبيرة جدًا بحيث لا يمكن تشغيلها على الأجهزة المحمولة. لذلك، لاحظ علماء ميتا في بحثهم أن هناك حاجة متزايدة لنماذج لغوية كبيرة وفعالة على الأجهزة المحمولة – وهي حاجة مدفوعة بزيادة تكاليف السحابة ومخاوف زمن الوصول.

في بحثهم، أوضح العلماء كيف قاموا بإنشاء نماذج لغوية كبيرة عالية الجودة مع أقل من مليار معلمة، والتي حافظوا على أنها حجم جيد للنشر على الأجهزة المحمولة.

وخلافًا للاعتقاد السائد الذي يؤكد على الدور المحوري للبيانات وكمية المعلمات في تحديد جودة النموذج، حقق العلماء نتائج باستخدام نموذجهم اللغوي الصغير الذي يمكن مقارنته في بعض المناطق ببرنامج Meta’s Llama LLM.

قال نيك ديجياكومو، الرئيس التنفيذي لشركة Bucephalus، وهي منصة سلسلة توريد للتجارة الإلكترونية تعمل بالذكاء الاصطناعي ومقرها في مدينة نيويورك: “هناك نموذج سائد مفاده أن “الأكبر هو الأفضل”، ولكن هذا يوضح أن الأمر يتعلق حقًا بكيفية استخدام المعلمات”.

وقال لـ TechNewsWorld: “هذا يمهد الطريق لاعتماد الذكاء الاصطناعي على الجهاز على نطاق أوسع”.

خطوة حاسمة

وأوضح داريان شيمي، الرئيس التنفيذي ومؤسس شركة FutureFund، وهي شركة لرأس المال الاستثماري في سان فرانسيسكو، أن أبحاث ميتا مهمة لأنها تتحدى المعيار الحالي للذكاء الاصطناعي المعتمد على السحابة، والذي غالبًا ما يشهد تحليل البيانات في مراكز البيانات البعيدة.

“من خلال جلب معالجة الذكاء الاصطناعي إلى الجهاز نفسه، تعمل Meta على قلب النص – مما قد يقلل من البصمة الكربونية المرتبطة بنقل البيانات ومعالجتها في مراكز البيانات الضخمة التي تستهلك الطاقة، ويجعل الذكاء الاصطناعي القائم على الجهاز لاعبًا رئيسيًا في النظام البيئي التكنولوجي.” قال لـ TechNewsWorld.

وأضاف ياشين مانراج، الرئيس التنفيذي لشركة Pvotal Technologies، وهي شركة تطوير برمجيات أمنية شاملة، في إيجل بوينت بولاية أوريغون: “يعد هذا البحث أول جهد شامل ومشترك علنيًا بهذا الحجم”.

وقال لـ TechNewsWorld: “إنها خطوة أولى حاسمة في تحقيق نهج منسق لـ SLM-LLM حيث يمكن للمطورين إيجاد التوازن الصحيح بين معالجة البيانات السحابية ومعالجة البيانات على الجهاز”. “إنه يضع الأساس حيث يمكن أن تصل وعود التطبيقات التي تعمل بالذكاء الاصطناعي إلى مستوى الدعم والأتمتة والمساعدة التي تم تسويقها في السنوات الأخيرة ولكنها تفتقر إلى القدرة الهندسية لدعم تلك الرؤى.”

لقد اتخذ علماء الميتا أيضًا خطوة مهمة في تقليص حجم نموذج اللغة. وقال نيشانت نيكرا، المدير العالمي لتطوير الأعمال في شركة Skyworks Solutions، وهي شركة لأشباه الموصلات في قرية ويستليك بولاية كاليفورنيا: “إنهم يقترحون نموذجًا يتم تقليصه من حيث الحجم، مما يجعله في متناول الأجهزة القابلة للارتداء والسماعات والهواتف المحمولة”.

وقال لـ TechNewsWorld: “إنهم يقدمون مجموعة جديدة تمامًا من تطبيقات الذكاء الاصطناعي مع توفير طرق جديدة لتفاعل الذكاء الاصطناعي في العالم الحقيقي”. “من خلال تقليص حجمها، فإنها تعمل أيضًا على حل تحدي النمو الرئيسي الذي يعاني منه حاملو شهادات LLM، وهو قدرتهم على النشر على الأجهزة الطرفية.”

تأثير كبير على الرعاية الصحية

أحد المجالات التي يمكن أن يكون لنماذج اللغة الصغيرة فيها تأثير مفيد هو الطب.

“يعد البحث بإطلاق العنان لإمكانات الذكاء الاصطناعي التوليدي للتطبيقات التي تتضمن الأجهزة المحمولة، والتي أصبحت منتشرة في كل مكان في مجال الرعاية الصحية اليوم للمراقبة عن بعد والتقييمات الحيوية،” دانييل كيلفاس، مستشار طبي في شركة IT Medical، وهي شركة عالمية لتطوير البرمجيات الطبية. قال TechNewsWorld.

وتابعت: من خلال إثبات أن نماذج SLM الفعالة يمكن أن تحتوي على أقل من مليار معلمة ولا تزال تؤدي أداءً مشابهًا للنماذج الأكبر في مهام معينة، يفتح الباحثون الباب أمام اعتماد الذكاء الاصطناعي على نطاق واسع في مراقبة الصحة اليومية والرعاية الشخصية للمرضى.

وأوضح كيلفاس أن استخدام SLMs يمكن أن يضمن أيضًا إمكانية معالجة البيانات الصحية الحساسة بشكل آمن على الجهاز، مما يعزز خصوصية المريض. ويمكنها أيضًا تسهيل المراقبة والتدخل الصحي في الوقت الفعلي، وهو أمر بالغ الأهمية للمرضى الذين يعانون من أمراض مزمنة أو أولئك الذين يحتاجون إلى رعاية مستمرة.

وأضافت أن النماذج يمكن أن تقلل أيضًا من الحواجز التكنولوجية والمالية التي تحول دون نشر الذكاء الاصطناعي في أماكن الرعاية الصحية، مما قد يؤدي إلى إضفاء الطابع الديمقراطي على تقنيات المراقبة الصحية المتقدمة لقطاعات أوسع من السكان.

تعكس اتجاهات الصناعة

وأوضح كاريداد مونيوز، أستاذ تكنولوجيا الوسائط الجديدة في جامعة مدينة نيويورك، أن تركيز ميتا على نماذج الذكاء الاصطناعي الصغيرة للأجهزة المحمولة يعكس اتجاهًا أوسع في الصناعة نحو تحسين الذكاء الاصطناعي من أجل الكفاءة وإمكانية الوصول. وقالت لـ TechNewsWorld: “لا يعالج هذا التحول التحديات العملية فحسب، بل يتماشى أيضًا مع المخاوف المتزايدة بشأن التأثير البيئي لعمليات الذكاء الاصطناعي واسعة النطاق”.

وأضاف مونيوز: “من خلال دعم نماذج أصغر وأكثر كفاءة، ترسي ميتا سابقة لتطوير الذكاء الاصطناعي المستدام والشامل”.

تتناسب نماذج اللغات الصغيرة أيضًا مع اتجاه الحوسبة المتطورة، والذي يركز على تقريب قدرات الذكاء الاصطناعي إلى المستخدمين. قال ديجياكومو: “إن نماذج اللغات الكبيرة من OpenAI، وAnthropic، وغيرهما غالبًا ما تكون مبالغة في المبالغة – “عندما يكون كل ما لديك هو مطرقة، فإن كل شيء يبدو وكأنه مسمار”.

وأشار إلى أن “النماذج المتخصصة والمضبوطة يمكن أن تكون أكثر كفاءة وفعالية من حيث التكلفة لمهام محددة”. “لا تتطلب العديد من تطبيقات الهاتف المحمول أحدث تقنيات الذكاء الاصطناعي. لا تحتاج إلى كمبيوتر فائق السرعة لإرسال رسالة نصية.

وأضاف: “يسمح هذا النهج للجهاز بالتركيز على التعامل مع التوجيه بين ما يمكن الإجابة عليه باستخدام SLM وحالات الاستخدام المتخصصة، على غرار العلاقة بين الأطباء العامين والمتخصصين”.

تأثير عميق على الاتصال العالمي

وأكد شيمي أن التأثيرات التي يمكن أن تحدثها أنظمة SLM على الاتصال العالمي عميقة.

وأشار إلى أنه “مع زيادة قدرة الذكاء الاصطناعي على الجهاز، تتضاءل ضرورة الاتصال المستمر بالإنترنت، مما قد يؤدي إلى تغيير كبير في المشهد التكنولوجي في المناطق التي يكون فيها الوصول إلى الإنترنت غير متسق أو مكلف”. “وهذا يمكن أن يضفي طابعًا ديمقراطيًا على الوصول إلى التقنيات المتقدمة، مما يجعل أدوات الذكاء الاصطناعي المتطورة متاحة عبر الأسواق العالمية المتنوعة.”

وبينما تقود شركة ميتا تطوير أنظمة الإدارة المستدامة للأراضي، أشار مانراج إلى أن البلدان النامية تراقب الوضع بقوة لإبقاء تكاليف تطوير الذكاء الاصطناعي تحت السيطرة. وقال: “يبدو أن الصين وروسيا وإيران قد أبدت اهتمامًا كبيرًا بالقدرة على تأجيل العمليات الحسابية على الأجهزة المحلية، خاصة عندما تكون رقائق أجهزة الذكاء الاصطناعي المتطورة محظورة أو لا يمكن الوصول إليها بسهولة”.

وتوقع قائلاً: “نحن لا نتوقع أن يكون هذا تغييرًا جذريًا بين عشية وضحاها، لأن الاستعلامات المعقدة ومتعددة اللغات ستظل تتطلب شهادات ماجستير في القانون قائمة على السحابة لتوفير قيمة متطورة للمستخدمين النهائيين. ومع ذلك، فإن هذا التحول نحو السماح بنموذج “الميل الأخير” على الجهاز يمكن أن يساعد في تقليل العبء الواقع على حاملي شهادات الماجستير في التعامل مع المهام الأصغر، وتقليل حلقات ردود الفعل، وتوفير إثراء البيانات المحلية.

وتابع: “في نهاية المطاف، سيكون المستخدم النهائي هو الفائز بشكل واضح، لأن هذا من شأنه أن يسمح بجيل جديد من القدرات على أجهزته وإجراء إصلاح شامل أكثر واعدة لتطبيقات الواجهة الأمامية وكيفية تفاعل الناس مع العالم.”

وأضاف: “بينما يقود المشتبه بهم المعتادون الابتكار في هذا القطاع مع تأثير محتمل واعد على الحياة اليومية للجميع، يمكن أن تكون SLMs أيضًا بمثابة حصان طروادة الذي يوفر مستوى جديدًا من التطور في اقتحام حياتنا اليومية من خلال وجود نماذج قادرة على جمع البيانات والبيانات الوصفية على مستوى غير مسبوق. ونأمل أنه مع وجود الضمانات المناسبة، سنتمكن من توجيه هذه الجهود نحو نتيجة مثمرة.