، مقالات،

Alphaevolve يعالج مشكلة التقبيل والمزيد


هناك مفهوم رياضي يسمى “رقم التقبيل‘ بشكل مخيب للآمال إلى حد ما ، لا علاقة له بالتقبيل الفعلي ؛ يعدد عدد المجالات التي يمكن أن تلمس (أو “قبلة”) مجال واحد من الحجم المتساوي دون عبوره. في بعد واحد ، رقم التقبيل هو اثنين. في بعدين ، 6 (فكر في نيويورك تايمزتكوين اللغز النحل الإملائي). مع نمو عدد الأبعاد ، تصبح الإجابة أقل وضوحًا: بالنسبة لمعظم الأبعاد التي تزيد عن 4 ، تُعرف الحدود العلوية والسفلية فقط على رقم التقبيل. الآن ، قام وكيل الذكاء الاصطناعى الذي طورته Google DeepMind الذي يسمى Alphaevolve بمساهمته في المشكلة ، مما زاد من الحد الأدنى على رقم التقبيل في 11 بعدًا من 592 إلى 593.

قد يبدو هذا بمثابة تحسن تدريجي في المشكلة ، خاصةً أن الحد الأعلى على رقم التقبيل في 11 أبعاد هو 868 ، وبالتالي فإن النطاق غير المعروف لا يزال كبيرًا جدًا. لكنه يمثل اكتشافًا رياضيًا جديدًا من قبل وكيل الذكاء الاصطناعي ، ويتحدى فكرة أن نماذج اللغة الكبيرة ليست قادرة على المساهمات العلمية الأصلية.

وهذا مجرد مثال واحد على ما أنجزه Alphaevolve. يقول Matej Balog ، عالم الأبحاث في DeepMind الذي عمل في المشروع: “لقد طبقنا Alphaevolve عبر مجموعة من المشكلات المفتوحة في الرياضيات البحثية ، وقمنا باختيار المشكلات عمداً من أجزاء مختلفة من الرياضيات: التحليل ، التواطؤ ، الهندسة”. ووجدوا أنه بالنسبة إلى 75 في المائة من المشكلات ، قام نموذج الذكاء الاصطناعي بتكرار الحل الأمثل المعروف بالفعل. في 20 في المائة من الحالات ، وجدت أن الأمثل الجديد تجاوز أي حل معروف. يقول بالوج: “كل حالة من هذا القبيل هو اكتشاف جديد”. (في 5 في المائة من الحالات ، تقارب الذكاء الاصطناعي على حل كان أسوأ من الحالات الأمثل المعروفة.)

طور النموذج أيضًا خوارزمية جديدة لضرب المصفوفة – وهي العملية التي تكمن وراء الكثير من التعلم الآلي. كان هناك إصدار سابق من طراز DeepMind’s AI ، المسمى Alphatensor ، قد تغلب بالفعل على أفضل خوارزمية معروفة السابقة ، التي تم اكتشافها في عام 1969 ، لضرب 4 من 4 مصفوفات. وجد Alphaevolve نسخة أكثر عمومية من تلك الخوارزمية المحسنة.

قام Alphaevolve من DeepMind بإجراء تحسينات على العديد من المشكلات العملية في Google. Google DeepMind

بالإضافة إلى الرياضيات المجردة ، قام الفريق أيضًا بتطبيق نموذجه على المشكلات العملية التي تواجهها Google كل يوم. تم استخدام الذكاء الاصطناعى أيضًا لتحسين تزامن مركز البيانات للحصول على تحسن بنسبة 1 في المائة ، لتحسين تصميم وحدة معالجة Google Tensor التالية ، واكتشاف تحسن في kernel المستخدمة في تدريب الجوزاء مما يؤدي إلى انخفاض في وقت التدريب بنسبة 1 في المائة.

يقول ألكساندر نوفكوف ، كبير عالم الأبحاث في ديبميند الذي عمل أيضًا على ألفايفل: “من المدهش للغاية أنه يمكنك القيام بالعديد من الأشياء المختلفة مع نظام واحد”.

كيف يعمل Alphaevolve

يمكن لـ Alphaevolve أن تكون عامة جدًا لأنه يمكن تطبيقها على أي مشكلة تقريبًا يمكن التعبير عنها كرمز ، والتي يمكن فحصها بواسطة قطعة رمز أخرى. يوفر المستخدم طعنة أولية في المشكلة – وهو برنامج يحل المشكلة المطروحة ، مهما كان دون المستوى الأمثل – وبرنامج التحقق الذي يتحقق من مدى استوفاء جزء من الكود بالمعايير المطلوبة.

بعد ذلك ، يأتي نموذج اللغة الكبير ، في هذه الحالة الجوزاء ، ببرامج مرشحات أخرى لحل نفس المشكلة ، ويتم اختبار كل واحد بواسطة التحقق. من هناك ، يستخدم Alphaevolve خوارزمية وراثية بحيث يبقى “الأصلح” للحلول المقترحة ويتطور إلى الجيل القادم. تتكرر هذه العملية حتى تتوقف الحلول عن التحسن.

مخطط مع أربعة مكونات تشير إلى الكوديستخدم Alphaevolve مجموعة من نماذج اللغة الجوزاء الكبيرة (LLMS) بالتزامن مع رمز التقييم ، وكلها تنسيقها خوارزمية وراثية لتحسين قطعة رمز. Google DeepMind

“جاءت نماذج اللغة الكبيرة ، وبدأنا نسأل أنفسنا ، هل هي الحالة التي سيضيفونها فقط ما هو موجود في بيانات التدريب ، أو هل يمكننا استخدامها في الواقع لاكتشاف شيء جديد تمامًا ، أو خوارزميات جديدة أو معرفة جديدة؟” يقول بالوج. يزعم هذا البحث ، كما يدعي Balog ، أنه “إذا كنت تستخدم نماذج اللغة الكبيرة بالطريقة الصحيحة ، فيمكنك ، بمعنى دقيق للغاية ، الحصول على شيء جديد بشكل واضح وصحيح في شكل خوارزمية.”

يأتي Alphaevolve من نسب طويلة من نماذج DeepMind ، والعودة إلى Alphazero ، التي أذهلت العالم من خلال تعلم لعب لعبة Chess ، Go ، وغيرها من الألعاب أفضل من أي لاعب بشري دون استخدام أي معرفة بشرية – فقط من خلال لعب اللعبة واستخدام التعلم التعزيز لإتقانها. منظمة العفو الدولية لحل الرياضيات الأخرى التي تعتمد على التعلم التعزيز ، ألفاب مقابل ، على المستوى الفضي الطبي على أولمبياد الرياضيات الدولي 2024.

بالنسبة إلى Alphaevolve ، انفجر الفريق من تقليد التعلم التعزيز لصالح الخوارزمية الوراثية. يقول بالوج: “النظام أبسط بكثير”. “وهذا في الواقع له عواقب ، أنه من الأسهل بكثير إعداد مجموعة واسعة من المشكلات.”

المستقبل (ليس مخيفًا تمامًا)

يأمل الفريق وراء Alphaevolve تطوير نظامه بطريقتين.

أولاً ، يريدون تطبيقه على مجموعة واسعة من المشكلات ، بما في ذلك تلك الموجودة في العلوم الطبيعية. لمتابعة هذا الهدف ، يخططون لفتح برنامج وصول مبكر للأكاديميين المهتمين لاستخدام Alphaevolve في أبحاثهم. قد يكون من الصعب تكييف النظام مع العلوم الطبيعية ، لأن التحقق من الحلول المقترحة قد يكون أقل وضوحًا. ولكن ، يقول بالوج ، “نحن نعلم أنه في العلوم الطبيعية ، هناك الكثير من أجهزة المحاكاة لأنواع مختلفة من المشكلات ، وبعد ذلك يمكن استخدامها في Alphaevolve أيضًا. ونحن ، في المستقبل ، مهتمين جدًا بتوسيع نطاق في هذا الاتجاه.”

ثانياً ، يريدون تحسين النظام نفسه ، ربما عن طريق اقترانه بمشروع آخر DeepMind: المعلم المشارك لمنظمة العفو الدولية. يستخدم هذا الذكاء الاصطناعي أيضًا LLM وخوارزمية وراثية ، لكنه يركز على توليد الفرضيات في اللغة الطبيعية. يقول بالوج: “إنهم يطورون هذه الأفكار والفرضيات ذات المستوى الأعلى”. “إن دمج هذا المكون في أنظمة شبيهة بـ Alphaevolve ، على ما أعتقد ، سيسمح لنا بالذهاب إلى مستويات أعلى من التجريد.”

هذه الاحتمالات مثيرة ، لكن بالنسبة للبعض قد تبدو أيضًا تهديدًا-على سبيل المثال ، يمكن اعتبار تحسين تدريب Alphaevolve لتدريب الجوزاء على أنه بداية من الذكاء الاصطناعى ذاتيًا ، والتي سيؤدي بعض القلق إلى انفجار استخباراتي هارب يشار إليه باسم التفرد. يؤكد فريق DeepMind أن هذا ليس هدفهم ، بالطبع. يقول نوفيكوف: “نحن متحمسون للمساهمة في تقدم الذكاء الاصطناعي الذي يفيد الإنسانية”.

من مقالات موقعك

المقالات ذات الصلة حول الويب

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى