تجد الذكاء الاصطناعي من Google الماس بدون تدريب

عشرات الملايين من اللاعبين يلعبون ماين كرافت كل شهر ، والكثير منهم على دراية جيدة بكيفية عمل الكون. يعد جمع Diamonds أحد أهم الأشياء التي عليك القيام بها لأنها مورد مهم يمكن استخدامه لصياغة الأدوات والأسلحة الأفضل ، وترقية أدوات السحر ، والتجارة.

إن الحصول على هذه الماس ليس بالأمر السهل ، على الأقل في البداية ، حيث يتعين عليك تعلم إجراء محدد لإلحاقها. تحتاج إلى الأدوات المناسبة ، التي تتطلب الصياغة ، ثم تحتاج إلى حفر وإنشاء منجم الماس الخاص بك. يمكن أن يستغرق الحصول على الماس ما بين 30 دقيقة وساعة ، خاصة إذا كنت جديدًا في اللعبة. كلما لعبت ماين كرافت، كلما ستحصل على كل شيء أفضل وأسرع ، بما في ذلك جمع الماس.

هل يمكن أن يجد نموذج الذكاء الاصطناعى الماس بمفرده في ماين كرافت دون أي تدريب مسبق على كيفية القيام بذلك؟ اتضح أن الجواب نعم. لدى DeepMind من Google منظمة العفو الدولية تسمى Dreamer ، والتي كلفتها بإيجاد الماس في ماين كرافت وأعطاها أي تدريب على الإطلاق لدعم المهمة. تعلمت الذكاء الاصطناعى اللعبة من تلقاء نفسها وكانت ناجحة في النهاية في اللعب ماين كرافت تماما مثل الإنسان عندما يتعلق الأمر بالعثور على الماس.

كما قد تكون قد خمنت بالفعل ، فإن هذه التجربة تزيد عن ذلك بكثير من مجرد ماين كرافت. لكن اللعبة الشعبية هي عالم رائع لتدريب بعض نماذج الذكاء الاصطناعي بسبب طبيعة اللعبة. في كل مرة تبدأ فيها لعبة ، ستحمل عالمًا جديدًا عليك استكشافه.

الغرض من أنظمة الذكاء الاصطناعى مثل Dreamer ليس في الحقيقة لعب ألعاب الفيديو الشهيرة ، والتي من الواضح أنها يمكن أن تفعل. بدلاً من ذلك ، فإنه يفهم محيطهم وتحديد الإجراءات التي يجب عليهم اتخاذها لتحقيق مهمة.

إذا كان الروبوتات يتبادر إلى الذهن كحالة استخدام لـ Dreamer ، فلن يكون ذلك مفاجئًا. هذا بالضبط ما قد تستخدمه Google مثل هذه الأنظمة ، خاصة بالنظر إلى ما فعله Dreamer “لـ” التغلب “على اللعبة ماين كرافت. للحصول على الماس ، تخيل الذكاء الاصطناعى المستقبل.

وفق طبيعة، استخدم علماء DeepMind عدة طرق للحصول على النموذج لإخراج الماس في ماين كرافت. أولاً ، هناك تعلم تعزيز ، وهي تقنية تكافئ الذكاء الاصطناعي للمهام المنجزة بشكل صحيح. يتعلم الذكاء الاصطناعي أداء المهام التي من شأنها أن تؤدي إلى المكافآت.

ثم هناك قدرة Dreamer على بناء نموذج عالمي لمحيطه في اللعبة لفهم ما قد تؤدي إليه تصرفاتها.

هل تتذكر الإجراء متعدد الخطوات لإلغاء الماس الذي ذكرته أعلاه؟ سيكون عليك قطع الأشجار إلى صياغة طاولة و pickaxe خشبية. هذا أنا جيد فقط للحصول على الحجر الذي تحتاجه لتخليص فأس الحجر والفرن. قد ترى إلى أين يسير هذا ؛ هذا صحيح ، تحتاج إلى جمع الحديد لفأس أفضل.

بمجرد الانتهاء من ذلك ، تحتاج إلى الحصول على نفسك بأمان في منجم ، وهو أمر مسؤول عن صنعه. سترغب في تجنب الحمم البركانية التي تقتلك.

ضعها على هذا النحو ، ومن السهل جدًا العثور على الماس الأول ، حتى لو استغرق الأمر وقتًا.

وضعت Google Dreamer للعمل ، حيث يتعلم الذكاء الاصطناعي كيفية العثور على هذا الماس على مدى تسعة أيام. يعيد Googlers ضبط الكون كل 30 دقيقة لإجبار Dreamer على التكيف مع عالم جديد بدلاً من التعود على الكون الذي كانت يلعبه. كما أعطوا Dreamer مكافأة “Plus One” في كل مرة يكمل فيها الذكاء الاصطناعى إحدى الخطوات المطلوبة في نهاية المطاف ماس.

واصلت الذكاء الاصطناعى اللعب وتعلم جميع الإجراءات اللازمة لاستسلام وإيجاد الماس على مدار تلك الأيام التسعة. يتيح كل شوط أن يتعلم المزيد عن العالم من حوله. فكر في الأمر مثل توم كروز في حافة الغد. ظل يموت ويعود إلى نفس اللحظة في ماضيه ، فقط للتقدم أكثر وأكثر مع كل حياة جديدة.

في النهاية ، تغلب توم كروز وإميلي بلانت على الأجانب في الفيلم. في النهاية ، تمكن Dreamer من استخراج هذا الماس في غضون 30 دقيقة ، وبسرعة لاعب بشري خبير سيحتاج إلى 20-30 دقيقة للذهاب إلى الإجراء بأكمله.

وقال دانيجار هافنر ، عالم Google Deeper طبيعة. “إنه يتيح لمنظمة العفو الدولية فهم بيئتها المادية وأيضًا أن تنشر ذاتيا مع مرور الوقت ، دون أن يضطر الإنسان إلى إخباره بالضبط بما يجب فعله.”

قد تتحول قدرة الذكاء الاصطناعى على تخيل المستقبل قبل اتخاذ أي إجراءات إلى تطور رئيسي في بناء نماذج منظمة العفو الدولية التي تعمل على تشغيل الروبوتات المتقدمة التي تحتاج إلى أداء مهام في العالم الحقيقي. سيتعين على الروبوتات أن تتخيل نتائج أفعالهم قبل التفاعل مع العالم من حولهم. في ماين كرافت، يمكن أن يتخيل حالم أن تقطيع الشجرة سيسمح لها بجمع الخشب قبل القيام بذلك.

لم يكن تحدي الماس أولوية للباحثين. لقد استخدموا ببساطة ماين كرافت البيئة لأنها يمكن أن توفر لهم أسباب الاختبار الصحيحة للخوارزمية. يمكن أن يلاحظوا منظمة العفو الدولية تكييفًا مع بيئة متغيرة باستمرار يتم إنشاؤها تلقائيًا بسهولة.

يمكنك معرفة المزيد من التفاصيل حول Dreamer V3 في هذا الرابط. دراسة DeepMind متوفرة بالكامل في طبيعة.