، مقالات،

بوسطن ديناميات وشراكة أبحاث تويوتا



اليوم، أعلنت بوسطن ديناميكس ومعهد أبحاث تويوتا (TRI) عن شراكة جديدة “لتسريع تطوير الروبوتات البشرية ذات الأغراض العامة باستخدام نماذج السلوك الكبيرة الخاصة بـ TRI وروبوت أطلس من بوسطن دايناميكس”. إن الالتزام بالعمل من أجل روبوت للأغراض العامة قد يجعل هذه الشراكة تبدو مثل أي شركة تجارية أخرى تعمل بالبشر في الوقت الحالي، ولكن هذا ليس ما يحدث هنا على الإطلاق: تتحدث BD وTRI عن أبحاث الروبوتات الأساسية، مع التركيز على المشكلات الصعبة، و ( الأهم من ذلك) مشاركة النتائج.

السياق الأوسع هنا هو أن شركة Boston Dynamics لديها منصة بشرية ذات قدرة استثنائية قادرة على سلوكيات حركة الجسم بالكامل المتقدمة والمؤلمة أحيانًا إلى جانب بعض التلاعب الأساسي والغاشم بالقوة نسبيًا. وفي الوقت نفسه، تعمل TRI منذ فترة طويلة على تطوير تقنيات التعلم القائمة على الذكاء الاصطناعي لمعالجة مجموعة متنوعة من تحديات التلاعب المعقدة. تعمل TRI على تحقيق ما يسمونه نماذج السلوك الكبيرة (LBMs)، والتي يمكنك اعتبارها مماثلة لنماذج اللغات الكبيرة (LLMs)، باستثناء الروبوتات التي تقوم بأشياء مفيدة في العالم المادي. إن جاذبية هذه الشراكة واضحة تمامًا: تحصل شركة Boston Dynamics على إمكانات جديدة مفيدة لنظام Atlas، بينما تحصل TRI على نظام Atlas لاستكشاف قدرات مفيدة جديدة.

إليك المزيد من البيان الصحفي:

تم تصميم المشروع للاستفادة من نقاط القوة والخبرة لدى كل شريك على قدم المساواة. إن القدرات المادية لروبوت أطلس الكهربائي الجديد، إلى جانب القدرة على القيادة والتشغيل عن بعد لمجموعة واسعة من سلوكيات التلاعب باليدين لكامل الجسم، ستسمح لفرق البحث بنشر الروبوت عبر مجموعة من المهام وجمع البيانات حول أدائه. سيتم استخدام هذه البيانات بدورها لدعم تدريب LBMs المتقدمة، وذلك باستخدام تقييم صارم للأجهزة والمحاكاة لإثبات أن النماذج الكبيرة المدربة مسبقًا يمكن أن تتيح اكتساب سريع لمهارات جديدة قوية وحاذقة لكامل الجسم.

سيقوم الفريق المشترك أيضًا بإجراء بحث للإجابة على أسئلة التدريب الأساسية للروبوتات البشرية، وقدرة نماذج البحث على الاستفادة من استشعار الجسم بالكامل، وفهم التفاعل بين الإنسان والروبوت وحالات السلامة/الضمان لدعم هذه القدرات الجديدة.

لمزيد من التفاصيل تحدثنا مع سكوت كويندرسما (المدير الأول لأبحاث الروبوتات في بوسطن ديناميكس) و روس تيدريك (نائب رئيس أبحاث الروبوتات في TRI).

كيف تمت هذه الشراكة؟

روس تيدريك: نحن نكن قدرًا كبيرًا من الاحترام لفريق Boston Dynamics وما فعلوه، ليس فقط فيما يتعلق بالأجهزة، ولكن أيضًا وحدة التحكم في Atlas. لقد عملوا على تنمية جهود التعلم الآلي الخاصة بهم حيث كنا نعمل أكثر فأكثر على جانب التعلم الآلي. من ناحية TRI، نحن نرى حدود ما يمكنك القيام به في التعامل مع الطاولة، ونريد استكشاف ما هو أبعد من ذلك.

سكوت كويندرسما: إن الجمع بين المهارات والأدوات التي تقدمها TRI مع إمكانات النظام الأساسي الحالية التي لدينا في Boston Dynamics، بالإضافة إلى فرق التعلم الآلي التي قمنا ببنائها على مدار العامين الماضيين، يضعنا في وضع رائع حقًا لتحقيق النجاح نعمل معًا على الأرض ونقوم ببعض الأشياء الرائعة باستخدام Atlas.

ما هو النهج الذي ستتبعه لتوصيل أعمالك، خاصة في سياق كل الجنون الذي يحيط بالبشر في الوقت الحالي؟

تيدريك: هناك الكثير من الضغط في الوقت الحالي للقيام بشيء جديد ومذهل كل ستة أشهر أو نحو ذلك. في بعض النواحي، من الصحي أن يتمتع هذا المجال بالكثير من الطاقة والحماس والطموح. لكنني أعتقد أيضًا أن هناك أشخاصًا في هذا المجال يقدّرون وجهة النظر الأطول والأعمق قليلاً لفهم ما ينجح وما لا ينجح، لذلك يتعين علينا تحقيق التوازن بين ذلك.

الشيء الآخر الذي أود قوله هو أن هناك الكثير من الضجيج هناك. أنا أكون متحمس بشكل لا يصدق للوعد بكل هذه القدرة الجديدة؛ أريد فقط التأكد من أنه بينما ندفع العلم للأمام، فإننا أيضًا نكون صادقين وشفافين بشأن مدى نجاحه.

كويندرسما: لم يغب عن أي من منظمتينا أن هذه ربما تكون واحدة من أكثر النقاط إثارة في تاريخ الروبوتات، ولكن لا يزال هناك قدر هائل من العمل الذي يتعين القيام به.

ما هي بعض التحديات التي ستكون شراكتكم قادرة بشكل فريد على حلها؟

كويندرسما: أحد الأشياء التي نحن متحمسون لها حقًا هو نطاق السلوكيات الممكنة مع البشر – الروبوت البشري هو أكثر بكثير من مجرد زوج من القابضين على قاعدة متنقلة. أعتقد أن فرصة استكشاف مساحة القدرات السلوكية الكاملة للبشر هي على الأرجح شيء نحن في وضع فريد للقيام به الآن بسبب العمل التاريخي الذي قمنا به في بوسطن ديناميكس. أطلس هو روبوت يتمتع بقدرات بدنية عالية، وهو الروبوت الأكثر قدرة الذي بنيناه على الإطلاق. وبرنامج النظام الأساسي الذي لدينا يسمح بأشياء مثل جمع البيانات للتلاعب بالجسم بالكامل لتكون سهلة كما هي في أي مكان في العالم.

تيدريك: في رأيي، لقد فتحنا بالفعل علمًا جديدًا تمامًا – هناك مجموعة جديدة من الأسئلة الأساسية التي تحتاج إلى إجابة. لقد دخلت الروبوتات في عصر العلوم الكبيرة هذا حيث يتطلب الأمر فريقًا كبيرًا وميزانية كبيرة ومتعاونين أقوياء لبناء مجموعات البيانات الضخمة بشكل أساسي وتدريب النماذج لتكون في وضع يسمح لها بطرح هذه الأسئلة الأساسية.

أسئلة جوهرية مثل ماذا؟

تيدريك: لا أحد لديه بداية فكرة عن خليط التدريب المناسب للبشر. مثلًا، نريد إجراء تدريب مسبق على اللغة، وهذا أفضل بكثير، ولكن في أي وقت مبكر نقدم الرؤية؟ في أي وقت مبكر يمكننا تقديم الإجراءات؟ لا أحد يعرف. ما هو المنهج المناسب للمهام؟ هل نريد بعض المهام السهلة التي نحصل فيها على أداء أكبر من الصفر فورًا؟ من المحتمل. هل نريد أيضًا بعض المهام المعقدة حقًا؟ من المحتمل. نريد أن نكون فقط في المنزل؟ فقط في المصنع؟ ما هو الخليط المناسب؟ هل نريد تقلبات خلفية؟ لا أعرف. علينا معرفة ذلك.

هناك المزيد من الأسئلة أيضًا، مثل ما إذا كان لدينا ما يكفي من البيانات على الإنترنت لتدريب الروبوتات، وكيف يمكننا مزج ونقل القدرات من مجموعات بيانات الإنترنت إلى الروبوتات. هل تختلف بيانات الروبوت اختلافًا جوهريًا عن البيانات الأخرى؟ هل ينبغي لنا أن نتوقع نفس قوانين القياس؟ فهل ينبغي لنا أن نتوقع نفس القدرات على المدى الطويل؟

والمسألة الكبيرة الأخرى التي ستسمع الخبراء يتحدثون عنها هي التقييم، وهو عنق الزجاجة الرئيسي. إذا نظرت إلى بعض هذه الأوراق البحثية التي تظهر نتائج مذهلة، فستجد أن القوة الإحصائية لقسم النتائج الخاص بها ضعيفة للغاية، وبالتالي فإننا نقدم الكثير من الادعاءات حول أشياء ليس لدينا أساس كبير لها. سوف يستغرق الأمر الكثير من العمل الهندسي لبناء القوة التجريبية بعناية في نتائجنا. أعتقد أن التقييم لا يحظى بالاهتمام الكافي.

ما الذي تغير في أبحاث الروبوتات في العام الماضي أو نحو ذلك والذي تعتقد أنه مكن من تحقيق هذا النوع من التقدم الذي تأمل في تحقيقه؟

كويندرسما: من وجهة نظري، هناك شيئان رفيعا المستوى غيّرا طريقة تفكيري في العمل في هذا المجال. الأول هو تقارب المجال حول العمليات المتكررة لتدريب مهارات التلاعب من خلال العروض التوضيحية. العمل الرائد لسياسة الانتشار (الذي كان TRI جزءًا كبيرًا منه) هو شيء قوي حقًا – فهو يتطلب عملية توليد مهارات التلاعب التي لم يكن من الممكن فهمها في السابق، وتحويلها إلى شيء حيث يمكنك فقط جمع مجموعة من البيانات، وتدريبها على بنية أكثر أو أقل استقرارًا في هذه المرحلة، وتحصل على نتيجة.

والشيء الثاني هو أن كل ما حدث في مجالات الذكاء الاصطناعي المتاخمة للروبوتات يُظهر أن حجم البيانات وتنوعها هما في الحقيقة مفاتيح السلوك القابل للتعميم. ونتوقع أن ينطبق هذا أيضًا على الروبوتات. ومن ثم، فإن جمع هذين الأمرين معًا، يجعل الطريق واضحًا حقًا، لكنني ما زلت أعتقد أن هناك الكثير من التحديات والأسئلة البحثية المفتوحة التي نحتاج إلى الإجابة عليها.

هل تعتقد أن المحاكاة هي وسيلة فعالة لتوسيع نطاق البيانات للروبوتات؟

تيدريك: أعتقد عمومًا أن الناس يقللون من أهمية المحاكاة. إن العمل الذي كنا نقوم به جعلني متفائلاً للغاية بشأن قدرات المحاكاة طالما أنك تستخدمها بحكمة. إن التركيز على روبوت معين يقوم بمهمة محددة هو بمثابة طرح السؤال الخطأ؛ تحتاج إلى الحصول على توزيع المهام والأداء في المحاكاة للتنبؤ بتوزيع المهام والأداء في العالم الحقيقي. هناك بعض الأشياء التي لا يزال من الصعب محاكاتها بشكل جيد، ولكن حتى عندما يتعلق الأمر بالاحتكاك وأشياء من هذا القبيل، أعتقد أننا نسير بشكل جيد في هذه المرحلة.

هل هناك مستقبل تجاري لهذه الشراكة يمكنك التحدث عنه؟

كويندرسما: بالنسبة لشركة Boston Dynamics، نعتقد بوضوح أن هناك قيمة تجارية طويلة المدى لهذا العمل، وهذا أحد الأسباب الرئيسية وراء رغبتنا في الاستثمار فيه. لكن الغرض من هذا التعاون يتعلق حقًا بالأبحاث الأساسية – التأكد من أننا نقوم بالعمل، ونتقدم بالعلم، ونقوم بذلك بطريقة صارمة بما فيه الكفاية حتى نفهم النتائج ونثق بها بالفعل، ويمكننا إيصال ذلك إلى العالم . لذا، نعم، نحن نرى قيمة هائلة في هذا الأمر تجاريًا. نعم، نحن نقوم بتسويق أطلس تجاريًا، لكن هذا المشروع يتعلق حقًا بالأبحاث الأساسية.

ماذا سيحدث بعد ذلك؟

تيدريك: هناك أسئلة تتقاطع بين الأشياء التي قامت بها BD والأشياء التي قامت بها TRI والتي يتعين علينا القيام بها معًا للبدء، وهذا سوف يؤدي إلى استمرار الأمور. ومن ثم لدينا طموحات كبيرة، فالهدف هو الحصول على قدرة عامة نطلق عليها LBM (نماذج السلوك الكبيرة) تعمل على نظام Atlas. نحاول في السنة الأولى التركيز على هذه الأسئلة الأساسية، وتجاوز الحدود، وكتابة الأوراق البحثية ونشرها.

أريد أن يكون الناس متحمسين لمشاهدة نتائجنا، وأريد أن يثق الناس في نتائجنا عندما يرونها. بالنسبة لي، هذه هي الرسالة الأكثر أهمية لمجتمع الروبوتات: من خلال هذه الشراكة، نحاول اتخاذ وجهة نظر أطول توازن بين تفاؤلنا الشديد وكوننا حاسمين في نهجنا.

من مقالات موقعك

مقالات ذات صلة حول الويب

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى