كيف يستخدم Helm.ai الذكاء الاصطناعي للسيارات ذاتية القيادة

كان من المفترض أن تكون السيارات ذاتية القيادة في مرائبنا الآن ، وفقًا للتنبؤات المتفائلة منذ بضع سنوات فقط. لكننا قد نقترب من عدد قليل من نقاط التحول ، مع ارتفاع اعتماد Robotaxi وتعتاد المستهلكين على أنظمة مساعدة السائق أكثر وأكثر تطوراً في سياراتهم. إحدى الشركات التي تدفع الأمور إلى الأمام هي مقر وادي السيليكون helm.ai ، التي تقوم بتطوير برامج لكل من أنظمة مساعدة السائق والمركبات ذاتية الحكم الكاملة.
توفر الشركة نماذج الأساس للتنبؤ القصد والتخطيط للمسار الذي تحتاجه السيارات ذاتية القيادة على الطريق ، كما تستخدم الذكاء الاصطناعي التوليدي لإنشاء بيانات تدريب اصطناعية تقوم بإعداد السيارات للعديد من الأشياء التي يمكن أن تخطئ هناك. IEEE Spectrum تحدث مع فلاديسلاف فورونينسكي، المؤسس والرئيس التنفيذي لشركة Helm.ai ، حول إنشاء الشركة من البيانات الاصطناعية لتدريب أنظمة السيارات ذاتية القيادة والتحقق منها.
كيف يستخدم Helm.ai الذكاء الاصطناعي للمساعدة في تطوير السيارات ذاتية القيادة؟
فلاديسلاف فوروننسكي: نحن نستخدم الذكاء الاصطناعي التوليدي لأغراض المحاكاة. لذا ، بالنظر إلى قدر معين من البيانات الحقيقية التي لاحظتها ، هل يمكنك محاكاة المواقف الجديدة بناءً على تلك البيانات؟ تريد إنشاء بيانات واقعية قدر الإمكان مع تقديم شيء جديد بالفعل. يمكننا إنشاء بيانات من أي كاميرا أو مستشعر لزيادة التنوع في مجموعات البيانات هذه ومعالجة حالات الزاوية للتدريب والتحقق من الصحة.
أعلم أن لديك Vidgen لإنشاء بيانات الفيديو و العالم لإنشاء أنواع أخرى من بيانات المستشعر. هل ما زالت شركات السيارات المختلفة تعتمد على طرائق مختلفة؟
فوروننسكي: هناك بالتأكيد مصلحة في طرائق متعددة من عملائنا. ليس الجميع يحاولون فعل كل شيء بالرؤية فقط. الكاميرات رخيصة نسبيا ، في حين أن أنظمة LIDAR أكثر تكلفة. ولكن يمكننا في الواقع تدريب أجهزة المحاكاة التي تأخذ بيانات الكاميرا ومحاكاة شكل إخراج Lidar. يمكن أن تكون وسيلة لتوفير التكاليف.
وحتى إذا كان مجرد مقطع فيديو ، فستكون هناك بعض الحالات التي تكون نادرة بشكل لا يصدق أو من المستحيل إلى حد كبير أو تشكل خطيرًا للغاية أثناء قيامك بالقيادة في الوقت الفعلي. وهكذا يمكننا استخدام الذكاء الاصطناعي التوليدي لإنشاء بيانات فيديو عالية الجودة للغاية ولا يمكن تمييزها بشكل أساسي من البيانات الحقيقية لتلك الحالات. هذه أيضًا طريقة لتوفير تكاليف جمع البيانات.
كيف يمكنك إنشاء حالات الحافة غير العادية؟ هل تقول ، “الآن وضع الكنغر في الطريق ، الآن ضع حمار وحشي على الطريق”؟
فوروننسكي: هناك طريقة للاستعلام عن هذه النماذج لحملها على إنتاج مواقف غير عادية – إنها حقًا تتعلق بدمج طرق للتحكم في نماذج المحاكاة. يمكن القيام بذلك باستخدام نص أو صور سريعة أو أنواع مختلفة من المدخلات الهندسية. يمكن تحديد هذه السيناريوهات بشكل صريح: إذا كان لدى شركة صناعة السيارات بالفعل قائمة بالغسيل من المواقف التي يعرفونها يمكن أن تحدث ، فيمكنهم الاستعلام عن نماذج الأساس هذه لإنتاج تلك المواقف. يمكنك أيضًا القيام بشيء أكثر قابلية للتطوير حيث توجد عملية استكشاف أو توزيع عشوائي لما يحدث في المحاكاة ، ويمكن استخدامه لاختبار كومة القيادة الذاتية مقابل المواقف المختلفة.
وشيء جميل حول بيانات الفيديو ، والتي لا تزال بالتأكيد الطريقة السائدة للقيادة ذاتية ، يمكنك التدريب على بيانات الفيديو التي لا تأتي فقط من القيادة. لذلك عندما يتعلق الأمر بفئات الكائنات النادرة هذه ، يمكنك العثور عليها بالفعل في العديد من مجموعات البيانات المختلفة.
لذلك إذا كان لديك مجموعة بيانات فيديو من الحيوانات في حديقة حيوان ، فهل ستساعد نظام القيادة على التعرف على الكنغر في الطريق؟
فوروننسكي: بالتأكيد ، يمكن استخدام هذا النوع من البيانات لتدريب أنظمة الإدراك لفهم فئات الكائنات المختلفة هذه. ويمكن أيضًا استخدامه لمحاكاة بيانات المستشعرات التي تدمج هذه الكائنات في سيناريو القيادة. أعني ، بالمثل ، أن عددًا قليلًا جدًا من البشر قد شاهدوا الكنغر على طريق في الحياة الحقيقية. أو حتى ربما في الفيديو. لكن من السهل أن تستحضر في عقلك ، أليس كذلك؟ وإذا رأيت ذلك ، فستتمكن من فهمه بسرعة كبيرة. ما هو لطيف في الذكاء الاصطناعى هو إذا [the model] يتعرض لمفاهيم مختلفة في سيناريوهات مختلفة ، يمكن أن يجمع بين تلك المفاهيم في المواقف الجديدة. يمكن أن يلاحظ ذلك في مواقف أخرى ثم يجلب هذا الفهم إلى القيادة.
كيف تقوم بالتحكم في الجودة للبيانات الاصطناعية؟ كيف تؤكد لعملائك أنه جيد مثل الشيء الحقيقي؟
فوروننسكي: هناك مقاييس يمكنك التقاطها والتي تقيم عدديًا تشابه البيانات الحقيقية مع البيانات الاصطناعية. أحد الأمثلة على ذلك هو أن تأخذ مجموعة من البيانات الحقيقية وتأخذ مجموعة من البيانات الاصطناعية التي تهدف إلى محاكاةها. ويمكنك ملائمة توزيع الاحتمالات لكليهما. وبعد ذلك يمكنك مقارنة العددي بين المسافة بين توزيعات الاحتمالات هذه.
ثانياً ، يمكننا التحقق من أن البيانات الاصطناعية مفيدة لحل بعض المشكلات. يمكنك القول ، “سنقوم بمعالجة حالة الزاوية هذه. يمكنك التحقق من أن استخدام البيانات المحاكاة في الواقع يحل المشكلة وتحسين الدقة في هذه المهمة دون التدريب على البيانات الحقيقية.
هل هناك الرافضين الذين يقولون إن البيانات الاصطناعية لن تكون جيدة بما يكفي لتدريب هذه الأنظمة وتعليمهم كل ما يحتاجون إلى معرفته؟
فوروننسكي: الرافضون هم عادة ليسوا خبراء منظمة العفو الدولية. إذا بحثت عن المكان الذي يسير فيه عفريت ، فمن الواضح أن المحاكاة سيكون لها تأثير كبير على تطوير أنظمة القيادة المستقلة. أيضًا ، ما هو جيد بما فيه الكفاية هو هدف متحرك ، مثل تعريف الذكاء الاصطناعي أو AGI[ artificial general intelligence]. يتم إجراء بعض التطورات ، ثم يعتاد الناس عليهم ، “أوه ، هذا لم يعد مثيرًا للاهتمام. لكنني أعتقد أنه من الواضح تمامًا أن المحاكاة القائمة على الذكاء الاصطناعي ستستمر في التحسن. أناوين تريد صراحة نظام الذكاء الاصطناعي لتصميم شيء ما ، لا يوجد عنق الزجاجة في هذه المرحلة. ثم إنها مجرد مسألة حول مدى تعميمها.
من مقالات موقعك
المقالات ذات الصلة حول الويب