Photo Robot يلتقط الصورة المثالية
هل تجد صعوبة في الحصول على الزاوية المثالية للقطة؟ يمكن لـ PhotoBot أن يفعل ذلك التقط الصورة لك. أخبره كيف تريد أن تبدو الصورة، وما هو شكلك مصور روبوت سوف نقدم لك إشارات لتقليد. اختر ما تفضله، وسيقوم PhotoBot – وهو ذراع روبوت مزود بكاميرا – بتعديل موضعه ليتوافق مع المرجع وصورتك. من المحتمل أنك ستعجبك هذه الصورة أكثر من صورك الفوتوغرافية الخاصة.
يقول أوليفر ليمويو، أحد مبتكري PhotoBot: “لقد كان مشروعًا ممتعًا حقًا”. كان يستمتع بالعمل في تقاطع عدة مجالات؛ كان تفاعل الروبوت البشري، ونماذج اللغة الكبيرة، ورؤية الكمبيوتر الكلاسيكية كلها ضرورية لإنشاء الروبوت.
عملت Limoyo على PhotoBot أثناء وجودها في سامسونجمع مديره جيمي لي. لقد كانوا يعملون في مشروع لجعل الروبوت يلتقط الصور، لكنهم كانوا يكافحون من أجل العثور على مقياس جيد للجماليات. ثم رأوا تحدي صور جيتي، حيث قام الأشخاص بإعادة إنشاء الأعمال الفنية الشهيرة في المنزل أثناء الإغلاق الناجم عن فيروس كورونا. أعطى التحدي ليمويو ولي فكرة جعل الروبوت يختار صورة مرجعية لإلهام الصورة.
لتشغيل PhotoBot، كان على Limoyo وLi معرفة شيئين: أفضل طريقة للعثور على الصور المرجعية لنوع الصورة التي تريدها وكيفية ضبط الكاميرا لتتناسب مع هذا المرجع.
اقتراح صورة مرجعية
للبدء في استخدام PhotoBot، عليك أولا أن تزوده بوصف مكتوب للصورة التي تريدها. (على سبيل المثال، يمكنك كتابة “صورة لي وأنا أبدو سعيدًا”.) ثم PhotoBot بمسح البيئة من حولك، وتحديد الأشخاص والأشياء التي يمكنه رؤيتها. يقوم بعد ذلك بالبحث عن مجموعة من الصور المشابهة من قاعدة بيانات للصور المصنفة التي تحتوي على نفس الكائنات.
التالي أ ماجستير يقارن الوصف الخاص بك والكائنات الموجودة في البيئة مع تلك المجموعة الأصغر من الصور ذات العلامات، مما يوفر أقرب المطابقات لاستخدامها كصور مرجعية. يمكن برمجة LLM لإرجاع أي عدد من الصور المرجعية.
على سبيل المثال، عند سؤالك عن “صورة لي أبدو غاضبًا” فقد تحدد شخصًا ونظارة وقميصًا وكوبًا في البيئة. يقوم PhotoBot بعد ذلك بتقديم صورة مرجعية لرجل منهك يحمل كوبًا أمام وجهه من بين خيارات أخرى.
بعد أن يختار المستخدم الصورة المرجعية التي يريد أن تحاكيها صورته، يقوم PhotoBot بتحريك ذراعه الآلية لوضع الكاميرا بشكل صحيح لالتقاط صورة مماثلة.
ضبط الكاميرا لتناسب مرجعًا
لتحريك الكاميرا إلى الموضع المثالي، يبدأ PhotoBot بتحديد الميزات المتماثلة في كلتا الصورتين، على سبيل المثال، ذقن شخص ما، أو أعلى الكتف. ومن ثم يحل مشكلة “نقطة المنظور” (PnP)، والتي تتضمن التقاط عرض ثنائي الأبعاد للكاميرا و مطابقة ذلك إلى موضع ثلاثي الأبعاد في الفضاء. بمجرد أن يحدد PhotoBot نفسه في الفضاء، فإنه يحل كيفية تحريك ذراع الروبوت لتحويل رؤيته ليبدو مثل الصورة المرجعية. يكرر هذه العملية عدة مرات، مع إجراء تعديلات تدريجية كلما اقترب من الوضع الصحيح.
ثم يقوم PhotoBot بالتقاط صورتك.
قام مطورو Photobot بمقارنة الصور مع نظامهم وبدونه.سامسونج/IEEE
لاختبار ما إذا كانت الصور التي التقطها PhotoBot أكثر جاذبية من التصوير الفوتوغرافي البشري للهواة، قام فريق Limoyo بتشكيل ثمانية أشخاص يستخدمون ذراع الروبوت والكاميرا لالتقاط صور فوتوغرافية لأنفسهم ثم يستخدمون PhotoBot لالتقاط صورة بمساعدة الروبوت. ثم طلبوا من 20 شخصًا جديدًا تقييم الصورتين، والسؤال عن أيهما أكثر جماليًا مع مراعاة مواصفات المستخدم (سعيد، متحمس، متفاجئ، إلخ). وبشكل عام، كان PhotoBot هو المصور المفضل 242 مرة من أصل 360 صورة، أي 67 بالمائة من الحالات.
تم تقديم PhotoBot في 16 أكتوبر في المؤتمر الدولي IEEE/RSJ حول الروبوتات والأنظمة الذكية.
على الرغم من أن المشروع لم يعد قيد التطوير، يعتقد لي أنه يجب على شخص ما إنشاء تطبيق يعتمد على البرمجة الأساسية، مما يمكّن الأصدقاء من التقاط صور أفضل لبعضهم البعض. “تخيل مباشرة على هاتفك، أنك ترى صورة مرجعية. لكنك ترى أيضًا ما يراه الهاتف الآن، ومن ثم يتيح لك ذلك التحرك والمحاذاة.
من مقالات موقعك
مقالات ذات صلة حول الويب