أخبار

يذهل ترقية Text to-Video AI بميزات جديدة


لا أقدر ما فعله Openai مع ميزات سلامة AI من طراز AI من ChatGPT ، لكنني بالتأكيد أقدر التطورات الهائلة من Openai. نعم ، صور استوديو Ghibli-esque التي تغمر الشبكات الاجتماعية مزعجة ، وكذلك ChatGpt Deepfakes التي تعرض المشاهير. ولكن ، مرة أخرى ، حقق Openai شيئًا رائعًا هنا.

إن سهولة استخدام توليد الصور 4O تضع بشكل أساسي أداة Photoshop متطورة في جيبك. ليس عليك حتى معرفة كيفية استخدام Photoshop ، لقد ذكرت المنتج بسبب ما تعنيه الكلمة أو تستخدمه. عليك ببساطة إخبار الذكاء الاصطناعى بما تريد ، وسوف يقوم ChatGpt بتسليمه.

لم أكن أعتقد أنه يمكن تفجير ذهني مرتين في غضون بضعة أسابيع ، ولكن هذا ما حققه المدرج مع نموذج Text/Image-to-Video الجديد Gen-4. تتنافس شركة AI Startup بشكل مباشر مع Sora من Openai وأدوات AI المماثلة التي تتيح لك إنشاء مقاطع فيديو بنفس السهولة التي تقوم بها بإنشاء الصور.

ومع ذلك ، فإن Runway Gen-4 يفعل شيئًا فشل الآخرون في تحقيقه. توصلت الشركة إلى نموذج يجلب الاتساق إلى توليد فيديو الذكاء الاصطناعى ، وهو أحد المشكلات التي يجب إصلاحها في هذا المجال الفرعي الخاص من برامج Genai.

لإنشاء مقاطع فيديو مع الذكاء الاصطناعي التي تستحق شيئًا ما ، يجب أن تكون الذكاء الاصطناعي قادرًا على دعم تناسق الشخصية والمشهد. هذا شيء يمكن أن يقدمه Runway Gen-4 ، والنتائج تثير العقل.

تطورت صناعة الأفلام بشكل كبير في السنوات الأخيرة ، ولكن هناك شيء واحد لم يتغير. أي قصة قد ترويها من خلال هذه الوسيلة لها نفس الشخصيات. تظهر في مشاهد مختلفة ، وارتداء ملابس مختلفة ، وتؤدي مهام مختلفة أثناء تقديم جميع أنواع الخطوط.

فكر في الأمر على هذا النحو: إذا كان لديك روبرت داوني جونيور في فيلم Marvel ، فأنت تريد دائمًا أن تتعرف عليه ، بغض النظر عن عدد الأدوار المتميزة التي سيتعين عليه لعبها في MCU ، وما هي الأزياء التي يرتديها ، واللكنة التي قد يستخدمها للتحدث.

هذا ليس ما يحدث مع مولدات Text to-Video AI. أو إذا كان الأمر كذلك ، لم يكن من السهل الانسحاب. لقد رأينا الكثير من إبداعات الفيديو المثيرة التي تم إنشاؤها من الذكاء الاصطناعى حيث كانت الذكاء الاصطناعى متاحًا إلى حد كبير للحفاظ على نفس الشخصية من مشهد إلى آخر. ولكن لا يزال بإمكانك معرفة أنها شخصية منظمة العفو الدولية ولم يكن اتساق الشخصية مثاليًا.

لكن Runway Gen-4 قد يجعل الأمر أسهل من أي وقت مضى لتحقيق دورات شخصية من الدرجة الأولى. على الأقل ، يبدو أن هذا هو الاستنتاج الذي أظهره المدرج عند الإعلان عن نموذج Gen-4.

وكتبت الشركة في منشور مدونة: “مع Gen-4 ، يمكنك الآن إنشاء شخصيات ومواقع وكائنات متسقة عبر المشاهد”.

“ببساطة اضبط مظهرك وشعورك وسيحافظ النموذج على بيئات عالمية متماسكة مع الحفاظ على الأسلوب المميز والمزاج والعناصر السينمائية لكل إطار. ثم تجديد تلك العناصر من وجهات نظر ومواقف متعددة داخل مشاهدك.”

الاتساق هو المفتاح هنا ، وهذا ما يركز عليه Runaway في منشور المدونة. “يمكن لـ GEN-4 الاستفادة من المراجع المرئية ، إلى جانب التعليمات ، لإنشاء صور ومقاطع فيديو جديدة تستخدم أنماطًا وموضوعات ومواقع متسقة وأكثر من ذلك. مما يتيح لك حرية إبداعية غير مسبوقة لرواية قصتك” ، كتب Runway. كل هذا يحدث دون صقل أو تدريب إضافي.

النتائج مذهلة ، سواء عندما يتعلق الأمر بمقاطع فيديو AI الحية ومقاطع الرسوم المتحركة. تعتبر لقطات العمل الحية مثيرة بشكل خاص ، لأنها تبدو مثل مقاطع الحياة الواقعية. لن تكون قادرًا على معرفة الفرق ، وهو أبرز ما في Runway Gen-4.

يسمى Gen-4 قصير القطيع (أعلاه) هي دراما ذات حرفين والكثير من الأبقار حيث يبحث رجل آخر. يهدد الأول بقتل أكبر عدد ممكن من الأبقار في تلك المزرعة في الليل حتى تستسلم الشخصية الثانية. سترى الشخصية في عين واحدة من تلك الأبقار. وفي الوقت نفسه ، فإن الشخصية ب تحرق المزرعة لأسفل. ليس لدينا أي فكرة عما حدث مع الأبقار ، لكنهم كانوا حيوانات منظمة العفو الدولية.

يتخيل مقطع مختلف مدينة نيويورك بأكملها كحيوان (أدناه) ، وهي مثيرة للإعجاب بنفس القدر. جميع أنواع الحيوانات الشبيهة بالحياة تتولى نيويورك. مرة أخرى ، قد تعتقد أن قطيع الأفيال الذي يقوم بدوريات في الشوارع حقيقية ، وليس من الذكاء الاصطناعي.

يجب أن يكون نموذج الذكاء الاصطناعي قادرًا على الحفاظ على الشخصيات من مشهد إلى آخر. يجب أيضًا أن تكون قادرًا على تغيير المشاهد والإضاءة والتأثيرات دون التأثير على هوية الشخصيات الرئيسية.

“تتفوق Gen-4 في قدرتها على توليد مقاطع فيديو ديناميكية للغاية بحركة واقعية بالإضافة إلى تناسق الموضوع والموضوع والأناقة مع الالتزام الفوري الفائق والأفضل في فهم العالم في الفصل” ، يكتب Runway ، ويبدو أن الأمثلة التي قدمت أنها تثبت أن هذا هو الحال.

أفضل جزء في الأمر هو أنه يمكنك تقديم شخصياتك ومواقعك. ما عليك سوى تحميل الصور في نصك إلى AI وأخبر Gen-4 ما تريد منه. هذا هو المرجع المرئي الذي يذكره المدرج على مدونته وفي شرح الفيديو القصير على X.

“لصياغة مشهد ما ، ما عليك سوى تقديم صور مرجعية لمواضيعك ووصف تكوين اللقطة الخاصة بك. سوف يقوم Runway Gen-4 بباقي”.

هناك الكثير من الضجيج هنا ، بالتأكيد. مثل أي بدء تشغيل منظمة العفو الدولية ، يقوم Runway برفع رأس المال والكثير منه. وقد لا تعمل الأمور بشكل مثالي في المحاولة الأولى. أيضًا ، قد تبدو الأمور أفضل في تلك العروض التوضيحية المكررة من المدرج أكثر من ما قد تواجهه في المحاولة الأولى. ولكن يبدو بالتأكيد أن Runway يعمل مع تقنية Generation Advanced AI.

بعبارة أخرى ، على عكس Smart Seri من Apple في Apple Intelligence ، يتوفر Runway Gen-4 للاختبار. يمكن للمستخدمين الحصول على أيديهم على التكنولوجيا.

ما هو واضح أيضًا هو أن استوديوهات الأفلام سيتعين عليها إيلاء اهتمام متزايد لمنتجات Genai مثل Runway Gen-4. لا أتوقع منهم أن يصنعوا نقرات جديدة فجأة تضم شخصيات تم إنشاؤها من الذكاء الاصطناعى. لكن منتجات مثل Gen-4 قد تجعل من أسهل بكثير إكمال الطلقات وإنشاء تأثيرات فيديو معقدة ، كل ذلك دون كسر البنك.

لسوء الحظ ، نعم ، سيؤدي هذا إلى خسائر الوظائف. لن يحب الأشخاص في مجال الترفيه ما يراه هنا ، حيث سيتولى الذكاء الاصطناعى الوظائف. هذا صحيح أيضًا لتوليد صور ChatGPT 4O وغيرها من أدوات الذكاء الاصطناعي القادر على القيام بعمل البشر بشكل أسرع وأرخص.

سأشير أيضًا إلى الجوانب السلبية الأخرى التي يجب أن تكون واضحة. يمكن إساءة معاملة التكنولوجيا مثل Runway Gen-4 لإنشاء قصص وهمية.

أيضًا ، هناك مسألة كيفية تدريب Runway على نماذجه للتوصل إلى Gen-4. مثل Openai مع Sora ، Runway لا يقول. TechCrunch يقول أن الناشئة تواجه دعوى قضائية حيث يتهم الفنانون شركات الذكاء الاصطناعي ، بما في ذلك Runway ، لتدريب الذكاء الاصطناعي على محتوى حقوق الطبع والنشر دون إذن.

هذا لا يغير حقيقة أن Gen-4 هو ببساطة مذهلة. أنا أكره أن أقول ذلك ، ولكن إذا كان يعمل كما يقول Runway إنه (ومن المحتمل أن يتحسن) ، فسيكون Runway قادرًا على تسوية أي دعاوى قضائية لأي مخالفات مع الأرباح التي على وشك توليدها.

يتم طرح ميزات Gen-4 Image-to-Video إلى جميع الخطط المدفوعة وعملاء المؤسسات. وقال Runway إن المراجع ستكون متاحة في المستقبل. ستجد الكثير من الأمثلة على Gen-4 في هذا الرابط. أيضا ، ابحث عن المبدعين الذين ينشرون إبداعات Gen-4 على وسائل التواصل الاجتماعي. يمكنك تجربة Runway مجانًا ، على الرغم من أن الخطط المدفوعة تقدم ميزات أفضل.



اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى