يقوم Lumiere من Google بإنشاء مقاطع فيديو واقعية بتقنية الذكاء الاصطناعي من خلال المطالبات النصية

ثقافة
تصميم
تم النشر في ٢٧ يناير ٢٠٢٠

الائتمان: جوجل لوميير

By جيمي واتس

لندن، المملكة المتحدة

1 طاقة + أضف الطاقة

تعليقات

يتحول فيديو الذكاء الاصطناعي بسرعة من وادي غريب إلى واقعي حقًا، ويُعد Lumiere من Google أكثر مولدات تحويل النص إلى فيديو تطورًا التي رأيناها حتى الآن.

في إثارة شعور بالرهبة ــ وجرعة كبيرة من عدم الارتياح ــ عرضت شركة جوجل مؤخراً مدى تطور فيديو الذكاء الاصطناعي في غضون سنوات قليلة من التطوير.

بنفس الطريقة التي يمكن بها لمولدات تحويل النص إلى صورة مثل Bing Image Creator وDALL-E وMidjourney إنشاء صور أصلية من موجه من سطر واحد، فإن Google'sلومييريمكن للتطبيق تحويل أفكارنا الجامحة إلى مقاطع فيديو معروضة بالكامل مدتها خمس ثوانٍ.

تتوفر بالفعل أمثلة أخرى لمولدات تحويل النص إلى فيديو، ولكن محاولة Google هي الأولى التي تقدم تصويرًا دقيقًا للحركة إلى مستوى قريب من معايير CGI.

يحقق ذلك من خلال إنشاء إطار أساسي واستخدامه عالي الجودة STUNet تقنية (Space-Time-U-Net) لتحديد المكان الذي يجب أن تتحرك فيه العناصر الموجودة في الصورة بشكل مستقل. بمجرد تحديدها، تتكون الكائنات الموجودة داخل هذا الإطار الأولي من عدة طبقات خاصة بها تتدفق إلى بعضها البعض بسلاسة.

https://youtu.be/wxLr02Dz2Sc

Lumiere قادرة على إنشاء 80 إطارًا لكل صورة مقارنة بالحد الأقصى السابق البالغ 25 الذي حققته أقرب منافسيها Stable Video Diffusion. على الرغم من أن العديد من النتائج المبكرة التي أصدرتها Google تتسم بلمسة من المصطنعة، إلا أن القفزة في الجودة الشاملة منذ ذلك الحين ليس تجريبي مذهل.

بالإضافة إلى تحويل النص إلى فيديو، هناك أيضًا إنشاء صورة إلى فيديو والذي سيضفي الحيوية على الصورة الثابتة، والتوليد المنمق، الذي يمكنه إنشاء مقاطع فيديو بأسلوب مرئي محدد، وإعداد سينمائي قادر على تحريك جزء معين من الفيلم. الصورة الموجودة - مثل المياه المتدفقة، أو النار الوامضة، أو الدخان المنبعث من محرك القطار، على سبيل المثال.

فيما يتعلق باستراتيجية السوق، فإن الوصول المتأخر لـ Lumiere يتماشى مع سياسة Google المتأخرة العصرية. منذ التكرار المبكر لأداة اللغة التوليدية فشل بارد في العام الماضي، طورت شركة التكنولوجيا العملاقة بهدوء رؤيتها متعددة الوسائط للذكاء الاصطناعي التوليدي في الخلفية.

https://youtu.be/jV1vkHv4zq8

Google's newest and most capable AI | Gemini (https://youtu.be/jV1vkHv4zq8)

يتبع إعلانها الأخير عن كثب عرضًا لنموذج لغة Gemini من Google، والذي من المتوقع أن يشكل تحديًا متأخرًا لتاج ChatGPT كمعيار لهذا القطاع.

إذا نظرنا إلى ما هو أبعد من الضجة التجارية للفيديو AI، سيكون من التقصير تجاهل احتمال إساءة استخدام التكنولوجيا حيث يصبح من الصعب التمييز بين الأعمال الخيالية والمحتوى الواقعي.

الكارثة المستمرة التي تنطوي على صور جنسية صريحة لـ تايلور سويفت وقد يكون تشابهها في استخدام تطبيقات تحويل النص إلى صورة مجرد قمة جبل الجليد إذا انطلق تحويل النص إلى فيديو على نطاق مماثل.

تؤكد جوجل أنها تضع ضمانات لضمان الاستخدام العادل لـ Lumiere، لكن مؤلفي البحث لم يصدقوا بالضبط على كيفية منع وقوع الحوادث. نحن حريصون على وضع أيدينا على التكنولوجيا، ولكن ليس إذا كانت ستفتح علبة أكبر من الديدان.

جيمي واتس

محرر التقنية لندن، المملكة المتحدة

أنا جيمي (هو / هو) ، نائب رئيس التحرير وكاتب أول في Thred. إن مواكبة تحديثات الوسائط الاجتماعية والتكنولوجيا الثورية هي موطن قوتي ، ولكن عندما تكون بعيدًا عن لوحة المفاتيح ، ستجدني على الأرجح ملتفًا حول انفجار جليدي كبير من Tango في أحدث نقرة رعب متواضعة. اتبعني تويتر, لينكدين: وأرسل لي بعض الأفكار / التعليقات عبر البريد الإلكتروني.

المزيد من thred.

رأي – تثبت FKA Twigs أن الذكاء الاصطناعي يمكنه تمكين الفنانين

الائتمان: ويكيميديا كومنز

الوسائط

رأي – تثبت FKA Twigs أن الذكاء الاصطناعي يمكنه تمكين الفنانين

اقترحت المغنية نسخة من الذكاء الاصطناعي لنفسها لتحقيق التوازن بين عبء عملها. كانت الاستجابة متباينة، لكن تويجز تشير إلى مستقبل تمكيني. من المعروف أن FKA Twigs يطمس الإبداع بها التكنلوجيا. إن موسيقاها وأفلامها ورقصها الأثيري - إلى جانب مشاريعها الفنية والأزياء - دفعت دائمًا الحدود وعززت مكانتها في الثقافة الشعبية. على الرغم من وصولها إلى مستويات الشهرة العالمية، إلا أن Twigs لم تتخلى عنها أبدًا...

By فلو بيلينجر برايتون، المملكة المتحدة

الائتمان: Unsplash

متفرقات

تفسير ظهور سياحة النوم

سرعان ما أصبح أحد أكبر الاتجاهات في صناعة العافية، حيث يتخلى المزيد والمزيد من المسافرين عن مسارات الرحلة المليئة بالأنشطة لصالح قوائم الوسائد والسهر في وقت مبكر من الليل. يمكن أن تكون العطلة أشياء كثيرة؛ بالنسبة للبعض، فهو ينطوي على الاستكشاف والمغامرة وتجربة المأكولات المحلية. بالنسبة للآخرين، إنها فرصة للجلوس والاسترخاء، وعدم القيام بأي شيء سوى الاستلقاء بجانب حمام السباحة لمدة أسبوع أو أسبوعين قبل...

By صوفيا فيليبس لندن، المملكة المتحدة

الائتمان: Thred

الوسائط

يثير استخدام الذكاء الاصطناعي غير المكشوف عنه من Netflix جدلاً حول التلاعب بالوسائط

تعرضت Netflix لانتقادات شديدة بسبب تضمينها صورًا غير معلنة بتقنية الذكاء الاصطناعي في فيلم وثائقي جديد عن الجريمة الحقيقية. أثار رد الفعل العنيف محادثات مهمة حول التلاعب بوسائل الإعلام. سواء أعجبك ذلك، أو تخاف منه، أو تكرهه، أصبح الذكاء الاصطناعي الآن جزءًا من حياتنا اليومية. من التعليم إلى الترفيه، من المتوقع أن يستمر الذكاء الاصطناعي في النمو، ليشكل تقريبًا كل جانب من جوانب تفاعلنا مع وسائل الإعلام. لكن هذه التغييرات تتطلب حدودا. كلا الذكاء الاصطناعي...

By فلو بيلينجر برايتون، المملكة المتحدة

"العين الإلكترونية" تحل لغز المثوى الأخير لأفلاطون

الائتمان: Thred

متفرقات

"العين الإلكترونية" تحل لغز المثوى الأخير لأفلاطون

ربما تمكن الباحث الإيطالي غرازيانو رانوكيا من حل لغز المثوى الأخير لأفلاطون. قامت "عين إلكترونية" مدعومة بالذكاء الاصطناعي بمسح لفيفة متفحمة عمرها 2,000 عام مكتوبة حوالي عام 348 قبل الميلاد والتي حددت موقعًا محددًا في أثينا. من المفارقات أن لغز المكان الذي يرقد فيه أحد أعظم فلاسفة العالم قد تم حله للتو بواسطة آلة. دفن أفلاطون، الذي يمكن القول إنه أكثر المفكرين المؤسسين للفلسفة اليونانية احترامًا...

By جيمي واتس لندن، المملكة المتحدة

يقوم Lumiere من Google بإنشاء مقاطع فيديو واقعية بتقنية الذكاء الاصطناعي من خلال المطالبات النصية

يتحول فيديو الذكاء الاصطناعي بسرعة من وادي غريب إلى واقعي حقًا، ويُعد Lumiere من Google أكثر مولدات تحويل النص إلى فيديو تطورًا التي رأيناها حتى الآن.

يمهد "AMIE" من Google الطريق للطب القائم على الذكاء الاصطناعي

يقال إن موظفي Google يصفون بارد بأنه أسوأ من عديم الفائدة

"العين الإلكترونية" تحل لغز المثوى الأخير لأفلاطون

المزيد من thred.

رأي – تثبت FKA Twigs أن الذكاء الاصطناعي يمكنه تمكين الفنانين

"العين الإلكترونية" تحل لغز المثوى الأخير لأفلاطون

يتحول فيديو الذكاء الاصطناعي بسرعة من وادي غريب إلى واقعي حقًا، ويُعد Lumiere من Google أكثر مولدات تحويل النص إلى فيديو تطورًا التي رأيناها حتى الآن.

مقالات ذات صلة

يمهد "AMIE" من Google الطريق للطب القائم على الذكاء الاصطناعي

يقال إن موظفي Google يصفون بارد بأنه أسوأ من عديم الفائدة

الرائج

"العين الإلكترونية" تحل لغز المثوى الأخير لأفلاطون

أصبحت الطبيعة رسميًا موسيقيًا

يثير استخدام الذكاء الاصطناعي غير المكشوف عنه من Netflix جدلاً حول التلاعب بالوسائط

مواكبة thred من خلال الاشتراك في النشرة الإخبارية لدينا كوكب إيجابي!

المزيد من thred.

رأي – تثبت FKA Twigs أن الذكاء الاصطناعي يمكنه تمكين الفنانين

تفسير ظهور سياحة النوم

يثير استخدام الذكاء الاصطناعي غير المكشوف عنه من Netflix جدلاً حول التلاعب بالوسائط

"العين الإلكترونية" تحل لغز المثوى الأخير لأفلاطون