Google का Lumiere टेक्स्ट प्रॉम्प्ट से यथार्थवादी AI वीडियो तैयार करता है

संस्कृति
डिज़ाइन
30 जनवरी, 2024 को पोस्ट किया गया

श्रेय: गूगल लुमिएरे

By जेमी वाट्स

लंदन, यूके

1 ऊर्जा + ऊर्जा जोड़ें

0 टिप्पणियां

एआई वीडियो तेजी से अलौकिक घाटी से वास्तव में यथार्थवादी में बदल रहा है, और Google का लुमियर सबसे परिष्कृत टेक्स्ट-टू-वीडियो जनरेटर है जिसे हमने आज तक देखा है।

विस्मय की भावना पैदा करना - और बेचैनी की एक बड़ी खुराक - Google ने हाल ही में प्रदर्शित किया कि विकास के कुछ ही वर्षों में AI वीडियो कितना परिष्कृत हो गया है।

उसी तरह जैसे बिंग इमेज क्रिएटर, DALL-E और मिडजर्नी जैसे टेक्स्ट-टू-इमेज जेनरेटर सिंगल-लाइन प्रॉम्प्ट से मूल छवियां बना सकते हैं, Google का 'Lumiere'एप्लिकेशन हमारे बेतहाशा विचारों को पूरी तरह से पांच सेकंड के वीडियो में बदल सकता है।

टेक्स्ट-टू-वीडियो जनरेटर के अन्य उदाहरण पहले से ही उपलब्ध हैं, लेकिन Google का प्रयास वास्तव में सीजीआई मानक के करीब आंदोलन के सटीक चित्रण को स्थापित करने का पहला प्रयास है।

यह एक बेस फ्रेम स्थापित करके और इसके अत्यधिक प्रचारित उपयोग से इसे प्राप्त करता है स्टुनेट (स्पेस-टाइम-यू-नेट) तकनीक स्वायत्त रूप से यह स्थापित करती है कि छवि में वस्तुओं को कहां और कैसे स्थानांतरित करना चाहिए। एक बार चुने जाने के बाद, उस प्रारंभिक फ्रेम के भीतर की वस्तुओं में स्वयं की कई परतें शामिल हो जाती हैं जो एक दूसरे में निर्बाध रूप से प्रवाहित होती हैं।

https://youtu.be/wxLr02Dz2Sc

ल्यूमियर प्रति छवि 80 फ्रेम उत्पन्न करने में सक्षम है, जबकि इसके निकटतम प्रतिद्वंद्वी स्टेबल वीडियो डिफ्यूजन ने पिछले अधिकतम 25 फ्रेम बनाए थे। हालाँकि Google द्वारा जारी किए गए कई शुरुआती परिणामों में कृत्रिमता का स्पर्श है, इसके बाद से समग्र गुणवत्ता में उछाल आया है डेमो नहीं चौंका देने वाला है।

टेक्स्ट-टू-वीडियो के अलावा, छवि-से-वीडियो पीढ़ी भी है जो एक स्थिर तस्वीर को जीवंत कर देगी, शैलीबद्ध पीढ़ी, जो एक विशिष्ट दृश्य शैली में वीडियो बना सकती है, और एक सिनेमोग्राफ सेटिंग जो किसी विशिष्ट हिस्से को एनिमेट करने में सक्षम है। मौजूदा छवि - उदाहरण के लिए, बहता पानी, टिमटिमाती आग, या ट्रेन इंजन से निकलने वाला धुआं।

बाज़ार रणनीति के संदर्भ में, लुमिएरे का देर से आगमन Google की फ़ैशनेबल देर से आने वाली नीति के अनुरूप है। इसके जनरेटिव भाषा उपकरण के प्रारंभिक पुनरावृत्ति के बाद से बार्ड फ्लॉप हो गया पिछले साल, तकनीकी दिग्गज ने चुपचाप पृष्ठभूमि में जेनरेटिव एआई के लिए अपना मल्टीमॉडल विज़न विकसित किया है।

https://youtu.be/jV1vkHv4zq8

Google's newest and most capable AI | Gemini (https://youtu.be/jV1vkHv4zq8)

इसकी नवीनतम घोषणा Google के जेमिनी भाषा मॉडल के प्रदर्शन का बारीकी से अनुसरण करती है, जिसे इस क्षेत्र के लिए बेंचमार्क के रूप में चैटजीपीटी के ताज के लिए देर से चुनौती देने के लिए तैयार किया गया है।

वीडियो एआई के लिए व्यावसायिक चर्चा से परे देखते हुए, प्रौद्योगिकी के दुरुपयोग की संभावना को नजरअंदाज करना गलती होगी क्योंकि काल्पनिक कार्यों को वास्तविक जीवन की सामग्री से अलग करना कठिन हो जाता है।

यौन रूप से स्पष्ट चित्रण से जुड़ी चल रही पराजय टेलर स्विफ्ट और यदि टेक्स्ट-टू-वीडियो समान पैमाने पर आगे बढ़ता है तो टेक्स्ट-टू-इमेज ऐप्स का उपयोग करने की उसकी समानता हिमशैल का टिप मात्र हो सकती है।

Google ने आश्वासन दिया है कि वह ल्यूमियर के उचित उपयोग को सुनिश्चित करने के लिए सुरक्षा उपाय बना रहा है, लेकिन पेपर के लेखकों ने इस बात की पुष्टि नहीं की है कि घटनाओं को कैसे रोका जाएगा। हम प्रौद्योगिकी पर अपना हाथ डालने के लिए उत्सुक हैं, लेकिन ऐसा नहीं है अगर यह कीड़ों का एक बड़ा पिटारा खोल देगा।

जेमी वाट्स

टेक संपादक लंदन, यूके

मैं जेमी (वह / वह), उप संपादक और थ्रेड में एक वरिष्ठ लेखक हूं। सोशल मीडिया अपडेट और क्रांतिकारी तकनीक के साथ बने रहना मेरी खासियत है, लेकिन जब मैं अपने कीबोर्ड से दूर होता हूं, तो आप शायद मुझे नवीनतम औसत दर्जे की डरावनी फिल्म में एक बड़े टैंगो आइस ब्लास्ट के चारों ओर लिपटा हुआ पाएंगे। मेरा अनुसरण करो ट्विटर, लिंक्डइन और मुझे कुछ विचार / प्रतिक्रिया दें drop ईमेल.

थ्रेड से अधिक.

क्रेडिट: अनप्लैश

लीक से हटकर

स्लीप टूरिज्म के बढ़ने की व्याख्या

वेलनेस उद्योग में तेजी से सबसे बड़े रुझानों में से एक बनते हुए, अधिक से अधिक यात्री तकिया मेनू और शुरुआती रात के पक्ष में गतिविधियों से भरे यात्रा कार्यक्रम छोड़ रहे हैं। एक छुट्टी में कई चीज़ें हो सकती हैं; कुछ के लिए, इसमें अन्वेषण, रोमांच और स्थानीय व्यंजनों को आज़माना शामिल है। दूसरों के लिए, यह आराम से बैठने और एक या दो सप्ताह पहले पूल के किनारे आराम करने के अलावा कुछ न करने का अवसर है...

By सोफिया फिलिप्स लंदन, यूके

क्रेडिट: थ्रेड

मीडिया

नेटफ्लिक्स के अज्ञात एआई उपयोग ने मीडिया हेरफेर पर बहस छेड़ दी है

एक नई सच्ची अपराध डॉक्यूमेंट्री में अज्ञात एआई इमेजरी को शामिल करने के लिए नेटफ्लिक्स आलोचनाओं के घेरे में आ गया है। इस प्रतिक्रिया ने मीडिया हेरफेर के इर्द-गिर्द महत्वपूर्ण बातचीत को जन्म दिया है। इसे पसंद करें, इससे डरें, या इससे घृणा करें, एआई अब हमारे रोजमर्रा के जीवन का हिस्सा है। शिक्षा से लेकर मनोरंजन तक, कृत्रिम बुद्धिमत्ता लगातार बढ़ती रहेगी और मीडिया के साथ हमारी बातचीत के लगभग हर पहलू को आकार देगी। लेकिन ये बदलाव सीमाओं की मांग करते हैं। दोनों एआई...

By फ़्लो बेलिंगर ब्राइटन, यूके

'बायोनिक आंख' ने सुलझाया प्लेटो के अंतिम विश्राम स्थल का रहस्य

क्रेडिट: थ्रेड

लीक से हटकर

'बायोनिक आंख' ने सुलझाया प्लेटो के अंतिम विश्राम स्थल का रहस्य

इतालवी शोधकर्ता ग्राज़ियानो रानोचिया ने अंततः प्लेटो के अंतिम विश्राम स्थल के रहस्य को सुलझा लिया है। एआई-संचालित 'बायोनिक आंख' ने 2,000 ईसा पूर्व के आसपास लिखे गए 348 साल पुराने कार्बोनाइज्ड स्क्रॉल को स्कैन किया, जिसने एथेंस में एक विशिष्ट स्थान को इंगित किया। विडंबना यह है कि दुनिया के सबसे महान दार्शनिकों में से एक कहां विश्राम करते हैं, इसका रहस्य अभी-अभी एक मशीन द्वारा सुलझाया गया है। ग्रीक दर्शन के संस्थापक विचारकों में संभवतः सबसे सम्मानित प्लेटो का दफ़नाना...

By जेमी वाट्स लंदन, यूके

प्रकृति आधिकारिक तौर पर संगीतकार बन गई है

क्रेडिट: पेक्सल्स

मीडिया

प्रकृति आधिकारिक तौर पर संगीतकार बन गई है

एक नए अभियान के हिस्से के रूप में, प्रकृति को Spotify सहित प्रमुख स्ट्रीमिंग प्लेटफार्मों पर एक कलाकार के रूप में मान्यता दी गई है। रॉयल्टी दुनिया भर में जलवायु कार्रवाई पहलों का समर्थन करने के लिए उपयोग की जाएगी। तापमान बढ़ रहा है, आवास कम हो रहे हैं और ग्लेशियर अभूतपूर्व दर से पिघल रहे हैं। जैसे-जैसे जलवायु में परिवर्तन हो रहा है, पृथ्वी की पीड़ा नई ऊंचाइयों पर पहुंचती जा रही है, और वास्तविकता यह है कि इस बारे में कुछ करने के लिए हमारे पास समय समाप्त हो रहा है...

By सोफिया फिलिप्स लंदन, यूके