सीडांस 2.0 जनरल एआई वीडियो की अगली बड़ी उम्मीद हो सकती है, लेकिन यह अभी भी सुस्त है

जब आयरिश फिल्म निर्माता रुएरी रॉबिन्सन ने सीडांस 2.0 – टिकटॉक डेवलपर बाइटडांस के नवीनतम वीडियो जेनरेशन मॉडल – के साथ बनाई गई छोटी क्लिप की एक श्रृंखला अपलोड करना शुरू किया, तो इस बात से इनकार करना मुश्किल था कि फुटेज अन्य पीढ़ी के एआई संगठनों से हमने जो देखा है, उससे कहीं अधिक प्रभावशाली था। क्लिप का सितारा (टॉम क्रूज़ का एक डिजिटल डुप्लिकेट) काफी हद तक वास्तविक चीज़ जैसा दिखता था क्योंकि यह ब्रैड पिट, ह्यूमनॉइड रोबोट और ज़ोंबी से लड़ता था। और पात्र एक जटिल तरलता के साथ आगे बढ़े जो लगभग कोरियोग्राफी के करीब थी और गतिज “कैमरावर्क” द्वारा प्रवर्धित हुई।

जनरल एआई के उत्साही लोग यह प्रचार करना पसंद करते हैं कि पारंपरिक रूप से निर्मित मनोरंजन उद्योग पक गया है, और हॉलीवुड के कुछ सबसे बड़े स्टूडियो सीडांस की हालिया क्षमताओं से चिंतित प्रतीत होते हैं क्योंकि ersatz-क्रूज़ वीडियो ऑनलाइन व्यूज़ बटोरना जारी रखते हैं। मोशन पिक्चर एसोसिएशन, डिज़्नी, पैरामाउंटऔर NetFlix प्रत्येक ने कॉपीराइट उल्लंघन के दावों पर बाइटडांस को संघर्ष विराम और समाप्ति पत्र भेजा। और जवाब में, बाइटडांस ने कहा यह “वर्तमान सुरक्षा उपायों को मजबूत करने के लिए कदम उठाएगा क्योंकि हम उपयोगकर्ताओं द्वारा बौद्धिक संपदा और समानता के अनधिकृत उपयोग को रोकने के लिए काम करते हैं।” बाइटडांस ने अभी तक आधिकारिक तौर पर सीडांस का एक संस्करण जारी नहीं किया है जो उपयोगकर्ताओं को फुटेज बनाने से रोकता है जिसे बनाने का अधिकार कंपनी के पास नहीं है।

सीडांस 2.0 के रोलआउट के बारे में सब कुछ एक वायरल स्टंट की तरह महसूस हुआ है, खासकर जब स्टूडियो ने पहले ही स्पष्ट कर दिया है कि एआई कंपनियों द्वारा उनका आईपी चुराने पर वे मुकदमा करने को तैयार हैं। यह सच है कि सीडांस द्वारा बनाए गए वीडियो सोरा, वीओ, रनवे और अन्य के साथ बनाए गए हमारे द्वारा देखे गए वीडियो से कहीं बेहतर दिखते हैं। लेकिन तथ्य यह है कि बहुत परिष्कृत रिपॉफ़ का मंथन नए मॉडल की प्रसिद्धि का मुख्य दावा है, जो सीडांस 2.0 को सिर्फ एक और स्लोप जनरेटर बनाता है – यद्यपि अधिक फैंसी।

जब हम जनरल एआई वीडियो को “ढलान” कहते हैं, तो हम आम तौर पर सौंदर्यशास्त्र और प्रस्तुति पर टिप्पणी कर रहे होते हैं। लेकिन जिस माध्यम से एआई फुटेज बनाया जाता है वह समीकरण का एक महत्वपूर्ण हिस्सा है। पारंपरिक रूप से निर्मित फिल्मों, शो और ऑनलाइन वीडियो के विपरीत – जो हो सकता है ढीली गढ़ी – एआई से बनी चीजें “ढलान” हैं क्योंकि वे किसी भी प्रत्यक्ष लेखकीय या कलात्मक इरादे से रहित वर्कफ़्लो के उत्पाद हैं। मानव फिल्म निर्माताओं की एक टीम के विपरीत, एक जेन एआई वीडियो मॉडल हमेशा एक कहानी की लय या एक चरित्र की प्रेरणा का अनुसरण नहीं कर सकता है, लेकिन यह सरल इनपुट को पार्स कर सकता है और ऐसे आउटपुट उत्पन्न कर सकता है जो प्रतीत होना एक कथा द्वारा सूचित (यदि आप भेंगापन करते हैं) क्योंकि कार्यक्रम को विशाल मात्रा में दृश्य डेटा पर प्रशिक्षित किया गया है।

इसके मूल में, सीडांस अपने साथियों से बिल्कुल अलग नहीं है

वास्तविक (पढ़ें: मनुष्यों द्वारा बनाई गई) चीज़ की नकल करने में सक्षम होना सीडांस 2.0 जैसी परियोजनाओं का संपूर्ण बिंदु है, लेकिन मॉडल ऐसा नहीं कर सकते हैं जब तक कि उन्हें पहले प्रोग्रामेटिक रूप से पुनरावृत्त करने के लिए पर्याप्त मात्रा में स्रोत सामग्री नहीं दी गई हो। और इस तरह के ज़बरदस्त आईपी उल्लंघन की अनुमति देकर, बाइटडांस ने हमें बताया है कि – इसके ज़िपर एक्शन शॉट्स और मजबूत ध्वनि डिज़ाइन के अलावा – इसके मूल में, सीडांस अपने साथियों से बिल्कुल अलग नहीं है। जब आप प्रोग्राम के साथ बनाई गई सबसे वायरल क्लिप को देखते हैं, तो सीडांस 2.0 को एक स्लोप जनरेटर के रूप में पहचानना आसान हो गया है, जिसमें ए-सूची की मशहूर हस्तियों और स्पष्ट रूप से कॉपीराइट किए गए काल्पनिक पात्रों को दिखाया गया है। लेकिन जब आप चीनी निर्देशक जिया झांगके की फिल्म देखते हैं तो इसकी गुत्थी को समझना बहुत मुश्किल हो जाता है जिया झांगके का नृत्यझांगके की विशेषता वाली सीडांस 2.0-जनरेटेड लघु फिल्म स्वयं के एआई संस्करण के साथ रचनात्मकता की प्रकृति के बारे में बहस कर रहा हूँ.

जिया झांगके का नृत्य मेटा चला जाता है क्योंकि इसके दो पात्र इस बात पर चर्चा करते हैं कि क्या एआई के साथ बनाई गई फिल्मों को मानव निर्मित कार्यों की पुरानी प्रतियों या एक नए प्रकार के कला रूप के रूप में माना जाना चाहिए। जब एक जियास खुद को दूसरे की एआई कॉपी बताता है, तो शॉर्ट उन दोनों का अनुसरण करता है मैट्रिक्सविभिन्न सेटिंग्स के माध्यम से यात्रा की तरह, जिसका उद्देश्य एआई की उन छवियों को प्रस्तुत करने की क्षमता को प्रदर्शित करना है जिनके बारे में एक संकेतकर्ता सोच सकता है। जिया झांगके का नृत्य एक सहजता और कथात्मक सामंजस्य के साथ सामने आता है, जिसे ओपनएआई के सोरा ऐप के माध्यम से स्क्रॉल करना आपके लिए कठिन होगा। लेकिन जब आप बारीकी से देखते हैं कि शॉर्ट के व्यस्त दृश्यों की पृष्ठभूमि में क्या चल रहा है जिसमें पृष्ठभूमि के पात्र शामिल हैं, तो सीडांस 2.0 को कुछ ऐसी ही निरंतरता की गलतियाँ करते हुए देखना मुश्किल नहीं है जो सभी वीडियो जनरेटर को प्रभावित करती हैं।

जिया झांगके का नृत्य यह इस बात का एक चमकदार उदाहरण है कि कैसे फिल्म निर्माता जनरल एआई के साथ काम करने योग्य चीजें बना सकते हैं, बशर्ते कि वे यह जानने के लिए पर्याप्त कुशल हों कि प्रौद्योगिकी की सीमाओं के आसपास कैसे काम किया जाए। हालाँकि फिल्म के शॉट्स बहुत छोटे हैं, अधिकांश एआई जनित वीडियो की तरह, उन्हें एक साथ इस तरह से संपादित किया गया है जिससे यह भ्रम पैदा होता है कि वे लंबे दृश्यों का हिस्सा हैं। और जबकि दूर के पात्र कभी-कभी दृष्टि के अंदर और बाहर हो जाएंगे, आप देख सकते हैं कि सीडांस 2.0 उन गलतियों को अग्रभूमि में चलती वस्तुओं के साथ कवर करके अस्पष्ट करने का प्रयास करता है।

यदि फिल्म निर्माता जानते हैं कि प्रौद्योगिकी की सीमाओं के आसपास कैसे काम करना है तो वे जनरल एआई के साथ काम करने योग्य चीजें बना सकते हैं

अगर कुछ भी, जिया झांगके का नृत्य हमें दिखाता है कि कितने एआई उत्साही लोग अपनी रचनाओं को उस तरह की कला बनाने के लिए विशेष रूप से कड़ी मेहनत नहीं कर रहे हैं जो सिनेमाघरों में प्रवेश कर सके या लोगों को स्ट्रीमिंग सेवा के लिए साइन अप करने के लिए प्रेरित कर सके। बाइटडांस के इंजीनियर एक ऐसा मॉडल बनाने के लिए कम से कम कुछ श्रेय के पात्र हैं जो वास्तविक लोगों के चेहरों को इतनी सटीकता के साथ फिर से बना सकता है। लेकिन ऐसा लगता है मानो यह ताकत मॉडल के गलत तरीके से हासिल किए गए प्रशिक्षण डेटा से जुड़ी हो सकती है, जिसने बाइटडांस को इतनी मुश्किल में डाल दिया है कि कंपनी सीडांस 2.0 की एपीआई को जनता के लिए जारी करने की अपनी योजना को रोक दिया.

वर्तमान की तुलना में बेहतर दिखने के अलावा, एआई-जनरेटेड वीडियो स्लोप के साथ जुड़ाव को खत्म करने में सक्षम हो सकता है, इसके पीछे की कंपनियों के लिए यह साबित करना होगा कि उनके मॉडल अन्य लोगों के काम को चुराने की आवश्यकता के बिना चीजें बना सकते हैं। एस्टेरिया जैसे स्टूडियो और एडोब सहित कंपनियां उचित लाइसेंस प्राप्त डेटा के साथ निर्मित “आईपी-सुरक्षित” मॉडल के साथ उस दूसरे मुद्दे से निपटने की कोशिश कर रही हैं। लेकिन जब तक हम एआई कार्यक्रमों की इस नई लहर से गुणवत्तापूर्ण काम देखना शुरू नहीं करते, तब तक यह पूरी तरह से धीमा ही रहेगा।

Source link

Leave a Comment