सोरा, 2021 में स्टार्टअप ओपनएआई द्वारा बनाया गया एक कृत्रिम बुद्धिमत्ता (एआई) वीडियो जनरेटर प्रोग्राम, धूम मचा रहा है क्योंकि यह अब अनुसंधान चरण से बाहर निकल गया है और आधिकारिक तौर पर सोरा टर्बो के नए नाम के तहत जनता के लिए जारी किया गया है।
लॉन्च ने उपयोगकर्ताओं के बीच एक ऑनलाइन उन्माद पैदा कर दिया है, जिससे कंपनी को भारी ट्रैफ़िक से अभिभूत होने के बाद अस्थायी रूप से नए खाता निर्माण को रोकना पड़ा है।
चैटजीपीटी जैसे अन्य सामग्री निर्माण कार्यक्रमों के समान, सोरा सामग्री बनाने के लिए टेक्स्ट संकेतों का उपयोग करता है। लिखित प्रतिक्रियाएँ देने वाले पारंपरिक एआई कार्यक्रमों के विपरीत, सोरा उपयोगकर्ता के टेक्स्ट इनपुट के आधार पर उच्च गुणवत्ता वाले वीडियो बनाता है।
सोरा घृणित रूप से अच्छा है, जी.जे @जो उसी
इसे जोड़ रहा हूँ @एवरटाई यथाशीघ्र ताकि आप अपनी छवियों को जीवंत बना सकें pic.twitter.com/wMehxOc8cm
– जे ए (@jay_azang) 9 दिसंबर 2024
9 दिसंबर को रिलीज़ के साथ ओपनएआई के एक बयान के अनुसार, सोरा टर्बो मूल सोरा प्रोग्राम में एक सुधार है क्योंकि यह तेज़ वीडियो निर्माण, उच्च गुणवत्ता वाले वीडियो और कई वीडियो संपादन सुविधाओं की अनुमति देता है जो उपयोगकर्ताओं को वीडियो क्लिप करने और बनाने में सक्षम बनाता है। अनुक्रम, और वीडियो के अन्य भागों को संरक्षित करते हुए वीडियो में तत्वों को बदलना।
तो सोरा टर्बो वास्तव में क्या है और यह वीडियो निर्माण उद्योग को कैसे बदल रहा है?
सोरा टर्बो कैसे काम करता है?
सोरा और कई अन्य एआई वीडियो जनरेटरों की शक्ति, यह दोहराने की क्षमता है कि मनुष्य उच्च गुणवत्ता वाले फिल्म उपकरणों के साथ बहुत कम समय में क्या कर सकते हैं।
उपयोगकर्ता प्रोग्राम को न केवल वीडियो में क्या शामिल करना है, बल्कि यह भी बता सकते हैं कि वे किस प्रकार के कैमरे का उपयोग करना चाहते हैं, लेंस चयन, प्रकाश व्यवस्था, दृश्य सौंदर्यशास्त्र, रचना और स्टोरीबोर्डिंग।
इनमें से कुछ विवरणों का उपयोग करते हुए एक उदाहरण संकेत इस प्रकार हो सकता है:
“रात में काम कर रहे एक स्ट्रीट वेंडर का अंतरंग चित्र खींचने के लिए एक मध्यम-टेलीफोटो लेंस (85 मिमी) का उपयोग करें। पृष्ठभूमि में विक्रेता की अपनी गर्म, चमकती स्टॉल रोशनी और ठंडी परिवेश वाली शहर की रोशनी के मिश्रण से दृश्य को रोशन करें। विक्रेता के हाथों के विवरण पर ध्यान केंद्रित करें जब वे भोजन या सामान तैयार करते हैं, फ्रेम को उनके अभिव्यंजक चेहरे के साथ संतुलित करते हैं। छवि को उनकी कला में कड़ी मेहनत और गर्व पैदा करना चाहिए।
सोरा टर्बो कितना अच्छा है?
यह पूर्ण नहीं है.
उपयोगकर्ता एक टेक्स्ट प्रॉम्प्ट लिखते हैं कि वे किस प्रकार का वीडियो बनाना चाहते हैं और सोरा वीडियो बनाता है। वर्तमान रिलीज़ में सीमाएँ हैं। वीडियो की गुणवत्ता 30 फ्रेम प्रति सेकंड पर 1080p तक है और केवल 20 सेकंड लंबी हो सकती है।
यह एक मल्टीमीडिया कलाकार और सैटेलाइट यंग के प्रमुख गायक एमी कुसाना के सोरा टर्बो वीडियो का एक उदाहरण है, जो 1980 के दशक के जे-पॉप और विज्ञान-फाई विषयों से प्रेरित एक संगीत समूह है, जिसमें ताकेनोको-ज़ोकू, एक फैशन समूह के विषयों का उपयोग किया गया है। 1980 का दशक. हालाँकि 20-सेकंड की सीमा है, सोरा स्टोरीबोर्ड सुविधा उपयोगकर्ताओं को कई एआई-जनित वीडियो को एक साथ जोड़ने और उन्हें क्रमिक रूप से व्यवस्थित करने की अनुमति देती है, जैसा कि नीचे दिए गए वीडियो में दिखाया गया है।
कुछ वीडियो में स्पष्ट त्रुटियाँ भी दिखाई देती हैं। उदाहरण के लिए, उपरोक्त वीडियो में, 36-सेकंड के निशान पर, नर्तकियों में से एक 180 डिग्री की गर्दन घुमाता है, जो निश्चित रूप से मानवीय रूप से संभव नहीं है, और नृत्य की दिनचर्या जारी रखता है। इसमें कहा गया है कि कंपनी को इस तरह की गड़बड़ियों को दूर करने के लिए आगे भी काम करना होगा।
ओपनएआई के संस्थापक सैम अल्टमैन द्वारा फरवरी में पोस्ट किए गए एक महिला के खाना पकाने के उदाहरण वीडियो में, दर्शक देखेंगे कि महिला के दाहिने हाथ में चम्मच मिश्रण बंद करने के बाद गायब हो जाता है।
https://t.co/rmk9zI0oqO pic.twitter.com/WanFKOzdIw
– सैम ऑल्टमैन (@sama) 15 फ़रवरी 2024
सोरा टर्बो को उद्योग में किस प्रकार प्राप्त किया गया है?
कुछ उद्योग विशेषज्ञ और रचनात्मक निर्देशक इस बात से चिंतित हैं कि सोरा फिल्म उद्योग, विशेषकर हॉलीवुड को कैसे बाधित कर सकती है।
मार्च में, एक हॉलीवुड कार्यकारी ने नाम न छापने की शर्त पर अल जजीरा को बताया: “मैं इसे उत्पादन के लिए खतरे के रूप में नहीं देखता, बल्कि उत्पादन के तरीके के लिए खतरा के रूप में देखता हूं जैसा कि हम वर्तमान में जानते हैं।”
उन्होंने अतीत में पोस्ट-प्रोडक्शन के तरीके में बदलाव का उल्लेख किया – जैसे कि जब लोगों ने काम करने के लिए पोस्ट-प्रोडक्शन कंपनियों को भुगतान करने के बजाय व्यक्तिगत लैपटॉप पर वीडियो संपादित करना शुरू किया।
उन्होंने कहा, “उस परिवर्तन में बहुत से लोग नष्ट हो गए, जबकि अन्य अचानक एक पोस्ट हाउस की अतिरिक्त मांग के बिना एक उचित संपादक का खर्च उठा सकते थे।”
क्या सोरा एकमात्र एआई वीडियो जनरेटर है?
नहीं, यह नहीं है। एआई वीडियो जनरेटर का बाजार हर दिन बढ़ रहा है। हालाँकि, सोरा और अन्य प्रतिस्पर्धियों के बीच एक स्पष्ट अंतर बेजोड़ वीडियो गुणवत्ता और यथार्थवाद है जिसे सोरा बनाने में सक्षम है।
इसके अलावा, नई रिलीज, सोरा टर्बो, कई उन्नत वीडियो संपादन सुविधाओं के साथ आती है जो उपयोगकर्ताओं को एडोब प्रीमियर प्रो या फाइनल कट प्रो पर मिल सकती है, जो फिल्म, टीवी और ऑनलाइन सामग्री निर्माण में उपयोग किए जाने वाले दो बहुत लोकप्रिय वीडियो संपादन सॉफ्टवेयर प्रोग्राम हैं।
इसके अलावा, सोरा को मेगा सॉफ्टवेयर कंपनी माइक्रोसॉफ्ट द्वारा आर्थिक रूप से समर्थन प्राप्त है। आज तक, माइक्रोसॉफ्ट ने 23 जनवरी को $10bn के नवीनतम नकद इंजेक्शन के साथ लगभग $14bn का निवेश किया है। अक्टूबर में CNBC के अनुसार, OpenAI के पास अब $4bn की घूमने वाली क्रेडिट लाइन है, जिससे इसकी कुल तरलता $10bn से अधिक हो गई है। निवेश की वह राशि सोरा को उत्तोलन का वह स्तर प्रदान करती है जो कई अन्य प्रतिस्पर्धियों के पास नहीं है।
अन्य कौन से वीडियो जनरेटर उपलब्ध हैं?
कई अन्य शीर्ष स्तरीय एआई वीडियो जनरेटर हैं, जिनमें शामिल हैं:
रनवे जनरल 3
प्रौद्योगिकी उद्योग और उद्यम पूंजी उद्योग को कवर करने वाले प्रकाशन, द इंफॉर्मेशन के अनुसार, 2018 में स्थापित रनवे ने कुल 237 मिलियन डॉलर की फंडिंग जुटाई है और कथित तौर पर नई फंडिंग में 450 मिलियन डॉलर जुटाने के लिए उद्यम पूंजी फर्म जनरल अटलांटिक के साथ बातचीत कर रही है। रनवे जेन 3 का मुफ्त संस्करण 30 फ्रेम प्रति सेकंड के साथ 720p रिज़ॉल्यूशन पर 10 सेकंड की वीडियो क्लिप उत्पन्न कर सकता है। सशुल्क ग्राहकों के लिए, वीडियो क्लिप को 1440p या 2160p पर सेट किया जा सकता है।
सोरा के समान, यह टेक्स्ट प्रॉम्प्ट के आधार पर एक वीडियो बना सकता है, लेकिन सोशल मीडिया रचनाकारों और विपणक पर बहुत अधिक निर्भर करता है जो शॉर्ट-फॉर्म वीडियो परियोजनाओं में इसकी उच्च गति और दक्षता के कारण विज्ञापन बनाने के लिए इसका उपयोग करते हैं।
लंबे प्रारूप वाले एआई-जनरेटेड वीडियो की चुनौतियों में से एक कई जेनरेट किए गए वीडियो में स्थिरता है। लंबे वीडियो के लिए इंटरैक्टिव शीघ्र परिशोधन की आवश्यकता होती है ताकि सभी वीडियो एक जैसे दिखें और महसूस हों।
ब्लेड ए.आई
कुआइशौ द्वारा समर्थित क्लिंग, जिसे अंतरराष्ट्रीय स्तर पर क्वाई के नाम से भी जाना जाता है, बीजिंग, चीन में स्थित एक प्रमुख चीनी प्रौद्योगिकी कंपनी है। क्लिंग का अनावरण जून 2024 में किया गया था और यह खुद को ओपनएआई के सोरा जैसे प्लेटफार्मों के प्रतिस्पर्धी के रूप में स्थापित कर रहा है। क्लिंग 30 फ्रेम प्रति सेकंड पर 1080p के रिज़ॉल्यूशन के साथ दो मिनट तक लंबे वीडियो तैयार कर सकता है।
अल्पमहिष्ठ
मिनीमैक्स, एक चीनी एआई स्टार्टअप, अलीबाबा ग्रुप होल्डिंग द्वारा समर्थित है, जो चीन में स्थित ई-कॉमर्स, इंटरनेट सेवाओं और प्रौद्योगिकी सेवाओं में विशेषज्ञता वाली एक बहुराष्ट्रीय कंपनी है और जिसकी फंडिंग का सबसे हालिया दौर मार्च में 600 मिलियन डॉलर था। मिनीमैक्स की स्थापना 2021 में शेटिन, हांगकांग में स्थित एक प्रमुख एआई कंपनी सेंसटाइम के पूर्व कर्मचारियों द्वारा की गई थी।
मिनिमैक्स 720p रिज़ॉल्यूशन और 25 फ्रेम प्रति सेकंड पर छह सेकंड की वीडियो क्लिप तैयार कर सकता है।
इसे शेयर करें: