153 रीडिंग

टास्क डिकंपोज़िशन के माध्यम से फ़िल्म ट्रेलर तैयार करना: सार और परिचय

बहुत लंबा; पढ़ने के लिए

इस शोधपत्र में, शोधकर्ताओं ने ट्रेलर बनाने के लिए फिल्मों को ग्राफ के रूप में मॉडल किया, कथा संरचना की पहचान की और भावनाओं की भविष्यवाणी की, जो पर्यवेक्षित तरीकों से बेहतर है।
featured image - टास्क डिकंपोज़िशन के माध्यम से फ़िल्म ट्रेलर तैयार करना: सार और परिचय
Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
0-item

लेखक:

(1) पिनेलोपी पापालाम्पीडी, भाषा, अनुभूति और संगणन संस्थान, सूचना विज्ञान स्कूल, एडिनबर्ग विश्वविद्यालय;

(2) फ्रैंक केलर, भाषा, अनुभूति और संगणन संस्थान, सूचना विज्ञान स्कूल, एडिनबर्ग विश्वविद्यालय;

(3) मिरेला लापाटा, भाषा, अनुभूति और संगणन संस्थान, सूचना विज्ञान स्कूल, एडिनबर्ग विश्वविद्यालय।

लिंक की तालिका

अमूर्त

मूवी ट्रेलर कई कार्य करते हैं: वे दर्शकों को कहानी से परिचित कराते हैं, फिल्म के मूड और कलात्मक शैली को व्यक्त करते हैं, और दर्शकों को फिल्म देखने के लिए प्रोत्साहित करते हैं। ये विविध कार्य स्वचालित ट्रेलर निर्माण को एक चुनौतीपूर्ण प्रयास बनाते हैं। हम इसे दो उप-कार्यों में विभाजित करते हैं: कथा संरचना पहचान और भावना भविष्यवाणी। हम फिल्मों को ग्राफ़ के रूप में मॉडल करते हैं, जहाँ नोड्स शॉट होते हैं और किनारे उनके बीच अर्थ संबंधों को दर्शाते हैं। हम इन संबंधों को संयुक्त विपरीत प्रशिक्षण का उपयोग करके सीखते हैं जो पटकथाओं से विशेषाधिकार प्राप्त पाठ्य सूचना (जैसे, पात्र, क्रियाएँ, परिस्थितियाँ) का लाभ उठाता है। एक अप्रशिक्षित एल्गोरिथ्म फिर ग्राफ़ को पार करता है और ऐसे ट्रेलर बनाता है जिन्हें मानव न्यायाधीश प्रतिस्पर्धी पर्यवेक्षित दृष्टिकोणों द्वारा बनाए गए ट्रेलरों से अधिक पसंद करते हैं।

1 परिचय

ट्रेलर फिल्मों को बढ़ावा देने के लिए इस्तेमाल किए जाने वाले छोटे वीडियो होते हैं और अक्सर व्यावसायिक सफलता के लिए महत्वपूर्ण होते हैं। जबकि उनका मुख्य कार्य दर्शकों की एक श्रृंखला के लिए फिल्म का विपणन करना है, ट्रेलर प्रेरक कला और प्रचार कथा का एक रूप भी हैं, जो दर्शकों को फिल्म देखने के लिए प्रेरित करने के लिए डिज़ाइन किए गए हैं। भले ही ट्रेलरों का निर्माण एक कलात्मक प्रयास माना जाता है, लेकिन फिल्म उद्योग ने ट्रेलर निर्माण को निर्देशित करने वाली रणनीतियाँ विकसित की हैं। एक विचारधारा के अनुसार, ट्रेलरों में एक कथात्मक संरचना प्रदर्शित होनी चाहिए, जिसमें तीन अधिनियम शामिल हों[1]। पहला अधिनियम कहानी के पात्रों और सेटअप को स्थापित करता है, दूसरा अधिनियम मुख्य संघर्ष का परिचय देता है, और तीसरा अधिनियम दांव बढ़ाता है और अंत से टीज़र प्रदान करता है। एक अन्य विचारधारा ट्रेलर के मूड से अधिक चिंतित है जैसा कि कहानी के उतार-चढ़ाव द्वारा परिभाषित किया गया है[2]। इस दृष्टिकोण के अनुसार, दर्शकों को लुभाने के लिए ट्रेलरों में पहले मध्यम तीव्रता होनी चाहिए, उसके बाद कहानी के बारे में महत्वपूर्ण जानकारी देने के लिए कम तीव्रता होनी चाहिए, और फिर ट्रेलर के अंत में चरमोत्कर्ष तक पहुँचने तक उत्तरोत्तर तीव्रता बढ़ानी चाहिए।


चित्र 1. महत्वपूर्ण मोड़ और उनकी परिभाषाएँ।


ट्रेलरों को स्वचालित रूप से बनाने के लिए, हमें व्यक्ति की पहचान, क्रिया पहचान और भावना की भविष्यवाणी जैसे निम्न-स्तरीय कार्य करने की आवश्यकता होती है, लेकिन साथ ही अधिक उच्च-स्तरीय कार्य जैसे कि घटनाओं और उनके कारण के बीच संबंधों को समझना, साथ ही पात्रों और उनके कार्यों के बारे में निष्कर्ष निकालना। कार्य की जटिलता को देखते हुए, मूवी-ट्रेलर जोड़ों से सीधे यह सारा ज्ञान सीखने के लिए कई हज़ार उदाहरणों की आवश्यकता होगी, जिनकी प्रोसेसिंग और एनोटेशन एक चुनौती होगी। इसलिए यह आश्चर्य की बात नहीं है कि स्वचालित ट्रेलर निर्माण के पिछले तरीकों [24,46,53] ने केवल दृश्य-श्रव्य सुविधाओं पर ध्यान केंद्रित किया है।


मानव संपादकों की रचनात्मक प्रक्रिया से प्रेरित होकर, हम ट्रेलर निर्माण के लिए नीचे से ऊपर की ओर दृष्टिकोण अपनाते हैं, जिसे हम दो ऑर्थोगोनल, सरल और अच्छी तरह से परिभाषित उप-कार्यों में विभाजित करते हैं। पहला है कथा संरचना की पहचान, यानी, फिल्म की सबसे महत्वपूर्ण घटनाओं को पुनः प्राप्त करना। पटकथा लेखन में एक आम तौर पर अपनाया गया सिद्धांत [13,22,51] सुझाव देता है कि किसी फिल्म के कथानक में पाँच प्रकार की प्रमुख घटनाएँ होती हैं, जिन्हें टर्निंग पॉइंट (टीपी; चित्र 1 में उनकी परिभाषाएँ देखें) के रूप में जाना जाता है। दूसरा उप-कार्य भावना की भविष्यवाणी है, जिसे हम शॉट्स और उत्पन्न भावनाओं के बीच तीव्रता के प्रवाह के अनुमान के रूप में देखते हैं।


हम एक अप्रशिक्षित ग्राफ-आधारित दृष्टिकोण का पालन करते हुए प्रस्ताव ट्रेलर तैयार करते हैं। हम मूवीज़ को ऐसे ग्राफ के रूप में मॉडल करते हैं जिनके नोड शॉट होते हैं और जिनके किनारे शॉट्स के बीच महत्वपूर्ण अर्थपूर्ण कनेक्शन को दर्शाते हैं (चित्र 2 देखें)। इसके अलावा, नोड्स पर लेबल होते हैं जो दर्शाते हैं कि वे महत्वपूर्ण घटनाएँ हैं (यानी, टीपी) और भावना तीव्रता (सकारात्मक या नकारात्मक) को संकेत देने वाले स्कोर। हमारा एल्गोरिदम ट्रेलर अनुक्रम बनाने के लिए इस मूवी ग्राफ को पार करता है। इनका उपयोग मानव संपादक द्वारा समीक्षा और संशोधन किए जाने वाले प्रस्तावों के रूप में किया जा सकता है।


टीपी पहचान और भावना भविष्यवाणी दोनों ही कार्य मूवी सामग्री की निम्न-स्तरीय समझ से लाभान्वित होते हैं। वास्तव में, हम पात्रों और स्थानों की पहचान करने, क्रियाओं को पहचानने और अर्थपूर्ण इकाइयों को स्थानीयकृत करने के लिए ऑफ-द-शेल्फ मॉड्यूल का उपयोग कर सकते हैं। हालाँकि, इस तरह के दृष्टिकोण प्रशिक्षण और अनुमान के दौरान पूर्व-प्रसंस्करण समय और मेमोरी आवश्यकताओं को काफी हद तक बढ़ाते हैं और त्रुटि प्रसार से ग्रस्त हैं। इसके बजाय, हम एक विपरीत सीखने की व्यवस्था का प्रस्ताव करते हैं, जहाँ हम पटकथाओं का लाभ विशेषाधिकार प्राप्त जानकारी के रूप में लेते हैं, यानी, केवल प्रशिक्षण के समय उपलब्ध जानकारी। पटकथाएँ बताती हैं कि फिल्म को दृश्यों में कैसे विभाजित किया गया है, पात्र कौन हैं, वे कब और किससे बात कर रहे हैं, वे कहाँ हैं और क्या कर रहे हैं (यानी, "दृश्य शीर्षक" बताते हैं कि कार्रवाई कहाँ होती है जबकि "कार्रवाई रेखाएँ" बताती हैं कि कैमरा क्या देखता है)। विशेष रूप से, हम दो अलग-अलग नेटवर्क बनाते हैं, एक पटकथा पर आधारित पाठ्य नेटवर्क और एक वीडियो पर आधारित मल्टीमॉडल, और सहायक विपरीत नुकसान का उपयोग करके उन्हें संयुक्त रूप से प्रशिक्षित करते हैं। पाठ्य नेटवर्क को स्व-पर्यवेक्षित सीखने के माध्यम से पटकथाओं के बड़े संग्रह पर पूर्व-प्रशिक्षित किया जा सकता है, बिना संबंधित फिल्मों को एकत्र और संसाधित किए। प्रायोगिक परिणामों से पता चलता है कि यह विपरीत प्रशिक्षण दृष्टिकोण लाभदायक है, जिसके परिणामस्वरूप ट्रेलरों को उनकी विषय-वस्तु और आकर्षण के संदर्भ में मनुष्यों द्वारा अनुकूल रूप से आंका जाता है।


यह पेपर CC BY-SA 4.0 DEED लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।


[1] https://www.studiobinder.com/blog/how-to-make-a-movie-trailer


[2] https://www.derek-lieu.com/blog/2017/9/10/the-matrix-is-a-trailereditors-dream

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks