लेखक:
(1) दिनेश कुमार विश्वकर्मा, बायोमेट्रिक अनुसंधान प्रयोगशाला, सूचना प्रौद्योगिकी विभाग, दिल्ली प्रौद्योगिकी विश्वविद्यालय, दिल्ली, भारत;
(2) मयंक जिंदल, बायोमेट्रिक अनुसंधान प्रयोगशाला, सूचना प्रौद्योगिकी विभाग, दिल्ली प्रौद्योगिकी विश्वविद्यालय, दिल्ली, भारत
(3) आयुष मित्तल, बायोमेट्रिक अनुसंधान प्रयोगशाला, सूचना प्रौद्योगिकी विभाग, दिल्ली प्रौद्योगिकी विश्वविद्यालय, दिल्ली, भारत
(4) आदित्य शर्मा, बायोमेट्रिक अनुसंधान प्रयोगशाला, सूचना प्रौद्योगिकी विभाग, दिल्ली प्रौद्योगिकी विश्वविद्यालय, दिल्ली, भारत।
यह कार्य मूवी शैली वर्गीकरण समस्या के लिए एक नए समग्र दृष्टिकोण के विचार को आगे बढ़ाता है जिसमें फ्रेम से स्थिति, भाषण से संवाद और मेटा-डेटा (मूवी प्लॉट और विवरण) सहित कई तौर-तरीकों पर विचार करके भावात्मक और संज्ञानात्मक स्तर शामिल हैं। हमने इस अध्ययन को आगे बढ़ाने के लिए एक हॉलीवुड अंग्रेजी मूवी ट्रेलर डेटासेट EMTD भी बनाया जिसमें 5 शैलियों, अर्थात् एक्शन, कॉमेडी, हॉरर, रोमांस, विज्ञान कथा से लगभग 2000 ट्रेलर शामिल हैं। हमने अनुभाग 5.2 में चर्चा के अनुसार विभिन्न मॉडल आर्किटेक्चर के साथ प्रयोग किया और EMTD और मानक LMTD-9 [2] पर अपने अंतिम ढांचे को भी मान्य किया जो क्रमशः 0.92 और 0.82 के AU (PRC) मान प्राप्त करता है। हमारे अध्ययन का मुख्य उद्देश्य एक मूवी शैली को उसके छोटे क्लिप यानी ट्रेलर से वर्गीकृत करने के लिए एक मजबूत ढांचा तैयार करना है।
हमारे प्रस्तावित मॉडल के विस्तार के लिए, स्वरों पर आधारित पृष्ठभूमि ऑडियो अध्ययन को भी शामिल किया जा सकता है। इसलिए, भविष्य में, हम मूवी ट्रेलरों से अधिकांश विशेषताओं को बेहतर ढंग से निकालने और उनका उपयोग करने के लिए अपने वर्तमान ढांचे के साथ-साथ ऑडियो में पृष्ठभूमि स्वरों पर विचार करते हुए एक ढांचा बनाने की योजना बना रहे हैं। हम मल्टी-लेबल वर्गीकरण के लिए अपने अध्ययन में कुछ और शैलियों को जोड़ने की भी योजना बना रहे हैं।
[1] ए. हंजालिक और एलक्यू जू, “प्रभावशाली वीडियो सामग्री प्रतिनिधित्व और मॉडलिंग,” आईईईई ट्रांस. मल्टीमीडिया, खंड 7, संख्या 1, 2005।
[2] जे. वेहरमैन और आर.सी. बैरोस, "मल्टी-लेबल मूवी शैली वर्गीकरण के लिए समय के माध्यम से संवलन," एप्लाइड कंप्यूटिंग पर एसीएम संगोष्ठी की कार्यवाही में, 2017, खंड। भाग F1280, पृष्ठ 114-119।
[3] जेड. रशीद, वाई. शेख, और एम. शाह, "फिल्म वर्गीकरण के लिए गणना योग्य सुविधाओं के उपयोग पर," आईईईई ट्रांस. सर्किट सिस्टम. वीडियो टेक्नोलॉजी, खंड. 15, संख्या. 1, पृष्ठ. 52-64, जनवरी. 2005.
[4] एलएच चेन, वाईसी लाइ, और एचवाई मार्क लियाओ, "पृष्ठभूमि जानकारी का उपयोग करके मूवी दृश्य विभाजन," पैटर्न रिकॉग्निट, खंड 41, संख्या 3, 2008।
[5] एस.के. जैन और आर.एस. जादोन, “न्यूरल नेटवर्क का उपयोग करके मूवी शैलियों का वर्गीकरण,” 2009।
[6] एल. कैनिनी, एस. बेनिनी, और आर. लियोनार्डी, “चयनित अर्थपूर्ण विशेषताओं के आधार पर फिल्मों की प्रभावशाली अनुशंसा,” आईईईई ट्रांस. सर्किट सिस्टम. वीडियो टेक्नोलॉजी, खंड 23, संख्या 4, 2013.
[7] एम. जू, सी. जू, एक्स. वह, जेएस जिन, एस. लुओ, और वाई. रुई, "उत्तेजना और वैलेंस आयामों में पदानुक्रमित भावात्मक सामग्री विश्लेषण," सिग्नल प्रोसेसिंग, खंड 93, संख्या 8, 2013।
[8] ए. यादव और डी.के. विश्वकर्मा, "मूवी ट्रेलर का उपयोग करके शैली वर्गीकरण के लिए गहरे नेटवर्क का एक एकीकृत ढांचा," एप्पल सॉफ्ट कंप्यूट जर्नल, वॉल्यूम 96, 2020।
[9] के. चोरोस, "समयबद्ध रूप से एकत्रित वीडियो शॉट्स के लंबाई विश्लेषण के आधार पर वीडियो शैली वर्गीकरण," लेक्चर नोट्स इन कंप्यूटर साइंस (सबसीरीज़ लेक्चर नोट्स इन आर्टिफिशियल इंटेलिजेंस और लेक्चर नोट्स इन बायोइनफॉरमैटिक्स सहित), 2018, वॉल्यूम 11056 एलएनएआई, पृष्ठ 509-518।
[10] एएम एर्टुगरुल और पी. करागोज़, "द्विदिशात्मक एलएसटीएम का उपयोग करके प्लॉट सारांश से मूवी शैली वर्गीकरण," कार्यवाही में - 12 वीं आईईईई इंटरनेशनल कॉन्फ्रेंस ऑन सेमेटिक कंप्यूटिंग, आईसीएससी 2018, 2018, वॉल्यूम। 2018-जनवरी।
[11] जी. पैस, पी. लैम्बर्ट, डी. ब्यूचेन, एफ. डेलौले और बी. इओनेस्कु, "टेक्स्ट और इमेज डिस्क्रिप्टर के प्रतीकात्मक संलयन का उपयोग करके एनिमेटेड मूवी शैली का पता लगाना," 2012.
[12] ए. शाहीन और ए. क्रज़ीज़क, "शैली: मूवी शैली डिटेक्टर," कंप्यूटर और सूचना विज्ञान में संचार, 2020, खंड 1178 सीसीआईएस।
[13] एन. कुमार, ए. हरिकृष्णन, और आर. श्रीधर, "हैश वेक्टराइज़र आधारित मूवी शैली पहचान," इलेक्ट्रिकल इंजीनियरिंग में व्याख्यान नोट्स, 2020, खंड 605।
[14] पीजी शंभरकर, पी. ठाकुर, एस. इमादुद्दीन, एस. चौहान, और एमएन डोजा, "3डी कन्वोल्यूशनल न्यूरल नेटवर्क का उपयोग करके मूवी ट्रेलरों का शैली वर्गीकरण," 2020।
[15] डब्ल्यूटी चू और एचजे गुओ, “डीप न्यूरल नेटवर्क के साथ पोस्टर छवियों के आधार पर मूवी शैली वर्गीकरण,” 2017।
[16] जीएस सिमोस, जे. वेहरमैन, आरसी बैरोस, और डीडी रुइज़, "कन्वोल्यूशनल न्यूरल नेटवर्क के साथ मूवी शैली वर्गीकरण," न्यूरल नेटवर्क पर अंतर्राष्ट्रीय संयुक्त सम्मेलन की कार्यवाही में, 2016, वॉल्यूम। 2016-अक्टूबर।
[17] जे. ली, एल. डेंग, आर. हेब-उमबाक, और वाई. गोंग, "अध्याय 2 - भाषण पहचान के मूल सिद्धांत," रोबस्ट ऑटोमैटिक स्पीच रिकॉग्निशन में, जे. ली, एल. डेंग, आर. हेब-उमबाक, और वाई. गोंग, संपादक। ऑक्सफोर्ड: एकेडमिक प्रेस, 2016, पृष्ठ 9–40।
[18] एस. प्रैट, एम. यात्स्कर, एल. वेह्स, ए. फरहादी, और ए. केम्भावी, "ग्राउंडेड सिचुएशन रिकॉग्निशन," कंप्यूटर विज़न में - ईसीसीवी 2020, 2020, पीपी. 314-332.
[19] बी. बील, जोरेन और लैंगर, स्टीफन और गिप, "टीएफ-आईडीयूएफ: उपयोगकर्ताओं के व्यक्तिगत दस्तावेज़ संग्रह के आधार पर उपयोगकर्ता मॉडलिंग के लिए एक उपन्यास टर्म-वेटिंग स्कीम," प्रोक. आईकॉन्फ्रेंस 2017, 2017.
[20] जे. वेहरमैन, आर.सी. बैरोस, जी.एस. सिमोस, टी.एस. पाउला, और डी.डी. रुइज़, “(डीप) लर्निंग फ्रॉम फ्रेम्स,” 2017.
[21] डीपी किंग्मा और जेएल बा, “एडम: स्टोकेस्टिक ऑप्टिमाइज़ेशन के लिए एक विधि,” 2015।
[22] ई. फिश, ए. गिल्बर्ट, और जे. वेनब्रेन, "फाइनग्रेन्ड सिमेंटिक क्लस्टरिंग के साथ मूवी शैली वर्गीकरण पर पुनर्विचार," arXiv Prepr. arXiv2012.02639, 2020.
[२३] एफ. अल्वारेज़, एफ. सांचेज़, जी. हर्नांडेज़-पेनालोज़ा, डी. जिमेनेज़, जेएम मेनेंडेज़, और जी. सिस्नेरोस, "फिल्म वर्गीकरण में निम्न-स्तरीय दृश्य विशेषताओं के प्रभाव पर," पीएलओएस वन, वॉल्यूम। १४, नं. 2, 2019.
[24] जे. वेहरमैन, एम.ए. लोपेज, और आर.सी. बैरोस, “सिनॉप्सिस-आधारित मल्टीलेबल मूवी शैली वर्गीकरण के लिए आत्म-ध्यान,” 2018।
[25] जे. वेहरमैन और आर.सी. बैरोस, "मूवी शैली वर्गीकरण: समय के माध्यम से संकल्पों पर आधारित एक बहु-लेबल दृष्टिकोण," एप्लाइड सॉफ्ट कंप्यूट. जे., वॉल्यूम. 61, 2017.