paint-brush
स्थिति और संवाद-आधारित गहरे नेटवर्क की बहुस्तरीय प्रोफाइलिंग: निष्कर्ष और संदर्भद्वारा@kinetograph

स्थिति और संवाद-आधारित गहरे नेटवर्क की बहुस्तरीय प्रोफाइलिंग: निष्कर्ष और संदर्भ

बहुत लंबा; पढ़ने के लिए

इस पत्र में, शोधकर्ताओं ने स्थिति, संवाद और मेटाडेटा विशेषताओं का उपयोग करते हुए फिल्म शैली वर्गीकरण के लिए एक बहु-रूपता ढांचे का प्रस्ताव दिया है।
featured image - स्थिति और संवाद-आधारित गहरे नेटवर्क की बहुस्तरीय प्रोफाइलिंग: निष्कर्ष और संदर्भ
Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
0-item

लेखक:

(1) दिनेश कुमार विश्वकर्मा, बायोमेट्रिक अनुसंधान प्रयोगशाला, सूचना प्रौद्योगिकी विभाग, दिल्ली प्रौद्योगिकी विश्वविद्यालय, दिल्ली, भारत;

(2) मयंक जिंदल, बायोमेट्रिक अनुसंधान प्रयोगशाला, सूचना प्रौद्योगिकी विभाग, दिल्ली प्रौद्योगिकी विश्वविद्यालय, दिल्ली, भारत

(3) आयुष मित्तल, बायोमेट्रिक अनुसंधान प्रयोगशाला, सूचना प्रौद्योगिकी विभाग, दिल्ली प्रौद्योगिकी विश्वविद्यालय, दिल्ली, भारत

(4) आदित्य शर्मा, बायोमेट्रिक अनुसंधान प्रयोगशाला, सूचना प्रौद्योगिकी विभाग, दिल्ली प्रौद्योगिकी विश्वविद्यालय, दिल्ली, भारत।

लिंक की तालिका

6। निष्कर्ष

यह कार्य मूवी शैली वर्गीकरण समस्या के लिए एक नए समग्र दृष्टिकोण के विचार को आगे बढ़ाता है जिसमें फ्रेम से स्थिति, भाषण से संवाद और मेटा-डेटा (मूवी प्लॉट और विवरण) सहित कई तौर-तरीकों पर विचार करके भावात्मक और संज्ञानात्मक स्तर शामिल हैं। हमने इस अध्ययन को आगे बढ़ाने के लिए एक हॉलीवुड अंग्रेजी मूवी ट्रेलर डेटासेट EMTD भी बनाया जिसमें 5 शैलियों, अर्थात् एक्शन, कॉमेडी, हॉरर, रोमांस, विज्ञान कथा से लगभग 2000 ट्रेलर शामिल हैं। हमने अनुभाग 5.2 में चर्चा के अनुसार विभिन्न मॉडल आर्किटेक्चर के साथ प्रयोग किया और EMTD और मानक LMTD-9 [2] पर अपने अंतिम ढांचे को भी मान्य किया जो क्रमशः 0.92 और 0.82 के AU (PRC) मान प्राप्त करता है। हमारे अध्ययन का मुख्य उद्देश्य एक मूवी शैली को उसके छोटे क्लिप यानी ट्रेलर से वर्गीकृत करने के लिए एक मजबूत ढांचा तैयार करना है।


हमारे प्रस्तावित मॉडल के विस्तार के लिए, स्वरों पर आधारित पृष्ठभूमि ऑडियो अध्ययन को भी शामिल किया जा सकता है। इसलिए, भविष्य में, हम मूवी ट्रेलरों से अधिकांश विशेषताओं को बेहतर ढंग से निकालने और उनका उपयोग करने के लिए अपने वर्तमान ढांचे के साथ-साथ ऑडियो में पृष्ठभूमि स्वरों पर विचार करते हुए एक ढांचा बनाने की योजना बना रहे हैं। हम मल्टी-लेबल वर्गीकरण के लिए अपने अध्ययन में कुछ और शैलियों को जोड़ने की भी योजना बना रहे हैं।

7. संदर्भ

[1] ए. हंजालिक और एलक्यू जू, “प्रभावशाली वीडियो सामग्री प्रतिनिधित्व और मॉडलिंग,” आईईईई ट्रांस. मल्टीमीडिया, खंड 7, संख्या 1, 2005।


[2] जे. वेहरमैन और आर.सी. बैरोस, "मल्टी-लेबल मूवी शैली वर्गीकरण के लिए समय के माध्यम से संवलन," एप्लाइड कंप्यूटिंग पर एसीएम संगोष्ठी की कार्यवाही में, 2017, खंड। भाग F1280, पृष्ठ 114-119।


[3] जेड. रशीद, वाई. शेख, और एम. शाह, "फिल्म वर्गीकरण के लिए गणना योग्य सुविधाओं के उपयोग पर," आईईईई ट्रांस. सर्किट सिस्टम. वीडियो टेक्नोलॉजी, खंड. 15, संख्या. 1, पृष्ठ. 52-64, जनवरी. 2005.


[4] एलएच चेन, वाईसी लाइ, और एचवाई मार्क लियाओ, "पृष्ठभूमि जानकारी का उपयोग करके मूवी दृश्य विभाजन," पैटर्न रिकॉग्निट, खंड 41, संख्या 3, 2008।


[5] एस.के. जैन और आर.एस. जादोन, “न्यूरल नेटवर्क का उपयोग करके मूवी शैलियों का वर्गीकरण,” 2009।


[6] एल. कैनिनी, एस. बेनिनी, और आर. लियोनार्डी, “चयनित अर्थपूर्ण विशेषताओं के आधार पर फिल्मों की प्रभावशाली अनुशंसा,” आईईईई ट्रांस. सर्किट सिस्टम. वीडियो टेक्नोलॉजी, खंड 23, संख्या 4, 2013.


[7] एम. जू, सी. जू, एक्स. वह, जेएस जिन, एस. लुओ, और वाई. रुई, "उत्तेजना और वैलेंस आयामों में पदानुक्रमित भावात्मक सामग्री विश्लेषण," सिग्नल प्रोसेसिंग, खंड 93, संख्या 8, 2013।


[8] ए. यादव और डी.के. विश्वकर्मा, "मूवी ट्रेलर का उपयोग करके शैली वर्गीकरण के लिए गहरे नेटवर्क का एक एकीकृत ढांचा," एप्पल सॉफ्ट कंप्यूट जर्नल, वॉल्यूम 96, 2020।


[9] के. चोरोस, "समयबद्ध रूप से एकत्रित वीडियो शॉट्स के लंबाई विश्लेषण के आधार पर वीडियो शैली वर्गीकरण," लेक्चर नोट्स इन कंप्यूटर साइंस (सबसीरीज़ लेक्चर नोट्स इन आर्टिफिशियल इंटेलिजेंस और लेक्चर नोट्स इन बायोइनफॉरमैटिक्स सहित), 2018, वॉल्यूम 11056 एलएनएआई, पृष्ठ 509-518।


[10] एएम एर्टुगरुल और पी. करागोज़, "द्विदिशात्मक एलएसटीएम का उपयोग करके प्लॉट सारांश से मूवी शैली वर्गीकरण," कार्यवाही में - 12 वीं आईईईई इंटरनेशनल कॉन्फ्रेंस ऑन सेमेटिक कंप्यूटिंग, आईसीएससी 2018, 2018, वॉल्यूम। 2018-जनवरी।


[11] जी. पैस, पी. लैम्बर्ट, डी. ब्यूचेन, एफ. डेलौले और बी. इओनेस्कु, "टेक्स्ट और इमेज डिस्क्रिप्टर के प्रतीकात्मक संलयन का उपयोग करके एनिमेटेड मूवी शैली का पता लगाना," 2012.


[12] ए. शाहीन और ए. क्रज़ीज़क, "शैली: मूवी शैली डिटेक्टर," कंप्यूटर और सूचना विज्ञान में संचार, 2020, खंड 1178 सीसीआईएस।


[13] एन. कुमार, ए. हरिकृष्णन, और आर. श्रीधर, "हैश वेक्टराइज़र आधारित मूवी शैली पहचान," इलेक्ट्रिकल इंजीनियरिंग में व्याख्यान नोट्स, 2020, खंड 605।


[14] पीजी शंभरकर, पी. ठाकुर, एस. इमादुद्दीन, एस. चौहान, और एमएन डोजा, "3डी कन्वोल्यूशनल न्यूरल नेटवर्क का उपयोग करके मूवी ट्रेलरों का शैली वर्गीकरण," 2020।


[15] डब्ल्यूटी चू और एचजे गुओ, “डीप न्यूरल नेटवर्क के साथ पोस्टर छवियों के आधार पर मूवी शैली वर्गीकरण,” 2017।


[16] जीएस सिमोस, जे. वेहरमैन, आरसी बैरोस, और डीडी रुइज़, "कन्वोल्यूशनल न्यूरल नेटवर्क के साथ मूवी शैली वर्गीकरण," न्यूरल नेटवर्क पर अंतर्राष्ट्रीय संयुक्त सम्मेलन की कार्यवाही में, 2016, वॉल्यूम। 2016-अक्टूबर।


[17] जे. ली, एल. डेंग, आर. हेब-उमबाक, और वाई. गोंग, "अध्याय 2 - भाषण पहचान के मूल सिद्धांत," रोबस्ट ऑटोमैटिक स्पीच रिकॉग्निशन में, जे. ली, एल. डेंग, आर. हेब-उमबाक, और वाई. गोंग, संपादक। ऑक्सफोर्ड: एकेडमिक प्रेस, 2016, पृष्ठ 9–40।


[18] एस. प्रैट, एम. यात्स्कर, एल. वेह्स, ए. फरहादी, और ए. केम्भावी, "ग्राउंडेड सिचुएशन रिकॉग्निशन," कंप्यूटर विज़न में - ईसीसीवी 2020, 2020, पीपी. 314-332.


[19] बी. बील, जोरेन और लैंगर, स्टीफन और गिप, "टीएफ-आईडीयूएफ: उपयोगकर्ताओं के व्यक्तिगत दस्तावेज़ संग्रह के आधार पर उपयोगकर्ता मॉडलिंग के लिए एक उपन्यास टर्म-वेटिंग स्कीम," प्रोक. आईकॉन्फ्रेंस 2017, 2017.


[20] जे. वेहरमैन, आर.सी. बैरोस, जी.एस. सिमोस, टी.एस. पाउला, और डी.डी. रुइज़, “(डीप) लर्निंग फ्रॉम फ्रेम्स,” 2017.


[21] डीपी किंग्मा और जेएल बा, “एडम: स्टोकेस्टिक ऑप्टिमाइज़ेशन के लिए एक विधि,” 2015।


[22] ई. फिश, ए. गिल्बर्ट, और जे. वेनब्रेन, "फाइनग्रेन्ड सिमेंटिक क्लस्टरिंग के साथ मूवी शैली वर्गीकरण पर पुनर्विचार," arXiv Prepr. arXiv2012.02639, 2020.


[२३] एफ. अल्वारेज़, एफ. सांचेज़, जी. हर्नांडेज़-पेनालोज़ा, डी. जिमेनेज़, जेएम मेनेंडेज़, और जी. सिस्नेरोस, "फिल्म वर्गीकरण में निम्न-स्तरीय दृश्य विशेषताओं के प्रभाव पर," पीएलओएस वन, वॉल्यूम। १४, नं. 2, 2019.


[24] जे. वेहरमैन, एम.ए. लोपेज, और आर.सी. बैरोस, “सिनॉप्सिस-आधारित मल्टीलेबल मूवी शैली वर्गीकरण के लिए आत्म-ध्यान,” 2018।


[25] जे. वेहरमैन और आर.सी. बैरोस, "मूवी शैली वर्गीकरण: समय के माध्यम से संकल्पों पर आधारित एक बहु-लेबल दृष्टिकोण," एप्लाइड सॉफ्ट कंप्यूट. जे., वॉल्यूम. 61, 2017.



L O A D I N G
. . . comments & more!

About Author

Kinetograph: The Video Editing Technology Publication HackerNoon profile picture
Kinetograph: The Video Editing Technology Publication@kinetograph
The Kinetograph's the 1st motion-picture camera. At Kinetograph.Tech, we cover cutting edge tech for video editing.

लेबल

इस लेख में चित्रित किया गया था...