यह पेपर arxiv पर CC BY-NC-SA 4.0 DEED लाइसेंस के अंतर्गत उपलब्ध है।
लेखक:
(1) येजिन बैंग, आर्टिफिशियल इंटेलिजेंस रिसर्च सेंटर (CAiRE), हांगकांग विज्ञान और प्रौद्योगिकी विश्वविद्यालय;
(2) नायेन ली, आर्टिफिशियल इंटेलिजेंस रिसर्च सेंटर (CAiRE), हांगकांग विज्ञान और प्रौद्योगिकी विश्वविद्यालय;
(3) पास्कल फंग, सेंटर फॉर आर्टिफिशियल इंटेलिजेंस रिसर्च (CAiRE), हांगकांग यूनिवर्सिटी ऑफ साइंस एंड टेक्नोलॉजी।
यह अध्ययन बेंचमार्क के अंग्रेजी-आधारित कार्य सेटअप के पालन द्वारा सीमित है। विश्लेषण संयुक्त राज्य अमेरिका और अंग्रेजी भाषा में राजनीतिक विचारधाराओं तक सीमित है। इसके अतिरिक्त, BART मॉडल की 1024 उप-टोकन इनपुट सीमा पक्षपाती स्रोत लेखों की संख्या को सीमित करती है जिन्हें इनपुट के रूप में शामिल किया जा सकता है। यह ध्यान रखना महत्वपूर्ण है कि ये सीमाएँ, अध्ययन के निष्कर्षों के दायरे को संभावित रूप से प्रभावित करते हुए, प्राकृतिक भाषा प्रसंस्करण अनुसंधान में असामान्य नहीं हैं। फिर भी, भविष्य के शोध को राजनीतिक विचारधाराओं (गैर-अमेरिकी राजनीतिक विचारधाराओं) और भाषाओं की व्यापक श्रेणी के लिए वैकल्पिक तरीकों की खोज करके इन सीमाओं को संबोधित करने से लाभ हो सकता है, साथ ही स्रोत लेखों की अधिक व्यापक श्रेणी को कैप्चर करने के लिए लंबे इनपुट टेक्स्ट को शामिल करना चाहिए।
फ़्रेमिंग के साथ पक्षपाती लेखों के मुद्दे का व्यापक रूप से अध्ययन किया गया है, क्योंकि यह किसी निश्चित व्यक्ति, समूह या विषय के प्रति पाठकों की राय को प्रभावित करके ध्रुवीकरण की ओर ले जा सकता है। इस समस्या को हल करने के लिए, हमारा शोध एक हानि फ़ंक्शन को पेश करने पर केंद्रित है जिसे मॉडल को उत्पन्न सारांश में फ़्रेमिंग पूर्वाग्रह को कम करने में सक्षम बनाने के लिए शामिल किया जा सकता है।
हालांकि, यह पहचानना महत्वपूर्ण है कि स्वचालित तकनीकों के अनपेक्षित नकारात्मक परिणाम भी हो सकते हैं यदि उन्हें उनके व्यापक प्रभावों पर सावधानीपूर्वक विचार करके विकसित नहीं किया जाता है। उदाहरण के लिए, मशीन लर्निंग मॉडल अपने आउटपुट में पूर्वाग्रह ला सकते हैं, ज्ञात स्रोत पूर्वाग्रह को पूर्वाग्रह के दूसरे रूप से बदल सकते हैं (ली एट अल., 2022)। इस जोखिम को कम करने के लिए, ली एट अल. (2022) ने स्वचालित रूप से उत्पन्न तटस्थ सारांशों के साथ-साथ स्रोत लेखों का स्पष्ट उल्लेख शामिल करने का सुझाव दिया है। इसके अलावा, जबकि हमारा काम मानव-जनित लेखों में फ़्रेमिंग पूर्वाग्रह को दूर करने का लक्ष्य रखता है, पीढ़ी में मतिभ्रम की संभावना है, जो कि जनरेटिव मॉडल की एक जानी-मानी समस्या है (जी एट अल., 2023)। इसलिए, यदि ऐसी स्वचालित तकनीक को वास्तविक उपयोग के मामलों के लिए लागू किया जाता है, तो एक सुरक्षा कवच (जैसे, स्रोत संदर्भ का प्रावधान) से लैस करना महत्वपूर्ण है।
इन चुनौतियों के बावजूद, हमारा शोध समाज में ध्रुवीकरण को कम करने के लिए मानव-जनित फ़्रेमिंग पूर्वाग्रह को कम करने के प्रयास में योगदान दे सकता है। उपयोग के मामलों में से एक फ़्रेमिंग पूर्वाग्रह के बिना बहु-दृश्य संश्लेषित लेख प्रदान करने की प्रक्रिया में मानव विशेषज्ञों की सहायता करना हो सकता है। व्यापक सामाजिक प्रभाव के संदर्भ में, हमें उम्मीद है कि हमारा काम ऑनलाइन उपयोगकर्ताओं को ऑनलाइन अधिक विध्रुवित जानकारी तक पहुँचने में मदद कर सकता है।
2021. केंद्र - "केंद्र" मीडिया पूर्वाग्रह रेटिंग का क्या अर्थ है?
रामी बाली, जियोवानी दा सैन मार्टिनो, जेम्स ग्लास और प्रेस्लाव नाकोव। 2020. हम आपके पूर्वाग्रह का पता लगा सकते हैं: समाचार लेखों की राजनीतिक विचारधारा की भविष्यवाणी करना। नेचुरल लैंग्वेज प्रोसेसिंग (ईएमएनएलपी) में अनुभवजन्य विधियों पर 2020 सम्मेलन की कार्यवाही में, पृष्ठ 4982-4991, ऑनलाइन। कम्प्यूटेशनल भाषाविज्ञान के लिए एसोसिएशन।
एड्रियाना बेरात्सोवा, क्रिस्टीना क्रचोवा, निकोला गाज़ोवा, और मिशल जिरासेक। 2016. फ़्रेमिंग और पूर्वाग्रह: हाल के निष्कर्षों की एक साहित्य समीक्षा। सेंट्रल यूरोपियन जर्नल ऑफ मैनेजमेंट, 3(2).
डेनिस चोंग और जेम्स एन ड्रकमैन। 2007. फ़्रेमिंग थ्योरी। वार्षिक समीक्षा राजनीति विज्ञान, 10:103–126।
रॉबर्ट एम एन्टमैन। 2002. फ़्रेमिंग: एक खंडित प्रतिमान के स्पष्टीकरण की ओर। मास कम्युनिकेशन थ्योरी में मैकक्वेल रीडर। लंदन, कैलिफोर्निया और नई दिल्ली: सेज।
रॉबर्ट एम. एंटमैन. 2007. फ़्रेमिंग पूर्वाग्रह: शक्ति के वितरण में मीडिया. जर्नल ऑफ़ कम्युनिकेशन, 57(1):163–173.
रॉबर्ट एम. एंटमैन. 2010. मीडिया फ़्रेमिंग पूर्वाग्रह और राजनीतिक शक्ति: अभियान 2008 की खबरों में झुकाव की व्याख्या. पत्रकारिता, 11(4):389–408.
अलेक्जेंडर आर फैब्री, इरेन ली, तियानवेई शी, सुई ली, और ड्रैगोमिर आर रादेव। 2019. मल्टी-न्यूज़: एक बड़े पैमाने पर मल्टी-डॉक्यूमेंट सारांश डेटासेट और अमूर्त पदानुक्रमित मॉडल। arXiv प्रीप्रिंट arXiv:1906.01749
लिसा फैन, मार्शल व्हाइट, ईवा शर्मा, रुइसी सु, प्रफुल्ल कुमार चौबे, रुइहोंग हुआंग और लू वांग। 2019. इन प्लेन साइट: मीडिया पूर्वाग्रह तथ्यात्मक रिपोर्टिंग के लेंस के माध्यम से। arXiv प्रीप्रिंट arXiv:1909.02670.
मैथ्यू जेंट्ज़कोव और जेसी एम शापिरो। 2006. मीडिया पूर्वाग्रह और प्रतिष्ठा। जर्नल ऑफ़ पॉलिटिकल इकोनॉमी, 114(2):280–316।
मैथ्यू जेंट्ज़कोव, जेसी एम शापिरो, और डैनियल एफ स्टोन। 2015. बाज़ार में मीडिया पूर्वाग्रह: सिद्धांत। मीडिया अर्थशास्त्र की पुस्तिका में, खंड 1, पृष्ठ 623-645। एल्सेवियर।
इरविंग गोफ़मैन। 1974. फ़्रेम विश्लेषण: अनुभव के संगठन पर एक निबंध। हार्वर्ड यूनिवर्सिटी प्रेस
फेलिक्स हैम्बर्ग, कार्स्टन डोनाय और बेला गिप। 2019. समाचार लेखों में मीडिया पूर्वाग्रह की स्वचालित पहचान: एक अंतःविषय साहित्य समीक्षा। इंटरनेशनल जर्नल ऑन डिजिटल लाइब्रेरीज़, 20(4):391–415।
फेलिक्स हैम्बर्ग, नॉर्मन म्यूशके और बेला गिप। 2017. मैट्रिक्स-आधारित समाचार एकत्रीकरण: विभिन्न समाचार दृष्टिकोणों की खोज। 2017 ACM/IEEE संयुक्त डिजिटल लाइब्रेरीज़ सम्मेलन (JCDL) में, पृष्ठ 1-10। IEEE।
ज़ीवेई जी, नायोन ली, रीटा फ़्रिस्के, टिएझेंग यू, डैन सु, यान जू, एत्सुको इशी, ये जिन बैंग, एंड्रिया मैडोटो और पास्कल फ़ंग। 2023. प्राकृतिक भाषा निर्माण में मतिभ्रम का सर्वेक्षण। ACM कंप्यूट। सर्वेक्षण, 55(12)।
डैनियल काह्नमैन और अमोस टवेर्स्की। 2013. संभावना सिद्धांत: जोखिम के तहत निर्णय का विश्लेषण। वित्तीय निर्णय लेने के मूल सिद्धांतों की पुस्तिका में: भाग I, पृष्ठ 99-127। वर्ल्ड साइंटिफिक।
फिलिप लैबन और मार्टी ए हर्स्ट। 2017. न्यूज़लेंस: लंबी दूरी की समाचार कहानियों का निर्माण और दृश्यांकन। समाचार कार्यशाला में घटनाओं और कहानियों की कार्यवाही में, पृष्ठ 1-9।
नायोन ली, येजिन बैंग, टाईझेंग यू, एंड्रिया मैडोटो और पास्कल फंग। 2022. न्यूस: फ़्रेमिंग पूर्वाग्रह को कम करने के लिए तटस्थ बहु-समाचार सारांश। कम्प्यूटेशनल भाषाविज्ञान संघ के उत्तरी अमेरिकी अध्याय के 2022 सम्मेलन की कार्यवाही में: मानव भाषा प्रौद्योगिकी, पृष्ठ 3131-3148, सिएटल, संयुक्त राज्य अमेरिका। कम्प्यूटेशनल भाषाविज्ञान संघ।
माइक लुईस, यिनहान लियू, नमन गोयल, मरजान ग़ज़विनीनेजाद, अब्देलरहमान मोहम्मद, ओमर लेवी, वेस स्टोयानोव और ल्यूक ज़ेटलमॉयर। 2019. बार्ट: प्राकृतिक भाषा निर्माण, अनुवाद और समझ के लिए अनुक्रम-से-अनुक्रम पूर्व-प्रशिक्षण को शोरमुक्त करना। arXiv प्रीप्रिंट arXiv:1910.13461.
युजियन लियू, शिनलियांग फ्रेडरिक झांग, डेविड वेग्समैन, निकोलस ब्यूचैम्प और लू वांग। 2022. राजनीति: विचारधारा की भविष्यवाणी और रुख का पता लगाने के लिए समान-कहानी लेख तुलना के साथ प्रीट्रेनिंग। कम्प्यूटेशनल भाषाविज्ञान संघ के निष्कर्षों में: NAACL 2022, पृष्ठ 1354-1374, सिएटल, संयुक्त राज्य अमेरिका। कम्प्यूटेशनल भाषाविज्ञान संघ।
सैफ मोहम्मद। 2018. 20,000 अंग्रेजी शब्दों के लिए वैलेंस, उत्तेजना और प्रभुत्व की विश्वसनीय मानवीय रेटिंग प्राप्त करना। कम्प्यूटेशनल भाषाविज्ञान संघ की 56वीं वार्षिक बैठक की कार्यवाही में (खंड 1: लंबे पत्र), पृष्ठ 174-184।
फ्रेड मोरस्टैटर, लियांग वू, उराज़ यावानोग्लू, स्टीफ़न आर. कॉर्मन और हुआन लियू। 2018. ऑनलाइन समाचारों में फ़्रेमिंग पूर्वाग्रह की पहचान करना। ACM ट्रांज़ैक्शन ऑन सोशल कंप्यूटिंग, 1(2):1–18.
किशोर पापिनेनी, सलीम रूकोस, टॉड वार्ड और वेईजिंग झू। 2002. ब्लू: मशीन अनुवाद के स्वचालित मूल्यांकन के लिए एक विधि। कम्प्यूटेशनल भाषाविज्ञान संघ की 40वीं वार्षिक बैठक की कार्यवाही में, पृष्ठ 311-318।
सौनील पार्क, सेउंगवू कांग, सांगयंग चुंग और जुनेह्वा सोंग। 2009. न्यूज़क्यूब: मीडिया पूर्वाग्रह को कम करने के लिए समाचार के कई पहलुओं को प्रस्तुत करना। कंप्यूटिंग सिस्टम में मानव कारकों पर SIGCHI सम्मेलन की कार्यवाही में, पृष्ठ 443-452।
डायट्राम ए स्केफेल। 2000. एजेंडा-सेटिंग, प्राइमिंग और फ़्रेमिंग पर फिर से विचार: राजनीतिक संचार के संज्ञानात्मक प्रभावों पर एक और नज़र। मास कम्युनिकेशन एंड सोसाइटी, 3(2-3):297–316।
ऑल साइड्स। 2018. मीडिया पूर्वाग्रह रेटिंग्स। Allsides.com।
टिमो स्पिंडे, क्रिस्टीना क्रेउटर, वोल्फगैंग गैस्मायर, फेलिक्स हैम्बर्ग, बेला गिप और हेल्गे गीसे। 2021. क्या आपको लगता है कि यह पक्षपातपूर्ण है? मीडिया पूर्वाग्रह की धारणा के बारे में कैसे पूछें। 2021 ACM/IEEE संयुक्त सम्मेलन डिजिटल लाइब्रेरीज़ (JCDL) में, पृष्ठ 61-69। IEEE.
एस्तेर वैन डेन बर्ग और कैटजा मार्कर्ट। 2020. सूचनात्मक पूर्वाग्रह का पता लगाने में संदर्भ। कम्प्यूटेशनल भाषाविज्ञान पर 28वें अंतर्राष्ट्रीय सम्मेलन की कार्यवाही में, पृष्ठ 6315-6326, बार्सिलोना, स्पेन (ऑनलाइन)। कम्प्यूटेशनल भाषाविज्ञान पर अंतर्राष्ट्रीय समिति।
जॉर्ज राइट और पॉल गुडविन। 2002. 'अधिक कठिन सोचने' के लिए सरल निर्देशों का उपयोग करके फ़्रेमिंग पूर्वाग्रह को खत्म करना और प्रबंधकीय अनुभव वाले उत्तरदाता: 'फ़्रेम को तोड़ना' पर टिप्पणी। रणनीतिक प्रबंधन जर्नल, 23(11):1059–1067.
जिंगकिंग झांग, याओ झाओ, मोहम्मद सालेह, और पीटर जे. लियू. 2019a. पेगासस: सारगर्भित सारांश के लिए निकाले गए अंतर-वाक्यों के साथ पूर्व-प्रशिक्षण।
तियानी झांग*, वर्षा किशोर*, फेलिक्स वू*, किलियन क्यू. वेनबर्गर, और योआव आर्टज़ी। 2020. बर्टस्कोर: बर्ट के साथ टेक्स्ट जेनरेशन का मूल्यांकन। लर्निंग रिप्रेजेंटेशन पर अंतर्राष्ट्रीय सम्मेलन में।
यिफान झांग, जियोवानी दा सैन मार्टिनो, अल्बर्टो बैरोनसेडेनो, सल्वाटोर रोमियो, जीसुन एन, हेवुन क्वाक, टोडर स्टेकोवस्की, इसरा जरादत, जॉर्जी कराडज़ोव, रामी बाली, आदि। 2019बी। तनबीह: आप जो पढ़ रहे हैं, उसे जानें। ईएमएनएलपी-आईजेसीएनएलपी 2019, पृष्ठ 223।