यह पेपर CC BY-NC-SA 4.0 DEED लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।
लेखक:
(1) येजिन बैंग, आर्टिफिशियल इंटेलिजेंस रिसर्च सेंटर (CAiRE), हांगकांग विज्ञान और प्रौद्योगिकी विश्वविद्यालय;
(2) नायेन ली, आर्टिफिशियल इंटेलिजेंस रिसर्च सेंटर (CAiRE), हांगकांग विज्ञान और प्रौद्योगिकी विश्वविद्यालय;
(3) पास्कल फंग, सेंटर फॉर आर्टिफिशियल इंटेलिजेंस रिसर्च (CAiRE), हांगकांग यूनिवर्सिटी ऑफ साइंस एंड टेक्नोलॉजी।
वास्तविक घटनाओं की धारणा को विकृत करके राजनीतिक ध्रुवीकरण को बढ़ाने में फ़्रेमिंग पूर्वाग्रह एक महत्वपूर्ण भूमिका निभाता है। अलग-अलग राजनीतिक रुख वाले मीडिया आउटलेट अक्सर एक ही घटना की रिपोर्टिंग में ध्रुवीकृत भाषा का उपयोग करते हैं। हम एक नया लॉस फ़ंक्शन प्रस्तावित करते हैं जो फ़्रेमिंग पूर्वाग्रह को कम करने के लिए ध्रुवीकृत इनपुट लेखों के बीच ध्रुवीयता अंतर को कम करने के लिए मॉडल को प्रोत्साहित करता है। विशेष रूप से, हमारा नुकसान मॉडल को संयुक्त रूप से ध्रुवीयता के अंत को द्विदिश रूप से मैप करने के लिए अनुकूलित करने के लिए डिज़ाइन किया गया है। हमारे प्रयोगात्मक परिणाम प्रदर्शित करते हैं कि प्रस्तावित ध्रुवीयता न्यूनीकरण हानि को शामिल करने से BART-आधारित बहु-दस्तावेज़ सारांश मॉडल की तुलना में फ़्रेमिंग पूर्वाग्रह में पर्याप्त कमी आती है। उल्लेखनीय रूप से, हम पाते हैं कि इस दृष्टिकोण की प्रभावशीलता सबसे अधिक तब स्पष्ट होती है जब मॉडल को सूचनात्मक फ़्रेमिंग पूर्वाग्रह (यानी, रिपोर्ट करने के लिए सूचना का विषम चयन) से जुड़ी ध्रुवीयता हानि को कम करने के लिए प्रशिक्षित किया जाता है।
फ़्रेमिंग पूर्वाग्रह आधुनिक मीडिया में एक व्यापक समस्या बन गई है, जो सूचना और भाषा के विषम चयन के माध्यम से वास्तव में क्या हुआ, इसकी समझ को गुमराह करती है (एंटमैन, 2007, 2010; जेंट्ज़कोव और शापिरो, 2006)। फ़्रेमिंग पूर्वाग्रह का सबसे उल्लेखनीय प्रभाव परस्पर विरोधी राजनीतिक दलों और मीडिया आउटलेट्स के बीच बढ़ी हुई ध्रुवता है। सूचना के सटीक और वस्तुनिष्ठ वितरण को बढ़ावा देने के लिए फ़्रेमिंग पूर्वाग्रह को कम करना महत्वपूर्ण है।
एक आशाजनक शमन प्रतिमान पक्षपाती स्रोत लेखों (साइड्स, 2018; ली एट अल., 2022) से कई विचारों को संश्लेषित करके एक समाचार लेख का एक तटस्थ संस्करण तैयार करना है। समाचार तटस्थता को अधिक प्रभावी ढंग से प्राप्त करने के लिए, हम एक ध्रुवीयता न्यूनतमीकरण हानि पेश करते हैं जो प्रेरक पूर्वाग्रह का लाभ उठाती है जो मॉडल को न्यूनतम ध्रुवीयता अंतर के साथ पीढ़ी को प्राथमिकता देने के लिए प्रोत्साहित करती है। हमारा प्रस्तावित नुकसान मॉडल को ध्रुवीयता स्पेक्ट्रम के एक छोर से दूसरे छोर तक और इसके विपरीत लेखों को मैप करने में एक साथ अच्छा होने के लिए प्रशिक्षित करता है जैसा कि चित्र 1 में दिखाया गया है। सहज रूप से, मॉडल को दो विपरीत छोरों से विपरीत ध्रुवीयताओं के बीच साझा पहलू को सीखने और ध्यान केंद्रित करने के लिए मजबूर किया जाता है।
इस कार्य में, हम फ्रेमिंग पूर्वाग्रह के विभिन्न आयामों में ध्रुवीयता को कम करके हमारे प्रस्तावित हानि फ़ंक्शन की प्रभावशीलता को प्रदर्शित करते हैं - शाब्दिक और सूचनात्मक (एंटमैन, 2002)। शाब्दिक ध्रुवीकरण एक ही जानकारी (जैसे, "विरोध" बनाम "दंगा") को समझाने के लिए अलग-अलग वैलेंस और उत्तेजना वाले शब्दों के चयन से उत्पन्न होता है। सूचनात्मक ध्रुवीकरण कवर करने के लिए सूचना के अलग-अलग चयन से उत्पन्न होता है, जिसमें अक्सर कवर किए जा रहे मुद्दे से संबंधित अनावश्यक या असंबंधित जानकारी शामिल होती है। हमारी जांच से पता चलता है कि सूचनात्मक आयाम में अलग-अलग विपरीत ध्रुवों को सीखना मॉडल को सामान्य आधार पर ध्यान केंद्रित करने और ध्रुवीकृत इनपुट लेखों में पूर्वाग्रहों को कम करने की बेहतर क्षमता हासिल करने में सक्षम बनाता है। अंततः, हमारा प्रस्तावित नुकसान पूर्वाग्रह-प्रेरक जानकारी को हटाने और अधिक तटस्थ भाषा विकल्पों की पीढ़ी को सक्षम बनाता है।