paint-brush
यूरोप में समाचार और गलत सूचना का उपभोग: परिणाम और चर्चाद्वारा@newsbyte
150 रीडिंग

यूरोप में समाचार और गलत सूचना का उपभोग: परिणाम और चर्चा

द्वारा NewsByte.Tech9m2024/06/07
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

इस शोधपत्र में शोधकर्ताओं ने यूरोपीय समाचार उपभोग पैटर्न, गलत सूचना स्रोतों और ट्विटर पर दर्शकों के व्यवहार का विश्लेषण किया है।
featured image - यूरोप में समाचार और गलत सूचना का उपभोग: परिणाम और चर्चा
NewsByte.Tech HackerNoon profile picture
0-item

लेखक:

(1) अनीस बाकिर, का' फ़ॉस्कारी यूनिवर्सिटी ऑफ़ वेनिस, इटली;

(2) एलेसेंड्रो गैलेज़ी, का फ़ोस्कारी यूनिवर्सिटी ऑफ़ वेनिस, इटली;

(3) फैबियाना ज़ोलो, का' फ़ॉस्कारी यूनिवर्सिटी ऑफ़ वेनिस, इटली और द न्यू इंस्टीट्यूट सेंटर फ़ॉर एनवायर्नमेंटल ह्यूमैनिटीज़, इटली।

लिंक की तालिका

3) परिणाम और चर्चा

इस खंड में, हम अपने विश्लेषण के परिणाम प्रस्तुत करते हैं, जिन्हें इस प्रकार व्यवस्थित किया गया है। सबसे पहले, हम तीन वर्षों में चयनित यूरोपीय देशों में सूचना परिदृश्य का अवलोकन प्रदान करते हैं। यह कदम उन प्रमुख विषयों की पहचान करने के लिए महत्वपूर्ण है जो देशों के बीच व्यापक रूप से साझा किए जाते हैं और संदिग्ध और विश्वसनीय स्रोतों के बीच अंतर करते हैं, जिससे सुसंगत तुलना संभव हो पाती है। इसके बाद, हम इन विषयों पर ऑनलाइन चर्चाओं में देशों के बीच समानताओं और अंतरों की जांच करते हैं, उपयोगकर्ता जुड़ाव और उपभोग पैटर्न पर ध्यान केंद्रित करते हैं।

3.1 विभिन्न देशों में सार्वजनिक संवाद का विकास

चयनित देशों में सार्वजनिक विमर्श के परिदृश्य की तुलना करने के लिए, हमारा प्रारंभिक चरण सभी चार देशों में और संदिग्ध और विश्वसनीय दोनों स्रोतों द्वारा व्यापक रूप से चर्चा किए गए सामान्य विषयों की पहचान करना शामिल है। इस उद्देश्य के लिए, हम तीन साल की अवधि में समाचार आउटलेट के खातों द्वारा तैयार की गई सामग्री पर विषय मॉडलिंग करने के लिए BERTopic(Grootendorst, 2022) का उपयोग करते हैं (अधिक जानकारी के लिए सेक्शन 2 देखें)। हमारे विश्लेषण के लिए उपयुक्त विषयों की पहचान करने के लिए, हम डेटासेट को वर्ष और देश के अनुसार विभाजित करते हैं और प्रत्येक उपसमूह पर BERTopic एल्गोरिथम चलाते हैं। चित्र 1 में रिपोर्ट किए गए परिणाम देश और स्रोत श्रेणी के अनुसार प्रत्येक वर्ष के लिए सबसे अधिक बहस वाले विषयों को दिखाते हैं। प्रत्येक विषय का आकार उसमें योगदान देने वाले समाचार स्रोतों की संख्या को दर्शाता है


चित्र 1 इस बात पर प्रकाश डालता है कि विभिन्न देशों और समाचार स्रोतों के प्रकारों के अनुसार समाचार आउटलेट का ध्यान किस तरह से अलग-अलग विषयों पर अलग-अलग था। उल्लेखनीय रूप से, सामान्य रुचि के कुछ विषयों के अलावा, समाचार आउटलेट राष्ट्रीय प्रासंगिकता के विषयों को प्राथमिकता देते थे, जैसे कि विरोध प्रदर्शन, विदेशी देशों का प्रभाव, धर्म, इलेक्ट्रिक कार और ड्रग वैधीकरण। हम एक ही देश के भीतर संदिग्ध और विश्वसनीय स्रोतों द्वारा कवर किए गए विषयों में असमानताएँ भी देखते हैं। उदाहरण के लिए, इटली में कोरोनावायरस वैक्सीन पर रिपोर्टिंग करने वाले समाचार आउटलेट का अनुपात विश्वसनीय स्रोतों के लिए संदिग्ध स्रोतों की तुलना में अधिक था। इसके अलावा, कुछ विषय एक प्रकार के स्रोत के लिए अनन्य थे, जैसे "उड़ानें" (इटली, विश्वसनीय), "जल प्रबंधन" (फ्रांस, विश्वसनीय), या "फिलिस्तीनी संघर्ष" (यूके, संदिग्ध)। ये निष्कर्ष संकेत देते हैं कि रुचि का स्तर देश और विचार किए गए स्रोत के प्रकार दोनों से प्रभावित था, संदिग्ध स्रोतों ने रुचियों की एक व्यापक श्रेणी प्रदर्शित की और विश्वसनीय स्रोत सभी देशों के लिए सामान्य विषयों पर अधिक ध्यान केंद्रित करते हैं।


महत्वपूर्ण रूप से, हमारा विश्लेषण सभी देशों की संदिग्ध और विश्वसनीय बहसों के बीच सामान्य विषयों की उपस्थिति को उजागर करता है। विशेष रूप से, तीन विषय सभी देशों में बहस में लगातार दिखाई दिए: "ब्रेक्सिट" (2019), "कोरोनावायरस" (2020), और "कोविड वैक्सीन" (2021)। इसलिए, बाद के विश्लेषण में, हम चर्चा की क्रॉस-कंट्री जांच के लिए विशेष रूप से इन विषयों पर ध्यान केंद्रित करते हैं। इस विकल्प के पीछे तर्क यह है कि इन विषयों को विभिन्न देशों के समाचार आउटलेट और उपयोगकर्ताओं द्वारा कैसे रिपोर्ट किया गया और उनका उपभोग किया गया, इस तरह हमारे विश्लेषण पर विषय-विशिष्ट भिन्नताओं के प्रभाव को कम किया जा सके। इसके अतिरिक्त, इन विषयों पर यूरोपीय स्तर पर व्यापक रूप से चर्चा की गई है, जिससे हमारा विश्लेषण यह समझने के लिए मूल्यवान हो जाता है कि विभिन्न देशों में यूरोपीय महत्व के विषयों को कैसे माना जाता है।


ऑनलाइन सार्वजनिक बहसों में चुने गए तीन विषयों की प्रासंगिकता को रेखांकित करने और प्रत्येक विषय को सौंपी गई समय-सीमा की सटीकता को मान्य करने के लिए, हम खोज परिणामों का Google रुझान विश्लेषण करते हैं।


चित्र 1: विभिन्न देशों में संदिग्ध और विश्वसनीय समाचार स्रोतों की विषय-वस्तु पर विषय मॉडलिंग के परिणाम। प्रत्येक विषय का आकार उसमें योगदान देने वाले अद्वितीय समाचार स्रोतों के अनुपात द्वारा दिया जाता है। प्रवाह समय के साथ विभिन्न विषयों में समाचार आउटलेट की रुचि में बदलाव को दर्शाता है।


2019 से 2021 तक फ्रांस, जर्मनी, इटली और यूके में ब्रेक्सिट, कोरोनावायरस और कोविड वैक्सीन में रुचि, जैसा कि चित्र 2 में दिखाया गया है।


Google Trends के विश्लेषण से पुष्टि होती है कि चयनित विषयों ने व्यापक ऑनलाइन संदर्भ में निर्दिष्ट समय सीमा के दौरान सबसे अधिक ध्यान आकर्षित किया। इस प्रकार, आगे बढ़ते हुए, हमारा विश्लेषण यूरोपीय परिदृश्य के भीतर समाचार उत्पादन और उपभोग में अंतर और समानता की जांच करने के लिए इन तीन विषयों (ब्रेक्सिट, कोरोनावायरस और कोविड वैक्सीन) पर केंद्रित है। इन विषयों पर विशेष रूप से अपना विश्लेषण करने के लिए, हम संबंधित समय सीमा के भीतर चुने गए विषय से संबंधित केवल ट्वीट्स का चयन करने के लिए समाचार आउटलेट की टाइमलाइन को फ़िल्टर करते हैं (विवरण के लिए अनुभाग 2 देखें)।

3.2 उपयोगकर्ता सहभागिता और सामुदायिक संरचनाएँ

हम सोशल मीडिया प्लेटफॉर्म पर पहचाने गए विषयों से संबंधित सामग्री के साथ जुड़ाव की तुलना करके अपना अध्ययन जारी रखते हैं। चित्र 3 देश के अनुसार ट्वीट इंटरैक्शन का वितरण दिखाता है, जिसकी गणना न्यूज़गार्ड द्वारा वर्गीकृत विश्वसनीय समाचार स्रोतों (नीला) और संदिग्ध समाचार स्रोतों (नारंगी) के लिए लाइक, रीट्वीट, उद्धरण और उत्तरों के योग के रूप में की जाती है (अनुभाग 2 देखें), तीनों विषयों में से प्रत्येक के लिए। मामूली भौगोलिक भिन्नताओं के बावजूद, उपयोगकर्ता इंटरैक्शन का वितरण सभी तीन विषयों के लिए एक समान लंबी-पूंछ वाला वितरण प्रदर्शित करता है, जहां कम संख्या में ट्वीट्स को बड़ी संख्या में इंटरैक्शन प्राप्त होते हैं जबकि बहुमत को बहुत कम मिलते हैं। विश्वसनीय समाचार स्रोतों को आम तौर पर संदिग्ध स्रोतों की तुलना में अधिक इंटरैक्शन प्राप्त हुए


चित्र 2: 2019 से 2021 तक फ्रांस, जर्मनी, इटली और यूके में ब्रेक्सिट, कोरोनावायरस और कोविड वैक्सीन में खोज रुचि का Google रुझान विश्लेषण। प्लॉट दिखाते हैं कि समय के साथ प्रत्येक विषय के लिए खोज रुचि कैसे विकसित हुई, जिसमें प्रत्येक पंक्ति एक विषय का प्रतिनिधित्व करती है। रुचि के रुझान बताते हैं कि ब्रेक्सिट 2019 में सबसे लोकप्रिय था, इसके बाद 2020 और 2021 में 2020 के अंत में कुछ अपवादों के साथ तेज गिरावट आई। कोरोनावायरस 2020 की शुरुआत में चरम पर था और उसके बाद गिरावट आई, जबकि कोविड वैक्सीन ने 2021 की शुरुआत में गति पकड़ी, 2021 के मध्य में अधिकतम तक पहुँच गई और 2021 के अंत में एक और उछाल देखा। कोष्ठक प्रत्येक विषय के लिए विश्लेषण में ध्यान में रखे गए समय अवधि को दर्शाते हैं।


स्रोत, जैसा कि x-अक्ष के साथ उनके व्यापक वितरण द्वारा दिखाया गया है। हालाँकि, कुछ अपवाद देखे गए हैं, जैसे कि COVID-19 वैक्सीन चर्चाओं में यूके का मामला और कोरोनावायरस बहस में फ्रांस का मामला। इसके अलावा, ब्रेक्सिट चर्चा में, संदिग्ध स्रोतों की जर्मनी और इटली में वितरण की पूंछ में उल्लेखनीय उपस्थिति है, हालांकि वे अन्य चर्चाओं में कम प्रमुख हैं। कुल मिलाकर, संदिग्ध स्रोतों की उपस्थिति और उनके द्वारा उत्पन्न जुड़ाव अलग-अलग हो सकते हैं, जो देश और विचाराधीन विशिष्ट विषय दोनों पर निर्भर करता है।


फिर हम समाचार आउटलेट के दर्शकों में अंतर और समानता को उजागर करने के लिए समाचार उपभोग पैटर्न पर अपना ध्यान केंद्रित करते हैं। ब्रेक्सिट, कोरोनावायरस और कोविड वैक्सीन पर ट्विटर डेटा का विश्लेषण करते हुए, हम यह पता लगाते हैं कि क्या एक ही प्रकार के समाचार आउटलेट समान दर्शकों द्वारा उपभोग किए जाते हैं। हम दर्शकों के संदर्भ में समाचार आउटलेट के बीच समानता को मापने के लिए रीट्वीटर पर कोसाइन समानता (अनुभाग 2 देखें) के आधार पर एक मीट्रिक परिभाषित करते हैं। रीट्वीटर का उच्च प्रतिशत साझा करने वाले समाचार आउटलेट में समानता मीट्रिक का उच्च मूल्य (1 के करीब) होता है, जबकि केवल कुछ साझा रीट्वीटर वाले आउटलेट में कम समानता (0 के करीब) होती है।


फिर हम एक अनिर्देशित नेटवर्क बनाते हैं जिसमें समाचार आउटलेट को नोड्स के रूप में दर्शाया जाता है और भारित किनारे उनके बीच समानता के स्तर को दर्शाते हैं। हम निष्पक्ष तुलना को सक्षम करने के लिए प्रत्येक देश और विषय के लिए एक नेटवर्क बनाते हैं। परिणामी नेटवर्क को चित्र 4 में दर्शाया गया है। केवल मजबूत कनेक्शन को उजागर करने के लिए, हम प्रत्येक नेटवर्क के किनारों के समग्र माध्य से कम भार वाले किनारों को छोड़ देते हैं (पूर्ण नेटवर्क के साथ परिणामों के लिए SI के चित्र 1 और 2 देखें)।


हम विचाराधीन देश और विषय के आधार पर नेटवर्क संरचना में भिन्नता देख सकते हैं। वास्तव में, फ्रांस, जर्मनी और इटली संदिग्ध स्रोतों (नारंगी त्रिकोण) का एक स्पष्ट रूप से पहचाने जाने योग्य समूह प्रदर्शित करते हैं, जो मुख्य रूप से संदिग्ध सामग्री का उपभोग करने वाले समुदायों की उपस्थिति को दर्शाता है। यूके में, यह अंतर कम स्पष्ट है। विषय-विशिष्ट अंतरों को देखते हुए, हम पाते हैं कि यूके को छोड़कर सभी देशों के लिए, ब्रेक्सिट के मामले में नेटवर्क कम एज घनत्व के साथ विरल होते हैं। कोरोनावायरस और कोविड वैक्सीन चर्चाओं के लिए, नेटवर्क अधिक जुड़े हुए हैं और उच्च एज घनत्व प्रदर्शित करते हैं (एसआई की तालिका 2 देखें)। यह संदिग्ध और विश्वसनीय समाचार स्रोतों के बीच अलगाव में परिलक्षित होता है: ब्रेक्सिट बहस में, दो प्रकार के समाचारों के बीच अलगाव स्पष्ट दिखाई देता है, जबकि अन्य बहसों में, वे अधिक संख्या में कनेक्शन साझा करते हैं, जैसा कि एसआई की तालिका 3 में दिखाया गया है। इस व्यवहार को और अधिक मापने के लिए, हम अपने नेटवर्क (करीमी और ओलिवेरा, 2022) पर समायोजित नाममात्र वर्गीकरण लागू करते हैं, यह दिखाते हुए कि ब्रेक्सिट बहस के संदर्भ में वर्गीकरण के उच्च स्तर प्राप्त किए जाते हैं। हालाँकि, ब्रिटेन का व्यवहार भिन्न है, संभवतः इस बहस में उसकी प्रत्यक्ष भागीदारी के कारण।


चित्र 3: ब्रेक्सिट (शीर्ष पंक्ति), कोरोनावायरस (मध्य पंक्ति) और कोविड वैक्सीन (निचली पंक्ति) के बारे में विश्वसनीय (नीला) और संदिग्ध (नारंगी) समाचार स्रोतों के लिए देश के अनुसार ट्वीट इंटरैक्शन का वितरण। ट्वीट इंटरैक्शन की गणना प्रत्येक ट्वीट को प्राप्त लाइक, रीट्वीट, उद्धरण और टिप्पणियों के योग के रूप में की जाती है।


हमारे विश्लेषण से यह भी पता चलता है कि संदिग्ध और विश्वसनीय समाचार आउटलेट के बीच कोई पूर्ण अलगाव नहीं है। इससे पता चलता है कि कुछ उपयोगकर्ता मुख्य रूप से या विशेष रूप से विश्वसनीय या संदिग्ध सामग्री का उपभोग करते हैं, जबकि अन्य के पास मिश्रित समाचार आहार होता है, जो अलग-अलग अनुपात में दोनों प्रकार का उपभोग करते हैं। इस प्रश्न पर गहराई से विचार करने के लिए, हम प्रत्येक उपयोगकर्ता द्वारा उपभोग किए गए संदिग्ध समाचारों के अंश का विश्लेषण करते हैं और चित्र 5 में वितरण प्रस्तुत करते हैं। परिणाम दर्शाते हैं कि प्रत्येक बहस में अधिकांश उपयोगकर्ता मुख्य रूप से विश्वसनीय समाचार स्रोतों पर निर्भर करते हैं (एसआई की तालिका 4 भी देखें)। हालाँकि, प्रत्येक बहस में, उपयोगकर्ताओं का एक छोटा लेकिन ध्यान देने योग्य अंश होता है जो विशेष रूप से संदिग्ध समाचारों का समर्थन करता है, हालाँकि प्रमुखता की अलग-अलग डिग्री के साथ। विशेष रूप से, चित्र एक विशिष्ट द्विध्रुवीय वितरण को दर्शाता है, जिसमें बहुत कम उपयोगकर्ता स्पेक्ट्रम के चरम छोर से बाहर आते हैं। ये उपयोगकर्ता समानता नेटवर्क के भीतर संदिग्ध और विश्वसनीय समाचारों के बीच की खाई को पाटने में महत्वपूर्ण भूमिका निभाते हैं। इसके अलावा, विश्वसनीय समाचार स्रोत नेटवर्क के मूल पर कब्जा करते हैं, जबकि संदिग्ध स्रोत आम तौर पर अधिक परिधीय पदों पर स्थित होते हैं। वास्तव में, प्रत्येक नेटवर्क में पेजरैंक एल्गोरिदम द्वारा पहचाने गए शीर्ष 25 स्रोतों में से (बक्शी एट अल., 2011), एक बड़ा बहुमत (कम से कम 95.3%) विश्वसनीय समाचार स्रोत पाए गए (अधिक जानकारी के लिए SI देखें)। हम समानता नेटवर्क की सामुदायिक संरचना की जांच करके अपने विश्लेषण का निष्कर्ष निकालते हैं। हम लौवेन क्लस्टरिंग का उपयोग करके समुदाय का पता लगाते हैं


चित्र 4: समाचार आउटलेट के बीच समानता नेटवर्क, जहाँ प्रत्येक समाचार स्रोत को नोड के रूप में दर्शाया जाता है, और किनारे समाचार आउटलेट के बीच दर्शकों की समानता को दर्शाते हैं। नोड्स का रंग और आकार समाचार स्रोत के वर्गीकरण को दर्शाता है, और किनारों की मोटाई दो समाचार स्रोतों के बीच रीट्वीटर की समानता के स्तर को दर्शाती है। हमने किनारों के समग्र माध्य से कम भार वाले किनारों को छोड़ दिया। प्रत्येक नेटवर्क एक देश के लिए एक विषय पर समाचार आउटलेट की समानता को दर्शाता है।


एल्गोरिदम (ब्लोंडेल एट अल., 2008) का उपयोग करके परिणाम को चित्र 6 में प्रस्तुत किया गया है। समूहों को संदिग्ध समाचार आउटलेट के अनुपात के आधार पर रंग-कोडित किया गया है, जिसमें गहरे रंग संदिग्ध स्रोतों के उच्च प्रतिशत को दर्शाते हैं।


सभी देशों और विषयों में, अधिकांश क्लस्टर में मुख्य रूप से विश्वसनीय समाचार आउटलेट शामिल थे, और इन क्लस्टरों के भीतर, हम पेजरैंक वर्गीकरण के अनुसार सबसे महत्वपूर्ण नोड्स भी पाते हैं। हालाँकि, हमारे विश्लेषण से संदिग्ध समाचार आउटलेट के उच्च अनुपात वाले छोटे क्लस्टरों की उपस्थिति का भी पता चलता है। इन क्लस्टरों की संख्या और आकार देश और विषय के आधार पर अलग-अलग होते हैं। उदाहरण के लिए, जर्मनी और इटली में, प्रत्येक विषय के लिए एक ऐसा क्लस्टर है, जबकि फ्रांस में ब्रेक्सिट बहस में, दो क्लस्टर हैं। यूके में, अलगाव कम स्पष्ट है, जिसमें कोई भी क्लस्टर संदिग्ध समाचार आउटलेट का उच्च प्रतिशत नहीं दिखाता है। हम यह भी देखते हैं कि विश्वसनीय क्लस्टर आकार में छोटे होते हैं लेकिन अधिक संख्या में होते हैं, जबकि संदिग्ध क्लस्टर बड़े होते हैं और अक्सर प्रत्येक नेटवर्क में अद्वितीय होते हैं। इससे पता चलता है कि संदिग्ध सामग्री का उपभोग करने वाले उपयोगकर्ता नेटवर्क के अधिकांश संदिग्ध स्रोतों का समर्थन करते हैं, जबकि विश्वसनीय समाचार उपभोक्ता कम समाचार आउटलेट पर ध्यान केंद्रित करते हैं।


कुल मिलाकर, हमारा विश्लेषण चयनित देशों में ऑनलाइन समाचार उपभोग परिदृश्य का एक अनुदैर्ध्य दृश्य प्रदान करता है, जो विश्वसनीय समाचार स्रोतों की प्रधानता को उजागर करता है, साथ ही कई देशों और विषयों में संदिग्ध समाचार स्रोतों के उच्च अनुपात वाले समूहों की उपस्थिति को भी प्रकट करता है। ऐसे समूहों का अस्तित्व उपयोगकर्ताओं के एक समूह की उपस्थिति का सुझाव देता है जो विश्वसनीय स्रोतों से बचते हुए विभिन्न संदिग्ध स्रोतों से सामग्री का उपभोग करते हैं। यह व्यवहार इको चैंबर्स की संभावित उपस्थिति के अनुरूप है, एक घटना जो ऑनलाइन बहसों में व्यापक रूप से देखी जाती है (सिनेली एट अल., 2021; फाल्केनबर्ग एट अल., 2022; कोटा एट अल., 2019)।


यह पेपर CC 4.0 लाइसेंस के अंतर्गत arxiv पर उपलब्ध है।