Autores:
(1) Anees Baqir, Universidade Ca' Foscari de Veneza, Itália;
(2) Alessandro Galeazzi, Universidade Ca' Foscari de Veneza, Itália;
(3) Fabiana Zollo, Universidade Ca' Foscari de Veneza, Itália e The New Institute Center for Environmental Humanities, Itália.
Nesta seção apresentamos os resultados de nossa análise, organizados da seguinte forma. Em primeiro lugar, fornecemos uma visão geral do panorama da informação em países europeus selecionados ao longo dos três anos. Esta etapa é crucial para identificar tópicos-chave que são amplamente partilhados entre os países e distinguir entre fontes questionáveis e fiáveis, permitindo uma comparação coerente. Em seguida, examinamos os pontos em comum e as diferenças entre os países nas suas discussões online sobre estes tópicos, centrando-nos no envolvimento dos utilizadores e nos padrões de consumo.
Para comparar os panoramas do discurso público nos países selecionados, o nosso passo inicial envolve a identificação de tópicos comuns amplamente discutidos nos quatro países e por fontes questionáveis e confiáveis. Para este objetivo, empregamos BERTopic (Grootendorst, 2022) para realizar modelagem de tópicos no conteúdo produzido pelas contas dos meios de comunicação ao longo de um período de três anos (ver Seção 2 para mais detalhes). Para identificar tópicos adequados para nossa análise, dividimos o conjunto de dados por ano e por país e executamos o algoritmo BERTopic em cada subconjunto. Os resultados apresentados na Figura 1 mostram os temas mais debatidos em cada ano, por país e categoria de fonte. O tamanho de cada tópico representa o número de fontes de notícias que contribuem para ele, enquanto a sua posição reflecte a sua relevância para os tópicos globais. Os diagramas de fluxo mostram a prevalência do tema nos meios de comunicação ao longo do tempo.
A Figura 1 destaca como a atenção dos meios de comunicação a diferentes tópicos variou entre países e tipos de fontes de notícias. Notavelmente, além de determinados temas de interesse comum, os meios de comunicação tendem a priorizar assuntos de relevância nacional, como protestos, influência de países estrangeiros, religião, carros elétricos e legalização das drogas. Observamos também disparidades nos temas cobertos por fontes questionáveis e confiáveis dentro do mesmo país. Por exemplo, a percentagem de meios de comunicação que informam sobre a vacina contra o coronavírus em Itália foi mais elevada para fontes fiáveis do que para fontes questionáveis. Além disso, certos tópicos eram exclusivos de um tipo de fonte, como “Voos” (Itália, confiável), “Gestão da água” (França, confiável) ou “Luta Palestina” (Reino Unido, questionável). Estas conclusões indicam que o nível de interesse foi influenciado tanto pelo país como pelo tipo de fonte considerada, com fontes questionáveis apresentando uma gama mais ampla de interesses e fontes confiáveis focando mais em tópicos comuns a todos os países.
Crucialmente, a nossa análise destaca a presença de tópicos comuns entre debates questionáveis e confiáveis de todos os países. Especificamente, três temas apareceram de forma consistente nos debates em todos os países: “Brexit”(2019), “Coronavírus”(2020) e “Vacina Covid”(2021). Portanto, na análise subsequente, nos concentramos exclusivamente nesses tópicos para um exame do discurso entre países. A lógica por detrás desta escolha é destacar as diferenças e semelhanças na forma como estes tópicos foram relatados e consumidos pelos meios de comunicação e utilizadores de vários países, minimizando assim o impacto das variações específicas dos tópicos na nossa análise. Além disso, estes tópicos foram amplamente discutidos a nível europeu, tornando a nossa análise valiosa para a compreensão de como os assuntos de importância europeia são percebidos em diferentes países.
Para sublinhar a relevância dos três temas escolhidos nos debates públicos online e validar a precisão dos prazos atribuídos a cada tema, realizamos uma análise do Google Trends sobre pesquisas
interesse no Brexit, Coronavírus e Vacina Covid na França, Alemanha, Itália e Reino Unido de 2019 a 2021, conforme mostrado na Figura 2.
A análise do Google Trends confirma que os tópicos selecionados atraíram a maior atenção durante os prazos especificados no contexto online mais amplo. Assim, daqui para frente, a nossa análise centra-se nestes três tópicos (Brexit, Coronavírus e Vacina Covid) para examinar as diferenças e semelhanças na produção e consumo de notícias no panorama europeu. Para realizar nossa análise exclusivamente sobre esses temas, filtramos os cronogramas dos veículos de notícias para selecionar apenas os tweets relevantes para o tema escolhido dentro do respectivo intervalo de tempo (veja a Seção 2 para detalhes).
Continuamos nosso estudo comparando o engajamento com conteúdos relacionados aos temas identificados nas plataformas de mídia social. A Figura 3 mostra a distribuição das interações de tweets por país, calculada como a soma de curtidas, retuítes, citações e respostas, para fontes de notícias confiáveis (azul) e fontes de notícias questionáveis (laranja), conforme classificação do NewsGuard (ver Seção 2). para cada um dos três tópicos. Apesar de pequenas variações geográficas, as distribuições das interações dos usuários apresentam uma distribuição semelhante de cauda longa para todos os três tópicos, onde um pequeno número de tweets recebe um grande número de interações, enquanto a maioria recebe muito poucas. Fontes de notícias confiáveis normalmente obtiveram mais interações do que fontes questionáveis
fontes, como mostrado pela sua distribuição mais ampla ao longo do eixo x. No entanto, observam-se algumas excepções, como o caso do Reino Unido nas discussões sobre a vacina contra a COVID-19 e a França nos debates sobre o Coronavírus. Além disso, no discurso do Brexit, fontes questionáveis têm uma presença notável na cauda da distribuição na Alemanha e em Itália, embora sejam menos proeminentes noutras discussões. No geral, a presença de fontes questionáveis e o envolvimento que geraram podem variar, dependendo tanto do país como do tema específico em consideração.
Voltamos então a nossa atenção para os padrões de consumo de notícias para destacar as diferenças e semelhanças nas audiências dos meios de comunicação. Analisando dados do Twitter sobre Brexit, Coronavírus e Vacina contra a Covid, exploramos se meios de comunicação do mesmo tipo são consumidos por públicos semelhantes. Definimos uma métrica baseada na similaridade de cosseno (ver Seção 2) em retuítes para quantificar a similaridade entre os meios de comunicação em termos de audiência. Os veículos de notícias que compartilham uma alta porcentagem de retuítes têm um valor mais alto da métrica de similaridade (próximo de 1), enquanto os veículos com apenas alguns retuítes compartilhados obtêm uma similaridade baixa (próximo de 0).
Construímos então uma rede não direcionada na qual os meios de comunicação são representados como nós e as arestas ponderadas indicam o nível de similaridade entre eles. Criamos uma rede para cada país e tópico considerado para permitir uma comparação justa. As redes resultantes são visualizadas na Figura 4. Para destacar apenas as conexões mais fortes, descartamos arestas com pesos inferiores à mediana geral das arestas de cada rede (ver Figuras 1 e 2 do SI para os resultados com as redes completas).
Poderemos observar variações na estrutura da rede dependendo do país e do tema em consideração. Na verdade, França, Alemanha e Itália tendem a apresentar um conjunto claramente identificável de fontes questionáveis (triângulos laranja), indicando a presença de comunidades que consomem principalmente conteúdos questionáveis. No Reino Unido, esta distinção é menos pronunciada. Olhando para as diferenças específicas por tópico, descobrimos que para todos os países, exceto o Reino Unido, as redes tendem a ser mais esparsas, com uma menor densidade de bordas, no caso do Brexit. Para as discussões sobre o Coronavírus e a Vacina contra a Covid, as redes estão mais conectadas e apresentam maior densidade de borda (ver Tabela 2 do SI). Isto reflecte-se na separação entre fontes de notícias questionáveis e confiáveis: no debate do Brexit, a separação entre os dois tipos de notícias parece mais clara, enquanto nos outros debates, partilham um maior número de ligações, como mostra a Tabela 3 do SI . Para quantificar ainda mais este comportamento, aplicamos a assortatividade nominal ajustada às nossas redes (Karimi e Oliveira, 2022), mostrando que níveis mais elevados de assortatividade são alcançados no contexto do debate do Brexit. No entanto, o Reino Unido apresenta um comportamento diferente, possivelmente devido ao seu envolvimento direto no debate.
A nossa análise também revela que não existe uma separação absoluta entre meios de comunicação questionáveis e confiáveis. Isto sugere que alguns utilizadores consomem principal ou exclusivamente conteúdo fiável ou questionável, enquanto outros têm uma dieta mista de notícias, consumindo ambos os tipos em proporções variadas. Para aprofundar esta questão, analisamos a fração de notícias questionáveis consumidas por cada usuário e apresentamos a distribuição na Figura 5. Os resultados indicam que a maioria dos usuários em cada debate depende principalmente de fontes de notícias confiáveis (ver também Tabela 4 do SI ). No entanto, em todos os debates, há uma pequena mas notável fração de utilizadores que apoiam exclusivamente notícias questionáveis, embora com graus variados de proeminência. Notavelmente, a Figura mostra uma distribuição bimodal distinta, com muito poucos usuários fora dos extremos do espectro. Estes utilizadores desempenham um papel crucial na redução da lacuna entre notícias questionáveis e confiáveis dentro das redes de similaridade. Além disso, as fontes noticiosas fiáveis tendem a ocupar o núcleo da rede, enquanto as fontes questionáveis estão geralmente situadas em posições mais periféricas. Na verdade, entre as 25 principais fontes identificadas pelo algoritmo PageRank em cada rede (Bakshy et al., 2011), uma maioria substancial (pelo menos 95,3%) são consideradas fontes de notícias fiáveis (ver SI para mais detalhes). Concluímos nossa análise examinando a estrutura comunitária das redes de similaridade. Realizamos detecção de comunidade usando o cluster Louvain
algoritmo (Blondel et al., 2008) e relata os resultados na Figura 6. Os clusters são codificados por cores com base na proporção de meios de comunicação questionáveis, com tons mais escuros indicando uma porcentagem maior de fontes questionáveis.
Em todos os países e tópicos, a maioria dos clusters consistia principalmente em meios de comunicação confiáveis e, dentro desses clusters, também encontramos os nós mais significativos de acordo com a classificação PageRank. No entanto, a nossa análise também revela a presença de pequenos grupos com uma elevada proporção de meios de comunicação questionáveis. O número e o tamanho destes clusters variam dependendo do país e do tema. Por exemplo, na Alemanha e em Itália, existe um grupo deste tipo para cada tópico, enquanto no debate do Brexit em França, existem dois grupos. No Reino Unido, a separação é menos clara, não existindo agrupamentos que apresentem uma elevada percentagem de meios de comunicação questionáveis. Notamos também que clusters confiáveis tendem a ser menores em tamanho, mas mais numerosos, enquanto clusters questionáveis tendem a ser maiores e muitas vezes únicos em cada rede. Isto sugere que os utilizadores que consomem conteúdos questionáveis tendem a apoiar a maioria das fontes questionáveis da rede, enquanto os consumidores de notícias fiáveis se concentram em menos meios de comunicação.
No geral, a nossa análise fornece uma visão longitudinal do cenário de consumo de notícias online nos países selecionados, destacando a predominância de fontes de notícias confiáveis, ao mesmo tempo que revela a presença de clusters com uma maior proporção de fontes de notícias questionáveis em muitos países e tópicos. A existência de tais clusters sugere a presença de um grupo de usuários consumindo conteúdo de diversas fontes questionáveis, evitando fontes confiáveis. Este comportamento é consistente com a potencial presença de câmaras de eco, fenômeno amplamente observado em debates online (Cinelli et al., 2021; Falkenberg et al., 2022; Cota et al., 2019).
Este artigo está disponível no arxiv sob licença CC 4.0.