paint-brush
Ausgleich von Bias und Varianz in Netzwerkexperimenten: Wann sollten Sie gruppieren?von@escholar
343 Lesungen
343 Lesungen

Ausgleich von Bias und Varianz in Netzwerkexperimenten: Wann sollten Sie gruppieren?

Zu lang; Lesen

Tauchen Sie in Experimenten in den Entscheidungsprozess bei der Wahl zwischen Cluster- und Bernoulli-Designs ein. In diesem Artikel werden Worst-Case-Bias und -Varianz eingehend untersucht und wertvolle Einblicke in die optimale Nutzung von Cluster-Designs geboten. Entdecken Sie Szenarien, in denen Cluster-Designs Bernoulli-Designs übertreffen, und gewinnen Sie praktische Implikationen für experimentelle Bias-Überlegungen. Entdecken Sie eine Faustregel für fundierte Entscheidungen, insbesondere bei gleich großen Clustern, um sicherzustellen, dass Ihr experimentelles Design mit Ihren Forschungszielen übereinstimmt.
featured image - Ausgleich von Bias und Varianz in Netzwerkexperimenten: Wann sollten Sie gruppieren?
EScholar: Electronic Academic Papers for Scholars HackerNoon profile picture

Autoren:

(1) Davide Viviano, Fakultät für Wirtschaftswissenschaften, Harvard University;

(2) Lihua Lei, Graduate School of Business, Stanford University;

(3) Guido Imbens, Graduate School of Business und Department of Economics, Stanford University;

(4) Brian Karrer, FAIR, Meta;

(5) Okke Schrijvers, Meta Central Applied Science;

(6) Liang Shi, Meta Central Applied Science.

Linktabelle

Zusammenfassung und Einführung

Aufstellen

(Wann) sollten Sie Cluster bilden?

Auswahl des Cluster-Designs

Empirische Darstellung und numerische Studien

Empfehlungen für die Praxis

Verweise

A) Notation

B) Endogene Peer-Effekte

C) Beweise

3 (Wann) sollten Sie Cluster bilden?


3.1 Worst-Case-Tendenz


3.2 Worst-Case-Varianz

Lemma 3.2 besagt, dass zwei realisierte Ergebnisse keine Kovarianz haben, wenn zwei Individuen (i) in zwei verschiedenen Clustern sind, so dass keiner der beiden Cluster einen Freund des anderen Individuums enthält, und (ii) keine Freunde sind oder einen gemeinsamen Freund haben ( set) und wenn es keinen Freund von j in einem Cluster gibt, der einen Freund von i enthält (Set Gi). Beachten Sie, dass Lemma 3.2 der Aussage entspricht, dass µi(Di , D−i)[2Di − 1], µj (Dj , D−j )[2Dj − 1] eine Kovarianz von Null haben, wenn Bi ∩ Bj = ∅. Als nächstes analysieren wir die Kovarianzen für die verbleibenden Einheiten.


Bemerkung 5 (Unbeobachtetes A). Nehmen wir an, dass A unbeobachtet oder teilweise beobachtet ist und Forscher einen Prior gegenüber A haben. In diesem Fall gilt die Charakterisierung der Verzerrung und Varianz weiterhin, wenn wir Erwartungen hinsichtlich der Verteilung von A annehmen, wobei der Prior gegenüber A davon abhängen kann auf partiellen Netzwerkinformationen [z. B. Breza et al., 2020].

3.3 Vergleich mit einem Bernoulli-Design


Jetzt liegt die Anzahl der Cluster in der Größenordnung n (z. B. enthalten Cluster jeweils wenige Individuen). Dann ist das Clusterdesign optimal.


Tabelle 1: Praktische Implikationen von Satz 3.5. Die Faustregel wird für λ = 1 berechnet, wenn gleich große Cluster vorhanden sind, deren Ergebnisse Werte zwischen null und eins annehmen und der Bias der Clusterbildung gleich (oder kleiner) 50 % ist (d. h. für jedes Individuum 50 %). ihre Verbindungen befinden sich in demselben Cluster). Hier ist ψ¯ ≤ 4, wenn die Ergebnisse binär sind.



Für λ = 1, bekannt als ψ¯, liefert die Faustregel die kleinsten Spillover-Effekte, die garantieren würden, dass das Cluster-Design das Bernoulli-Design dominiert.


Die letzte Spalte in Tabelle 1 sammelt die Implikationen der Faustregel unter der Annahme, dass (i) Cluster gleicher Größe vorliegen, (ii) die Abweichung der Clusterbildung höchstens 50 % als konservative Obergrenze beträgt und (iii) die Ergebnisse zwischen diesen Werten liegen Null und Eins (in diesem Fall ist ψ¯ ≤ 4). In dieser Situation sollten Forscher ein Clusterexperiment durchführen, wenn ϕ¯ n √ Kn größer als 2,3 ist und ψ¯ = 4. Abbildung 2 zeigt die Faustregel als Funktion der Vorspannung und der Cluster.





[10] Die Bedingung Kn/n = o(1) kann durch eine endliche Stichprobenbedingung Kn ≤ nδ′ (ψ/ψ¯) für ein δ ′ ∈ [0, 1) gelockert werden. Insbesondere ist unter den Annahmen in Abschnitt 4.2 ψ = ψ¯ und die Bedingung entspricht der, dass ein fester Anteil von Clustern mehr als eine Beobachtung hat.