Autoren:
(1) Davide Viviano, Fakultät für Wirtschaftswissenschaften, Harvard University;
(2) Lihua Lei, Graduate School of Business, Stanford University;
(3) Guido Imbens, Graduate School of Business und Department of Economics, Stanford University;
(4) Brian Karrer, FAIR, Meta;
(5) Okke Schrijvers, Meta Central Applied Science;
(6) Liang Shi, Meta Central Applied Science.
Zusammenfassung und Einführung
(Wann) sollten Sie Cluster bilden?
Empirische Darstellung und numerische Studien
Lemma 3.2 besagt, dass zwei realisierte Ergebnisse keine Kovarianz haben, wenn zwei Individuen (i) in zwei verschiedenen Clustern sind, so dass keiner der beiden Cluster einen Freund des anderen Individuums enthält, und (ii) keine Freunde sind oder einen gemeinsamen Freund haben ( set) und wenn es keinen Freund von j in einem Cluster gibt, der einen Freund von i enthält (Set Gi). Beachten Sie, dass Lemma 3.2 der Aussage entspricht, dass µi(Di , D−i)[2Di − 1], µj (Dj , D−j )[2Dj − 1] eine Kovarianz von Null haben, wenn Bi ∩ Bj = ∅. Als nächstes analysieren wir die Kovarianzen für die verbleibenden Einheiten.
Bemerkung 5 (Unbeobachtetes A). Nehmen wir an, dass A unbeobachtet oder teilweise beobachtet ist und Forscher einen Prior gegenüber A haben. In diesem Fall gilt die Charakterisierung der Verzerrung und Varianz weiterhin, wenn wir Erwartungen hinsichtlich der Verteilung von A annehmen, wobei der Prior gegenüber A davon abhängen kann auf partiellen Netzwerkinformationen [z. B. Breza et al., 2020].
Jetzt liegt die Anzahl der Cluster in der Größenordnung n (z. B. enthalten Cluster jeweils wenige Individuen). Dann ist das Clusterdesign optimal.
Tabelle 1: Praktische Implikationen von Satz 3.5. Die Faustregel wird für λ = 1 berechnet, wenn gleich große Cluster vorhanden sind, deren Ergebnisse Werte zwischen null und eins annehmen und der Bias der Clusterbildung gleich (oder kleiner) 50 % ist (d. h. für jedes Individuum 50 %). ihre Verbindungen befinden sich in demselben Cluster). Hier ist ψ¯ ≤ 4, wenn die Ergebnisse binär sind.
Für λ = 1, bekannt als ψ¯, liefert die Faustregel die kleinsten Spillover-Effekte, die garantieren würden, dass das Cluster-Design das Bernoulli-Design dominiert.
Die letzte Spalte in Tabelle 1 sammelt die Implikationen der Faustregel unter der Annahme, dass (i) Cluster gleicher Größe vorliegen, (ii) die Abweichung der Clusterbildung höchstens 50 % als konservative Obergrenze beträgt und (iii) die Ergebnisse zwischen diesen Werten liegen Null und Eins (in diesem Fall ist ψ¯ ≤ 4). In dieser Situation sollten Forscher ein Clusterexperiment durchführen, wenn ϕ¯ n √ Kn größer als 2,3 ist und ψ¯ = 4. Abbildung 2 zeigt die Faustregel als Funktion der Vorspannung und der Cluster.
[10] Die Bedingung Kn/n = o(1) kann durch eine endliche Stichprobenbedingung Kn ≤ nδ′ (ψ/ψ¯) für ein δ ′ ∈ [0, 1) gelockert werden. Insbesondere ist unter den Annahmen in Abschnitt 4.2 ψ = ψ¯ und die Bedingung entspricht der, dass ein fester Anteil von Clustern mehr als eine Beobachtung hat.
Dieses Dokument ist auf arxiv unter der CC 1.0-Lizenz verfügbar .