paint-brush
Cân bằng xu hướng và phương sai trong thử nghiệm mạng: Khi nào bạn nên phân cụm?từ tác giả@escholar
343 lượt đọc
343 lượt đọc

Cân bằng xu hướng và phương sai trong thử nghiệm mạng: Khi nào bạn nên phân cụm?

dài quá đọc không nổi

Đi sâu vào quá trình ra quyết định lựa chọn giữa thiết kế cụm và thiết kế Bernoulli trong các thử nghiệm. Bài viết này tìm hiểu kỹ lưỡng về độ lệch và phương sai trong trường hợp xấu nhất, đưa ra những hiểu biết sâu sắc có giá trị về cách sử dụng tối ưu các thiết kế cụm. Khám phá các kịch bản trong đó thiết kế cụm hoạt động tốt hơn thiết kế Bernoulli và đạt được ý nghĩa thực tế khi cân nhắc sai lệch thử nghiệm. Khám phá quy tắc ngón tay cái để đưa ra quyết định sáng suốt, đặc biệt là khi có các cụm có quy mô bằng nhau, đảm bảo thiết kế thử nghiệm của bạn phù hợp với mục tiêu nghiên cứu của bạn.
featured image - Cân bằng xu hướng và phương sai trong thử nghiệm mạng: Khi nào bạn nên phân cụm?
EScholar: Electronic Academic Papers for Scholars HackerNoon profile picture

tác giả:

(1) Davide Viviano, Khoa Kinh tế, Đại học Harvard;

(2) Lihua Lei, Trường Cao học Kinh doanh, Đại học Stanford;

(3) Guido Imbens, Trường Cao học Kinh doanh và Khoa Kinh tế, Đại học Stanford;

(4) Brian Karrer, CÔNG BẰNG, Meta;

(5) Okke Schrijvers, Khoa học ứng dụng Meta Central;

(6) Liang Shi, Khoa học ứng dụng Meta Central.

Bảng liên kết

Tóm tắt & Giới thiệu

Cài đặt

(Khi nào) bạn nên phân cụm?

Lựa chọn thiết kế cụm

Minh họa thực nghiệm và nghiên cứu số

Khuyến nghị thực hành

Người giới thiệu

A) Ký hiệu

B) Tác động ngang hàng nội sinh

C) Bằng chứng

3 (Khi nào) bạn nên phân cụm?


3.1 Sai lệch trong trường hợp xấu nhất


3.2 Phương sai trường hợp xấu nhất

Bổ đề 3.2 phát biểu rằng hai kết quả được thực hiện có hiệp phương sai bằng 0 nếu hai cá nhân (i) ở hai cụm khác nhau, sao cho không cụm nào trong hai cụm chứa bạn của cá nhân kia và (ii) không phải là bạn bè hoặc có chung một người bạn ( tập) và nếu không có bạn nào của j trong cụm chứa bạn của i (tập Gi). Lưu ý rằng Bổ đề 3.2 tương đương với việc nói rằng µi(Di , D−i)[2Di − 1], µj (Dj , D−j )[2Dj − 1] có hiệp phương sai bằng 0 nếu Bi ∩ Bj = ∅. Tiếp theo, chúng tôi phân tích hiệp phương sai cho các đơn vị còn lại.


Nhận xét 5 (Không quan sát được A). Giả sử rằng A không được quan sát hoặc được quan sát một phần và các nhà nghiên cứu có ưu tiên hơn A. Trong trường hợp này, đặc điểm của độ lệch và phương sai tiếp tục được giữ nguyên khi chúng ta đưa ra các kỳ vọng về phân phối của A, trong đó ưu tiên hơn A có thể phụ thuộc về thông tin mạng một phần [ví dụ Breza và cộng sự, 2020].

3.3 So sánh với thiết kế Bernoulli


bây giờ số lượng cụm có thứ tự n (ví dụ: mỗi cụm chứa một vài cá thể). Khi đó thiết kế cụm là tối ưu.


Bảng 1: Ý nghĩa thực tiễn của Định lý 3.5. Nguyên tắc chung được tính cho λ = 1, khi có các cụm có kích thước bằng nhau với kết quả lấy các giá trị từ 0 đến 1 và độ lệch của phân cụm bằng (hoặc nhỏ hơn) 50% (nghĩa là đối với mỗi cá nhân, 50% của các kết nối của cô ấy nằm trong cùng một cụm). Ở đây ψ¯ 4 khi kết quả là nhị phân.



Đối với λ = 1, được biết là ψ¯, quy tắc ngón tay cái mang lại hiệu ứng lan tỏa nhỏ nhất đảm bảo rằng thiết kế cụm chiếm ưu thế trong thiết kế Bernoulli.


Cột cuối cùng trong Bảng 1 thu thập ý nghĩa của quy tắc ngón tay cái, giả sử (i) các cụm có kích thước bằng nhau, (ii) độ lệch của phân cụm tối đa là 50% dưới dạng giới hạn trên thận trọng và (iii) kết quả được giới hạn giữa không và một (trong trường hợp đó ψ¯ ≤ 4). Trong cài đặt này, các nhà nghiên cứu nên chạy thử nghiệm cụm khi ϕ¯ n √ Kn lớn hơn 2,3 khi ψ¯ = 4. Hình 2 minh họa quy tắc ngón tay cái như một hàm của độ lệch và cụm.





[10] Điều kiện Kn/n = o(1), có thể được nới lỏng bằng điều kiện mẫu hữu hạn Kn ≤ nδ′ (ψ/ψ¯) đối với một số δ ′ ∈ [0, 1). Cụ thể, theo các giả định trong Phần 4.2, ψ = ψ¯ và điều kiện tương đương với việc một phần cố định của các cụm có nhiều hơn một quan sát.


Bài viết này có sẵn trên arxiv theo giấy phép CC 1.0.