লেখক:
(1) ডেভিড ভিভিয়ানো, অর্থনীতি বিভাগ, হার্ভার্ড বিশ্ববিদ্যালয়;
(2) লিহুয়া লেই, গ্র্যাজুয়েট স্কুল অফ বিজনেস, স্ট্যানফোর্ড ইউনিভার্সিটি;
(3) Guido Imbens, গ্রাজুয়েট স্কুল অফ বিজনেস এবং ডিপার্টমেন্ট অফ ইকোনমিক্স, স্ট্যানফোর্ড ইউনিভার্সিটি;
(4) ব্রায়ান কারার, FAIR, মেটা;
(5) Okke Schrijvers, Meta Central Applied Science;
(6) লিয়াং শি, মেটা সেন্ট্রাল অ্যাপ্লাইড সায়েন্স।
লিঙ্কের টেবিল
(কখন) আপনি ক্লাস্টার করা উচিত?
ক্লাস্টার ডিজাইন নির্বাচন করা হচ্ছে
অভিজ্ঞতামূলক চিত্রণ এবং সংখ্যাগত অধ্যয়ন
3 (কখন) আপনার ক্লাস্টার করা উচিত?
3.1 সবচেয়ে খারাপ ক্ষেত্রে পক্ষপাত
3.2 সবচেয়ে খারাপ-কেস বৈচিত্র
Lemma 3.2 বলে যে দুটি উপলব্ধ ফলাফলের শূন্য সহভক্তি থাকে যদি দুটি ব্যক্তি (i) দুটি ভিন্ন ক্লাস্টারে থাকে, যেমন দুটি ক্লাস্টারের একটিতে অন্য ব্যক্তির বন্ধু থাকে না এবং (ii) বন্ধু নয় বা একটি সাধারণ বন্ধু ভাগ করে নেয় ( সেট), এবং যদি একটি ক্লাস্টারে j এর কোনো বন্ধু না থাকে যেখানে i (সেট Gi) এর বন্ধু রয়েছে। উল্লেখ্য যে Lemma 3.2 হল µi(Di, D−i)[2Di −1], µj (Dj , D−j )[2Dj − 1] বলার সমতুল্য যদি Bi ∩ Bj = ∅ হয়। এর পরে, আমরা অবশিষ্ট ইউনিটগুলির জন্য কোভেরিয়েন্সগুলি বিশ্লেষণ করি।
মন্তব্য 5 (অনিরীক্ষিত এ)। ধরুন যে A অবলোকিত বা আংশিকভাবে পর্যবেক্ষিত, এবং গবেষকদের A এর পূর্বে রয়েছে। এই ক্ষেত্রে, A-এর বন্টনের ক্ষেত্রে আমরা যখন প্রত্যাশা গ্রহণ করি তখন পক্ষপাত ও বৈচিত্র্যের বৈশিষ্ট্য বজায় থাকে, যেখানে A-এর পূর্ববর্তী নির্ভর করতে পারে। আংশিক নেটওয়ার্ক তথ্যে [যেমন Breza et al., 2020]।
3.3 একটি Bernoulli নকশা সঙ্গে তুলনা
এখন ক্লাস্টারের সংখ্যা ক্রমানুসারে (যেমন, ক্লাস্টারে প্রত্যেকটিতে কিছু ব্যক্তি থাকে)। তারপর ক্লাস্টার ডিজাইন সর্বোত্তম।
সারণী 1: উপপাদ্য 3.5 এর ব্যবহারিক প্রভাব। অঙ্গুষ্ঠের নিয়মটি λ = 1 এর জন্য গণনা করা হয়, সমান আকারের ক্লাস্টারগুলির উপস্থিতিতে ফলাফলগুলি শূন্য এবং একের মধ্যে মান গ্রহণ করে এবং ক্লাস্টারিংয়ের পক্ষপাত 50% সমান (বা এর চেয়ে ছোট) (অর্থাৎ, প্রতিটি ব্যক্তির জন্য, 50%) তার সংযোগগুলি তার একই ক্লাস্টারে রয়েছে)। এখানে ψ¯ ≤ 4 যখন ফলাফল বাইনারি হয়।
λ = 1, পরিচিত ψ¯ এর জন্য, থাম্বের নিয়মটি ক্ষুদ্রতম স্পিলওভার ইফেক্ট প্রদান করে যা গ্যারান্টি দেয় যে ক্লাস্টার ডিজাইন বার্নৌলি ডিজাইনের উপর প্রাধান্য পাবে।
সারণি 1 এর শেষ কলামটি থাম্বের নিয়মের অন্তর্নিহিততা সংগ্রহ করে, অনুমান করে (i) সমান আকারের ক্লাস্টার, (ii) ক্লাস্টারিংয়ের পক্ষপাত একটি রক্ষণশীল উপরের সীমা হিসাবে সর্বাধিক 50%, এবং (iii) ফলাফলগুলির মধ্যে আবদ্ধ শূন্য এবং এক (যে ক্ষেত্রে ψ¯ ≤ 4)। এই সেটিংয়ে, গবেষকদের একটি ক্লাস্টার পরীক্ষা চালানো উচিত যখন ϕ¯ n √ Kn 2.3 থেকে বড় হয় যখন ψ¯ = 4। চিত্র 2 পক্ষপাত এবং ক্লাস্টারগুলির একটি ফাংশন হিসাবে থাম্বের নিয়মকে চিত্রিত করে।
[১০] শর্ত Kn/n = o(1), কিছু δ ′ ∈ [0, 1) এর জন্য একটি সসীম নমুনা শর্ত Kn ≤ nδ′ (ψ/ψ¯) দ্বারা শিথিল করা যেতে পারে। বিশেষ করে, অনুচ্ছেদ 4.2-এর অনুমানের অধীনে, ψ = ψ¯ এবং শর্তটি সমতুল্য যে ক্লাস্টারগুলির একটি নির্দিষ্ট ভগ্নাংশের একাধিক পর্যবেক্ষণ রয়েছে।
এই কাগজটি CC 1.0 লাইসেন্সের অধীনে arxiv-এ উপলব্ধ ।