Tak som sa začal hrať
(Vyhlásenie: Nie som profesionálny dátový vedec. Moje hlavné zameranie je hrať sa s údajmi a skúmať niektoré veci.)
V prvom rade to chcem zatiaľ zjednodušiť. Ako vysvetľuje Kahneman vo svojej knihe Hluk : Jednoduché modely často zvládnu svoju prácu celkom dobre.
① Preto beriem do úvahy iba vysokokvalitných anketárov, ale bez toho, aby som ich ankety posudzoval inak. Do súboru údajov 538 zahŕňam iba dátové body s numeric_grade
stupňom ≥ 2,5 (najlepšie: 3).
② Vážim si blízkosť dňa volieb. Čím bližšie k 5. novembru, tým je prieskum relevantnejší. Beriem do úvahy prieskumy spred 90 dní (~ 3 mesiace) vážené lineárne. Anketa končiaca sa 7. augusta má váhu 1/90 a anketa končiaca 4. novembra má váhu 90/90.
③ Nakoniec, nepozerám sa na národné prieskumy. Na čo sa sústredím, je 7 swingových štátov, ktoré rozhodnú voľby.
S tým všetkým sa dostávame k nasledujúcemu obrázku k 24. septembru. Harris vpredu v MI, NV, NC, PA, WI; Trump v AZ & GA.
Na základe týchto pravdepodobností môžeme tiež vypočítať očakávané volebné hlasy (EV) pre každý swing state a preteky celkovo:
④ Toto však nezohľadňuje chybu vo voľbách, ktorá bola významná v rokoch 2016 aj 2020. Urobil som teda aj ①–③ pre tieto dva. O voľbách pred tým neuvažujem, pretože odkedy Trump vstúpil na scénu, dynamika volieb sa výrazne zmenila. Staré pravidlá už neplatia. Rok 2024 bude oveľa viac podobný rokom 2020 a 2016 ako ktorýmkoľvek voľbám pred tým. Chyba hlasovania pre moju metodiku vyzerá takto:
Podľa pravidla „keep it simple“ predpokladajme, že chyba vo voľbách v roku 2024 bude priemerom 2016/20 a aplikujme ju na okraje zhora, pričom k neistote z prieskumov pridáme aj neistotu volebnej chyby:
A opäť, toto sú očakávané EV založené na pravdepodobnosti:
Teraz by sa dalo namietať, že prieskumníci verejnej mienky sa možno poučili a prieskumy budú tento rok opäť presnejšie. To však bol argument už v roku 2020. Navyše, aspoň časť problému sa zdá byť v tom, že niektorí Trumpovi priaznivci sa už jednoducho nechcú zúčastňovať na prieskumoch kvôli problémom s dôverou (pozri napr.
Je zrejmé, že anketári sa snažia poučiť a prispôsobiť sa, ale či budú tento rok menej mimo ako v predošlých dvoch voľbách, uvidíme až 5. novembra. Zatiaľ tiež neberiem chyby pri prieskumoch z roku 2022 voľby do úvahy. Najprv si o tom musím prečítať viac a predpokladám, že prezidentské voľby sa najviac podobajú iným prezidentským voľbám.
Takže pri tomto prvom pokuse moja vlastná malá predpoveď obsahuje jednu predpoveď čisto založenú na vážených prieskumoch verejnej mienky od vysokokvalitných prieskumníkov a jednu predpoveď, ktorá predpokladá, že chyba prieskumu v roku 2024 bude priemerom rokov 2016 a 2020.
Neváhajte a prejdite na môj Github – kde všetko zhromažďujem a archivujem – a pozrite si kompletné údaje a výpočty v najnovšom súbore Excel: https://github.com/maxspeicher/2024-us-presidential -voľby/