519 lasījumi
519 lasījumi

Es mēģināju paredzēt 2024. gada vēlēšanas — lūk, kas man bija pareizi (un pilnīgi nepareizi)

autors Maximilian Speicher3m2025/03/13
Read on Terminal Reader

Pārāk ilgi; Lasīt

Es pārbaudīju trīs vēlēšanu prognozēšanas modeļus: vienu, izmantojot neapstrādātas augstas kvalitātes aptaujas, vienu, kas pielāgotas pagātnes aptauju kļūdām (2016/2020), un vienu ar pusi korekciju. Daļēji koriģētajam modelim (③) bija vislabākie rezultāti, izmantojot vairākus precizitātes rādītājus. Tas apstiprina, ka Trampa laikmeta aptauju aizspriedumiem joprojām ir nozīme, taču pastāv uzlabojumi. Tikmēr alternatīvas pieejas, piemēram, vecāku vēlēšanu iekļaušana, izrādījās neuzticamas. Tiekamies 2028. gadā! 🚀
featured image - Es mēģināju paredzēt 2024. gada vēlēšanas — lūk, kas man bija pareizi (un pilnīgi nepareizi)
Maximilian Speicher HackerNoon profile picture

Tāpat kā daudziem citiem, man bija vajadzīgs laiks, lai sagremotu 2024. gada ASV prezidenta vēlēšanu rezultātus. Bet ir vēl viena svarīga lieta, kas jādara: analizēt, kā patiesībā veicās manām prognozēm . Un beidzot es to izdarīju.


Aptuveni 1,5 mēnešu laikā es parasti veicu trīs dažādas prognozes: ① pamatojoties tikai uz svērtām augstas kvalitātes aptaujām (es lejupielādēju tās no 538); ② koriģēts ar pilnu vidējo aptauju neobjektivitāti no 2016. un 2020. gada vēlēšanām; un ③ koriģēts tikai par pusi no 2016./2020. gada aptauju novirzes.



Kāds bija mans pamatojums 2016. un 2020. gada aptauju neobjektivitātes integrēšanai? "Pirms tam es neapsveru vēlēšanas, jo kopš Trampa stāšanās uz skatuves vēlēšanu dinamika ir būtiski mainījusies. Vecie noteikumi vairs netiek piemēroti. 2024. gads būs daudz līdzīgāks 2020. un 2016. gadam nekā jebkurām vēlēšanām pirms tam." (Skatiet manu pašu pirmo atjauninājums no 2024. gada 22. septembra .)


Un kāpēc es iekļāvu to, kam ir puse aptaujas? Manā atjauninājums no 2024. gada 9. oktobra , es rakstīju: "Visticamāk, ir tikpat nereāli pieņemt, ka šogad svārstīgos stāvokļos būs nenozīmīga sistemātiska aptaujas kļūda (①), kā arī pieņemt, ka tā būs tikpat liela kā 2016./2020. gadā (②). Patiesība, visticamāk, atradīsies kaut kur pa vidu."


Novembra sākumā, pamatojoties uz ļoti saprātīgiem argumentiem, es arī sāku pētīt, vai 2012. un 2022. gada aptaujas kļūdas varētu būt svarīgas. Diemžēl šie argumenti izrādījās pilnīgi, pilnīgi nepareizi, tāpēc mēs izslēgsim prognozes ④ un ⑤ šajā pēcnāves analīzē.


Prognozes no ① līdz ③ bija paredzētas uzvaras starpībai septiņos mainīgajos štatos, kas pēc tam nodrošināja kandidātu uzvaras iespējamību katrā štatā, sagaidāmās elektoru balsis (EV) un, apvienojot (un pamatojoties uz Montekarlo simulāciju), kopējo iespēju uzvarēt visā. Šeit es pievērsīšos tam, lai apskatītu, cik tālu manas maržas prognozes bija no faktiskajām robežām svārstību stāvokļos, jo tie bija tie, uz kuriem balstījās visas pārējās manas prognozes sastāvdaļas.


Esmu izvēlējies to darīt, izmantojot trīs izplatītas pieejas: virziena precizitāte, vidējā absolūtā kļūda (MAE) un vidējā kvadrātiskā kļūda (RMSE). Kamēr MAE vienkārši aprēķina absolūto atšķirību starp prognozētajām robežām un faktiskajām robežām un pēc tam aprēķina šīs vērtības vidējo vērtību, RMSE par lielām kļūdām tiek sodīts smagāk. Es arī izdarīšu MAE un RMSE, lai nodrošinātu vienādu septiņu svārstību stāvokļu svērumu, kā arī katram uz EV balstītu svērumu. Vienāds svērums katra stāvokļa prognozei tiek uzskatīta ar vienādu nozīmi, koncentrējoties tikai uz prognozēšanas precizitāti neatkarīgi no stratēģiskās nozīmes. Tomēr uz EV balstītais svērums labāk atspoguļo katras prognozes nozīmi vēlēšanās. Gan MAE, gan RMSE zemāks ir labāks.


Tas viss ir pateikts, ķersimies pie tā. Paskatīsimies, kā veicās manām prognozēm.

Metrika

Prognoze ①

Prognoze ②

Prognoze ③

Virziena precizitāte

42,9%

100% ✓

100% ✓

MAE (vienādi svari)

2.37

2.11

1,01 ✓

RMSE (vienādi svari)

2.46

2.32

1,32 ✓

MAE (EV-svērtais)

2.26

2.11

0,81 ✓

RMSE (EV-svērtais)

2.35

2.32

1,06 ✓


Kā redzam, neatkarīgi no tā, kādu metodi mēs izmantojam un kā nosveram atsevišķos svārstību stāvokļus, prognoze ③ viegli pārspēj pārējos divus (izņemot virziena precizitāti, visvienkāršāko mēru, kas parāda, cik stāvokļu tika prognozēti pareizi neatkarīgi no starpības).


Tā kā visas trīs prognozes ir balstītas uz vienām un tām pašām aptaujām ar vienādu svērumu un atšķiras tikai ar to, cik lielā mērā tās tika koriģētas, ņemot vērā aptauju aizspriedumus, tas liecina, ka manis sākotnēji izdarītie pieņēmumi bija pamatoti: vēlēšanas ar Trampu kā kandidātu atšķiras no citām vēlēšanām; aptauju veicēji joprojām ir slikti, lai iegūtu atbalstu Trampam (sakarā ar "kautrīgo Trampa vēlētāju" utt.); aptauja joprojām ir nedaudz uzlabojusies; vienkāršie modeļi (ņemt vidējo aptaujas kļūdu no 2016./2020. gada un vienkārši samazināt to uz pusēm) lielākoties dara to triku.


Noslēdzot visu šo tēmu (līdz sāksim no jauna pēc nepilniem 4 gadiem), vēl viens gabals tālākai lasīšanai: Ir ziņas, ka kāds franču derību slēdzējs polimārketā iesaistījis tā saukto kaimiņu aptauju (ļoti rupji runājot, jautājot "par ko, jūsuprāt, balsos jūsu kaimiņš?", nevis "par ko jūs balsosit?"), tādējādi visu pareizi paredzot. Prof. Endrjū Gelmans ir uzrakstījis a ļoti interesants raksts par šo .


Labi, tiekamies pēc 3,5 gadiem. 👋🏻

L O A D I N G
. . . comments & more!

About Author

Maximilian Speicher HackerNoon profile picture
Maximilian Speicher@maxspeicher
Computer scientist, designer, part-time philosopher. I write, mostly about design and user experience.

PAKARINĀT TAGUS

ŠIS RAKSTS TIKS PĀRSTRĀDĀTS...

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks