519 lecturi
519 lecturi

Am încercat să prezic alegerile din 2024 – Iată ce am înțeles corect (și total greșit)

de Maximilian Speicher3m2025/03/13
Read on Terminal Reader

Prea lung; A citi

Am testat trei modele de predicție electorală: unul folosind sondaje brute de înaltă calitate, unul ajustat pentru erorile anterioare de sondaj (2016/20) și unul cu o jumătate de ajustare. Modelul pe jumătate ajustat (③) a avut cele mai bune rezultate pentru mai multe valori de precizie. Acest lucru confirmă faptul că părtinirile de sondaj din epoca Trump încă contează, dar există îmbunătățiri. Între timp, abordările alternative, cum ar fi încorporarea alegerilor mai vechi, s-au dovedit nesigure. Ne vedem in 2028! 🚀
featured image - Am încercat să prezic alegerile din 2024 – Iată ce am înțeles corect (și total greșit)
Maximilian Speicher HackerNoon profile picture

La fel ca mulți alții, mi-a luat ceva timp să diger rezultatele alegerilor prezidențiale din SUA din 2024. Dar mai este un lucru important de făcut: să analizez cum au mers de fapt predicțiile pe care le-am făcut . Și în sfârșit am ajuns să fac asta.


În general, am făcut trei predicții diferite pe parcursul a ~1,5 luni: ① numai pe baza sondajelor ponderate de înaltă calitate (le-am descărcat pe cele de la 538); ② ajustată de media totală a părtinirii votării de la alegerile din 2016 și 2020; și ③ ajustate cu doar jumătate din distorsiunea sondajului 2016/20.



Care a fost raționamentul meu pentru integrarea părtinirii sondajelor din 2016 și 2020? „Nu mă gândesc la alegeri înainte de asta pentru că de când Trump a intrat în scenă, dinamica alegerilor s-a schimbat semnificativ. Regulile vechi nu se mai aplică. 2024 va fi mult mai asemănător cu 2020 și 2016 decât cu orice alegeri înainte de asta”. (Vezi primul meu actualizare din 22 septembrie 2024 .)


Și de ce l-am inclus pe cel cu jumătate de părtinire de vot? In mea actualizare din 9 octombrie 2024 , am scris: „Este la fel de probabil la fel de nerealist să presupunem că va exista o eroare sistematică neglijabilă de sondare în statele swing anul acesta (①) pe cât să presupunem că va fi la fel de mare ca în 2016/20 (②). Cel mai probabil, adevărul va fi undeva la mijloc."


La începutul lunii noiembrie -- bazat pe argumente foarte rezonabile -- am început, de asemenea, să analizez dacă erorile de sondaj din 2012 și 2022 ar putea fi relevante de luat în considerare. Din păcate, acele argumente s-au dovedit a fi complet, total greșite, așa că vom exclude predicțiile ④ și ⑤ din această analiză post-mortem.


Ceea ce au făcut previziunile de la ① la ③ a fost să prezică marja de câștig în cele șapte state swing, care a generat apoi o probabilitate de câștig în fiecare stat pentru candidați, voturile electorale așteptate (EV) și, combinate (și bazate pe o simulare Monte Carlo), o șansă generală de a câștiga totul. Ceea ce mă voi concentra aici este să mă uit la cât de departe erau predicțiile mele privind marjele de marjele reale din stările de swing, deoarece acestea erau cele pe care s-au bazat toate celelalte componente ale prognozei mele.


Am ales să fac acest lucru cu trei abordări comune: precizia direcțională, eroarea medie absolută (MAE) și eroarea pătratică medie (RMSE). În timp ce MAE calculează pur și simplu diferența absolută dintre marjele prezise și marjele reale și apoi face media acestor valori, RMSE penalizează erorile mari mai puternic. De asemenea, voi face MAE și RMSE pentru o ponderare egală a celor șapte stări de balansare, precum și pentru o ponderare bazată pe EV fiecare. Ponderea egală tratează fiecare predicție de stare cu o importanță egală, concentrându-se exclusiv pe acuratețea predictivă, indiferent de importanța strategică. Cu toate acestea, ponderarea bazată pe EV reflectă mai bine semnificația electorală a fiecărei predicții. Pentru ambele, MAE și RMSE, mai mic este mai bine.


Toate acestea fiind spuse, să trecem la asta. Să vedem cum au mers predicțiile mele.

Metric

Predicția ①

Predicția ②

Predicția ③

Precizie direcțională

42,9%

100% ✓

100% ✓

MAE (greutăți egale)

2.37

2.11

1.01 ✓

RMSE (greutăți egale)

2.46

2.32

1,32 ✓

MAE (ponderat EV)

2.26

2.11

0,81 ✓

RMSE (ponderat EV)

2.35

2.32

1,06 ✓


După cum putem vedea, indiferent de metoda pe care o folosim și de modul în care cântărim stările individuale de balansare, predicția ③ le depășește cu ușurință pe celelalte două (cu excepția preciziei direcționale, cea mai elementară măsură, care analizează câte stări au fost prezise corect, independent de marjă).


Deoarece toate cele trei predicții se bazează pe aceleași sondaje cu aceleași ponderi și diferă doar în ceea ce privește ajustarea lor pentru care părtiniri de sondaj, acest lucru arată că ipotezele pe care le-am făcut inițial au fost rezonabile: alegerile cu Trump ca candidat sunt diferite de alte alegeri; Sondatorii sunt încă prost un sprijin de captare pentru Trump (datorită „alegător timid al lui Trump” etc.); sondajul încă s-a îmbunătățit puțin, totuși; modelele simple (luați eroarea medie de sondare din 2016/20 și tăiați-o la jumătate) în mare parte fac trucul.


Pentru a încheia acest întreg subiect (până când vom începe din nou peste mai puțin de 4 ani de acum), încă o lectură ulterioară: există rapoarte conform cărora un parior francez de la Polymarket a angajat așa-numitele sondaje ale vecinilor (foarte grosier, întrebând „pentru cine crezi că va vota vecinul tău?” în loc de „cu cine vei vota?”), prevăzând astfel totul corect. Prof. Andrew Gelman a scris a foarte interesanta piesa despre asta .


Bine atunci, ne vedem peste 3,5 ani. 👋🏻

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks