La fel ca mulți alții, mi-a luat ceva timp să diger rezultatele alegerilor prezidențiale din SUA din 2024. Dar mai este un lucru important de făcut: să analizez cum au mers de fapt predicțiile pe care le-am făcut . Și în sfârșit am ajuns să fac asta.
În general, am făcut trei predicții diferite pe parcursul a ~1,5 luni: ① numai pe baza sondajelor ponderate de înaltă calitate (le-am descărcat pe cele de la 538); ② ajustată de media totală a părtinirii votării de la alegerile din 2016 și 2020; și ③ ajustate cu doar jumătate din distorsiunea sondajului 2016/20.
Care a fost raționamentul meu pentru integrarea părtinirii sondajelor din 2016 și 2020? „Nu mă gândesc la alegeri înainte de asta pentru că de când Trump a intrat în scenă, dinamica alegerilor s-a schimbat semnificativ. Regulile vechi nu se mai aplică. 2024 va fi mult mai asemănător cu 2020 și 2016 decât cu orice alegeri înainte de asta”. (Vezi primul meu
Și de ce l-am inclus pe cel cu jumătate de părtinire de vot? In mea
La începutul lunii noiembrie -- bazat pe argumente foarte rezonabile -- am început, de asemenea, să analizez dacă erorile de sondaj din 2012 și 2022 ar putea fi relevante de luat în considerare. Din păcate, acele argumente s-au dovedit a fi complet, total greșite, așa că vom exclude predicțiile ④ și ⑤ din această analiză post-mortem.
Ceea ce au făcut previziunile de la ① la ③ a fost să prezică marja de câștig în cele șapte state swing, care a generat apoi o probabilitate de câștig în fiecare stat pentru candidați, voturile electorale așteptate (EV) și, combinate (și bazate pe o simulare Monte Carlo), o șansă generală de a câștiga totul. Ceea ce mă voi concentra aici este să mă uit la cât de departe erau predicțiile mele privind marjele de marjele reale din stările de swing, deoarece acestea erau cele pe care s-au bazat toate celelalte componente ale prognozei mele.
Am ales să fac acest lucru cu trei abordări comune: precizia direcțională, eroarea medie absolută (MAE) și eroarea pătratică medie (RMSE). În timp ce MAE calculează pur și simplu diferența absolută dintre marjele prezise și marjele reale și apoi face media acestor valori, RMSE penalizează erorile mari mai puternic. De asemenea, voi face MAE și RMSE pentru o ponderare egală a celor șapte stări de balansare, precum și pentru o ponderare bazată pe EV fiecare. Ponderea egală tratează fiecare predicție de stare cu o importanță egală, concentrându-se exclusiv pe acuratețea predictivă, indiferent de importanța strategică. Cu toate acestea, ponderarea bazată pe EV reflectă mai bine semnificația electorală a fiecărei predicții. Pentru ambele, MAE și RMSE, mai mic este mai bine.
Toate acestea fiind spuse, să trecem la asta. Să vedem cum au mers predicțiile mele.
Metric | Predicția ① | Predicția ② | Predicția ③ |
---|---|---|---|
Precizie direcțională | 42,9% | 100% ✓ | 100% ✓ |
MAE (greutăți egale) | 2.37 | 2.11 | 1.01 ✓ |
RMSE (greutăți egale) | 2.46 | 2.32 | 1,32 ✓ |
MAE (ponderat EV) | 2.26 | 2.11 | 0,81 ✓ |
RMSE (ponderat EV) | 2.35 | 2.32 | 1,06 ✓ |
După cum putem vedea, indiferent de metoda pe care o folosim și de modul în care cântărim stările individuale de balansare, predicția ③ le depășește cu ușurință pe celelalte două (cu excepția preciziei direcționale, cea mai elementară măsură, care analizează câte stări au fost prezise corect, independent de marjă).
Deoarece toate cele trei predicții se bazează pe aceleași sondaje cu aceleași ponderi și diferă doar în ceea ce privește ajustarea lor pentru care părtiniri de sondaj, acest lucru arată că ipotezele pe care le-am făcut inițial au fost rezonabile: alegerile cu Trump ca candidat sunt diferite de alte alegeri; Sondatorii sunt încă prost un sprijin de captare pentru Trump (datorită „alegător timid al lui Trump” etc.); sondajul încă s-a îmbunătățit puțin, totuși; modelele simple (luați eroarea medie de sondare din 2016/20 și tăiați-o la jumătate) în mare parte fac trucul.
Pentru a încheia acest întreg subiect (până când vom începe din nou peste mai puțin de 4 ani de acum), încă o lectură ulterioară: există rapoarte conform cărora un parior francez de la Polymarket a angajat așa-numitele sondaje ale vecinilor (foarte grosier, întrebând „pentru cine crezi că va vota vecinul tău?” în loc de „cu cine vei vota?”), prevăzând astfel totul corect. Prof. Andrew Gelman a scris a
Bine atunci, ne vedem peste 3,5 ani. 👋🏻