Tulad ng marami pang iba, natagalan ako upang matunaw ang mga resulta ng 2024 US presidential election. Ngunit may isa pang mahalagang bagay na dapat gawin: upang pag-aralan kung paano aktuwal na nangyari ang mga hula na ginawa ko . At sa wakas ay naisipan kong gawin iyon.
Sa pangkalahatan ay gumawa ako ng tatlong magkakaibang mga hula sa loob ng ~1.5 buwan: ① batay sa timbang na mataas na kalidad na mga botohan lamang (na-download ko ang mga iyon mula sa 538); ② inaayos ng buong average na bias sa botohan mula sa 2016 at 2020 na halalan; at ③ inayos ng kalahati lang ng 2016/20 polling bias.
Ano ang aking katwiran para sa pagsasama ng bias sa botohan mula 2016 at 2020? "Hindi ko isinasaalang-alang ang mga halalan bago iyon dahil mula nang pumasok si Trump sa entablado, ang dynamics ng halalan ay nagbago nang malaki. Hindi na nalalapat ang mga lumang tuntunin. Ang 2024 ay magiging mas katulad sa 2020 at 2016 kaysa sa anumang halalan bago iyon." (Tingnan ang aking pinakauna
At bakit ko isinama yung may half polling bias? Sa aking
Simula ng Nobyembre -- batay sa napaka-makatwirang mga argumento -- sinimulan ko ring tingnan kung ang mga error sa botohan mula 2012 at 2022 ay maaaring may kaugnayan upang isaalang-alang. Sa kasamaang palad, ang mga argumentong iyon ay naging ganap, lubos na mali, kaya ibubukod namin ang mga hula ④ at ⑤ sa pagsusuring ito ng post-mortem.
Ang ginawa ng mga hula ① hanggang ③ ay ang hulaan ang winning margin sa pitong swing states, na pagkatapos ay nagbunga ng posibilidad na manalo sa bawat estado para sa mga kandidato, inaasahang mga boto sa elektoral (EV), at, pinagsama-sama (at batay sa isang Monte Carlo simulation), isang pangkalahatang pagkakataon na mapanalunan ang buong bagay. Ang pagtutuunan ko dito ay tingnan kung gaano kalayo ang aking mga hula sa margin mula sa aktwal na mga margin sa mga estado ng swing, dahil iyon ang mga kung saan nakabatay ang lahat ng iba pang bahagi ng aking hula.
Pinili kong gawin ito sa tatlong karaniwang paraan: katumpakan ng direksyon, mean absolute error (MAE), at root mean square error (RMSE). Habang kinakalkula lamang ng MAE ang ganap na pagkakaiba sa pagitan ng mga hinulaang margin at aktwal na mga margin at pagkatapos ay i-average ang mga halagang ito, pinarurusahan ng RMSE ang malalaking error nang mas mabigat. Gagawin ko rin ang MAE at RMSE para sa pantay na weighting ng pitong swing states pati na rin para sa EV-based weighting bawat isa. Ang pantay na pagtimbang ay tinatrato ang bawat hula ng estado na may pantay na kahalagahan, na puro katumpakan ng predictive anuman ang estratehikong kahalagahan. Gayunpaman, mas mahusay na ipinapakita ng EV-based weighting ang kahalagahan ng elektoral ng bawat hula. Para sa parehong, MAE at RMSE, mas mababa ang mas mahusay.
Lahat ng sinasabi, punta na tayo. Tingnan natin kung paano nangyari ang aking mga hula.
Sukatan | Hula ① | Hula ② | Hula ③ |
---|---|---|---|
Katumpakan ng Direksyon | 42.9% | 100% ✓ | 100% ✓ |
MAE (pantay na timbang) | 2.37 | 2.11 | 1.01 ✓ |
RMSE (pantay na timbang) | 2.46 | 2.32 | 1.32 ✓ |
MAE (EV-weighted) | 2.26 | 2.11 | 0.81 ✓ |
RMSE (EV-weighted) | 2.35 | 2.32 | 1.06 ✓ |
Gaya ng nakikita natin, kahit na anong paraan ang ating gamitin at kung paano natin timbangin ang mga indibidwal na estado ng swing, ang prediciton ③ ay madaling nahihigitan ng iba pang dalawa (maliban sa katumpakan ng direksyon, ang pinakapangunahing sukat, na tumitingin sa kung gaano karaming mga estado ang hinulaan nang tama na hindi nakasalalay sa margin).
Dahil ang lahat ng tatlong hula ay nakabatay sa parehong mga botohan na may parehong mga timbang at nagkakaiba lamang sa kung gaano kalaki ang mga ito ay nababagay para sa kung aling mga pagkiling sa botohan, ito ay nagpapakita na ang mga pagpapalagay na aking orihinal na ginawa ay makatwiran: Ang mga halalan kasama si Trump bilang isang kandidato ay hindi katulad ng ibang mga halalan; masama pa rin ang mga pollster sa pagkuha ng suporta para kay Trump (dahil sa "mahiyaing Trump voter" atbp.); medyo bumuti pa rin ang pollster; mga simpleng modelo (kunin ang average na error sa botohan mula 2016/20 at hatiin lang ito sa kalahati) kadalasang ginagawa ang lansihin.
Upang tapusin ang buong paksang ito (hanggang sa magsimula tayong muli wala pang 4 na taon mula ngayon), isa pang piraso ng karagdagang pagbabasa: May mga ulat na ang isang French bettor sa Polymarket ay nakipag-ugnayan sa tinatawag na neighbor polling (halos halos magsalita, nagtatanong "sino sa tingin mo ang iboboto ng iyong kapitbahay?" sa halip na "sino ang iboboto mo?"), at sa gayon ay hinuhulaan nang tama ang lahat . Si Prof. Andrew Gelman ay sumulat ng isang
Sige, magkita-kita tayo sa 3.5 taon. 👋🏻