519 показания
519 показания

Опитах се да предскажа изборите през 2024 г. - ето какво съм прав (и тотално грешно)

от Maximilian Speicher3m2025/03/13
Read on Terminal Reader

Твърде дълго; Чета

Тествах три модела за прогнозиране на изборите: един, използващ необработени висококачествени анкети, един коригиран за минали грешки в анкетите (2016/20) и един с половин корекция. Полукоригираният модел (③) се представи най-добре при множество показатели за точност. Това потвърждава, че пристрастията към социологическите проучвания от ерата на Тръмп все още имат значение, но има подобрения. Междувременно алтернативните подходи - като включването на по-стари избори - се оказаха ненадеждни. Ще се видим през 2028! 🚀
featured image - Опитах се да предскажа изборите през 2024 г. - ето какво съм прав (и тотално грешно)
Maximilian Speicher HackerNoon profile picture

Подобно на много други, на мен ми отне известно време да осмисля резултатите от президентските избори в САЩ през 2024 г. Но има още едно важно нещо, което трябва да направя: да анализирам как прогнозите, които направих , всъщност се представиха. И най-накрая успях да го направя.


Като цяло направих три различни прогнози в течение на ~1,5 месеца: ① въз основа само на претеглени висококачествени анкети (изтеглих тези от 538); ② коригирано с пълното средно отклонение от социологическите проучвания от изборите през 2016 г. и 2020 г.; и ③ коригирано само с половината от пристрастието в анкетите за 2016/20 г.



Какви бяха мотивите ми да интегрирам пристрастията към социологическите проучвания от 2016 г. и 2020 г.? „Не обмислям избори преди това, защото откакто Тръмп излезе на сцената, динамиката на изборите се промени значително. Старите правила вече не се прилагат. 2024 г. ще прилича много повече на 2020 г. и 2016 г., отколкото на всички избори преди това.“ (Вижте първия ми актуализация от 22 септември 2024 г .)


И защо включих тази с половината пристрастие към анкетата? В моята актуализация от 9 октомври 2024 г , написах: „Най-вероятно е също толкова нереалистично да приемем, че тази година ще има незначителна систематична грешка в анкетите в щатите на суинг (①), както и да приемем, че ще бъде толкова голяма, колкото през 2016/20 (②). Истината най-вероятно ще е някъде по средата.“


В началото на ноември -- въз основа на много разумно звучащи аргументи -- също започнах да проучвам дали грешките в анкетите от 2012 г. и 2022 г. може да са подходящи за разглеждане. За съжаление, тези аргументи се оказаха напълно, напълно погрешни, така че ще изключим прогнозите ④ и ⑤ в този анализ след смъртта.


Това, което направиха прогнозите от ① до ③, беше да предскажат печалбата в седемте променящи се щата, което след това доведе до вероятност за победа във всеки щат за кандидатите, очаквани електорални гласове (EV) и, комбинирано (и въз основа на симулация на Монте Карло), общ шанс за спечелване на всичко. Това, върху което ще се съсредоточа тук, е да видя колко далеч са моите прогнози за маржове от действителните маржове в състоянията на суинг, защото те бяха тези, на които се основаваха всички други компоненти на прогнозата ми.


Избрах да направя това с три общи подхода: точност на посоката, средна абсолютна грешка (MAE) и средна квадратична грешка (RMSE). Докато MAE просто изчислява абсолютната разлика между прогнозираните маржове и действителните маржове и след това осреднява тези стойности, RMSE наказва по-сериозно големите грешки. Също така ще направя MAE и RMSE за еднакво претегляне на седемте състояния на колебание, както и за претегляне, базирано на EV. Еднаквото претегляне третира всяка прогноза за състояние с еднаква важност, като се фокусира изцяло върху точността на прогнозиране, независимо от стратегическото значение. Базираното на EV тегло обаче по-добре отразява електоралното значение на всяка прогноза. И за двете, MAE и RMSE, по-ниското е по-добро.


Като се има предвид всичко това, нека да се заемем с него. Нека да видим как се справят моите прогнози.

Метрика

Прогноза ①

Прогноза ②

Прогноза ③

Точност на насочване

42,9%

100% ✓

100% ✓

MAE (равни тегла)

2.37

2.11

1,01 ✓

RMSE (равни тегла)

2.46

2.32

1,32 ✓

MAE (EV-претеглено)

2.26

2.11

0,81 ✓

RMSE (EV-претеглено)

2.35

2.32

1,06 ✓


Както можем да видим, без значение кой метод използваме и как претегляме отделните състояния на колебание, предсказанието ③ лесно превъзхожда другите две (с изключение на точността на насочване, най-основната мярка, която разглежда колко състояния са прогнозирани правилно, независимо от маржа).


Тъй като и трите прогнози се основават на едни и същи социологически проучвания с едни и същи коефициенти и се различават само в това колко са били коригирани за кои пристрастия в социологическите проучвания, това показва, че предположенията, които първоначално направих, са разумни: Изборите с Тръмп като кандидат са различни от други избори; социологите все още са лоша подкрепа за Тръмп (поради „срамежливия гласоподавател на Тръмп“ и т.н.); анкетьорът все пак се подобри малко; простите модели (вземете средната грешка при гласуване от 2016/20 г. и просто я намалете наполовина) най-вече вършат работа.


За да завършим цялата тази тема (докато не започнем наново след по-малко от 4 години), още едно по-нататъшно четене: Има доклади, че френски залагащ в Polymarket е включил така нареченото проучване на съседите (много грубо казано, питайки „за кого мислите, че вашият съсед ще гласува?“ вместо „за кого ще гласувате?“), като по този начин прогнозира всичко правилно. Проф. Андрю Гелман е написал a много интересна статия по въпроса .


Добре тогава, ще се видим след 3,5 години. 👋🏻

L O A D I N G
. . . comments & more!

About Author

Maximilian Speicher HackerNoon profile picture
Maximilian Speicher@maxspeicher
Computer scientist, designer, part-time philosopher. I write, mostly about design and user experience.

ЗАКАЧВАЙТЕ ЕТИКЕТИ

ТАЗИ СТАТИЯ Е ПРЕДСТАВЕНА В...

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks