Као и многим другима, требало ми је неко време да преварим резултате председничких избора у САД 2024. Али постоји још једна важна ствар коју треба урадити: анализирати како су предвиђања која сам направио заправо прошла. И коначно сам успео да то урадим.
Генерално сам направио три различита предвиђања током ~1,5 месеца: ① само на основу пондерисаних анкета високог квалитета (преузео сам оне са 538); ② прилагођен потпуној просечној пристрасности у анкетама са избора 2016. и 2020. године; и ③ прилагођен за само половину пристрасности у анкетама 2016/20.
Шта је било моје резоновање да интегришем пристрасност гласања из 2016. и 2020. године? „Не размишљам о изборима пре тога, јер откако је Трамп ступио на сцену, изборна динамика се значајно променила. Стара правила више не важе. 2024. ће бити много сличнија 2020. и 2016. него било којим изборима пре тога.“ (Погледајте моје прво
А зашто сам укључио ону са пристрасношћу на пола гласања? У мом
Почетком новембра -- на основу врло разумних аргумената -- такође сам почео да испитујем да ли би грешке у анкетама из 2012. и 2022. могле бити релевантне за разматрање. Нажалост, испоставило се да су ти аргументи потпуно, потпуно погрешни, тако да ћемо искључити предвиђања ④ и ⑤ у овој обдукционој анализи.
Оно што су предвиђања од ① до ③ урадила је да предвиде победничку маргину у седам свинг држава, што је онда дало вероватноћу победе у свакој држави за кандидате, очекиване електорске гласове (ЕВ) и, комбиновано (и засновано на симулацији Монте Карла), укупне шансе за победу у целој ствари. Оно на шта ћу се фокусирати овде је да погледам колико су моја предвиђања маргине била удаљена од стварних маргина у свинг државама, јер су то биле оне на којима су се заснивале све остале компоненте моје прогнозе.
Одабрао сам да то урадим са три уобичајена приступа: тачност усмерења, средња апсолутна грешка (МАЕ) и просечна квадратна грешка (РМСЕ). Док МАЕ једноставно израчунава апсолутну разлику између предвиђених маргина и стварних маргина и затим усредњује ове вредности, РМСЕ теже кажњава велике грешке. Такође ћу урадити МАЕ и РМСЕ за једнако пондерисање седам свинг стања, као и за пондерисање на бази ЕВ. Једнако пондерисање третира свако предвиђање стања са једнаким значајем, фокусирајући се искључиво на тачност предвиђања без обзира на стратешки значај. Међутим, пондерисање засновано на ЕВ боље одражава изборни значај сваког предвиђања. За оба, МАЕ и РМСЕ, ниже је боље.
Све ово је речено, хајде да пређемо на то. Да видимо како су прошла моја предвиђања.
Метриц | Предвиђање ① | Предвиђање ② | Предвиђање ③ |
---|---|---|---|
Дирецтионал Аццураци | 42,9% | 100% ✓ | 100% ✓ |
МАЕ (једнаке тежине) | 2.37 | 2.11 | 1.01 ✓ |
РМСЕ (једнаке тежине) | 2.46 | 2.32 | 1.32 ✓ |
МАЕ (ЕВ-пондерисано) | 2.26 | 2.11 | 0,81 ✓ |
РМСЕ (ЕВ-пондерисано) | 2.35 | 2.32 | 1.06 ✓ |
Као што видимо, без обзира који метод користимо и како одмеравамо појединачна стања замаха, предвиђање ③ лако надмашује друга два (осим тачности усмерења, најосновније мере, која гледа колико је стања тачно предвиђено независно од маргине).
Пошто су сва три предвиђања заснована на истим анкетама са истим пондерима и разликују се само по томе колико су прилагођена за које анкетне пристрасности, ово показује да су претпоставке које сам првобитно изнео биле разумне: Избори са Трампом као кандидатом су различити од других избора; анкетари су и даље лоша подршка Трампу (због „стидљивог Трамповог гласача“ итд.); анкета се ипак мало побољшала; једноставни модели (узмите просечну грешку гласања из 2016/20 и само је преполовите) углавном раде трик.
Да закључимо целу ову тему (док не почнемо изнова за мање од 4 године), још један део даљег читања: Постоје извештаји да је француски кладионичар на Полимаркету ангажовао такозвано анкетирање суседа (врло грубо говорећи, питајући „за кога мислите да ће ваш комшија гласати?“ уместо „за кога ћете гласати?“), и на тај начин предвидео све тачно. Проф. Андрев Гелман је написао а
У реду, видимо се за 3,5 године. 👋🏻