Авторы:
(1) Арав Патель, Региональная средняя школа Амити – электронная почта: [email protected];
(2) Питер Глор, Центр коллективного разума Массачусетского технологического института и автор-корреспондент – электронная почта: [email protected].
Модель случайной лесной регрессии показала самые сильные общие результаты при тестировании на контрольной выборке из 64 компаний. Модель случайной лесной регрессии имела наибольшую корреляцию с текущими показателями S&P Global ESG со статистически значимым коэффициентом корреляции 26,1% и средней абсолютной средней ошибкой (MAAE) 13,4% (рис. 5, 6). Это означает, что алгоритм имеет значение p 0,0372 (<0,05), что указывает на то, что он хорошо откалиброван для существующих решений ESG. С другой стороны, хотя другие модели имеют аналогичные MAAE, они также имеют более низкие коэффициенты корреляции, которые не оказываются статистически значимыми (рис. 6). Например, алгоритм регрессии опорного вектора имел корреляцию 18,3% и MAAE 13,7%, что дает значение p 0,148 (рис. 8). Модель XGBoost имела корреляцию 16,0% и MAAE 14,7%, что дает значение p 0,207 (рис. 7). Наконец, алгоритм K-Nearest Neighbours имел корреляцию 13,2% и MAAE 14,0%, что соответствует p-значению 0,298 (рис. 9). Однако все алгоритмы имели одинаковый MAAE, который колебался в пределах 13–15 %, при этом у модели случайного леса был самый низкий показатель — 13,4 % (рис. 10). Все алгоритмы превзошли критерий MAAE на 20,0%.
Этот документ доступен на arxiv под лицензией CC BY-NC-ND 4.0 DEED.