Autoren:
(1) Aarav Patel, Amity Regional High School – E-Mail: [email protected];
(2) Peter Gloor, Center for Collective Intelligence, Massachusetts Institute of Technology und korrespondierender Autor – E-Mail: [email protected].
Das Random-Forest-Regressionsmodell zeigte die insgesamt stärksten Ergebnisse, als es an einer Holdout-Stichprobe von 64 Unternehmen getestet wurde. Das Random-Forest-Regressionsmodell wies die stärkste Korrelation mit den aktuellen S&P Global ESG-Scores auf, mit einem statistisch signifikanten Korrelationskoeffizienten von 26,1 % und einem mittleren absoluten Durchschnittsfehler (MAAE) von 13,4 % (Abbildung 5, 6). Das bedeutet, dass der Algorithmus einen p-Wert von 0,0372 (<0,05) hat, was zeigt, dass er gut auf bestehende ESG-Lösungen abgestimmt ist. Andererseits haben die anderen Modelle zwar ähnliche MAAE, aber auch niedrigere Korrelationskoeffizienten, die sich als nicht statistisch signifikant erweisen (Abbildung 6). Beispielsweise hatte der Support Vector Regression-Algorithmus eine Korrelation von 18,3 % und einen MAAE von 13,7 %, was zu einem p-Wert von 0,148 führt (Abbildung 8). Das XGBoost-Modell wies eine Korrelation von 16,0 % und einen MAAE von 14,7 % auf, was einen p-Wert von 0,207 ergibt (Abbildung 7). Schließlich wies der K-Nearest Neighbors-Algorithmus eine Korrelation von 13,2 % und einen MAAE von 14,0 % auf, was einem p-Wert von 0,298 entspricht (Abbildung 9). Alle Algorithmen hatten jedoch einen ähnlichen MAAE, der zwischen 13 % und 15 % lag, wobei das Random Forest-Modell mit 13,4 % den niedrigsten Wert aufwies (Abbildung 10). Alle Algorithmen übertrafen das MAAE-Kriterium von 20,0 %.
Dieses Dokument ist auf arxiv unter der Lizenz CC BY-NC-ND 4.0 DEED verfügbar .