paint-brush
Réseau neuronal profond pour la prévision de la température de la surface de la mer : résultats expérimentaux et analysepar@oceanography
205 lectures

Réseau neuronal profond pour la prévision de la température de la surface de la mer : résultats expérimentaux et analyse

Trop long; Pour lire

Dans cet article, les chercheurs améliorent la prévision de la SST en transférant les connaissances physiques des observations historiques vers les modèles numériques.
featured image - Réseau neuronal profond pour la prévision de la température de la surface de la mer : résultats expérimentaux et analyse
Oceanography: Everything You Need to Study the Ocean HackerNoon profile picture
0-item

Auteurs:

(1) Yuxin Meng;

(2) Feng Gao;

(3) Éric Rigall;

(4) Ran Dong;

(5) Junyu Dong;

(6) Qian Du.

Tableau des liens

IV. RÉSULTATS EXPÉRIMENTAUX ET ANALYSE

A. Zone d'étude et paramètres d'expérimentation


La mer de Chine méridionale est située dans l’océan Pacifique occidental, au sud de la Chine continentale. Sa superficie est d'environ 3,5 millions de kilomètres carrés avec une profondeur moyenne de 1 212 mètres. Dans cet article, la zone d'étude sélectionnée est (3,99°N∼24,78°N, 98,4°E∼124,4°E).


Nous utilisons les données de télédétection par satellite à haute résolution du GHRSST (Group for High Resolution Sea Surface Temperature) [55] comme données observées. GHRSST fournit une variété de données sur la température de la surface de la mer, notamment des coordonnées de fauchée satellite, des données maillées et des produits maillés sans interruption. Ici, nous avons utilisé des produits maillés sans lacunes, qui sont générés en combinant des observations complémentaires par satellite et in situ dans un cadre d'interpolation optimale. Le HYCOM [56] est sélectionné comme modèle numérique. Leurs résolutions spatiales sont respectivement de 1/20°×1/20° et 1/12°×1/12°. La résolution temporelle est d'un jour. Les données de mai 2007 à décembre 2013 sont utilisées pour la formation, tandis que les données restantes de janvier 2014 à décembre 2014 sont utilisées pour les tests. Il est à noter que nous utilisons des données sans nuages fournies par GHRSST. Les données ont été capturées par des instruments à micro-ondes capables de pénétrer à travers les nuages. Les données couvrent donc entièrement la zone d’étude. De plus, l'heure précise de chaque pixel du produit GHRSST SST est la même.


La standardisation du score Z a été utilisée pour le prétraitement comme :



où x désigne le modèle SST GHRSST et HYCOM, z désigne les données normalisées, µ et σ désignent respectivement la valeur moyenne et l'écart type. Nous avons converti les données en cartes thermiques de forme carrée de 256 × 256.


Plus précisément, les données GHRSST et le vecteur aléatoire à 512 dimensions sont utilisés dans la première étape de la formation préalable du réseau. La taille des données GHRSST d'entrée est N × H × W, où N représente la taille du lot, H indique la hauteur des données d'entrée et W désigne la largeur des données d'entrée. Pour la deuxième étape du réseau précédent, nous utilisons uniquement les données GHRSST pour la formation des encodeurs. Les tailles d'entrées et de sorties pour les deux étapes sont N × H × W. De même, lors de la troisième étape de la formation préalable du réseau, les données HYCOM SST sont introduites dans le modèle pré-entraîné. Ici, les tailles des entrées et des sorties sont N × H × W. Dans nos implémentations, nous définissons N sur 2430, tandis que H et W sont tous deux définis sur 256.


Fig. 3. Illustration de trois modèles utilisés dans l'étude d'ablation. (a) Schéma A : les données SST du modèle numérique sont d'abord introduites dans le ConvLSTM, puis les sorties sont introduites dans le réseau préalable bien entraîné. La séquence du réseau précédent et de ConvLSTM est remplacée. (b) Schéma B : Le réseau précédent n’a pas été bien formé. Plus précisément, la formation du modèle GAN dans le réseau précédent a été omise. (c) La méthode proposée.


Nous avons mené des expériences approfondies sur une NVIDIA GeForce 2080Ti avec 8 GPU. Le réseau antérieur utilise la même structure et configuration de réseau que celles mentionnées dans [53] pour acquérir les connaissances physiques à partir des données historiques observées. Ensuite, les connaissances physiques obtenues sont transférées aux données du modèle numérique dans le but de restaurer et d'améliorer les composants incorrects du modèle numérique. La configuration du modèle ConvLSTM utilisé dans cet article est la même que celle du modèle ConvLSTM dans les travaux de Shi [20]. L'ensemble de données GHRSST SST est utilisé comme référence pour la comparaison et l'évaluation dans cet article.


B. Influences du numéro du jour passé pour la prévision SST


Comme mentionné dans la section III. C, t désigne le nombre de jours passés utilisés pour la prédiction. Il s'agit d'un paramètre critique qui peut affecter les performances de prédiction SST. Dans cet article, nous tentons de prédire la SST des prochains jours, trois et sept jours. Nous avons mis en œuvre des expériences approfondies pour trouver le


TABLEAU IRÉSULTATS EXPÉRIMENTAUX DE DIFFÉRENTS NOMBRE DE JOURS PASSÉS POUR LA PRÉDICTION DE SST SUR UN JOUR PROCHAIN


TABLEAU II RÉSULTATS EXPÉRIMENTAUX DE DIFFÉRENTS NOMBRE DE JOURS PASSÉS POUR LA PRÉVISION DE LA SST DES TROIS PROCHAINS JOURS


TABLEAU III RÉSULTATS EXPÉRIMENTAUX DE DIFFÉRENTS NOMBRE DE JOURS PASSÉS POUR LA PRÉDICTION DE SST DES SEPT JOURS SUIVANTS


nombre approprié de jours passés pour la future prévision SST. L'erreur quadratique moyenne (RMSE) et le coefficient de détermination (R2) sont appliqués comme critères d'évaluation. Des valeurs RMSE inférieures et R2 plus élevées indiquent des résultats plus précis.


Le tableau I répertorie les résultats de prédiction pour le jour suivant en utilisant séparément les données d'un jour, de trois jours et de cinq jours précédents. On peut observer que le modèle proposé fonctionne mieux en utilisant les données des cinq derniers jours, où les résultats RMSE et R2 sont respectivement de 0,3618 et 0,9967. Ils sont légèrement meilleurs que les autres programmes. Par rapport aux deux autres schémas, les valeurs RMSE et R2 s'améliorent de 0,0086, 0,001 et 0,0028, 0,0006. Par conséquent, les données des cinq derniers jours sont adoptées pour la prévision SST du jour suivant.


Nous analysons les influences de t pour la prévision SST des trois prochains jours dans le tableau II. On peut constater que plus les données historiques sont utilisées longtemps, meilleures sont les performances de prévision. La valeur RMSE utilisant les données des sept derniers jours permet d'obtenir les meilleures performances. Il est amélioré de 0,0025 par rapport à celui utilisant les données des cinq derniers jours. Pendant ce temps, le R2 obtient les meilleurs résultats en utilisant les données des sept derniers jours par rapport aux deux autres systèmes. Par conséquent, les données des sept derniers jours ont été utilisées pour la prévision SST des trois prochains jours.


Les résultats expérimentaux de la prévision SST des sept prochains jours sont illustrés dans le tableau III. Comme on peut le constater, les résultats de prédiction utilisant les données des dix derniers jours permettent d'obtenir les meilleures performances. Par conséquent, nous exploitons les données des dix derniers jours pour la prévision SST des sept prochains jours.


TABLEAU IVRÉSULTATS EXPÉRIMENTAUX (MOYENNE ± STD) DES ÉTUDES D'ABLATION EN MOYENNE SUR 10 EXÉCUTIONS ALÉATOIRES


C. Étude sur l'ablation


Pour vérifier l'efficacité du réseau préalable et de la formation GAN, nous menons des expériences d'ablation. Comme illustré sur la figure 3, deux variantes sont conçues à des fins de comparaison :


• Schéma A. La séquence du réseau précédent et de ConvLSTM est remplacée. Les données SST du modèle numérique sont d'abord introduites dans le ConvLSTM, puis les sorties sont introduites dans le réseau préalable bien formé.


• Schéma B. Le réseau précédent n'a pas été bien formé. Plus précisément, la formation du modèle GAN (la première étape de la figure 2) lors de la formation réseau antérieure a été omise.


Les résultats expérimentaux sont présentés dans le tableau IV. Comme on peut le constater, notre méthode atteint les meilleures valeurs RMSE et R2. Plus précisément, la méthode proposée surpasse le schéma A, qui démontre que la séquence correcte du réseau antérieur et de ConvLSTM peut améliorer les performances de prédiction SST. Il est évident que le réseau antérieur restaure efficacement les composants incorrects des données du modèle numérique et que les données restaurées fonctionnent mieux dans la prédiction SST. De plus, la méthode proposée présente des performances supérieures à celles du schéma B, ce qui démontre que la modélisation GAN est une étape essentielle. La modélisation GAN peut apprendre la distribution des données du SST observé et aide le réseau précédent à capturer de meilleures informations physiques à partir du SST observé. En résumé, dans la méthode proposée, nous utilisons l'apprentissage contradictoire pour le pré-entraînement préalable du réseau, qui peut transférer efficacement les connaissances physiques des données SST observées vers le réseau précédent. Il peut guider une convergence rapide de la formation et améliorer les performances de prédiction SST.


D. Résultats expérimentaux et discussion


La figure 4 compare la SST prévue pour le prochain jour avec les données de vérité terrain observées. Nous pouvons voir que les résultats prédits par notre méthode correspondent bien aux données observées. De même, les données observées et la SST prévue correspondante pour les trois et sept prochains jours sont affichées respectivement sur les figures 5 et 6. Les résultats visualisés indiquent que la méthode proposée peut générer des résultats robustes et fiables pour la prévision de la SST.


Un nuage de points sur la prévision de la SST pour le jour suivant est illustré sur la figure 7. On peut observer que les points de données sont


Fig. 4. Résultats de la prédiction SST sur un jour suivant par rapport aux données de vérité terrain observées.


Fig. 5. Résultats de la prévision SST sur les trois prochains jours par rapport aux données de vérité terrain observées.


Fig. 6. Résultats de la prédiction SST des sept prochains jours par rapport aux données de vérité terrain observées.


Fig. 7. Nuage de points comparant la prévision SST du prochain jour avec les données observées correspondantes


Fig. 8. Nuage de points comparant la prévision SST des trois prochains jours avec les données observées correspondantes


répartis à peu près uniformément près de la ligne rouge. Les figures 8 et 9 sont des nuages de points des résultats de prédiction pour les trois jours suivants et les sept jours suivants, respectivement. Les nuages de points démontrent l'efficacité de la méthode proposée pour la prédiction de la SST.


Afin de vérifier l'efficacité de la méthode proposée, nous comparons la méthode proposée avec sept méthodes étroitement liées : ConvLSTM [20], Hybrid-NN [14], Hybrid-TL [15], Gen-END [57], VAE- GAN [58], Tra-NM et Tra-ASL. La zone d'étude est (3,99°N∼24,78°N, 98,4°E∼ 124,4°E) pour ces méthodes. Toutes ces méthodes ont utilisé les données d'entraînement des 5 derniers jours pour la prédiction du prochain jour, les données des 7 derniers jours pour la prédiction des 3 prochains jours et les données des 10 derniers jours pour les 7 prochains jours. prédiction.


ConvLSTM est abordé dans la section III. C, et c'est un modèle spatio-temporel efficace pour la prédiction de la SST. HybridNN utilise l'écart entre les données observées et les données du modèle numérique pour guider la formation des réseaux de neurones profonds. Hybrid-TL combine les avantages des modèles numériques et des réseaux de neurones grâce à l'apprentissage par transfert. GenEND est un encodeur génératif qui peut être utilisé pour la prédiction SST. VAE-GAN intègre un auto-encodeur variationnel et


Fig. 9. Nuage de points comparant la prévision SST des sept prochains jours avec les données observées correspondantes


GAN, et il peut capturer des fonctionnalités sémantiques de haut niveau pour la prédiction SST. Les données HYCOM SST sont utilisées pour entraîner le modèle ConvLSTM pour la prochaine prévision sur 1 jour, 3 jours et 7 jours (appelée Tra-NM). Tra-ASL est une méthode d'assimilation traditionnelle et exploite les corrélations entre plusieurs types de données (données observées et données de modèles numériques).


Les données GHRSST sont d'abord utilisées pour former un modèle ConvLSTM, qui sert de référence. Il s’agit d’une approche basée sur les données largement utilisée pour la prédiction de la SST. Hybrid-NN, HybridTL, Gen-END et VAE-GAN utilisent les données GHRSST et HYCOM pour la formation. Les données d’assimilation HYCOM [56]


TABLEAU VSST RÉSULTATS DE PRÉDICTION DE DIFFÉRENTES MÉTHODES


Fig. 10. Résultats visualisés pour la prochaine prédiction SST sur un jour.


Fig. 11. Résultats visualisés pour la prévision SST des trois prochains jours. La première colonne montre les résultats de la SST prévue. Les données SST observées sur le terrain sont présentées dans la deuxième colonne. Nous présentons leur différence dans la troisième colonne.


sont utilisés ici, avec une résolution spatiale de 1/12°×1/12°. Notre méthode améliore et corrige les composants incorrects dans les données du modèle numérique en introduisant des connaissances physiques à partir des données historiques observées. Les données corrigées du modèle numérique sont appelées données améliorées par la physique. Pour comparer avec les données améliorées par la physique, les données d'assimilation HYCOM (Tra-ASL) et les données HYCOM (Tra-NM) sont également utilisées pour entraîner le modèle ConvLSTM.


Les temps de formation de ConvLSTM, Hybrid-NN, Tra-NM et Tra-ASL pour les prochaines prévisions sur 1 jour, 3 jours et 7 jours sont respectivement de 1,8, 4,4 et 8,2 heures. La méthode Hybrid-TL a entraîné le modèle ConvLSTM à deux reprises et la durée de la formation est respectivement de 3,6, 8,8 et 16,4 heures pour les trois tâches. Le VAE-GAN nécessite 181,6, 184,2 et 188,4 heures de formation, tandis que la méthode Gen-END nécessite presque le même temps, avec respectivement 196,8, 199,3 et 203,2 heures pour trois tâches de prédiction SST.


Les résultats de la prévision SST sur 1, 3 et 7 jours suivants sont présentés dans le tableau V. Il est évident que la méthode TraNM donne des résultats insatisfaisants par rapport aux autres méthodes. Cela est probablement dû à des composants incorrects dans les données HYCOM, qui nuisent aux performances de prédiction SST. La méthode Hybrid-NN est également peu performante, car ses valeurs RMSE moyennes sont les deuxièmes plus basses parmi les modèles. Le modèle Hybrid-TL est plus performant que le ConvLSTM pour la prédiction SST sur 1 jour suivant, mais pas pour les deux autres tâches. Notre méthode permet d'obtenir les meilleures valeurs RMSE et les valeurs R2 les plus élevées. Par rapport au modèle ConvLSTM, les valeurs RMSE moyennes de notre méthode sont effectivement améliorées. Cela démontre que l’introduction des connaissances physiques


Fig. 12. Résultats visualisés pour la prévision SST des sept prochains jours. La première ligne montre les résultats du SST prévu. Les données SST observées sur le terrain sont présentées dans la deuxième ligne. Nous présentons leur différence dans la troisième rangée.


à partir des données observées peut restaurer les composants incorrects dans les données du modèle numérique, améliorant ainsi la précision de la prédiction SST.


La figure 10 présente respectivement les résultats visualisés pour la prédiction SST d'un jour suivant, les données SST observées et leurs différences. On peut constater que les résultats prédits sont très similaires aux données SST observées dans toute la région de la mer de Chine méridionale. La figure 11 affiche les résultats visualisés pour la prévision SST des trois prochains jours. On observe des différences de valeurs significatives dans le golfe du Tonkin et dans d’autres zones marginales de la mer de Chine méridionale. La figure 12 illustre les résultats visualisés pour la prédiction SST des sept prochains jours. On constate que les valeurs de différence majeures se concentrent principalement sur le Golfe du Tonkin pour la prévision des sept prochains jours, et qu'elles sont plus grandes que les résultats des deux autres tâches.


E. Limitation et discussion


Des figures 7 à 9, on peut observer qu'il existe certaines inexactitudes dans le SST de milieu de gamme, qui sont visualisées sur la figure 13. Les pixels brillants indiquent de grandes erreurs de prédiction du SST, tandis que les pixels sombres indiquent des prédictions SST précises. Comme on peut le constater, ces points sont principalement situés dans la partie nord-ouest du détroit de Taiwan, où la température prévue de la surface de la mer est inférieure aux données observées. L'erreur de prédiction est principalement causée par le modèle ConvLSTM et le masque terrestre. Dans nos implémentations, le masque de terrain est appliqué à la zone d'étude. Le ConvLSTM exploite les caractéristiques spatiales et temporelles de l’ensemble de la zone d’étude. Les caractéristiques de la partie nord-ouest du détroit de Taiwan sont affectées dans une certaine mesure par le masque terrestre et entraînent donc des erreurs de prévision. Si des données d’entraînement à plus haute résolution pouvaient être obtenues, la précision des prévisions dans cette région serait encore améliorée.


Fig. 13. Visualisation de l'erreur de prédiction SST.


Sur les figures 11 et 12, on peut voir qu'il n'y a pas d'augmentation significative des erreurs avec le jour d'avance. Cela peut être dû au fait que notre méthode utilise une quantité suffisante de données d'entraînement et que les réseaux de neurones profonds sont capables de capturer efficacement les caractéristiques temporelles. De plus, la persistance du SST est également un facteur important.


Cet article est disponible sur arxiv sous licence CC 4.0.