paint-brush
Red neuronal profunda para la predicción de la temperatura de la superficie del mar: resumen e introducciónpor@oceanography
210 lecturas

Red neuronal profunda para la predicción de la temperatura de la superficie del mar: resumen e introducción

Demasiado Largo; Para Leer

En este artículo, los investigadores mejoran la predicción de la TSM transfiriendo conocimiento físico de observaciones históricas a modelos numéricos.
featured image - Red neuronal profunda para la predicción de la temperatura de la superficie del mar: resumen e introducción
Oceanography: Everything You Need to Study the Ocean HackerNoon profile picture
0-item

Autores:

(1) Yuxin Meng;

(2) Feng Gao;

(3) Eric Rigall;

(4) Ran Dong;

(5) Junyu Dong;

(6) Qiandu.

Tabla de enlaces

Abstracto

Tradicionalmente, los modelos numéricos se han utilizado en estudios de oceanografía para simular la dinámica del océano mediante la representación de ecuaciones físicas. Sin embargo, muchos factores relacionados con la dinámica oceánica parecen estar mal definidos. Sostenemos que la transferencia de conocimiento físico a partir de datos observados podría mejorar aún más la precisión de los modelos numéricos al predecir la temperatura de la superficie del mar (SST). Recientemente, los avances en las tecnologías de observación de la Tierra han producido un crecimiento monumental de datos. En consecuencia, es imperativo explorar formas de mejorar y complementar los modelos numéricos utilizando cantidades cada vez mayores de datos de observación históricos. Con este fin, presentamos un método para la predicción de TSM que transfiere conocimiento físico de observaciones históricas a modelos numéricos. Específicamente, utilizamos una combinación de un codificador y una red generativa adversaria (GAN) para capturar conocimiento físico a partir de los datos observados. Luego, los datos del modelo numérico se introducen en el modelo previamente entrenado para generar datos mejorados físicamente, que luego pueden usarse para la predicción de SST. Los resultados experimentales demuestran que el método propuesto mejora considerablemente el rendimiento de la predicción de SST en comparación con varias líneas de base de última generación.


Términos del índice : temperatura de la superficie del mar, conocimiento físico, red generativa adversaria, modelo numérico

I. INTRODUCCIÓN

Los modelos NUMÉRICOS han sido un método de cálculo matemático tradicional para la predicción de la dinámica oceánica. Según las estadísticas del Programa Mundial de Investigación del Clima (PMIC), la comunidad científica ha desarrollado más de 40 modelos numéricos oceánicos, cada uno de los cuales tiene sus propias ventajas y características. Por ejemplo, el sistema de modelo oceánico regional (ROMS) [1] tiene un potente módulo ecológico adjunto, el modelo de atmósfera oceánica rápida (FOAM) [2] es muy eficaz en estudios globales acoplados océano-atmósfera, el modelo oceánico costero de volumen finito (FVCOM) [3] es capaz de ajustar con precisión el límite de la costa y la topografía submarina. El modelo oceánico de coordenadas híbridas (HYCOM) [4] puede implementar tres variedades de coordenadas autoadaptativas. Estos modelos numéricos no son intercambiables y su uso depende de la aplicación específica. Cabe señalar que los diversos procesos de la dinámica oceánica descritos en modelos numéricos se basan en ecuaciones simplificadas y


Fig. 1. Comparación conceptual del modelo numérico y el método propuesto para la predicción de la temperatura de la superficie del mar (SST). (a) Modelo numérico. (b) Método propuesto para la predicción de la TSM. La red adversarial generativa se utiliza para transferir el conocimiento físico de los datos históricos observados al modelo numérico y, por lo tanto, mejora el rendimiento de la predicción de SST.


parámetros debido a nuestra limitada comprensión del océano. Los movimientos y cambios en el océano real son tan diversos y complejos que identificar las fuentes de un determinado fenómeno se convierte en un verdadero desafío. Por tanto, la búsqueda de nuevas relaciones o conocimientos a partir de datos históricos es de vital importancia para mejorar el rendimiento de los modelos numéricos en el estudio de la dinámica oceánica. En este artículo nos referimos a la capacidad que puede mejorar el modelo numérico como conocimiento físico. Suponemos que los datos históricos pueden poseer conocimientos físicos hasta ahora no descubiertos.


El aprendizaje profundo tiene la notable capacidad de aprender funciones altamente complejas, transformando los datos originales a un nivel mucho más alto de abstracción. En [5], Lecun et al. Describió los principios fundamentales y los beneficios clave del aprendizaje profundo. Recientemente, el aprendizaje profundo se ha aplicado a una variedad de tareas, como el monitoreo de la biodiversidad marina [6], [7], la identificación de objetivos en imágenes de sonar [8], [9] y el pronóstico de la concentración de hielo marino [10]. Por ejemplo, Bermant et al. [6] emplearon redes neuronales convolucionales (CNN) para clasificar espectrogramas generados a partir de datos acústicos de cachalotes. Allken et al. [7] desarrollaron un modelo CNN para la clasificación de especies de peces, aprovechando datos sintéticos para el aumento de datos de entrenamiento. Lima et al. [8] propusieron un método de aprendizaje de transferencia profunda para el reconocimiento automático de frentes oceánicos, extrayendo conocimiento de modelos CNN profundos entrenados con datos históricos. Xu et al. [9] presentaron un enfoque que combina redes de generación profunda y aprendizaje por transferencia para la detección de naufragios con sonar. Ren et al. [10] propusieron un marco codificador-decodificador con redes totalmente convolucionales que pueden predecir la concentración de hielo marino con una semana de anticipación con alta precisión. Mediante la aplicación de métodos basados en el aprendizaje profundo a la investigación oceánica, se han logrado mejoras significativas en términos de clasificación y rendimiento de predicción.


Debido al conocimiento físico incompleto de los modelos numéricos y al débil rendimiento de generalización de las redes neuronales, existen algunos esfuerzos para mejorar el rendimiento de la predicción combinando las ventajas del modelo numérico y las redes neuronales. En ciencia geográfica esto se puede lograr de tres maneras diferentes [11]: 1) Aprendiendo los parámetros del modelo numérico a través de redes neuronales. Las redes neuronales pueden describir de manera óptima la escena observada a partir del modelo detallado de alta resolución, pero muchos parámetros son difíciles de deducir, lo que dificulta su estimación. Brenowitz et al. [12] entrenaron una red neuronal profunda basada en parametrización física unificada y explicaron la influencia de la radiación y la convección de cúmulos. 2) Reemplazo del modelo numérico por una red neuronal. De esta manera, la arquitectura de la red neuronal profunda puede capturar la consistencia física especificada. Pannekoucke et al. [13] tradujeron ecuaciones físicas en arquitecturas de redes neuronales utilizando una herramienta plug-and-play. 3) Analizar el desajuste de salida entre el modelo numérico y los datos de observación. Las redes neuronales se pueden utilizar para identificar, visualizar y comprender los patrones de las imprecisiones del modelo y corregir dinámicamente la desviación del modelo. Patil et al. [14] aplicaron la discrepancia entre los resultados del modelo numérico y los datos de observación para entrenar una red neuronal para predecir la temperatura de la superficie del mar (SST). Ham et al. [15] entrenaron una red neuronal convolucional basada en el aprendizaje por transferencia. Primero entrenan su modelo con los datos del modelo numérico y luego utilizan los datos del reanálisis para calibrar el modelo. Sin embargo, se ha descubierto que el tercer enfoque sufre un problema de sesgo a largo plazo, donde el rendimiento de la predicción se deteriora a medida que aumentan los días de predicción.


Para abordar los problemas anteriores, en este estudio utilizamos las redes generativas adversarias (GAN) para transferir el conocimiento físico de los datos históricos observados a los datos del modelo numérico, como se ilustra en la Fig. 1. A diferencia del modelo numérico tradicional, el modelo numérico propuesto El método puede corregir la parte física de los datos del modelo numérico para mejorar el rendimiento de la predicción. Para ser específicos, como se ilustra en la Fig. 2, primero adquirimos la característica física de los datos observados utilizando un modelo de red anterior compuesto por un codificador y GAN. Posteriormente, obtuvimos la SST mejorada física al alimentar los datos del modelo numérico al modelo previamente entrenado. Después de eso, se adoptó la TSM mejorada por la física para entrenar un modelo espacio-temporal para predecir la TSM. Mientras tanto, realizamos experimentos de ablación para aprovechar al máximo los nuevos datos generados.


Las principales aportaciones de este trabajo son tres:


• Hasta donde sabemos, somos los primeros en transferir conocimiento físico de los datos históricos observados a los datos del modelo numérico mediante el uso de GAN para la predicción de SST.


• La diferencia entre los datos mejorados basados en el conocimiento físico y los resultados previstos se aprovechó para ajustar el peso del modelo durante el entrenamiento.


• Los resultados experimentales indican que nuestro método propuesto puede cubrir la escasez de conocimiento físico en el modelo numérico y mejorar la precisión de la predicción.


El resto del documento está organizado de la siguiente manera. La Sección II presenta la revisión de la literatura relacionada con nuestro método, mientras que el diseño de nuestro método se detalla en la Sección III. Luego, los resultados experimentales se muestran en la Sección IV. La sección V concluye finalmente este artículo.


Este documento está disponible en arxiv bajo licencia CC 4.0.