paint-brush
Mạng lưới thần kinh sâu để dự đoán nhiệt độ bề mặt biển: Kết quả và phân tích thử nghiệmtừ tác giả@oceanography
205 lượt đọc

Mạng lưới thần kinh sâu để dự đoán nhiệt độ bề mặt biển: Kết quả và phân tích thử nghiệm

dài quá đọc không nổi

Trong bài báo này, các nhà nghiên cứu nâng cao khả năng dự đoán SST bằng cách chuyển kiến thức vật lý từ các quan sát lịch sử sang mô hình số.
featured image - Mạng lưới thần kinh sâu để dự đoán nhiệt độ bề mặt biển: Kết quả và phân tích thử nghiệm
Oceanography: Everything You Need to Study the Ocean HackerNoon profile picture
0-item

tác giả:

(1) Ngọc Tân Mạnh;

(2) Phùng Cao;

(3) Eric Rigall;

(4) Chạy Đông;

(5) Junyu Đồng;

(6) Càn Độ.

Bảng liên kết

IV. KẾT QUẢ THỰC NGHIỆM VÀ PHÂN TÍCH

A. Khu vực nghiên cứu và bối cảnh thử nghiệm


Biển Đông nằm ở Tây Thái Bình Dương, phía nam lục địa Trung Quốc. Diện tích của nó là khoảng 3,5 triệu km2 với độ sâu trung bình 1.212 mét. Trong bài báo này, vùng nghiên cứu được chọn là (3,99°N∼24,78°N, 98,4°E∼124,4°E).


Chúng tôi sử dụng dữ liệu viễn thám vệ tinh có độ phân giải cao từ GHRSST (Nhóm Nhiệt độ bề mặt biển có độ phân giải cao) [55] làm dữ liệu quan sát được. GHRSST cung cấp nhiều loại dữ liệu nhiệt độ mặt nước biển, bao gồm tọa độ vệ tinh, dữ liệu dạng lưới và các sản phẩm được chia lưới không có khe hở. Ở đây, chúng tôi đã sử dụng các sản phẩm có lưới không có khoảng trống, được tạo ra bằng cách kết hợp các quan sát vệ tinh bổ sung và quan sát tại chỗ trong khuôn khổ Nội suy tối ưu. HYCOM [56] được chọn làm mô hình số. Độ phân giải không gian của chúng lần lượt là 1/20°×1/20° và 1/12°×1/12°. Độ phân giải tạm thời là một ngày. Dữ liệu từ tháng 5 năm 2007 đến tháng 12 năm 2013 được sử dụng cho mục đích đào tạo, trong khi dữ liệu còn lại từ tháng 1 năm 2014 đến tháng 12 năm 2014 được sử dụng để thử nghiệm. Cần lưu ý rằng chúng tôi sử dụng dữ liệu không có mây do GHRSST cung cấp. Dữ liệu được ghi lại bằng các thiết bị vi sóng có thể xuyên qua các đám mây. Do đó, dữ liệu có phạm vi bao phủ đầy đủ của khu vực nghiên cứu. Ngoài ra, thời gian chính xác của từng pixel trong sản phẩm GHRSST SST là như nhau.


Tiêu chuẩn hóa điểm Z được sử dụng để xử lý trước như:



trong đó x biểu thị SST mô hình GHRSST và HYCOM, z biểu thị dữ liệu chuẩn hóa, µ và σ lần lượt biểu thị giá trị trung bình và độ lệch chuẩn. Chúng tôi đã chuyển đổi dữ liệu thành bản đồ nhiệt hình vuông 256 × 256.


Cụ thể hơn, dữ liệu GHRSST và vectơ ngẫu nhiên 512 chiều được sử dụng trong bước đầu tiên của quá trình huấn luyện mạng trước đó. Kích thước của dữ liệu GHRSST đầu vào là N × H × W, trong đó N đại diện cho kích thước lô, H biểu thị chiều cao của dữ liệu đầu vào và W biểu thị chiều rộng của dữ liệu đầu vào. Đối với giai đoạn thứ hai của mạng trước, chúng tôi chỉ sử dụng dữ liệu GHRSST để đào tạo bộ mã hóa. Kích thước của đầu vào và đầu ra cho cả hai giai đoạn là N × H × W. Tương tự, ở bước thứ ba của quá trình huấn luyện mạng trước, dữ liệu HYCOM SST được đưa vào mô hình được huấn luyện trước. Ở đây, kích thước của cả đầu vào và đầu ra là N × H × W. Trong quá trình triển khai, chúng tôi đặt N thành 2430, trong khi H và W đều được đặt thành 256.


Hình 3. Minh họa ba mô hình được sử dụng trong nghiên cứu cắt bỏ. (a) Sơ đồ A: Dữ liệu SST mô hình số trước tiên được đưa vào ConvLSTM, sau đó đầu ra được đưa vào mạng trước đó được đào tạo tốt. Trình tự của mạng trước và ConvLSTM được thay thế. (b) Sơ đồ B: Mạng trước đó chưa được đào tạo bài bản. Cụ thể, việc đào tạo mô hình GAN trong mạng trước đó đã bị bỏ qua. (c) Phương pháp đề xuất.


Chúng tôi đã tiến hành thử nghiệm rộng rãi trên NVIDIA GeForce 2080Ti với 8 GPU. Mạng trước sử dụng cấu trúc và cấu hình mạng giống như được đề cập trong [53] để thu thập kiến thức vật lý từ dữ liệu được quan sát lịch sử. Sau đó, kiến thức vật lý thu được sẽ được chuyển sang dữ liệu mô hình số nhằm mục đích khôi phục và cải thiện các thành phần không chính xác trong mô hình số. Cấu hình cho mô hình ConvLSTM được sử dụng trong bài viết này giống với mô hình ConvLSTM trong nghiên cứu của Shi [20]. Bộ dữ liệu GHRSST SST được sử dụng làm chuẩn để so sánh và đánh giá trong bài viết này.


B. Ảnh hưởng của số ngày trong quá khứ tới việc dự đoán thuế SST


Như đã đề cập ở Phần III. C, t biểu thị số ngày trong quá khứ được sử dụng để dự đoán. Đây là thông số quan trọng có thể ảnh hưởng đến hiệu suất dự đoán SST. Trong bài viết này, chúng tôi cố gắng dự đoán SST trong một ngày, ba ngày và bảy ngày tiếp theo. Chúng tôi đã thực hiện các thí nghiệm rộng rãi để tìm ra


BẢNG KẾT QUẢ THÍ NGHIỆM CỦA SỐ NGÀY KHÁC NHAU TRONG TRƯỚC ĐỂ DỰ ĐOÁN SST MỘT NGÀY TIẾP THEO


BẢNG II KẾT QUẢ THÍ NGHIỆM CỦA SỐ NGÀY KHÁC NHAU TRONG QUÁ KHỨ CHO DỰ ĐOÁN SST 3 NGÀY TIẾP THEO


BẢNG III KẾT QUẢ THÍ NGHIỆM CỦA SỐ NGÀY KHÁC NHAU TRONG QUÁ KHỨ CHO DỰ ĐOÁN SST 7 NGÀY TIẾP THEO


số ngày vừa qua thích hợp cho dự đoán SST trong tương lai. Sai số bình phương trung bình gốc (RMSE) và hệ số xác định (R2) được áp dụng làm tiêu chí đánh giá. Giá trị RMSE thấp hơn và R2 cao hơn cho thấy kết quả chính xác hơn.


Bảng I liệt kê các kết quả dự đoán cho ngày tiếp theo bằng cách sử dụng riêng dữ liệu của một ngày, ba ngày và năm ngày trước đó. Có thể thấy rằng mô hình đề xuất hoạt động tốt nhất khi sử dụng dữ liệu của 5 ngày qua, trong đó kết quả RMSE và R2 lần lượt là 0,3618 và 0,9967. Chúng tốt hơn một chút so với các chương trình khác. So với hai phương án còn lại, giá trị RMSE và R2 cải thiện 0,0086, 0,001 và 0,0028, 0,0006. Do đó, dữ liệu của 5 ngày qua được sử dụng cho dự đoán SST một ngày tiếp theo.


Chúng tôi phân tích ảnh hưởng của t đối với dự đoán SST trong ba ngày tiếp theo trong Bảng II. Có thể thấy rằng dữ liệu lịch sử được sử dụng càng lâu thì hiệu suất dự đoán càng đạt được tốt hơn. Giá trị RMSE sử dụng dữ liệu của bảy ngày qua đạt được hiệu suất tốt nhất. Nó được cải thiện 0,0025 so với dữ liệu của 5 ngày qua. Trong khi đó, R2 hoạt động tốt nhất khi sử dụng dữ liệu của bảy ngày qua so với hai phương án còn lại. Do đó, dữ liệu của bảy ngày qua đã được sử dụng để dự đoán SST trong ba ngày tiếp theo.


Kết quả thử nghiệm dự đoán SST bảy ngày tiếp theo được minh họa trong Bảng III. Có thể thấy rằng kết quả dự đoán sử dụng dữ liệu của mười ngày qua đạt được hiệu suất tốt nhất. Do đó, chúng tôi khai thác dữ liệu của mười ngày qua để dự đoán SST trong bảy ngày tiếp theo.


BẢNG IV KẾT QUẢ THỰC NGHIỆM (TRUNG BÌNH±STD) CỦA CÁC NGHIÊN CỨU TRÁCH NHIỆM TRUNG BÌNH TRÊN 10 CHẠY NGẪU NHIÊN


C. Nghiên cứu cắt bỏ


Để xác minh tính hiệu quả của quá trình đào tạo mạng và GAN trước đó, chúng tôi tiến hành các thử nghiệm cắt bỏ. Như được minh họa trong Hình 3, hai biến thể được thiết kế để so sánh như sau:


• Sơ đồ A. Trình tự của mạng trước và ConvLSTM được thay thế. Dữ liệu SST mô hình số trước tiên được đưa vào ConvLSTM, sau đó đầu ra được đưa vào mạng trước đó được đào tạo tốt.


• Sơ đồ B. Mạng trước đây chưa được đào tạo bài bản. Cụ thể, đào tạo mô hình GAN (bước đầu tiên trong Hình 2) trong quá trình đào tạo mạng trước đó đã bị bỏ qua.


Kết quả thực nghiệm được trình bày ở Bảng IV. Có thể thấy rằng phương pháp của chúng tôi đạt được giá trị RMSE và R2 tốt nhất. Cụ thể, phương pháp được đề xuất vượt trội hơn Sơ đồ A, điều này chứng tỏ rằng trình tự chính xác của mạng trước và ConvLSTM có thể tăng hiệu suất dự đoán SST. Rõ ràng là mạng trước đó đã khôi phục một cách hiệu quả các thành phần không chính xác của dữ liệu mô hình số và dữ liệu được khôi phục hoạt động tốt hơn trong dự đoán SST. Hơn nữa, phương pháp được đề xuất có hiệu suất vượt trội so với Sơ đồ B, điều này chứng tỏ rằng mô hình hóa GAN là một bước thiết yếu. Mô hình GAN có thể tìm hiểu cách phân phối dữ liệu của SST được quan sát và giúp mạng trước đó nắm bắt thông tin vật lý tốt hơn từ SST được quan sát. Tóm lại, trong phương pháp được đề xuất, chúng tôi sử dụng phương pháp học đối nghịch để huấn luyện trước mạng, phương pháp này có thể chuyển kiến thức vật lý một cách hiệu quả từ dữ liệu SST được quan sát sang mạng trước đó. Nó có thể hướng dẫn hội tụ đào tạo nhanh và cải thiện hiệu suất dự đoán SST.


D. Kết quả thí nghiệm và thảo luận


Hình 4 so sánh SST một ngày tiếp theo được dự đoán với dữ liệu thực tế cơ bản được quan sát. Chúng ta có thể thấy rằng kết quả dự đoán của phương pháp của chúng tôi rất phù hợp với dữ liệu được quan sát. Tương tự, dữ liệu được quan sát và SST dự đoán tương ứng trong ba ngày và bảy ngày tiếp theo lần lượt được hiển thị trong Hình 5 và Hình 6. Các kết quả trực quan chỉ ra rằng phương pháp được đề xuất có thể tạo ra các kết quả chắc chắn và đáng tin cậy cho việc dự báo SST.


Biểu đồ phân tán về dự đoán SST cho ngày tiếp theo được minh họa trong Hình 7. Có thể thấy rằng các điểm dữ liệu là


Hình 4. Kết quả dự đoán SST một ngày tiếp theo so với dữ liệu thực tế cơ bản được quan sát.


Hình 5. Kết quả dự đoán SST trong ba ngày tiếp theo so với dữ liệu thực tế cơ bản được quan sát.


Hình 6. Kết quả dự đoán SST trong bảy ngày tiếp theo so với dữ liệu thực tế cơ bản được quan sát.


Hình 7. Biểu đồ phân tán so sánh dự đoán SST một ngày tiếp theo với dữ liệu được quan sát tương ứng


Hình 8. Biểu đồ phân tán so sánh dự đoán SST ba ngày tiếp theo với dữ liệu quan sát tương ứng


phân bố gần như đều gần đường màu đỏ. Hình 8 và Hình 9 lần lượt là biểu đồ phân tán kết quả dự đoán trong ba ngày tiếp theo và bảy ngày tiếp theo. Các biểu đồ phân tán chứng minh tính hiệu quả của phương pháp đề xuất để dự đoán SST.


Để kiểm chứng tính hiệu quả của phương pháp đề xuất, chúng tôi so sánh phương pháp đề xuất với bảy phương pháp có liên quan chặt chẽ: ConvLSTM [20], Hybrid-NN [14], Hybrid-TL [15], Gen-END [57], VAE- GAN [58], Tra-NM và Tra-ASL. Khu vực nghiên cứu là (3,99°N∼24,78°N, 98,4°E∼ 124,4°E) đối với các phương pháp này. Tất cả các phương pháp này đều sử dụng dữ liệu huấn luyện trong 5 ngày qua cho dự đoán 1 ngày tiếp theo, dữ liệu từ 7 ngày qua cho dự đoán 3 ngày tiếp theo và dữ liệu từ 10 ngày qua cho 7 ngày tiếp theo. sự dự đoán.


ConvLSTM được thảo luận trong Phần III. C và đây là mô hình không gian-thời gian hiệu quả để dự đoán SST. HybridNN sử dụng sự khác biệt giữa dữ liệu được quan sát và dữ liệu mô hình số để hướng dẫn việc đào tạo mạng lưới thần kinh sâu. Hybrid-TL kết hợp các ưu điểm của mô hình số và mạng lưới thần kinh thông qua học chuyển giao. GenEND là một bộ mã hóa tổng hợp có thể được sử dụng để dự đoán SST. VAE-GAN tích hợp bộ mã hóa tự động đa dạng và


Hình 9. Biểu đồ phân tán so sánh dự đoán SST trong bảy ngày tiếp theo với dữ liệu được quan sát tương ứng


GAN và nó có thể nắm bắt các đặc điểm ngữ nghĩa cấp cao để dự đoán SST. Dữ liệu HYCOM SST được sử dụng để huấn luyện mô hình ConvLSTM cho dự đoán 1 ngày, 3 ngày và 7 ngày tiếp theo (được gọi là Tra-NM). Tra-ASL là một phương pháp đồng hóa truyền thống và nó khai thác mối tương quan giữa nhiều loại dữ liệu (dữ liệu được quan sát và dữ liệu mô hình số).


Dữ liệu GHRSST lần đầu tiên được sử dụng để huấn luyện mô hình ConvLSTM, đóng vai trò là đường cơ sở. Đây là một phương pháp tiếp cận dựa trên dữ liệu được sử dụng rộng rãi để dự đoán SST. Hybrid-NN, HybridTL, Gen-END và VAE-GAN sử dụng dữ liệu GHRSST và HYCOM để đào tạo. Dữ liệu đồng hóa HYCOM [56]


BẢNG KẾT QUẢ DỰ ĐOÁN VSST CỦA CÁC PHƯƠNG PHÁP KHÁC NHAU


Hình 10. Kết quả trực quan cho dự đoán SST một ngày tiếp theo.


Hình 11. Kết quả trực quan cho dự đoán SST trong ba ngày tiếp theo. Cột đầu tiên hiển thị kết quả của SST dự đoán. Dữ liệu SST thực tế được quan sát được hiển thị trong cột thứ hai. Chúng tôi trình bày sự khác biệt của họ trong cột thứ ba.


được sử dụng ở đây, với độ phân giải không gian là 1/12°×1/12°. Phương pháp của chúng tôi cải thiện và sửa chữa các thành phần không chính xác trong dữ liệu mô hình số bằng cách đưa ra kiến thức vật lý từ dữ liệu quan sát lịch sử. Dữ liệu mô hình số đã hiệu chỉnh được gọi là dữ liệu tăng cường vật lý. Để so sánh với dữ liệu được tăng cường vật lý, dữ liệu đồng hóa HYCOM (Tra-ASL) và dữ liệu HYCOM (Tra-NM) được sử dụng tương tự để huấn luyện mô hình ConvLSTM.


Thời gian huấn luyện của ConvLSTM, Hybrid-NN, Tra-NM và Tra-ASL cho dự đoán 1 ngày, 3 ngày và 7 ngày tiếp theo lần lượt là 1,8, 4,4 và 8,2 giờ. Phương pháp Hybrid-TL đã huấn luyện mô hình ConvLSTM hai lần và thời gian huấn luyện lần lượt là 3,6, 8,8 và 16,4 giờ cho ba nhiệm vụ. VAE-GAN yêu cầu 181,6, 184,2 và 188,4 giờ để đào tạo, trong khi phương pháp Gen-END yêu cầu lượng thời gian gần như tương tự, với 196,8, 199,3 và 203,2 giờ tương ứng cho ba nhiệm vụ dự đoán SST.


Kết quả dự đoán SST 1 ngày, 3 ngày và 7 ngày tiếp theo được trình bày trong Bảng V. Rõ ràng là phương pháp TraNM mang lại kết quả không đạt yêu cầu so với các phương pháp khác. Điều này có thể là do các thành phần trong dữ liệu HYCOM không chính xác, ảnh hưởng xấu đến hiệu suất dự đoán SST. Phương pháp Hybrid-NN cũng hoạt động kém vì giá trị RMSE trung bình của nó thấp thứ hai trong số các mô hình. Mô hình Hybrid-TL hoạt động tốt hơn ConvLSTM cho dự đoán SST 1 ngày tiếp theo, nhưng không hoạt động tốt hơn cho hai nhiệm vụ còn lại. Phương pháp của chúng tôi đạt được giá trị RMSE tốt nhất và giá trị R2 cao nhất. So với mô hình ConvLSTM, giá trị RMSE trung bình trong phương pháp của chúng tôi được cải thiện một cách hiệu quả. Nó chứng tỏ rằng việc giới thiệu kiến thức vật lý


Hình 12. Kết quả trực quan cho dự đoán SST trong bảy ngày tiếp theo. Hàng đầu tiên hiển thị kết quả của SST dự đoán. Dữ liệu SST được quan sát thực tế được hiển thị ở hàng thứ hai. Chúng tôi trình bày sự khác biệt của họ ở hàng thứ ba.


từ dữ liệu được quan sát có thể khôi phục các thành phần không chính xác trong dữ liệu mô hình số, do đó cải thiện độ chính xác của dự đoán SST.


Hình 10 trình bày các kết quả trực quan cho dự đoán SST một ngày tiếp theo, dữ liệu SST được quan sát và sự khác biệt của chúng tương ứng. Có thể thấy, kết quả dự đoán rất giống với dữ liệu SST được quan sát trên toàn bộ khu vực Biển Đông. Hình 11 hiển thị kết quả trực quan cho dự đoán SST trong ba ngày tiếp theo. Người ta quan sát thấy rằng có một số giá trị khác biệt đáng kể ở Vịnh Bắc Bộ và ở các khu vực cận biên khác của Biển Đông. Hình 12 minh họa kết quả trực quan cho dự đoán SST trong bảy ngày tiếp theo. Người ta thấy rằng các giá trị chênh lệch chính chủ yếu tập trung vào Vịnh Bắc Bộ cho dự báo bảy ngày tiếp theo và chúng lớn hơn kết quả của hai nhiệm vụ còn lại.


E. Giới hạn và thảo luận


Từ Hình 7 đến Hình 9, có thể thấy rằng có một số điểm không chính xác trong SST tầm trung, được hiển thị trong Hình 13. Các pixel sáng biểu thị lỗi dự đoán SST lớn, trong khi các pixel tối biểu thị các dự đoán SST chính xác. Có thể thấy, các điểm này chủ yếu nằm ở phía tây bắc eo biển Đài Loan, nơi nhiệt độ mặt nước biển được dự báo thấp hơn số liệu quan trắc. Lỗi dự đoán chủ yếu do mô hình ConvLSTM và mặt nạ đất gây ra. Trong quá trình triển khai của chúng tôi, mặt nạ đất được áp dụng cho khu vực nghiên cứu. ConvLSTM khai thác các đặc điểm không gian và thời gian của toàn bộ khu vực nghiên cứu. Các đặc điểm của phần phía tây bắc eo biển Đài Loan bị ảnh hưởng bởi mặt nạ đất liền ở một mức độ nào đó và do đó dẫn đến sai sót trong dự đoán. Nếu có thể thu được dữ liệu huấn luyện có độ phân giải cao hơn, độ chính xác của các dự đoán ở khu vực này sẽ được cải thiện hơn nữa.


Hình 13. Trực quan hóa lỗi dự đoán SST.


Trong Hình 11 và 12, có thể thấy rằng không có sự gia tăng đáng kể về sai số so với ngày dẫn đầu. Điều này có thể là do phương pháp của chúng tôi sử dụng đủ lượng dữ liệu huấn luyện và mạng lưới thần kinh sâu có thể nắm bắt một cách hiệu quả các đặc điểm thời gian. Hơn nữa, sự tồn tại lâu dài của SST cũng là một yếu tố quan trọng.


Bài viết này có sẵn trên arxiv theo giấy phép CC 4.0.