[討論] neuralGCM 基於神經網路的通用循環模型

aabaabaabaab 發表於 2024/1/4 下午8:52:58

看板TY_Research標題[討論] neuralGCM 基於神經網路的通用循環模型作者

(衝擊樂透)時間Jan 4 20:52:58 2024推噓推:0 噓:0 →:0

本篇論文一樣由google的研究發表，包含以下幾點特點
1.
相較於graphcast直接對數據擬合，此模型同時採用物理核心與神經網路，預測過程受
ODE等物理條件限制，並採用類似數值模式的時間積分型式。
https://imgur.com/fiau2Af.jpg

https://imgur.com/Jw0qWRE.jpg

2.
模型輸入包含外力(地形、時間、經緯度、太陽輻射、海冰密集度、海表溫度、隨機噪
聲及ERA5，由於使用sigma座標，採用神經網路濾除重力波。
https://imgur.com/pjie69J.jpg

3.
訓練預報時長由6小時延長到3-5天，並用於氣候預報，對於長期預報特徵的模糊性有
較好的改善(大氣河流)
https://imgur.com/dcZI2FC.jpg

https://imgur.com/cj1zfFF.jpg

4.誤差表現
https://imgur.com/8jwfzNF.jpg

總結:
NeuralGCM最大的不同是以動力框架提供的物理關系為核心，進而從源頭上解決了AI模
型的最大問題：物理一致性。

可以像數值模式一樣根據空間分辨率設置相應的時間積分步長。即使是神經網絡部分
，也可以說擬合的是物理過程而不是統計關係。

保證輸出的大氣環流具備物理可解釋性，與觀測到的天氣、氣候現象始終保持一致。
在物理方程的約束下，僅用3~5天預報時間的數據即可訓練出在幾十年模擬上保持穩定
的模型。

由於其監督學習的本質沒有改變，其中仍然存在一些問題：
仍然以ERA5為基準訓練模型。類似數值模式的動力框架置入NeuralGCM後，要超越數值
模式的預報，某種程度上其成功的核心仍然是替代參數化方案的神經網絡部分。同時
，ERA5也依賴數值模式，則NeuralGCM的學習目標其實限於ERA5對觀測的同化。換句話
說，NeuralGCM的本質仍然是利用神經網絡擬合觀測，且上限仍受同化效果的約束。

仍存在大量“魔法數字”的設置。如不同變量損失的平衡，參數化方案輸出的放縮，
不同損失項的權重等。這些參數的影響很難評估。當然，對於次網格尺度過程而言，
這些經驗性超參數即使在數值模式中也不可避免。

進一步，我們可以從不同角度理解NeuralGCM的設計：

從AI角度，NeuralGCM將代表物理過程的基本方程組嵌入神經網絡，訓練出受物理約束
的AI預報模型。

從數值模式角度，則是用神經網絡代替數值模式中的參數化方案。

甚至，我們可以將NeuralGCM中的神經網絡視作“訂正模型”，只是將訂正直接嵌入
數值模式的時間積分過程中，針對每一步的結果訂正，而不是訂正最終的輸出。

參考資料:
https://blog.csdn.net/qq_33431368/article/details/135143616
https://arxiv.org/abs/2311.07222

https://imgur.com/0BNN9nU.jpg

※ PTT 留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.115.200.156 (臺灣)

※ PTT 網址

其他人也閱讀了

PTT 熱門相關