谷歌 DeepMind 實(shí)驗(yàn)室推出的天氣預(yù)測(cè)大模型,已在 Science 雜志發(fā)表。
只需要不到 1 分鐘,它就能直接預(yù)測(cè)出未來 10 天的天氣。
準(zhǔn)確度上,它在 90% 的指標(biāo)上超越了最先進(jìn)的人類系統(tǒng),在 AI 氣象模型中屬首次!
DeepMind 的這個(gè)氣象模型名叫 GraphCast,目前已經(jīng)開源。
它的分辨率為 0.25 度經(jīng)度 / 緯度(在赤道處約為 28×28 公里),而目前的最高分辨率為 1 度。
這樣的分辨率相當(dāng)于將地球表面分割成了超過 100 萬個(gè)網(wǎng)格,而每個(gè)網(wǎng)格又可以產(chǎn)生數(shù)百條預(yù)測(cè)數(shù)據(jù),總計(jì)數(shù)量達(dá)到了上億規(guī)模。
不同于傳統(tǒng)的預(yù)測(cè)方式,GraphCast 預(yù)測(cè)主要依靠數(shù)據(jù)中的規(guī)律進(jìn)行預(yù)報(bào),而不使用人類建立的物理方程。
相比于人類最準(zhǔn)確的 HRES 預(yù)報(bào),GraphCast 在 1380 個(gè)測(cè)試指標(biāo)中,90% 的預(yù)測(cè)結(jié)果都更為準(zhǔn)確。
如果把預(yù)測(cè)范圍限制在對(duì)流層,GraphCast 擊敗 HRES 的指標(biāo)比例更是高達(dá) 99.7%。
YC 上有網(wǎng)友表示,用“impressive”已經(jīng)不足以形容這項(xiàng)成果了。
那么,GraphCast 的預(yù)測(cè)表現(xiàn)具體是怎樣的呢?
90% 指標(biāo)超越人類最好方法
在劃分出的 100 萬多個(gè)網(wǎng)格上,GraphCast 劃分出的每個(gè)網(wǎng)格都能夠產(chǎn)生 227 條預(yù)測(cè)數(shù)據(jù)。
其中包括了 37 個(gè)不同高度上,每個(gè)高度的 6 個(gè)大氣變量(包括比濕度、風(fēng)速和風(fēng)向以及溫度等)。
在地球表面,GraphCast 還可以預(yù)測(cè)包括溫度、風(fēng)速和風(fēng)向以及平均海平面壓力等在內(nèi)的 5 個(gè)變量。
完整的變量種類和具體高度(以氣壓表示,單位:hPa)如下表所示:
為了比較 GraphCast 和 HRES 的表現(xiàn),研究人員從歐洲中期天氣預(yù)報(bào)中心(ECMWF)的 ERA5 再分析數(shù)據(jù)中選取了 2018 年(GraphCast 訓(xùn)練數(shù)據(jù)截止 2017 年)的歷史數(shù)據(jù)。
研究者分別讓 HRES 和 GraphCast 站在當(dāng)時(shí)的情況下進(jìn)行“預(yù)測(cè)”,然后比較它們的“預(yù)測(cè)”和 ERA5 進(jìn)行比較。
在 500hPa 高度場(chǎng)上,GraphCast 的 RMSE(均方根誤差,數(shù)值越低表現(xiàn)越好)和 ACC(異常相關(guān)系數(shù))指標(biāo)都顯著優(yōu)于 HRES。
而在研究人員選取的 50-1000hPa 的 1380 個(gè)數(shù)據(jù)點(diǎn)中,GraphCast 有 90.3% 優(yōu)于 HRES,89.9% 優(yōu)勢(shì)顯著(下圖 d 組中,藍(lán)色表示 GraphCast 優(yōu)于 HRES,越深優(yōu)勢(shì)越明顯)。
除了這些數(shù)據(jù),GraphCast 在極端天氣的預(yù)測(cè)上也有明顯優(yōu)勢(shì)。
對(duì)于熱帶氣旋路徑,GraphCast 中位誤差低于 HRES,特別是在前 4.75 天開始,優(yōu)勢(shì)開始變得明顯(下圖 a、b)。
在根據(jù)大氣河流(Atmospheic River)進(jìn)行水汽通量預(yù)測(cè)時(shí),GraphCast 的 RMSE 值也明顯低于 HRES(下圖 c)。
預(yù)測(cè)熱浪時(shí),GraphCast 在提前 12 小時(shí)、5 天、10 天時(shí),準(zhǔn)確度也都比 HRES 高(下圖 d)。
今年 9 月,GraphCast 成功在登陸前 9 天預(yù)測(cè)了北大西洋的颶風(fēng) Lee,而使用傳統(tǒng)方法最多提前 6 天預(yù)報(bào)。
GraphCast 不僅準(zhǔn)確度高,預(yù)測(cè)速度也非???。
在一臺(tái) Google TPU v4 機(jī)器上使用 GraphCast 進(jìn)行 10 天預(yù)測(cè),只需不到一分鐘就能完成。
相比之下,使用 HRES 等傳統(tǒng)方法,即使在超級(jí)計(jì)算機(jī)上也要花費(fèi)數(shù)個(gè)小時(shí)。
那么,GraphCast 是如何實(shí)現(xiàn)高效準(zhǔn)確的氣象預(yù)測(cè)的呢?
不使用物理方程,預(yù)測(cè)全靠數(shù)據(jù)分析
工作流程上,輸入從 6 小時(shí)前開始到當(dāng)前的氣象數(shù)據(jù),GraphCast 就可以預(yù)測(cè)未來 6 小時(shí)的天氣。
而預(yù)測(cè)出的數(shù)據(jù)可以作為新的“當(dāng)前”態(tài),繼續(xù)往后迭代預(yù)測(cè),最長可以預(yù)測(cè)到 10 天后的天氣狀況。
原理層面,GraphCast 使用機(jī)器學(xué)習(xí)方式和圖神經(jīng)網(wǎng)絡(luò)(GNN)架構(gòu),其中包括編碼器和解碼器各一層,以及中間層 16 層,參數(shù)量為 3670 萬。
它僅通過學(xué)習(xí)已有氣象數(shù)據(jù)實(shí)現(xiàn)預(yù)測(cè),不依賴人類建立的物理方程。
GraphCast 將 0.25 度網(wǎng)格的氣象數(shù)據(jù)進(jìn)行編碼映射到神經(jīng)網(wǎng)絡(luò),經(jīng)過傳遞計(jì)算后的結(jié)果再由解碼器還原為氣象數(shù)據(jù)。
訓(xùn)練時(shí),GraphCast 使用的是來自 ERA5 數(shù)據(jù)集中的 1979-2017 這近四十年天氣的再分析數(shù)據(jù),包括了衛(wèi)星圖像、雷達(dá)和氣象站測(cè)結(jié)果。
ERA5 是基于 4DVar 方法和同化觀測(cè)生成的全球最優(yōu)重構(gòu)資料,涵蓋時(shí)間從上世紀(jì) 40 年代至今,空間則覆蓋全球。
而如果使用更近期的數(shù)據(jù),GraphCast 的預(yù)測(cè)結(jié)果準(zhǔn)確度還能繼續(xù)提高。
下一步,DeepMind 計(jì)劃構(gòu)建集合預(yù)報(bào)模型,以適應(yīng)實(shí)際情況中天氣的不確定性,進(jìn)一步增強(qiáng)預(yù)報(bào)準(zhǔn)確性。
論文地址:
https://www.science.org/doi/10.1126/science.adi2336
參考鏈接:
[1]https://deepmind.google/discover/blog/graphcast-ai-model-for-faster-and-more-accurate-global-weather-forecasting/
[2]https://www.ft.com/content/ca5d655f-d684-4dec-8daa-1c58b0674be1
本文來自微信公眾號(hào):量子位 (ID:QbitAI),作者:克雷西
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。