新智元報(bào)道
編輯:Mindy
【新智元導(dǎo)讀】天氣本質(zhì)上是隨機(jī)的,為了量化不確定性,傳統(tǒng)方法通常需要高昂的成本來物理模擬大量預(yù)測。谷歌最新研究登 Science 子刊,用生成式 AI 模型高效生成規(guī)?;奶鞖忸A(yù)報(bào)集合,為天氣和氣候科學(xué)開辟了新的機(jī)會。
1972 年 12 月,在美國華盛頓特區(qū)舉行的美國科學(xué)促進(jìn)會年會上,麻省理工學(xué)院氣象學(xué)教授埃德?洛倫茲發(fā)表了題為「巴西一只蝴蝶的扇動是否會在得克薩斯引發(fā)龍卷風(fēng)?」的演講,這貢獻(xiàn)了「蝴蝶效應(yīng)」這一術(shù)語。
在他 1963 年的一篇論文中,他發(fā)現(xiàn)在時(shí)間積分與數(shù)值天氣預(yù)測模型里,即使微小的起始條件誤差,也會在數(shù)值模型中迅速擴(kuò)大,導(dǎo)致預(yù)測結(jié)果的不確定性迅速增加,這被稱為混沌現(xiàn)象。
因此,天氣預(yù)報(bào)的可靠性受到了限制,尤其是在極端天氣事件的預(yù)測方面,比如颶風(fēng)、熱浪或洪水。
出于上述原因,目前的天氣預(yù)報(bào)其實(shí)都是概率預(yù)報(bào)。
這些預(yù)報(bào)使用了一種叫做集合預(yù)報(bào)的方法,通過在初始條件中引入一些隨機(jī)性,然后運(yùn)行多個(gè)不同的模型來生成多種可能的結(jié)果。
通過對集合中的所有預(yù)報(bào)進(jìn)行平均處理來減少誤差增長,并且集合中的預(yù)報(bào)的變化量量化了天氣條件的不確定性。
盡管有效,生成這些概率預(yù)報(bào)的計(jì)算成本很高。它們需要在大規(guī)模超級計(jì)算機(jī)上多次運(yùn)行高度復(fù)雜的數(shù)值天氣模型。
尤其是極端天氣,通常需要更大的集合來評估。例如,為了預(yù)測發(fā)生概率為 1% 的事件的可能性,需要一個(gè)包含 1 萬個(gè)成員的集合,且相對誤差小于 10%。
但準(zhǔn)確和及時(shí)的天氣預(yù)報(bào),是人們?nèi)粘I钏匦璧?。從?zhǔn)備一天的活動需要帶什么出門,到面對危險(xiǎn)天氣的時(shí)候要提前做什么準(zhǔn)備。
谷歌最新研究給天氣預(yù)報(bào)帶來了一個(gè)新的進(jìn)展:Scalable Ensemble Envelope Diffusion Sampler(SEEDS)是一個(gè)生成式的 AI 模型,可以高效地生成規(guī)模化的天氣預(yù)報(bào)集合,成本僅為傳統(tǒng)基于物理的預(yù)測模型的一小部分。
這項(xiàng)技術(shù)為天氣和氣候科學(xué)開辟了新的機(jī)遇,它同時(shí)也代表了概率擴(kuò)散模型在天氣和氣候預(yù)測中的首次應(yīng)用。
生成式 AI 準(zhǔn)確生成天氣預(yù)報(bào)集合
在上述論文中,谷歌提出了可擴(kuò)展的集合包絡(luò)擴(kuò)散采樣器(SEEDS),這是一種用于天氣預(yù)報(bào)集合生成的生成式人工智能技術(shù)。
SEEDS 基于去噪擴(kuò)散概率模型,這是一種由 Google Research 部分開創(chuàng)的最先進(jìn)的生成式人工智能方法。
生成式人工智能以生成非常詳細(xì)的圖像和視頻而聞名,這一特性對于生成與真實(shí)天氣模式一致的集合預(yù)報(bào)特別有用。
SEEDS 可以根據(jù)操作性數(shù)值天氣預(yù)報(bào)系統(tǒng)中的一兩個(gè)預(yù)報(bào)來生成大量的集合。
生成的集合在技能指標(biāo)上與基于物理的集合相匹配或超過,比如均方根誤差(RMSE)和連續(xù)排名概率評分(CRPS)等;不僅如此,還為預(yù)報(bào)分布的尾部(如 ±2σ 和 ±3σ 天氣事件)分配了更準(zhǔn)確的可能性。
最重要的是,與需要數(shù)小時(shí)計(jì)算時(shí)間的超級計(jì)算機(jī)相比,該模型的計(jì)算成本幾乎可以忽略不計(jì)。在 Google Cloud TPUv3-32 實(shí)例上,其吞吐量為每 3 分鐘 256 個(gè)集合成員(分辨率為 2°),并且可以通過部署更多加速器輕松擴(kuò)展到更高的吞吐量。
下圖對比了 SEEDS 與操作性美國天氣預(yù)報(bào)系統(tǒng)(全球集合預(yù)報(bào)系統(tǒng),GEFS)在 2022 年歐洲熱浪期間某個(gè)特定日期的預(yù)報(bào)結(jié)果。
其中 A 是真實(shí)觀測的代理,(Ca-Ch)是 SEEDS 模擬出來的 8 個(gè)樣本,而(Da-Dh)是來自 GEFS 的預(yù)報(bào)。雖然肉眼可能很難直接看出明顯的區(qū)別,但 SEEDS 更能捕捉到交叉場和空間相關(guān)性,這會與真實(shí)的天氣更加貼近。
這是因?yàn)?SEEDS 直接模擬了大氣狀態(tài)的聯(lián)合分布,它實(shí)際上捕捉了大氣狀態(tài)的空間協(xié)方差和中對流層高度和平均海平面氣壓之間的相關(guān)性,這兩者常被氣象學(xué)家用于預(yù)報(bào)評估和驗(yàn)證。(一些專業(yè)的解釋:平均海平面氣壓的梯度驅(qū)動著地表的風(fēng),而中對流層高度的梯度則產(chǎn)生了移動大尺度天氣模式的高層風(fēng)。)
更準(zhǔn)確地覆蓋極端事件
SEEDS 集合能夠從一兩個(gè)種子預(yù)報(bào)中外推,展示了可能的天氣狀態(tài)的范圍,對事件的統(tǒng)計(jì)覆蓋更好。
也就是說,高度可擴(kuò)展的生成方法能夠創(chuàng)建非常大的集合,可以通過任何不同狀態(tài)閾值設(shè)置的天氣樣本,來描述非常罕見的事件。
比如說下圖展示了 2022 年 7 月 14 日當(dāng)?shù)貢r(shí)間 1:00 在里斯本附近發(fā)生的極端高溫事件的 2 米溫度和總柱水汽的聯(lián)合分布。
對于每個(gè)圖,谷歌研究團(tuán)隊(duì)使用 SEEDS 根據(jù) 2 個(gè)物理模型的種子預(yù)報(bào),生成了 16384 個(gè)成員的集合,顯示為綠色點(diǎn)。
正確天氣事件來自 ERA5,用星號表示。
用方塊表示用于傳統(tǒng)方法生成集合的預(yù)報(bào),用三角形表示剩余的傳統(tǒng)方法集合成員。
可以看到藍(lán)色方塊和黃色三角形根本不接近星號,也就是說,傳統(tǒng)方式根本不可能提前觀察到這種極端情況,其 31 個(gè)成員中沒有一個(gè)預(yù)測到與觀察到的那樣溫暖的近地表溫度。
實(shí)際上,從高斯核密度估計(jì)中計(jì)算的事件概率低于 1%,這意味著少于 100 個(gè)成員的集合不太可能包含與此事件一樣極端的預(yù)報(bào)。
而 SEEDS 生成的綠色點(diǎn),卻可以提供更好的統(tǒng)計(jì)覆蓋,基于它精準(zhǔn)的生成能力和高效的生成速度。
天氣預(yù)報(bào)新模式?
上述實(shí)驗(yàn)展示了一種混合預(yù)報(bào)系統(tǒng),SEEDS 利用基于物理模型計(jì)算出的少數(shù)幾條天氣軌跡來更有效地生成更多預(yù)報(bào)的擴(kuò)散模型。
這種方法提供了一種替代當(dāng)前操作性天氣預(yù)報(bào)范式的方法。
同時(shí),通過統(tǒng)計(jì)模擬器節(jié)省的計(jì)算資源可以用于提高基于物理模型的分辨率或更頻繁地發(fā)布預(yù)報(bào)。
這或許是天氣預(yù)報(bào)的未來新模式,也可能 SEEDS 僅代表了未來幾年 AI 將加速操作性數(shù)值天氣預(yù)報(bào)進(jìn)展的眾多方式之一。
但谷歌研究展現(xiàn)出來的是生成式人工智能在天氣預(yù)報(bào)模擬和后處理中的實(shí)用性,對于準(zhǔn)確量化未來氣候的不確定性和氣候風(fēng)險(xiǎn)評估,提供了一個(gè)新的方向。
參考資料:
https://blog.research.google/2024/03/generative-ai-to-quantify-uncertainty.html
本文來自微信公眾號:新智元 (ID:AI_era)
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。