英特爾研究院發(fā)布全新 AI 擴(kuò)散模型，可根據(jù)文本提示生成 360 度全景圖

2023/6/21 23:34:07 來源：IT之家作者：孤城責(zé)編：孤城

評論：

IT之家 6 月 21 日消息，英特爾研究院今日宣布與 Blockade Labs 合作發(fā)布 LDM3D（Latent Diffusion Model for 3D）模型，這一全新的擴(kuò)散模型使用生成式 AI 創(chuàng)建 3D 視覺內(nèi)容。

據(jù)介紹，LDM3D 是業(yè)界領(lǐng)先的利用擴(kuò)散過程（diffusion process）生成深度圖（depth map）的模型，進(jìn)而生成逼真的、沉浸式的 360 度全景圖。LDM3D 有望革新內(nèi)容創(chuàng)作、元宇宙應(yīng)用和數(shù)字體驗(yàn)，改變包括娛樂、游戲、建筑和設(shè)計(jì)在內(nèi)的許多行業(yè)。

英特爾表示，LDM3D 是在 LAION-400M 數(shù)據(jù)集包含一萬個樣本的子集上訓(xùn)練而成的。LAION-400M 是一個大型圖文數(shù)據(jù)集，包含超過 4 億個圖文對。對訓(xùn)練語料庫進(jìn)行標(biāo)注時，研究團(tuán)隊(duì)使用了之前由英特爾研究院開發(fā)的稠密深度估計(jì)模型 DPT-Large，為圖像中的每個像素提供了高度準(zhǔn)確的相對深度。LAION-400M 數(shù)據(jù)集是基于研究用途創(chuàng)建而成的，以便廣大研究人員和其它興趣社群能在更大規(guī)模上測試模型訓(xùn)練。

LDM3D 模型在一臺英特爾 AI 超級計(jì)算機(jī)上完成了訓(xùn)練，該超級計(jì)算機(jī)由英特爾至強(qiáng)處理器和英特爾Habana Gaudi AI 加速器驅(qū)動。最終的模型和流程整合了 RGB 圖像和深度圖，生成 360 度全景圖，實(shí)現(xiàn)了沉浸式體驗(yàn)。

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

英特爾研究院發(fā)布全新 AI 擴(kuò)散模型，可根據(jù)文本提示生成 360 度全景圖

相關(guān)文章

英特爾研究院發(fā)布全新 AI 擴(kuò)散模型，可根據(jù)文本提示生成 360 度全景圖