IT之家 11 月 5 日消息,騰訊混元今日開源了 Hunyuan3D-1.0 大模型,官方稱這是首個同時(shí)支持文生和圖生的 3D 開源大模型。
模型采用兩階段生成方法,官方表示在保證質(zhì)量和可控的基礎(chǔ)上,10 秒即可生成 3D 資產(chǎn):
第一階段,團(tuán)隊(duì)采用了一種多視角擴(kuò)散模型,輕量版模型能夠在大約 4 秒內(nèi)生成多視角圖像。這些多視角圖像從不同的視角捕捉了 3D 資產(chǎn)的豐富的紋理和幾何先驗(yàn),將任務(wù)從單視角重建松弛到多視角重建
第二階段,團(tuán)隊(duì)引入了一種前饋重建模型,利用上一階段生成的多視角圖像。該模型能夠在大約 3 秒內(nèi)快速而準(zhǔn)確地重建 3D 資產(chǎn)。重建模型學(xué)習(xí)處理多視角擴(kuò)散引入的噪聲和不一致性,并利用條件圖像中的可用信息高效恢復(fù) 3D 結(jié)構(gòu)
最終該模型可以實(shí)現(xiàn)輸入任意單視角實(shí)現(xiàn)三維生成
官方表示該模型的泛化能力和可控性強(qiáng),可重建各類尺度物體,大到建筑,小到工具花草。
IT之家附相關(guān)鏈接如下:
Huggingface:https://huggingface.co/tencent/Hunyuan3D-1
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。