設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

草圖人像變 3D 模特,360° 無(wú)死角還原姿勢(shì),一張就行,多“草”都可|SIGGRAPH 2022

量子位 2022/8/22 13:37:58 責(zé)編:長(zhǎng)河

一張隨便勾畫的草圖,居然也可以分分鐘自動(dòng)變成逼真的 3D 模型?!

360° 無(wú)死角不說(shuō),轉(zhuǎn)換期間真的不需要任何其它角度姿勢(shì)的輸入。這就是獲得了 SIGGRAPH 2022 榮譽(yù)獎(jiǎng)的一個(gè)最新 3D 姿態(tài)估計(jì)模型:Sketch2Pose。

除了草圖,像這樣的小猴子,四肢嚴(yán)重不按比例生長(zhǎng),Sketch2Pose 也可以辦到:

這是如何做到的?

只要 4 步,草圖人變 3D 人

將草圖上的人物 / 形象變成 3D 模型,此前的研究中都還未專門涉及。該任務(wù)最大的挑戰(zhàn)就是比例失真問題,因?yàn)楫嬌系臇|西可能頭大身子小、胳膊長(zhǎng)腿短……

為此,Sketch2Pose 通過對(duì)三個(gè)關(guān)鍵元素進(jìn)行預(yù)測(cè)來(lái)消除繪制姿勢(shì)時(shí)的可能出現(xiàn)的“歧義”。這三個(gè)元素分別是:

  • 2D 骨骼切線(2D bone tangents)

  • 自接觸區(qū)域(self-contacts)

  • 骨骼縮短比例(bone foreshortening)

其中,2D 骨骼切線(下圖藍(lán)色部分)是預(yù)測(cè) 3D 骨骼方向最有力的指標(biāo)(關(guān)節(jié)位置不行)。自接觸區(qū)域(如下圖綠色部分,手接觸腰的位置)對(duì)于理解 3D 姿勢(shì)至關(guān)重要,也是消除未知身體部位歧義的線索。骨骼縮短轉(zhuǎn)換系統(tǒng)則利用統(tǒng)計(jì)分析來(lái)糾正原圖中的比例問題。

根據(jù)這三者預(yù)測(cè),再使用最先進(jìn)的優(yōu)化框架(optimization framework),并用專門設(shè)計(jì)的一種新的損失(loss)來(lái)平衡姿勢(shì)自然度,以及與輸入草圖的相似性,AI 就能最終推斷出符合畫者意向的 3D 姿勢(shì)。

具體步驟如下:

  • 輸入一張草圖,首先預(yù)測(cè)出 2D 關(guān)節(jié)位置或骨架,用于 3D 人體模型的粗略對(duì)齊。

  • 然后預(yù)測(cè)屏幕空間(screen-space)接觸區(qū)域,將其映射到粗略對(duì)齊的 3D 模型上,得到一組接觸頂點(diǎn)(紅色部分)。

  • 接著,利用縮短轉(zhuǎn)換階段描述的草圖人物比例問題,進(jìn)行修補(bǔ)。

  • 最后,在優(yōu)化框架中利用 2D 骨架的骨骼切線、粗略對(duì)齊的 3D 姿勢(shì)以及比例修補(bǔ),產(chǎn)生最終結(jié)果。

有遮擋缺失也 OK

最終的 Sketch2Pose 可以支持多種草圖風(fēng)格的轉(zhuǎn)換,比如下圖中的簡(jiǎn)筆畫或者水墨畫,像下下圖最后一張那樣簡(jiǎn)略的也可以。

同時(shí),對(duì)缺失、遮擋部位也能穩(wěn)健處理。比如上圖第一行中的人手(不過我們發(fā)現(xiàn)左邊的似乎推測(cè)有錯(cuò),手應(yīng)該是放在兩腿之間;右邊的抱頭基本沒啥問題,但手掌應(yīng)該向后彎曲)。

再將 Sketch2Pose 和 SOTA 方法進(jìn)行比較,結(jié)果還是令人非常滿意的??梢钥吹?,Sketch2Pose(第三列)對(duì)姿勢(shì)還原的更到位,缺失部分的預(yù)測(cè)也更符合人體構(gòu)造。

而開頭那只小猴子,Müller et al. 2021 等方法的轉(zhuǎn)換效果就是下面這樣:

對(duì)于猴子“扭曲”的下肢部分,這些方法都出現(xiàn)了理解偏差 ——Sketch2Pose 完勝。

作者介紹

Sketch2Pose 一共有兩位作者,都來(lái)自加拿大蒙特利爾大學(xué)。

一作名叫 Kirill Brodt (Кирилл Бродт),出生于 1991 年,本碩畢業(yè)于新西伯利亞州立大學(xué)(數(shù)學(xué)學(xué)位),后在 Yandex 數(shù)據(jù)分析和計(jì)算機(jī)科學(xué)中心學(xué)院學(xué)習(xí)機(jī)器學(xué)習(xí),現(xiàn)為蒙特利爾大學(xué)的一位博士生。他的主要研究方向?yàn)楦輬D有關(guān)的計(jì)算機(jī)視覺轉(zhuǎn)換。

另一位作者名叫 Mikhail Bessmeltsev,是一作的導(dǎo)師,蒙特利爾大學(xué)計(jì)算機(jī)科學(xué)與運(yùn)籌學(xué)系的助理教授。

感興趣的同學(xué)可以戳論文原文,或者去 Huggingface 上試試效果。

論文原文:

https://dl.acm.org/doi/10.1145/3528223.3530106

項(xiàng)目主頁(yè):

https://www-labs.iro.umontreal.ca/~bmpix/sketch2pose/

Huggingface demo:

https://huggingface.co/spaces/SIGGRAPH2022/sketch2pose

Github 代碼:

https://github.com/kbrodt/sketch2pose

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:模型計(jì)算機(jī)視覺

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知