AI 圖像編輯技術(shù) DragGAN 開源，拖動鼠標即可將獅子 P 轉(zhuǎn)頭

2023/6/28 12:02:55 來源：IT之家作者：漾仔（實習(xí)） 責編：汪淼

評論：

IT之家 6 月 28 日消息，近日來自馬克斯?普朗克計算機科學(xué)研究所、MIT CSAIL 和谷歌的研究者們研究了一種控制 GAN 的新方法 DragGAN，只要點擊拖拽，用戶就可以“改變汽車的尺寸或者將人物的笑容變成皺眉”。目前該項目已經(jīng)在 GitHub 中開源，有興趣的IT之家小伙伴們可以前往了解。

▲ 視頻源 DragDAN，微博視頻轉(zhuǎn)錄由科普君 XueShu

DragGAN 是一個直觀的圖像編輯工具，用戶只需要控制圖像中的像素點和方向，就可以快速調(diào)整照片主體的位置、姿態(tài)、表情、大小和角度等。這種工具的潛力主要表現(xiàn)在，從文本生成圖像的人工智能并不總是能輸出你想要的結(jié)果，所以用戶可以在生成圖像之后再進行重新編輯，而不必重新生成一個新的圖像。

AI 圖像編輯技術(shù) DragGAN 開源，拖動鼠標即可將獅子 P 轉(zhuǎn)頭

▲ 圖源 DragGAN

AI 圖像編輯技術(shù) DragGAN 開源，拖動鼠標即可將獅子 P 轉(zhuǎn)頭

▲ 圖源 DragGAN

研究論文中展示了一些演示案例，包括增加山峰的高度，改變模特的姿勢和衣服的長度和形狀，張開或閉合獅子的嘴巴，以及將一個人的表情從平淡變成微笑。

研究人員表示，他們的方法在基于 GAN 的操作中優(yōu)于 SOTA，并為圖像編輯開辟了新方向。在接下來的幾個月里，他們希望將基于點的編輯擴展到 3D 生成模型。

雖然公布了源代碼，但源代碼有嚴格的限制：

本作品及其任何衍生作品只能用于或打算用于非商業(yè)用途。盡管有上述規(guī)定，英偉達公司及其附屬機構(gòu)可以在商業(yè)上使用該作品和任何衍生作品。在此，"非商業(yè)" 是指僅用于研究或評估目的。

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

AI 圖像編輯技術(shù) DragGAN 開源，拖動鼠標即可將獅子 P 轉(zhuǎn)頭

相關(guān)文章

AI 圖像編輯技術(shù) DragGAN 開源，拖動鼠標即可將獅子 P 轉(zhuǎn)頭