IT之家 6 月 28 日消息,近日來自馬克斯?普朗克計(jì)算機(jī)科學(xué)研究所、MIT CSAIL 和谷歌的研究者們研究了一種控制 GAN 的新方法 DragGAN,只要點(diǎn)擊拖拽,用戶就可以“改變汽車的尺寸或者將人物的笑容變成皺眉”。目前該項(xiàng)目已經(jīng)在 GitHub 中開源,有興趣的IT之家小伙伴們可以前往了解。
DragGAN 是一個(gè)直觀的圖像編輯工具,用戶只需要控制圖像中的像素點(diǎn)和方向,就可以快速調(diào)整照片主體的位置、姿態(tài)、表情、大小和角度等。這種工具的潛力主要表現(xiàn)在,從文本生成圖像的人工智能并不總是能輸出你想要的結(jié)果,所以用戶可以在生成圖像之后再進(jìn)行重新編輯,而不必重新生成一個(gè)新的圖像。
研究論文中展示了一些演示案例,包括增加山峰的高度,改變模特的姿勢(shì)和衣服的長度和形狀,張開或閉合獅子的嘴巴,以及將一個(gè)人的表情從平淡變成微笑。
研究人員表示,他們的方法在基于 GAN 的操作中優(yōu)于 SOTA,并為圖像編輯開辟了新方向。在接下來的幾個(gè)月里,他們希望將基于點(diǎn)的編輯擴(kuò)展到 3D 生成模型。
雖然公布了源代碼,但源代碼有嚴(yán)格的限制:
本作品及其任何衍生作品只能用于或打算用于非商業(yè)用途。盡管有上述規(guī)定,英偉達(dá)公司及其附屬機(jī)構(gòu)可以在商業(yè)上使用該作品和任何衍生作品。在此,"非商業(yè)" 是指僅用于研究或評(píng)估目的。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。