AI 逆向繪畫：一鍵重繪梵高《羅納河上的星夜》，來自華盛頓大學(xué)

量子位 2024/10/11 15:03:32 責(zé)編：汪淼

評論：

梵高名作也能被 AI 逆向破解了？！

直接喂一張原圖，AI 就能化身梵高?本高一點點重繪整張圖畫（原圖可任意）。

梵高《羅納河上的星夜》

▲ 梵高《羅納河上的星夜》

仔細對照兩邊，AI 幾乎實現(xiàn)了 1:1 復(fù)刻，還為我們這些繪畫小白清晰展示了整幅圖的構(gòu)建過程。

AI 逆向繪畫：一鍵重繪梵高《羅納河上的星夜》，來自華盛頓大學(xué)

這項魔法來自華盛頓大學(xué)，項目名為 Inverse Painting，相關(guān)論文已入選 SIGGRAPH Asia 2024，其中兩位作者還是東北大學(xué)（Bowei Chen ）和上?？萍即髮W(xué)（Yifan Wang）的校友。

AI 逆向繪畫：一鍵重繪梵高《羅納河上的星夜》，來自華盛頓大學(xué)

項目一經(jīng)發(fā)布后即在 Reddit 引起熱議，最高贊更是為藝術(shù)家群體操起了心（doge）。

藝術(shù)家可能會對此感到憤怒

AI 逆向繪畫：一鍵重繪梵高《羅納河上的星夜》，來自華盛頓大學(xué)

不過也有人表示，這對于人們學(xué)習(xí)如何繪畫非常有幫助。

AI 逆向繪畫：一鍵重繪梵高《羅納河上的星夜》，來自華盛頓大學(xué)

甚至可以用來“破解”一些大師遺作，提取隱藏或失傳的技術(shù)。

AI 逆向繪畫：一鍵重繪梵高《羅納河上的星夜》，來自華盛頓大學(xué)

基于擴散模型

從原圖 → 繪畫過程延時視頻，Inverse Painting 采用基于擴散的逆繪畫方法。

通過學(xué)習(xí)真實藝術(shù)家的繪畫視頻，結(jié)合文本和區(qū)域理解來定義繪畫“指令”，并使用基于擴散的渲染器更新畫布，從而生成類似于人類藝術(shù)家繪畫過程的視頻。

AI 逆向繪畫：一鍵重繪梵高《羅納河上的星夜》，來自華盛頓大學(xué)

進一步拆解，這一過程主要包括以下步驟：

學(xué)習(xí)藝術(shù)家的繪畫過程。收集了 294 個丙烯酸風(fēng)景畫繪畫過程視頻（平均時長 9 分鐘），并進行視頻幀分割、裁剪和篩選等預(yù)處理操作，讓模型學(xué)習(xí)繪畫過程；
定義繪畫指令。基于對畫作不同元素（比如天空、樹木、人物等）以及元素相互關(guān)系的理解，模型會生成一組“繪畫指令”，告訴模型應(yīng)該先畫什么，后畫什么；
使用擴散模型。用擴散模型生成逼真圖像，并逐步在畫布上添加細節(jié)，就像藝術(shù)家繪畫時一樣；
文本和區(qū)域理解。模型還會生成文本指令和區(qū)域掩碼，前者告訴模型要繪制的內(nèi)容，后者用來指定內(nèi)容的確切位置；
逐步渲染。從一個空白畫布開始，逐步生成完整繪畫過程；
時間控制。為了模擬真實世界中藝術(shù)家的繪畫速度，模型還會考慮每步之間的時間間隔；

這些步驟整體可歸為兩階段訓(xùn)練 + 測試，如下所示：

AI 逆向繪畫：一鍵重繪梵高《羅納河上的星夜》，來自華盛頓大學(xué)