設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

AI 用 50 個(gè)三角形畫出抽象版蒙娜麗莎,有股后現(xiàn)代的感覺(jué)了

量子位 2021/9/23 19:55:57 責(zé)編:信鴿

9 月 23 日消息 現(xiàn)在,給 AI 一個(gè)短語(yǔ)和 50 個(gè)三角形,它就能創(chuàng)作一副極簡(jiǎn)風(fēng)格的抽象畫了。

只需輸入“a drawing of cat(一張貓的畫像)”,一只棱角分明、散發(fā)著冷酷氣息的抽象貓就生成了。

不只是這種泛泛的概念,給出特定詞匯,這個(gè) AI 也能指定作畫。

比如輸入“Walt Disney World(迪士尼樂(lè)園)”,50 個(gè)三角形立刻重新排布,一個(gè)風(fēng)格完全不同的抽象版迪士尼城堡就出現(xiàn)在了眼前。

可以說(shuō)是完完全全抓住了迪士尼城堡的精髓。

以上這些“大作”,其實(shí)都是進(jìn)化策略 (ES)和 CLIP 結(jié)合后生成的效果,由谷歌大腦團(tuán)隊(duì)出品。

他們讓兩個(gè) AI 相互配合,根據(jù)文字提示及具體圖像,用一堆三角形創(chuàng)作出了一幅幅極具特色的抽象畫。

抽象后的谷歌大樓,大概長(zhǎng)這樣:

不能說(shuō)毫無(wú)關(guān)系,只能說(shuō)一模一樣啊。

這回,真的有點(diǎn)后現(xiàn)代藝術(shù)的 feel 了。

只用三角形創(chuàng)作的抽象畫

從生成的效果可以看到,ES 算法 + CLIP 其實(shí)就是把一堆隨機(jī)的三角形重新排布,通過(guò)調(diào)整它們的大小、位置、顏色,逐漸將其構(gòu)建成一個(gè)與給出詞匯所吻合的圖像。

具體來(lái)看,在最初始時(shí),ES 算法會(huì)以三角形的坐標(biāo)、RGBA 值作為參數(shù),在畫布上隨機(jī)給出一些三角形。

進(jìn)化策略(ES)算法的原理則像進(jìn)化論一樣,它可以根據(jù)給出的信息不斷優(yōu)化,直到得到一個(gè)最優(yōu)解。

CLIP 則是 OpenAI 開發(fā)的一個(gè)負(fù)責(zé)給圖像重排序的模型。

它會(huì)對(duì) ES 算法給出的三角形圖像與文字描述的相似度進(jìn)行打分,然后將結(jié)果反饋給 ES 算法,ES 算法就會(huì)為了提升分?jǐn)?shù)而不斷迭代,最后得到一副藝術(shù)畫。

除了給出文字指令外,直接給一張圖作為初始信息,只用 ES 算法也能進(jìn)行作畫。

這不,用 50 個(gè)三角形、迭代 10000 次后,后現(xiàn)代抽象版蒙娜麗莎誕生了。

如果增加更多的三角形,算法給出的效果也會(huì)更好。

在下面的對(duì)比中,當(dāng)三角形數(shù)量達(dá)到 200 時(shí),生成的圖像立刻增加了億點(diǎn)點(diǎn)細(xì)節(jié)。

其中達(dá)爾文和蒙娜麗莎的例子,fitness 幾近達(dá)到了 100%。

此外,為了實(shí)現(xiàn)更好的效果,研究人員還采用了 ClipUp 優(yōu)化器。

從對(duì)比中可以看到,使用優(yōu)化器后迭代 1 萬(wàn)次后的效果比基本算法迭代 56 萬(wàn)次后的還要好。

同時(shí),與基于梯度的渲染方法對(duì)比,ES 算法的表現(xiàn)也可圈可點(diǎn)。

渲染方法會(huì)更側(cè)重于紋理和顏色上的細(xì)化,而 ES 算法會(huì)更加側(cè)重于如何布局這些三角形。

那么給出文本指令生成的效果如何呢?

在“Self”、“Human”、“Walt Disney World(迪士尼樂(lè)園)”幾個(gè)案例中,算法的表現(xiàn)依舊很優(yōu)秀。

在體現(xiàn)關(guān)鍵字主題精髓的情況下,隨著構(gòu)圖三角形數(shù)量的增多,算法給出的結(jié)果細(xì)節(jié)也就更為豐富。

但是在“picture of Tokyo”這個(gè)例子中,它的表現(xiàn)就不那么好了。

研究人員認(rèn)為這是由于算法在生成陰影較深的三角形上還存在困難,所以造成了這一結(jié)果。

而且面對(duì)命題作業(yè),算法也會(huì)盡可能給出不同的答案。

在這幾個(gè)案例的重復(fù) 4 次測(cè)試中,我們可以看到生成的圖像都存在明顯的區(qū)別。

Demo 可試玩

其實(shí)這并不是 CLIP 第一次“指揮”別的 AI 作畫了。

此前與 GAN 配合,就讓圖像變成了 CG 藝術(shù)風(fēng)。

事實(shí)上,這一次的抽象畫效果,你也可以體驗(yàn)。

團(tuán)隊(duì)已經(jīng)將代碼開源,在 Colab 上也能進(jìn)行試玩(鏈接已附在文末)。

這是有網(wǎng)友上傳的生成圖像,效果真的還不錯(cuò),你能猜出來(lái)這是誰(shuí)嗎?

論文鏈接:點(diǎn)擊打開

GitHub 開源地址:點(diǎn)擊訪問(wèn)

試玩鏈接:點(diǎn)擊打開

— 完 —

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:谷歌,AI,抽象畫

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知