這兩天,不少人開始拿到 Adobe Firefly 的測(cè)試資格。
雖然 3 月下旬才剛剛殺入,但作為設(shè)計(jì)界權(quán)威公司的新 AI 工具,它的生成效果也自是被寄予厚望。
這不,英偉達(dá) AI 研究科學(xué)家 Jim Fan 率先給出實(shí)測(cè):
Adobe 能否與自籌資金的 11 人團(tuán)隊(duì) MidJourney 相抗衡?
結(jié)果是 ——
嗯,Adobe Firefly 被吊打了……
不信你看:
Adobe Firefly 大戰(zhàn) MidJourney
Jim Fan 一共測(cè)試了 8 輪。
第一輪:
死侍在英國(guó)一所公寓大樓外的汽車頂部擺出廣角姿勢(shì)。
來看兩者的生成結(jié)果,左邊是 Firefly,右邊 MidJourney(下同):
啊這,F(xiàn)irefly 你確定左邊這個(gè)是蜘蛛俠,而不是真?豬豬俠?
第二輪:
一張照片捕捉到超級(jí)馬里奧在昏暗的街道上擺 pose,在地上的水坑里有一個(gè)大倒影,空氣中有輕微的薄霧,你知道某些事情即將發(fā)生,人們對(duì)此充滿期待。這就像好萊塢電影中的場(chǎng)景,高產(chǎn)值,擬人化的鏡頭。
結(jié)果:
超級(jí)馬里奧的形象就不說了,感覺 Firefly 在背景和氛圍感的刻畫上也遜色一番。
第三輪:
和第二輪的提示詞一模一樣,不過把超級(jí)馬里奧換成皮卡丘。
除去皮卡丘形象不說,還是 MidJourney 更能抓住氛圍,F(xiàn)irefly 這次連昏暗的街道都表現(xiàn)得不到位。
第四輪:
不整 IP 形象了,這輪看看誰更擅長(zhǎng)人物攝影。
富士膠片拍攝的這張現(xiàn)代街頭風(fēng)格的照片捕捉到了東京一個(gè)憂郁的早晨,一大群通勤者在街上行走。
人群中注意力集中的面孔穿著日本街頭服飾和商務(wù)裝的混搭,但吸引你注意力的是穿紅色衣服的女人。
日出的溫暖光芒在薄霧中綻放,而銳利的陽光和精心的構(gòu)圖強(qiáng)調(diào)了人群的情緒和紅衣女子的優(yōu)雅。
完全兩種不同的呈現(xiàn)方式,但 Firefly 實(shí)在實(shí)在是有點(diǎn)失真了。
第五輪:
這輪再整點(diǎn)科幻的。
抽象分形藝術(shù)作品,由數(shù)百萬個(gè)三維異形塊組成的圓形馬賽克城市建筑,城市位于太空中,背景可以看到木星,就像從宇宙飛船上看到的那樣。
感覺 Firefly 對(duì)“圓形”的理解過于表面,顯然也不懂什么是“像從宇宙飛船上看到的那樣”。
第六輪:
現(xiàn)在來生成一些手機(jī)應(yīng)用程序的圖標(biāo)設(shè)計(jì),F(xiàn)irefly 知道這是什么嗎?
應(yīng)用程序圖標(biāo)設(shè)計(jì):iOS,科幻星球景觀,skeomorphic 風(fēng)格;視覺技巧:使用淺景深、高曝光度、柔焦來強(qiáng)調(diào)美;設(shè)備:采用高分辨率相機(jī)拍攝;編輯:通過顏色校正和銳化增強(qiáng);平臺(tái):Dribble、Behance
顯然它還不知道。
第七輪:
報(bào)刊 / 電視臺(tái) / 新聞風(fēng)格的照片,中全景,afga vista 劇照,一位留著白色辮子的牙買加年輕女子站在沙漠中,身穿復(fù)古亮片 Gucci 白色禮服。
這輪主要是看一下 AI 最不擅長(zhǎng)的手部生成。
乍看一眼,兩個(gè)都還行,但稍微瞧瞧就會(huì)發(fā)現(xiàn) Firefly 給了個(gè)男扮女裝的形象,手部廢了,背景相比 MidJourney 還是輸了一截。不過兩者這個(gè)“白色辮子”的呈現(xiàn)就大哥不說二哥了。
最后一輪:
Seealpsee 湖旁蒲公英中的紅色法拉利 F40,用 Fujifilm Velvia 50 拍攝,高細(xì)節(jié),高對(duì)比度 4k
乍一看也都還行,但細(xì)看 Firefly 的背景還是假,不過 Firefly 說畫蒲公英就只畫蒲公英,MidJourney 反而畫蛇添足給了一些其它花種,略微偏離題意。
測(cè)試就是這些,總體看下來,F(xiàn)irefly 確實(shí)完敗,有種小學(xué)生 VS 大學(xué)生的趕腳,也有網(wǎng)友認(rèn)為 Firefly 的水平也就算 MidJourney 的 V1 版本。
不過如 Jim Fan 所說,這種情況情有可原,畢竟:
(1)這些提示語已經(jīng)在 MidJourney 中進(jìn)行了大量?jī)?yōu)化,直接和剛“出道”的 Firefly 來比不是很公平。
不過 Jim Fan 也試了一些“變體”,但仍然無法獲得更好的結(jié)果,也可能是和他寫的提示詞不是很好有關(guān),上面這些測(cè)試的提示語基本來自網(wǎng)友。
(2)最重要的一點(diǎn),F(xiàn)irefly 宣稱它僅在 Adobe Stock 和完全許可的圖像上接受過訓(xùn)練。
這點(diǎn)是很大的劣勢(shì),但對(duì)于必須確保輸出圖像版權(quán)的使用者來說卻是一個(gè)重要的優(yōu)勢(shì)。因?yàn)檫@些人很可能更愿意為了合法性而犧牲質(zhì)量。
針對(duì)這個(gè)話題,Jim Fan 進(jìn)一步發(fā)表觀點(diǎn):
恕我直言,從長(zhǎng)遠(yuǎn)來看,MidJourney 的策略(幾乎不關(guān)注藝術(shù)家和版權(quán))和 Adobe 的策略(為了保護(hù)知識(shí)產(chǎn)權(quán)削弱訓(xùn)練)都不是最優(yōu)的。
也有一些還不錯(cuò)的作品
事實(shí)上,隨便在網(wǎng)上搜一搜,還是能看到 Firefly 在沒有如此對(duì)比之下生成的一些還不錯(cuò)的作品。
算是挽回一些局面。
比如這個(gè):
走在鵝卵石路上的阿爾巴尼亞老婦人。
這個(gè):
這個(gè):
以及用它添加的動(dòng)畫效果:
能感覺到,F(xiàn)irefly 不擅長(zhǎng)寫實(shí),這種卡通 / 手繪等效果還是可以。
Midjourney 更新:能以圖生文了
強(qiáng)大的 Midjourney 仍在繼續(xù)迭代。
官方最新發(fā)布一個(gè)命令:/describe,可以用 4 種文字結(jié)果來描述一張圖片。
網(wǎng)友紛紛表示:我們可以用它給的描述來研究怎么更好的寫提示詞了。
不過,直接用它給出的描述再生成圖,會(huì)跟原圖有些差別,比如設(shè)計(jì)美學(xué)博主 @Simon_阿文嘗試的這個(gè)“地鐵老人看手機(jī)”梗圖:
但很快就有網(wǎng)友給出解決方案:
除了手動(dòng)再修改提示詞,在二次生成時(shí)將原圖也喂給 Midjourney 就會(huì)基本差別不大了。
參考鏈接:
[1]https://twitter.com/DrJimFan/status/1642967379939573761
[2]https://twitter.com/midjourney/status/1643053450501169157
[3]https://weibo.com/1757693565/MAuOMcoUO?pagetype=homefeed
本文來自微信公眾號(hào):量子位 (ID:QbitAI),作者:豐色
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。