輸入一句話,AI 就能為有志于從事藝術創(chuàng)作的任何人,生成一幅創(chuàng)意畫作,不管創(chuàng)作者此前是否接受過專業(yè)的藝術訓練。
近兩年,海外用戶借助 Disco Diffusion、MidJourney 等 AI 繪畫軟件來進行藝術創(chuàng)作,逐漸成為一種風潮。在國內(nèi),也有了諸如百度文心一格、TIAMAT 等這類適用于中文描述語輸入、更能理解中國文化審美的 AI 藝術和創(chuàng)意輔助平臺誕生。
對專業(yè)者而言,這類 AI 繪畫輔助工具是一個很好的創(chuàng)意助手。而一些素人則利用這些工具,發(fā)展出了自己的斜桿事業(yè),在抖音上做壁紙?zhí)?,在閑魚上賣描述語,有的還將自己的作品賣給了包裝廠或數(shù)字藏品業(yè)者,賺到些許零花錢。
01、AI 式創(chuàng)作自由
吳先生本職工作是一位醫(yī)生,他愛玩抖音,閑暇之時常想著在抖音上做點什么來掙錢。
2 個月前,他看到不少創(chuàng)作者在抖音上做壁紙?zhí)?,也就是?chuàng)作者會發(fā)布一些好看的照片或圖片,用戶可以下載拿去當電腦或手機桌面。下載時用戶需要看一段平臺廣告,創(chuàng)作者則能從廣告播放中獲得平臺分成。
據(jù)吳先生的觀察,壁紙?zhí)柸θ詫傩”?,但圈中也?2、30 萬粉絲的創(chuàng)作者,通過向用戶輸送風景、人物、汽車等這類美照,月入上萬。
吳先生本身是風景照愛好者,也想做一個風景類的壁紙?zhí)枺嘤跊]有多少素材。正發(fā)愁時,他接觸到了 AI 繪畫,發(fā)現(xiàn)只需要在 AI 繪畫軟件里輸入相關描述語,就能生成好看的圖片,這解決了他素材缺乏的難題。
吳先生下載了兩款海外的 AI 繪畫產(chǎn)品,一款是 Disco Diffusion,一款是 MidJourney,在抖音上注冊了一個賬號,名為“AI 美圖”,便開始作畫。
DiscoDiffusion 每天有 3 小時可免費使用,MidJourney 吳先生則充了會員費,每月 30 美元。每張圖平均幾分鐘就能生成的創(chuàng)作效率,足以支撐起吳先生做賬號的素材需要。
在吳先生看來,這兩款軟件擅長的重點各有不同。Disco Diffusion 擅長畫場景,MidJourney 擅長畫人物或動物之類的近景。
在有了這兩款軟件的加持后,身為醫(yī)生的吳先生實現(xiàn)了創(chuàng)作自由。
他通過輸入各種描述語,來不斷試錯,一天能夠發(fā)布 7 到 8 張作品。雖然后來吳先生發(fā)現(xiàn),因為用戶圈子太小,并不需要每日在抖音上傳這么多。
更難能可貴的是,雖然沒有藝術積淀,但并不妨礙吳先生創(chuàng)作出可賣出價格的作品。
據(jù)介紹,吳先生創(chuàng)作的一幅賽博朋克機器人,其背后的描述語,被一位從事數(shù)字藏品交易的人士以數(shù)十元價格買去,這讓吳先生驚訝不已。
爾后,這位人士又請吳先生創(chuàng)作了一組十二生肖圖片,用作數(shù)字藏品開發(fā)。吳先生用 AI 為每組生肖創(chuàng)作了 3 張圖片備選,最后這一組圖片背后的描述語,以數(shù)百元的價格售出。
這給了吳先生以啟發(fā)。由于吳先生的抖音號粉絲才 200 多人,難以通過廣告分成的方式掙到錢,他索性決定專門去賣描述語。
百條描述語標價 20 元,拿到抖音、閑魚上去賣,有印刷商前來購買,這形成了吳先生的零花錢收入。
與吳先生經(jīng)歷類似的還有小紅書博主土味牛仔,攝影專業(yè)出身的他,今年 6 月起開始嘗試用 MidJourney 來進行 AI 繪畫。
土味牛仔的 AI 繪畫作品多以牛仔為主題,風格涵蓋東方元素、未來感、科幻感等,點贊量高的達數(shù)千,他習慣把攝影時無法實現(xiàn)的腦洞告訴 AI,讓 AI 幫他實現(xiàn)。
4 個月的時間里,土味牛仔一共在小紅書發(fā)布了 117 張 AI 繪畫作品,其中每張作品背后平均的生成次數(shù)為 50 次,可謂精益求精。
創(chuàng)作者在學習,AI 也在學習。目前,MidJourney 里共記錄了土味牛仔的 10000 多次生成記錄?,F(xiàn)在土味牛仔只要一輸入相關詞匯,AI 就能生成相關額外的聯(lián)想。有時土味牛仔會懷念“不太聽人話”、更具備天馬行空創(chuàng)意的 AI,而不是對人類思維偏好越來越貼近的圓滑 AI。
在小紅書上發(fā)布 AI 繪畫作品以后,土味牛仔說他接到過幾次約稿,也有人找上門想直接購買原圖留作 NFT 收藏,但這樣的人屈指可數(shù)。目前他在 AI 繪畫作品上的收入還不足以支付他在 MidJourney 上的投入。
據(jù)土味牛仔在圈子里的觀察,大家使用 AI 繪畫的原因各不相同。有插畫師朋友會用 AI 生成作品的草稿,以此為基礎進行創(chuàng)意和修改。做建筑設計的朋友則會利用 AI 來進行頭腦風暴。但更多素人就是圖一個新鮮,就是想要看“超人跟鋼鐵俠合在一起是什么樣子”。
在用戶們的推動下,B站、抖音上等介紹 AI 繪畫軟件和教程的視頻越來越多,小紅書則成了 AI 繪畫作品的一個重要展示平臺,閑魚則扮演了一個銷售描述語的平臺角色。
02、AI 繪畫技術的迭代
AI 繪畫的源頭可以追溯到上世紀 70 年代。
計算機問世后的 10 年,就有藝術家打造電腦程序 AARON 來進行繪畫創(chuàng)作,其主要原理是控制機械臂來作畫,但當時的技術成本比較高,且只能得到抽象的結果。
而現(xiàn)代意義的 AI 繪畫,主要是指 AI 從海量圖文對應的數(shù)據(jù)中學習“語言描述”與“藝術畫面”的關聯(lián),以隨機化的起點開始,不斷修正畫作,最終形成在審美上與人類經(jīng)驗與知識高度一致的成品。
據(jù)百度文心一格相關負責人介紹,現(xiàn)代意義 AI 繪畫技術的雛形,主要出現(xiàn)在上一個十年中。
彼時的技術可以批量完成由文本信息指定的畫面生成,技術上包括風格遷移、元素拼接和對抗生成網(wǎng)絡(GAN—Generative Adverserial Network)等。
從生成的畫面質(zhì)量來看,雖然這些技術使 AI 繪畫的水平有了明顯進展,并且在比較強烈的風格上有了初步的應用可能性,但與人類作畫質(zhì)量依然存在差距。
AI 繪畫最近的一次技術爆發(fā)是 2022 年對擴散生成模型的引入,這類模型用于文生圖后,能夠在更短的時間內(nèi),像素級建模并生成分辨率顯著提升的繪畫,并且在美感、細節(jié)精細度有非常顯著的提升,一些 AI 繪畫的成品已經(jīng)和人類作畫的質(zhì)量不相上下。
行業(yè)里普遍認為,從 2021 年到 2022 年,是 AI 文生圖技術發(fā)展最快的兩年,諸多新的學習模型或產(chǎn)品誕生,AI 繪畫的風潮也開始發(fā)展。
一是 Open AI 于 2021 年初發(fā)布的深度學習模型 CLIP(Contrastive Language-ImagePre-Training)。
Open AI 是一家于 2015 年 12 月成立于美國的人工智能研究公司,它用 CLIP 先后創(chuàng)建了 DALL-E 和 DALL?E 2 兩個 AI 系統(tǒng),為用戶構建了可以根據(jù)文字描述創(chuàng)建更逼真、更準確圖像的能力。
二是于今年 2 月初開始出現(xiàn)并流行的開源繪畫程序 Disco Diffusion,它是一個由谷歌推出的 AI,開發(fā)者是藝術家兼程序開發(fā)員的 Somnai_dreams 。
Disco Diffusion 的特點是能夠高效合成視覺數(shù)據(jù),圖片生成的質(zhì)量直接擊敗了 GAN 模型。但缺陷仍然存在,主要表現(xiàn)在 AI 繪畫欠缺細節(jié),渲染的時間過長,內(nèi)存資源消耗巨大。今年 7 月開始測試的 Stable Diffusion 程序,則很快改進了以上缺點。
三是今年 6 月推出的 MidJourney,它是一個富有創(chuàng)造性的 AI,用它生成的圖片質(zhì)量得到了大幅度的提升,且以月費為方式的商業(yè)化做得比較成功。目前公開資料顯示 MidJourney 的用戶成員已經(jīng)超過了 240 萬人。
在國內(nèi),AI 繪畫也開始逐漸有了熱度。
像 Stable Diffusion、MidJourney 這類模型,主要是針對英文世界的用戶,語言和文化的差異形成了國內(nèi)用戶使用海外 AI 繪畫軟件的阻礙。國內(nèi)用戶呼喚中文世界的文生圖產(chǎn)品,這形成了一定的市場需求。
TIAMAT 成立于 2021 年、被稱為是國內(nèi)首批 AI 生成式平臺。今年上半年,TIAMAT 開始在小紅書、抖音等社交媒體上發(fā)布中文文生圖的產(chǎn)品,趕上了 AI 繪畫的第一波熱潮。
TIAMAT 致力于為個人用戶和企業(yè)客戶提供創(chuàng)意生產(chǎn)、廣告、數(shù)字藏品等場景形式下的服務。日前,TIAMAT 已宣布完成數(shù)百萬美元天使輪融資,投資方為 DCM。
今年 8 月,百度發(fā)布了 AI 藝術和創(chuàng)意輔助平臺文心一格,它使用了百度自主研發(fā)的產(chǎn)業(yè)級知識增強大模型 — 文心大模型,通過語義理解 + 多畫作風格適配 + 結果優(yōu)化排序,讓用戶只需要輸入一句話,就能完成畫作,包括意向、具象等多種類型和風格。
文心一格被認為有效地解決了中文世界中,需求描述困難、多樣化需求強、模型生成結果篩選難的困難,降低了中文世界用戶使用 AI 繪畫的難度。
基于文心一格平臺,由百度數(shù)字人度曉曉創(chuàng)作的“無界”系列畫作,已被專業(yè)美院教授評價為“已經(jīng)達到了本科美術生的基本要求”。
業(yè)內(nèi)人士指出,對于 AI 繪畫而言,如何讓 AI 準確理解中英文語境中的描述語至關重要。描述語不僅有中英文上的語言差異,也有語言承載的文化差異,從而影響到 AI 繪畫技術的研發(fā)。
例如“龍”對于英文環(huán)境基本沒有歧義,但在中文環(huán)境中則有東方龍和西方龍的形象差異,且東方龍和西方龍作為文化符號的意義也完全不同,這對 AI 繪畫技術提出了很大的挑戰(zhàn)。
從當下來看,如何處理好語言、文化的差異,AI 繪畫還有很長的路要走。
03、AI 繪畫的爭議點和未來發(fā)展
AI 繪畫誕生后,市場上存在的一個爭議點主要圍繞版權展開。
AI 繪畫平臺的底層邏輯是融合各創(chuàng)作者的作品以及現(xiàn)有的互聯(lián)網(wǎng)圖片生成的作品,提取原作的筆觸、用色、構圖等元素而進行的“二次創(chuàng)作”,至于版權是歸原作者、平臺方,還是現(xiàn)在的創(chuàng)作者,目前尚難以界定。
據(jù)使用過 Disco Diffusion 和 MidJourney 的用戶介紹,用 Disco Diffusion 生成的圖片版權屬于創(chuàng)作者自己所有,而使用 MidJourney 生成的圖片版權則屬于創(chuàng)作者與平臺共有。
百度文心一格相關負責人認為,AI 技術生成的圖片并不是既有圖片的拼湊,而是類似人類經(jīng)過長期繪畫訓練后的再創(chuàng)作,既有繼承,也有自己的特色。
不過基于版權問題,行業(yè)仍在討論中,為了避免可能的風險以及解決可能發(fā)生的糾紛,百度文心一格方面就表示,未來如果平臺開放出來的生成圖片侵犯到原作者權益,會提供投訴反饋通道,為相關權利人提供權利救濟渠道,迅速處理。
據(jù)了解,目前國內(nèi)還無相關具體的法律案例能夠用來作參考。
關于 AI 繪畫的發(fā)展方向,本質(zhì)是 AIGC(人工智能自主生成內(nèi)容)技術的發(fā)展,它是一種繼 PGC、UGC 之后全新的內(nèi)容生產(chǎn)方式,被認為能夠刺激內(nèi)容產(chǎn)業(yè)進一步發(fā)展。
公開數(shù)據(jù)顯示,全球庫存圖片市場規(guī)模接近 3000 億美元。但目前主流的圖片市場是平臺有什么用戶用什么,而不是用戶想要什么就有什么。內(nèi)容生產(chǎn)者仍然受限于生產(chǎn)的想象力,傳統(tǒng)圖片行業(yè)還處于“數(shù)字手工業(yè)”階段。
相較之下,AIGC 的發(fā)展正好順應了內(nèi)容創(chuàng)作者對生產(chǎn)想象力的延伸。以前 AI 只是輔助內(nèi)容創(chuàng)作的工具,現(xiàn)在 AI 已經(jīng)能夠獨立完成寫作、設計、繪畫、作曲等創(chuàng)意性工作。
這里需要注意的一點是,AIGC 聽上去時髦,但自動化內(nèi)容生成并不是一個很新的概念。
利用計算機輔助人類進行內(nèi)容生產(chǎn)早已經(jīng)出現(xiàn),比如在計算機編程領域 IDE 的代碼提示、使用 Office Word 編輯內(nèi)容的錯誤修正,再到后來利用 NLG 自動化文本生成等都可以算在這個范圍里。
關于目前的 AIGC 技術處于哪個發(fā)展階段,百度 CEO 李彥宏在 2022 年百度世界大會上有一個論述。
他將 AIGC 分為三個發(fā)展階段:第一階段是助手階段,AIGC 輔助人類進行內(nèi)容生產(chǎn);第二階段是協(xié)作階段,AIGC 以虛實并存的虛擬人形態(tài)出現(xiàn),形成人機共生的局面;第三階段是原創(chuàng)階段,AIGC 將獨立完成內(nèi)容創(chuàng)作。
從目前 AI 在作文、繪畫、寫歌等各個領域的發(fā)展來看,AIGC 已經(jīng)進入助手階段,但總體處于發(fā)展早期。
未來 AI 作畫是否會取代設計師、原畫師等,這個還說不定。但從目前人們的反應來看,人們顯然還沒有那么憂慮。
本文來自微信公眾號:真故研究室 (ID:zhengulab),作者:鄭思芳,編輯:龔正
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。