如果不說,你能看出來下面這幅畫又是 AI 畫的嗎?
而且還是 AI 自己生成了語言描述,又通過這些描述畫出了圖。
沒錯(cuò),這就是 GPT-3 和 DALL?E 強(qiáng)強(qiáng)聯(lián)合之后的效果。
最初給 GPT-3 的輸入是:
寫一篇關(guān)于一群浣熊去搶劫的電腦游戲描述。
然后,GPT-3“設(shè)計(jì)”了一款名為《浣熊打劫》的游戲。描述中詳細(xì)介紹了游戲背景、玩家角色和需要做的事情。完全看不出是 AI 寫的啊~
接下來,再把這些描述喂給 DALL?E,一幅生動(dòng)的游戲原型動(dòng)畫誕生了。
畫面里,兩只鬼鬼祟祟的浣熊,在深夜的大街上游走,一副隨時(shí)準(zhǔn)備作案的樣子。畫風(fēng)拿捏非常到位,和常見動(dòng)畫游戲中色調(diào)和筆觸幾乎一個(gè)味兒。更重要的是,整個(gè)制作過程,只要不到 60 秒!
有網(wǎng)友圍觀后自己上手試了試,讓兩個(gè) AI 合力做一個(gè)“白鼬在家里玩嗨了”的游戲原型。
生成的游戲介紹和原型動(dòng)畫,都是讓人看了直呼偶買噶的程度啊。甚至都讓人有點(diǎn)想玩!
AI 創(chuàng)作圖文,再次突破想象
實(shí)際上,不只是生成游戲原型動(dòng)畫,這兩個(gè) AI 組合還能搞出各種圖文原創(chuàng)。比如睡前故事。有位網(wǎng)友表示,他讓 AI 以自己兒子、家里狗狗為主角,創(chuàng)作了一個(gè)去火星的故事。
從前有個(gè)小男孩,他喜歡搭積木,他最好的朋友是一只名叫 Mochi 的狗狗。有一天,他們夢(mèng)想去火星,然后一起做了一個(gè)大火箭,飛向了太空。
在網(wǎng)友的展示中一共有 9 幅畫,每一幅都配著簡短易懂的文字。畫風(fēng)也和普通兒童繪本幾乎沒什么兩樣,真的很難讓人相信是 AI 創(chuàng)作的?。《抑灰约泳庉?,還能讓 DALL?E 生成的一系列圖像中,主角形象不發(fā)生變化(不過這樣人物的表情就沒有變化了)。
沒想到,當(dāng)代版一千零一夜,竟然能靠 AI 來講。除此之外,最近還有一個(gè)用 DALL?E 2 設(shè)計(jì) logo 的帖子爆火。
一位網(wǎng)友開發(fā)了一個(gè)名為“OctoSQL”的工具,想要為其設(shè)計(jì)一個(gè) logo。然后,他就把自己的設(shè)計(jì)想法告訴了 AI:小章魚玩轉(zhuǎn)數(shù)據(jù)庫、圖表。同時(shí)補(bǔ)充了“數(shù)字藝術(shù)”、“卡通”等關(guān)鍵詞,得到了如下效果。
不得不說這效果一開始就很好??!但是作者想要更精細(xì)一些,所以之后又給了 AI 十多次關(guān)鍵字來嘗試。其中,在加了“標(biāo)志”的關(guān)鍵字后,AI 給出了黑色圓底的輸出,有 logo 的感覺了。
更為意外的是,DALL?E 還能真的像乙方一樣調(diào)細(xì)節(jié)。比如作者確定了要用這只帶安全帽的章魚當(dāng) logo,但是它手里拿的東西不滿意。那么還能固畫面的一部分,來繼續(xù)換關(guān)鍵字生成新內(nèi)容。
最終,作者用瀏覽器反向搜索了一下,生成的章魚 logo 是完全原創(chuàng)、沒有類似結(jié)果的。
網(wǎng)友看后表示:
這個(gè)過程,仿佛和找人類設(shè)計(jì)師來沒什么兩樣啊。
值得一提的是,想要得到如上這些好的輸出結(jié)果,人類自己還要懂得一些小技巧。比如 GPT-3 針對(duì)“描述一個(gè) XXX 的產(chǎn)品介紹”很擅長,那么使用這種句式得到的結(jié)果質(zhì)量會(huì)相對(duì)高一些。
還有,在 DALL?E 2 的關(guān)鍵詞輸入后添加“artstation”效果會(huì)更好。當(dāng)然了,這些生成的過程中難免發(fā)生翻車事件。
有網(wǎng)友表示,自己想要用 DALL?E 生成一個(gè)“Jared’s pizza”的 logo,但是輸出結(jié)果一直是“Jizza”。
One More Thing
由于 GPT-3 和 DALL?E 都需要排隊(duì)申請(qǐng)使用,所以并不是所有人都能試玩。有網(wǎng)友推薦了 craiyonAI,可以替代 DALL?E,效果也還不錯(cuò)。
值得一提的是,這次發(fā)現(xiàn) AI 能做游戲原型動(dòng)畫的網(wǎng)友不是普通人。他是 Django Web 的創(chuàng)始人之一 Simon Willison。
Django 是高水準(zhǔn)的 Python 編程語言驅(qū)動(dòng)的一個(gè)開源模型。使用這種架構(gòu),程序員可以方便、快捷地創(chuàng)建高品質(zhì)、易維護(hù)、數(shù)據(jù)庫驅(qū)動(dòng)的應(yīng)用程序。
參考鏈接:
[1]https://twitter.com/simonw/status/1555626060384911360
[2]https://news.ycombinator.com/item?id=32320491
[3]https://jacobmartins.com/posts/how-i-used-dalle2-to-generate-the-logo-for-octosql/
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。