DALL?E 2、GPT-3 提示詞在線交易平臺(tái),了解一下?
最近,一家初創(chuàng)公司 PromptBase,允許用戶在該平臺(tái)買賣提示詞(Prompt),提示詞售價(jià)為 1.99 美元。PromptBase 將向賣家抽成 20%。
平臺(tái)上已上架不少提示詞,生成內(nèi)容范圍從新聞標(biāo)題、運(yùn)動(dòng)隊(duì)標(biāo)志、針織娃娃到動(dòng)物的正裝照,應(yīng)有盡有。
▲ 用戶嘗試用 DALL?E 2 生成包含皮卡丘形象的圖片
拿“Knitted Doll”這款來說,它能保證讓 AI 生成可愛且風(fēng)格一致的針織娃娃,但每次生成的具體樣式則是隨機(jī)的。宛如一款 AI 盲盒。
目前,PromptBase 僅托管在 DALL?E 2 和 GPT-3 上測試的提示,但創(chuàng)始人 Ben Stokes 對(duì)外稱,未來平臺(tái)將拓展到其它系統(tǒng),最終目的是服務(wù)于一種全新的職業(yè) —— 提示工程師(Prompt Engineers)。
什么是提示工程?
提示工程(Prompt Engineering)是伴隨預(yù)訓(xùn)練模型和少樣本學(xué)習(xí)誕生的概念,可用很小的代價(jià)讓 AI 執(zhí)行全新的任務(wù)。
換句話說,就是把任務(wù)用文字描述出來喂給 AI,AI 理解之后便能直接執(zhí)行,無需再次訓(xùn)練。
創(chuàng)建具有特定畫家風(fēng)格的圖像就是一個(gè)典型案例,比如輸入提示“日出時(shí)分安坐在田野里的狐貍,莫奈風(fēng)格”,你將得到:
提示的描述風(fēng)格沒有固定,任君選擇。
你想在得到的圖像中有一只考拉,有一輛自行車。你可以寫作“一幅考拉騎自行車的兒童畫”,也可以寫“一張考拉騎車的老照片”。
如此自由度,讓 GPT-3 的生成文字和 DALL?E 的生成圖像等應(yīng)用風(fēng)靡一時(shí)。
不過對(duì)于人類玩家來說,想要讓 AI 穩(wěn)定的生成自己滿意的作品也不是一件容易的事。網(wǎng)絡(luò)上不斷有人在分享自己試驗(yàn)出來的技巧,讓人眼花繚亂。
猜猜看,使用 DALL?E 返回“一幅非常漂亮的畫,畫中一座山緊鄰瀑布”和“一幅非常非常非常漂亮的畫,畫中一座山緊鄰瀑布”兩個(gè)提示,哪個(gè)輸出的結(jié)果會(huì)更好?
答案是后者。
因?yàn)?DALL?E 2 對(duì)“非常”這個(gè)詞賦予了極高的權(quán)重。
2022 年斯隆研究獎(jiǎng)獲得者,MIT 電子工程與計(jì)算機(jī)科學(xué)系助理教授 Phillip Isola 在 Twitter 上做了個(gè)有趣的試驗(yàn)。用 0 個(gè) very 和 22 個(gè) very 分別修飾了“一幅畫,畫中一座山緊鄰瀑布”這一提示。
最終結(jié)果對(duì)比如下:
▲ 0 個(gè) very(1、2 行)和 22 個(gè) very(3、4 行)修飾提示后分別輸出的圖像
果然,“very”數(shù)量越多,圖像就更精美。
另外得克薩斯大學(xué)奧斯汀分校的一項(xiàng)研究中,研究人員記錄了大量使用 DALL?E 2 生成圖像的提示詞,其奇怪程度堪稱“魔咒”。
拿這倆不知所云的詞組舉例:
1、Apoploe vesrreaitais(以下簡稱詞組 1)
2、Contarra ccetnxniams luryca tanniounons(以下簡稱詞組 2)
是真?不知所云,翻譯軟件看了都能原地懵圈。
但在 DALL?E 這兒,詞組 1 的代表著“鳥”,詞組 2 代表著“蟲子 / 害蟲”。如果告訴 DALL?E“詞組 1 eat 詞組 2”,你會(huì)獲得這樣的圖:
現(xiàn)在是否能夠理解,為啥把提示比作“咒語”了 —— 一些不知道在說啥的詞,恰好對(duì)應(yīng)著系統(tǒng)的一些內(nèi)部邏輯。
總的來看,提示一定程度上快捷地滿足了“所需”。但要玩轉(zhuǎn)這些 AI 還需要講究很多技巧,對(duì)懶人來說,在 PromptBase 這類平臺(tái)上購買提示,省事兒多了。
提示賣錢,這個(gè)商業(yè)模式成立么?
來正經(jīng)說說買賣提示這事兒。
此前,以 DALL?E 為主,許多研究人員和愛好者已經(jīng)發(fā)布過免費(fèi)的流行 AI 系統(tǒng)提示詞資源。
作為最早將提示詞商業(yè)化的公司之一,PromptBase 飽受爭議。實(shí)際上,AI 社區(qū)內(nèi)部一直存在著關(guān)于哪些研究應(yīng)該或可以商業(yè)化的爭論。
出售提示并不違反任何 AI 提供商的服務(wù)條款,也沒人能阻止 PromptBase 客戶使用購買的提示。
不過,由于背后涉及一系列道德和法律問題,不乏有人將其視為不該打開的“潘多拉魔盒”。
首先是信息泄露問題。
研究表明,在大量公共數(shù)據(jù)(如 GPT-3)上訓(xùn)練的語言系統(tǒng)在輸入某些提示時(shí),會(huì)“泄漏”更人信息,包括姓名和地址等。
再者,如果提示 DALL?E 2 生成“寶可夢(mèng)的 3D 模型”,就難免涉及對(duì)任天堂公司的侵權(quán)問題。
▲ 用戶嘗試用 DALL?E 2 生成包含皮卡丘形象的圖片
研究人員還推測,DALL?E 2 的“咒語”,可以繞過其違禁詞過濾器,從而生成一些原本禁止的圖像,比如暴力圖像。
以及,雖然 PromptBase 表示會(huì)嚴(yán)格審查,確保提示不違反任何“AI 生成規(guī)則”,但如果業(yè)務(wù)增長、市場擴(kuò)大,嚴(yán)格的審查水平可能難以維持。
德國薩爾州學(xué)院的計(jì)算語言學(xué)家 Vagrant Gautam 也認(rèn)為提示商業(yè)化可能會(huì)導(dǎo)致提示濫用。
同時(shí),她也覺得這是一把雙刃劍。畢竟,提示可以賣錢,懂技術(shù)的人可以把副業(yè)搞起來了。
“提示商業(yè)化指出了提示工程的重要性,以及創(chuàng)造力、耗時(shí)、對(duì)抗性思維等所需技能的重要性?!盙autam 說。
用戶對(duì)提示商業(yè)化的抱怨,主要集中在免費(fèi)調(diào)整提示的次數(shù)太少。
但轉(zhuǎn)頭一想,人們又必須采取這種反復(fù)試驗(yàn)、對(duì)抗性的方法來搞明白怎么促使生成模型,完成自己的“所需”。
看到這里,你是否會(huì)購買提示詞呢,或者會(huì)不會(huì)考慮出售提示詞賺點(diǎn)外快?
參考鏈接:
[1]https://promptbase.com
[2]https://techcrunch.com/2022/07/29/a-startup-is-charging-1-99-for-strings-of-text-to-feed-to-dall-e-2/
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。