IT之家 11 月 4 日消息,OpenAI 推出了公開測試版的 API,使其圖像生成軟件 DALL-E 更廣泛地提供給企業(yè)。該 API 將使企業(yè)更容易將 DALL-E 的文本轉(zhuǎn)圖像功能添加到他們的產(chǎn)品中,為開發(fā)者提供簡化的工具,以便按照他們的喜好整合和定制該軟件。
該 API 的一個早期使用案例是微軟的 Designer 應(yīng)用程序,該應(yīng)用使用 DALL-E 為 Office 用戶生成圖像。微軟是 OpenAI 的主要投資者之一,并在上個月發(fā)布了該應(yīng)用程序。
OpenAI 負(fù)責(zé) API 的產(chǎn)品經(jīng)理 Luke Miller 稱:“我們已經(jīng)有一些客戶以非常有趣的方式在此基礎(chǔ)上進行開發(fā)。有些是創(chuàng)造性的探索,有些是更多的商業(yè)導(dǎo)向。一家名為 Mixtiles 的初創(chuàng)公司正在使用該 API 生成用于家庭裝飾的海報和藝術(shù)品,另一家名為 CALA 的公司正在使用它來幫助客戶設(shè)計他們自己的服裝?!?/p>
在過去的一年里,人們對文本轉(zhuǎn)圖像人工智能的興趣和采用呈爆炸式增長,而 OpenAI 雖然曾經(jīng)是該領(lǐng)域的領(lǐng)導(dǎo)者,但現(xiàn)在受到了 Midjourney 和 Stability AI 等后來者的挑戰(zhàn),并且他們對用戶的限制較少,允許用戶在幾乎沒有監(jiān)督的情況下建立自己的 AI 系統(tǒng)。同時,這一領(lǐng)域的其它參與者,如谷歌和 Meta,采取了更為謹(jǐn)慎的方法:開發(fā)具有類似能力的系統(tǒng),但將其公開使用限制在非常有限的場景中。
文本轉(zhuǎn)圖像人工智雖然能提供的明顯的創(chuàng)造性好處,但也存在多方面的問題。該軟件可以被用來產(chǎn)生錯誤的信息和有害的圖像,并且在數(shù)據(jù)使用方面存在著具有挑戰(zhàn)性的道德問題。
像 DALL-E 這樣的文本-圖像人工智能系統(tǒng)是根據(jù)從網(wǎng)絡(luò)上搜羅的圖像進行訓(xùn)練的,這些圖像通常包括攝影師、藝術(shù)家和設(shè)計師的版權(quán)作品。許多藝術(shù)家感到憤怒的是,由此產(chǎn)生的技術(shù)不僅可以用來模仿他們的個人風(fēng)格,而且他們也沒有因為使用他們的作品為 OpenAI 這樣價值數(shù)十億美元的公司創(chuàng)造收入而得到補償。
IT之家了解到,一些開發(fā)文字轉(zhuǎn)圖像應(yīng)用的公司開始提供補償。例如 Shutterstock,他們將其貢獻者的數(shù)據(jù)授權(quán)給 OpenAI 以創(chuàng)建 DALL-E,并使用其 API 生成定制的庫存圖像,最近該公司宣布正在設(shè)立一個貢獻者基金,以補償其作品被用于訓(xùn)練 AI 的個人。
當(dāng)被問及 OpenAI 是否計劃制定任何類似的計劃來補償藝術(shù)家時,Miller 說現(xiàn)在沒有任何具體的東西可以分享,會繼續(xù)從社區(qū)尋求反饋,并稱這是一個非常復(fù)雜的問題,需要從很多不同的角度來考慮。
對于 OpenAI 來說,這個問題確實難以回答,因為該公司從未分享過用于創(chuàng)建 DALL-E 的訓(xùn)練數(shù)據(jù)。法律專家稱,在美國,通過刮取公共圖片,即使是受版權(quán)保護的圖片,來訓(xùn)練人工智能模型可能會被合理使用原則所涵蓋。但許多藝術(shù)家指出,充分的法律保障并不等于道德上的認(rèn)可。
OpenAI 說,對 DALL-E API 的訪問開始時將是有速率限制的,不會在客戶如何使用該技術(shù)方面進行審查。客戶將按生成的圖像數(shù)量收費,并能在三個分辨率級別中進行選擇:256 x 256 的圖像每張 0.016 美元(約 0.1168 元人民幣);512 x 512 的圖像每張 0.018 美元(約 0.1314 元人民幣);而 1024 x 1024 的圖像每張 0.02 美元(約 0.146 元人民幣)。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。