IT之家 8 月 16 日消息,阿里云“魔搭社區(qū)”現(xiàn)已上線靈動人像功能 Live Portait,上傳一張照片和一段文本或語音即可生成一段開口說話的數(shù)字人視頻。
IT之家實測,用戶進入應(yīng)用界面后上傳形象照片,可選擇文本驅(qū)動(100 字以內(nèi))或音頻驅(qū)動,提供 28 種聲音選擇,若唇齒生成不清晰,可選擇開啟“唇齒修復”功能。此外,用戶還可設(shè)置眨眼頻率,在 0-4 之間選擇,0 代表不眨眼。
設(shè)置完成后,上傳圖片可以像視頻一樣進行播報,可應(yīng)用于視頻直播、聊天機器人、企業(yè)營銷等場景。據(jù)介紹,Live Portait 相關(guān)技術(shù)已被 CVPR、ICCV 等國際 AI 頂會收錄。
在本月初,魔搭社區(qū)上架兩款開源模型 Qwen-7B 和 Qwen-7B-Chat,阿里云確認其為通義千問 70 億參數(shù)通用模型和對話模型,兩款模型均開源、免費、可商用。其中,Qwen-7B 是支持中、英等多種語言的基座模型,而 Qwen-7B-Chat 是基于基座模型的中英文對話模型。
公開資料顯示,魔搭是阿里達摩院與中國計算機學會(CCF)開源發(fā)展委員會在 2022 年聯(lián)合推出的國內(nèi)首個 AI 模型開源社區(qū),把 300 多個模型開放給中國的 AI 研究者與團隊,涵蓋了自然語言處理,視覺、語音、多模態(tài)等模型。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。