設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色
国资委:将对整车央企进行战略性重组    小米新机重拾 UWB 技术

單圖可生成視頻,阿里云“魔搭社區(qū)”上線靈動人像功能

2023/8/16 15:31:58 來源:IT之家 作者:浩渺(實習) 責編:汪淼
感謝IT之家網(wǎng)友 西窗舊事 的線索投遞!

IT之家 8 月 16 日消息,阿里云“魔搭社區(qū)”現(xiàn)已上線靈動人像功能 Live Portait,上傳一張照片和一段文本或語音即可生成一段開口說話的數(shù)字人視頻。

圖片 1

IT之家實測,用戶進入應(yīng)用界面后上傳形象照片,可選擇文本驅(qū)動(100 字以內(nèi))或音頻驅(qū)動,提供 28 種聲音選擇,若唇齒生成不清晰,可選擇開啟“唇齒修復”功能。此外,用戶還可設(shè)置眨眼頻率,在 0-4 之間選擇,0 代表不眨眼。

設(shè)置完成后,上傳圖片可以像視頻一樣進行播報,可應(yīng)用于視頻直播、聊天機器人、企業(yè)營銷等場景。據(jù)介紹,Live Portait 相關(guān)技術(shù)已被 CVPR、ICCV 等國際 AI 頂會收錄。

圖片 1

在本月初,魔搭社區(qū)上架兩款開源模型 Qwen-7B 和 Qwen-7B-Chat,阿里云確認其為通義千問 70 億參數(shù)通用模型和對話模型,兩款模型均開源、免費、可商用。其中,Qwen-7B 是支持中、英等多種語言的基座模型,而 Qwen-7B-Chat 是基于基座模型的中英文對話模型。

圖片 1

公開資料顯示,魔搭是阿里達摩院與中國計算機學會(CCF)開源發(fā)展委員會在 2022 年聯(lián)合推出的國內(nèi)首個 AI 模型開源社區(qū),把 300 多個模型開放給中國的 AI 研究者與團隊,涵蓋了自然語言處理,視覺、語音、多模態(tài)等模型。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:阿里云,魔搭社區(qū)
  • 日榜
  • 周榜
  • 月榜

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知