告別“默片”：智譜發(fā)布新清影，可生成 10 秒 4K60 幀 / 自帶音效視頻

2024/11/8 16:17:47 來(lái)源：IT之家作者：清源責(zé)編：清源

評(píng)論：

感謝IT之家網(wǎng)友 HH_KK 的線索投遞！

IT之家 11 月 8 日消息，智譜技術(shù)團(tuán)隊(duì)今天發(fā)布并開(kāi)源最新版本的視頻模型 CogVideoX v1.5，相比于原有模型，CogVideoX v1.5 將包含 5/10 秒、768P、16 幀的視頻生成能力，I2V 模型支持任意尺寸比例，大幅提升圖生視頻質(zhì)量及復(fù)雜語(yǔ)義理解。　

官方介紹，CogVideoX v1.5 也將同步上線到“清影”平臺(tái)，并與新推出的 CogSound 音效模型結(jié)合，“新清影”將具備如下特性：

質(zhì)量提升：在圖生視頻的質(zhì)量、美學(xué)表現(xiàn)、運(yùn)動(dòng)合理性以及復(fù)雜提示詞語(yǔ)義理解方面能力顯著增強(qiáng)。
超高清分辨率：支持生成 10s、4K、60 幀超高清視頻。
可變比例：支持任意比例，從而適應(yīng)不同的播放場(chǎng)景。
多通道輸出：同一指令 / 圖片可以一次性生成 4 個(gè)視頻。
帶聲效的 AI 視頻：新清影可以生成與畫面匹配的音效。

告別“默片”：智譜發(fā)布新清影，可生成 10 秒 4K60 幀 / 自帶音效視頻

IT之家附開(kāi)源地址如下：

代碼：

https://github.com/thudm/cogvideo

模型：

https://huggingface.co/THUDM/CogVideoX1.5-5B-SAT

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

告別“默片”：智譜發(fā)布新清影，可生成 10 秒 4K60 幀 / 自帶音效視頻

相關(guān)文章