設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色
漫威《复仇者联盟 5》开拍,27 名演员公布    2025 胡润全球富豪榜发布

騰訊混元文生圖大模型對外開源:搭載首個(gè)中英雙語 DiT 架構(gòu),免費(fèi)商用

2024/5/14 17:01:24 來源:IT之家 作者:沛霖(實(shí)習(xí)) 責(zé)編:汪淼
感謝IT之家網(wǎng)友 西窗舊事 的線索投遞!

IT之家 5 月 14 日消息,騰訊宣布旗下的混元文生圖大模型升級并對外開源,目前已經(jīng)在 Hugging FaceGithub 上發(fā)布,包含模型權(quán)重、推理代碼、模型算法等完整模型,可供企業(yè)與個(gè)人開發(fā)者免費(fèi)商用

▲ 混元文生圖效果

▲ 混元長文生圖效果

升級后的混元文生圖大模型采用了與 Sora 一致的 DiT 架構(gòu),騰訊表示,混元 DiT 是首個(gè)中英雙語 DiT 架構(gòu)?;煸?DiT 是一個(gè)基于 Diffusion transformer 的文本到圖像生成模型,此模型具有中英文細(xì)粒度理解能力,混元 DiT 能夠與用戶進(jìn)行多輪對話,根據(jù)上下文生成并完善圖像。這也是業(yè)內(nèi)首個(gè)中文原生的 DiT 架構(gòu)文生圖開源模型,支持中英文雙語輸入及理解,參數(shù)量 15 億。

運(yùn)行該模型需要支持 CUDA 的英偉達(dá) GPU,單獨(dú)運(yùn)行混元 DiT 所需的最低顯存為 11GB,同時(shí)運(yùn)行 DialogGen(騰訊推出的文本轉(zhuǎn)圖像多模態(tài)交互式對話系統(tǒng))和混元 DiT 則至少需要 32GB 的顯存,騰訊表示他們已經(jīng)在 Linux 上測試了英偉達(dá)的 V100 和 A100 GPU。

▲ 配置要求

據(jù)IT之家此前報(bào)道,國內(nèi)首個(gè)官方“大模型標(biāo)準(zhǔn)符合性評測”結(jié)果公布,騰訊混元大模型、成為首批通過評測的國產(chǎn)大模型,首批通過的大模型還有阿里通義千問、360 智腦和百度文心一言。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:大模型文生圖,騰訊混元
  • 日榜
  • 周榜
  • 月榜

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知