IT之家 7 月 5 日消息,在 2024 世界人工智能大會(huì)(WAIC 2024)上,嗶哩嗶哩(以下簡稱“B站”)公布了多項(xiàng)自主研發(fā)的 AI 技術(shù)成果和 AIGC 多元?jiǎng)?chuàng)意,包括最新定制的 AI 語音聲庫、自研音視頻大模型必剪 Studio 以及自研 AI 動(dòng)態(tài)漫技術(shù)等。
此外,B站自研的大語言模型系列也在此次 WAIC 2024 大會(huì)上首次展出,包括開源的 Index-1.9B chat 和 Index-1.9B character 兩個(gè)模型。
IT之家查詢 GitHub 獲悉,Index-1.9B 系列模型于 6 月開源,包含基座模型、對(duì)照組、對(duì)話模型、角色扮演模型:
Index-1.9B base : 基座模型,具有 19 億非詞嵌入?yún)?shù)量,在 2.8T 中英文為主的語料上預(yù)訓(xùn)練,多個(gè)評(píng)測(cè)基準(zhǔn)上與同級(jí)別模型比處于領(lǐng)先
Index-1.9B pure : 基座模型的對(duì)照組,與 base 具有相同的參數(shù)和訓(xùn)練策略,不同之處在于過濾了該版本語料中所有指令相關(guān)的數(shù)據(jù),以此來驗(yàn)證指令對(duì) benchmark 的影響
Index-1.9B chat : 基于 index-1.9B base 通過 SFT 和 DPO 對(duì)齊后的對(duì)話模型
Index-1.9B character : 在 SFT 和 DPO 的基礎(chǔ)上引入了 RAG 來實(shí)現(xiàn) fewshots 角色扮演定制
在B站 15 周年演講上,B站董事長兼 CEO 陳睿表示,2023 年,B站 AI 相關(guān)內(nèi)容的日均視頻播放量同比增長超過 80%,爆款內(nèi)容涵蓋科普資訊、AI 技術(shù)應(yīng)用、數(shù)字人和創(chuàng)意應(yīng)用等領(lǐng)域。
根據(jù)B站透露的數(shù)據(jù),當(dāng)前超過 8000 萬用戶每月在B站觀看 AI 相關(guān)的視頻,其中 6 成為 00 后。
Index-1.9B 系列模型開源地址:
https://github.com/bilibili/Index-1.9B
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。