清華首個虛擬學(xué)生華智冰露臉唱歌，小冰公司：實現(xiàn)完全虛擬生成不存在的面部

2021/9/30 8:25:23 來源：IT之家作者：遠(yuǎn)洋 責(zé)編：遠(yuǎn)洋

評論：

IT之家 9 月 30 日消息近日清華虛擬學(xué)生華智冰彈唱歌曲的視頻走紅網(wǎng)絡(luò)，這也是團(tuán)隊首次發(fā)布其正面露臉視頻。華智冰是由清華大學(xué)計算機(jī)系、北京智源研究院、智譜 AI 和小冰公司聯(lián)合培養(yǎng)，是中國首個原創(chuàng)虛擬學(xué)生，已在清華園里開啟學(xué)習(xí)和研究生涯。

小冰公司對此發(fā)表了聲明，聲明中小冰解釋了華智冰項目的初衷：希望能夠以智能模型作為核心，試驗預(yù)訓(xùn)練模型能夠帶來哪些技術(shù)與應(yīng)用方面的驚喜。

小冰公司在聲明中還稱，新的產(chǎn)品化技術(shù)實現(xiàn)了完全虛擬生成不存在的面部，且具有足夠豐富的 features，從而能夠?qū)崿F(xiàn)精度更高的視覺化交互內(nèi)容。視頻中人物的面部特征，包括人臉、表情、口型等，全部由人工智能小冰框架 X Avatar 生成并進(jìn)行融合；視頻中的人物肢體、動作，包括手持吉他彈唱，來源于小冰團(tuán)隊成員魚子醬醬錄制的原始視頻模版。視頻中的歌聲，由人工智能小冰框架 X Studio 生成。

據(jù)悉，華智冰將師從清華大學(xué)唐杰教授，即日起開啟在清華大學(xué)的學(xué)習(xí)和研究生涯。

IT之家了解到，華智冰是由清華大學(xué)計算機(jī)系、北京智源研究院、智譜 AI 和小冰公司聯(lián)合培養(yǎng)，可以作詩作曲，生成圖畫，還將具有一定的推理和情感交互的能力，而她來到清華的第一年將通讀“天下書”，不斷地為其輸入各種語料；第二年進(jìn)入“精讀”階段，引導(dǎo)華智冰對語料背后的邏輯有更深刻的理解；第三年則培養(yǎng)她的創(chuàng)造力，從此有望在多項認(rèn)知智能上超過人類。華智冰智商和情商雙高，可以作詩、作畫、創(chuàng)作劇本殺，還具有一定的推理和情感交互的能力。不同于一般的虛擬人物，華智冰背后依托的是中國“悟道”超大規(guī)模人工智能模型。

以下為小冰公司的具體聲明：

隨著視覺化交互內(nèi)容（如短視頻）的不斷深化，對于人物出鏡交互的需求越來越多。但是，由于人類的行為存在各種不穩(wěn)定性，常常給商業(yè)機(jī)構(gòu)和品牌方帶去很大的風(fēng)險與不確定性。對此，越來越多的商業(yè)機(jī)構(gòu)、內(nèi)容制作方與品牌方，呼喚一種安全可控的虛擬人類內(nèi)容（含商業(yè)代言）產(chǎn)品化技術(shù)。

但是，已往付諸產(chǎn)品化的技術(shù)存在諸多問題：它無法像真實人類一樣，生成足夠豐富的面部 features，且無法打通生成與替換的端到端流程。因此，只能實現(xiàn)真實人類面部間的替換，精度質(zhì)量不足。

更嚴(yán)重的問題是，以往的方法無法從根源上避免隱私侵權(quán)風(fēng)險。

新的產(chǎn)品化技術(shù)實現(xiàn)了完全虛擬生成不存在的面部，且具有足夠豐富的 features，從而能夠?qū)崿F(xiàn)精度更高的視覺化交互內(nèi)容。尤其是，由于從根源上避免了使用任何真實人類面部的可能性，有效阻斷以往技術(shù)無法避免的隱私侵權(quán)問題。從隱私角度，是一個重要的進(jìn)步。

我們相信，虛擬人將成為未來視頻內(nèi)容的主要提供者之一，而安全、可控、無隱私風(fēng)險和侵權(quán)風(fēng)險是其前提。因此，小冰一直在這一趨勢方向上進(jìn)行探索，并從不同方面對這一領(lǐng)域做拓展研究。小冰與清華大學(xué)計算機(jī)系合作華智冰項目，正是在預(yù)訓(xùn)練模型方面進(jìn)行合作，希望能夠以智能模型作為核心，試驗預(yù)訓(xùn)練模型能夠帶來哪些技術(shù)與應(yīng)用方面的驚喜。

這次傳播的視頻，來自小冰發(fā)布會的進(jìn)展匯報展示，為華智冰能力續(xù)寫了一些新的進(jìn)展，demo 小冰框架下最新的面部生成和 3D 視頻封裝技術(shù)成果。具體來說：視頻中人物的面部特征，包括人臉、表情、口型等，全部由人工智能小冰框架 X Avatar 生成并進(jìn)行融合；視頻中的人物肢體、動作，包括手持吉他彈唱，來源于小冰團(tuán)隊成員魚子醬醬錄制的原始視頻模版。視頻中的歌聲，由人工智能小冰框架 X Studio 生成。

除此之外，華智冰除了 3D 面部生成，以及歌聲合成的優(yōu)化，還有其他很多更底層的、涉及數(shù)字人“大腦”的新技術(shù)應(yīng)用，例如在有機(jī)融合了知識圖譜和預(yù)訓(xùn)練模型后，可以讓數(shù)字人有常識和推理能力。華智冰正在不斷“成長”中，還會有更多最新技術(shù)的應(yīng)用，敬請期待。

小冰公司

2021 年 9 月 29 日

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

清華首個虛擬學(xué)生華智冰露臉唱歌，小冰公司：實現(xiàn)完全虛擬生成不存在的面部

相關(guān)文章

清華首個虛擬學(xué)生華智冰露臉唱歌，小冰公司：實現(xiàn)完全虛擬生成不存在的面部