IT之家 3 月 22 日消息,阿里 M6 大模型的原帶頭人楊紅霞已于去年 9 月因個(gè)人家庭原因從阿里巴巴達(dá)摩院智能計(jì)算實(shí)驗(yàn)室離職。36 氪從多處獨(dú)立信源獲悉,楊紅霞現(xiàn)已加入字節(jié) AI Lab(人工智能實(shí)驗(yàn)室),參與語(yǔ)言生成大模型的研發(fā)。
有知情人士稱,楊紅霞在語(yǔ)言生成大模型團(tuán)隊(duì)中處于領(lǐng)導(dǎo)地位,直接向字節(jié)跳動(dòng)副總裁楊震原匯報(bào)。
據(jù)公開(kāi)資料,楊紅霞 2007 年本科畢業(yè)于南開(kāi)大學(xué),后前往美國(guó)杜克大學(xué)統(tǒng)計(jì)科學(xué)系攻讀博士學(xué)位,師從 David Dunson 教授。博士畢業(yè)后,楊紅霞先入職 IBM 全球研發(fā)中心任 Watson 研究員,之后入職雅虎公司,擔(dān)任首席數(shù)據(jù)科學(xué)家。
據(jù)IT之家所知,她在人工智能領(lǐng)域國(guó)際會(huì)議、頂級(jí)期刊有上百篇頂級(jí)論文。2022 年 6 月,楊紅霞入選 2022 福布斯中國(guó)科技女性 50 榜。
2016 年,楊紅霞結(jié)束了她在美國(guó)近 10 年的留學(xué)及工作生涯回國(guó),去往杭州加入阿里巴巴集團(tuán)。而阿里大模型 M6 正是楊紅霞在任期間的最突出成就,在她離職之前一直是阿里達(dá)摩院超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型 M6 的技術(shù)負(fù)責(zé)人。
楊紅霞領(lǐng)導(dǎo)的阿里巴巴達(dá)摩院 M6 團(tuán)隊(duì)致力于認(rèn)知智能方向,此前已經(jīng)研發(fā)出了 AliGraph、M6、洛犀等較為有影響力的人工智能開(kāi)源平臺(tái)和系統(tǒng),在美國(guó)和中國(guó)注冊(cè)的專利超過(guò) 30 項(xiàng)。
M6 是一項(xiàng)通用性 AI 大模型,擁有多模態(tài)、多任務(wù)能力,尤其擅長(zhǎng)設(shè)計(jì)、寫(xiě)作、問(wèn)答,在電商、制造業(yè)、文學(xué)藝術(shù)、科學(xué)研究等領(lǐng)域都具有廣泛應(yīng)用前景。
M6 于 2021 年 3 月首次發(fā)布,是國(guó)內(nèi)首個(gè)千億參數(shù)多模態(tài)大模型,后續(xù)又通過(guò) 480 塊 GPU 更迭至萬(wàn)億參數(shù),再在 512 GPU 的基礎(chǔ)上成功在 10 天內(nèi)訓(xùn)練出 10 萬(wàn)億模型,與 GPT-3 具有同等參數(shù)規(guī)模,但能耗僅為其 1%。
值得一提的是,OpenAI 前政策主管 Jack Clark 當(dāng)時(shí)曾贊揚(yáng)道:這個(gè)模型的規(guī)模和設(shè)計(jì)都非常驚人。這看起來(lái)像是眾多中國(guó)的 AI 研究組織逐漸發(fā)展壯大的一種表現(xiàn)。
值得一提的是,阿里巴巴技術(shù)副總裁賈揚(yáng)清昨日也宣布從阿里巴巴畢業(yè),表示將走向職業(yè)生涯的下一個(gè)挑戰(zhàn)。據(jù)稱,其計(jì)劃創(chuàng)業(yè)的方向?qū)儆谑?AI 基礎(chǔ)設(shè)施提供商,關(guān)注包括大模型在內(nèi)的 AI 應(yīng)用。
據(jù)公開(kāi)資料,賈揚(yáng)清為浙江紹興人,本科和研究生階段就讀于清華大學(xué)自動(dòng)化專業(yè),后赴加州大學(xué)伯克利分校攻讀計(jì)算機(jī)科學(xué)博士。他在博士期間創(chuàng)立并開(kāi)源了如今業(yè)內(nèi)耳熟能詳?shù)纳疃葘W(xué)習(xí)框架 Caffe,被微軟、雅虎、英偉達(dá)、Adobe 等公司采用。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。