設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色
22.98 万元起比亚迪唐 L 上市    支付宝推出“碰一下”进小区

人工智能技術(shù)加持,新一代通用視覺技術(shù)體系“書生”正式發(fā)布

2021/11/18 9:19:13 來源:IT之家 作者:長河 責(zé)編:長河

IT之家 11 月 18 日消息,昨日,上海人工智能實驗室聯(lián)合商湯科技 SenseTime、香港中文大學(xué)、上海交通大學(xué)共同發(fā)布新一代通用視覺技術(shù)體系“書生”(INTERN),該體系旨在系統(tǒng)化解決當(dāng)下人工智能視覺領(lǐng)域中存在的任務(wù)通用、場景泛化和數(shù)據(jù)效率等一系列瓶頸問題。

圖片

▲ 圖源:上海人工智能實驗室

目前,技術(shù)報告《INTERN: A New Learning Paradigm Towards General Vision》已在 arXiv 平臺發(fā)布,基于“書生”的通用視覺開源平臺 OpenGVLab 也將在明年年初正式開源,向?qū)W術(shù)界和產(chǎn)業(yè)界公開預(yù)訓(xùn)練模型及其使用范式、數(shù)據(jù)系統(tǒng)和評測基準(zhǔn)等。

根據(jù)相關(guān)技術(shù)報告,一個“書生”基模型即可全面覆蓋分類、目標(biāo)檢測、語義分割、深度估計四大視覺核心任務(wù)。

上海人工智能實驗室表示,相較于當(dāng)前最強開源模型(OpenAI 于 2021 年發(fā)布的 CLIP),“書生”在準(zhǔn)確率和數(shù)據(jù)使用效率上均取得大幅提升。具體而言,基于同樣的下游場景數(shù)據(jù),“書生”在分類、目標(biāo)檢測、語義分割及深度估計四大任務(wù) 26 個數(shù)據(jù)集上的平均錯誤率分別降低了 40.2%、47.3%、34.8% 和 9.4%。

IT之家了解到,通用視覺技術(shù)體系“書生”(INTERN)由七大模塊組成,包括通用視覺數(shù)據(jù)系統(tǒng)、通用視覺網(wǎng)絡(luò)結(jié)構(gòu)、通用視覺評測基準(zhǔn)三個基礎(chǔ)設(shè)施模塊,以及區(qū)分上下游的四個訓(xùn)練階段模塊。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:人工智能,通用視覺
  • 日榜
  • 周榜
  • 月榜

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知