文字識別OCR全球測試成績發(fā)布：中國包攬前五

2018/11/20 14:30:09 來源：新浪科技作者：辛苓責(zé)編：騎士

評論：

11月20日下午消息，今天，國際文檔分析與識別大會（ICDAR）數(shù)據(jù)集最新結(jié)果公布，中國高校及企業(yè)包攬排行榜前五。

ICDAR2015數(shù)據(jù)集前五名及框架名稱分別是：云從科技（Pixel-Anchor）、南京大學(xué)與南京理工大學(xué)（PSENet）、曠視科技（Mask Text）、商湯科技（FOTS）、阿里巴巴（IncepText）。

ICDAR2017 MLT數(shù)據(jù)集前五名及框架名稱分別是云從科技（Pixel-Anchor）、阿里巴巴（ATL-cangjie）、商湯科技（FOTS）、南京大學(xué)（PSENet_NJU）、曠視科技（EAST++）。

國際文檔分析與識別大會（ICDAR）專注于文本領(lǐng)域的識別與應(yīng)用，自2003年大會設(shè)立“Robust Reading Competitions”以來，該競賽就成了評測和檢驗(yàn)自然場景/網(wǎng)絡(luò)圖片/復(fù)雜視頻文本自動提取與智能識別最新技術(shù)研究進(jìn)展的最為重要的國際賽事及標(biāo)準(zhǔn)，至今已有全球89個國家的3500多支隊(duì)伍參與。

截至目前，全球頂級的高校、科研機(jī)構(gòu)及企業(yè)都參加過這項(xiàng)測試，包括Google、Microsoft、Amazon、Facebook，以及中國的騰訊、搜狗、北京大學(xué)、中國科學(xué)技術(shù)大學(xué)等。

OCR（Optical Character Recognition）是指對輸入圖像進(jìn)行分析識別處理，獲取圖像中文字信息的過程，具有廣泛的應(yīng)用場景。而自然場景中的OCR技術(shù)不需要針對特殊場景進(jìn)行定制，可以識別任意場景圖片中的文字。

和面對高質(zhì)量文檔圖像的傳統(tǒng)OCR相比，自然場景OCR跳出了對輸入圖像的質(zhì)量和場景束縛，能夠在更寬泛的領(lǐng)域中獲取應(yīng)用，引起了學(xué)術(shù)界以及工業(yè)界的極大關(guān)注。

但相較于傳統(tǒng)OCR，自然場景OCR中的各種商品、布景或自然場景圖片中的文本檢測與識別面臨著復(fù)雜背景干擾、文字的模糊與退化、不可預(yù)測的光照、字體的多樣性、垂直文本、傾斜文本等眾多挑戰(zhàn)。

OCR是計(jì)算機(jī)視覺領(lǐng)域的經(jīng)典問題，長久以來，一直受到學(xué)術(shù)界和工業(yè)界的持續(xù)關(guān)注。在工業(yè)界，Google、Microsoft、Amazon等大型互聯(lián)網(wǎng)公司都在OCR技術(shù)上耕耘多年。隨著技術(shù)不斷成熟，OCR也開始在互聯(lián)網(wǎng)及其他行業(yè)逐步上線使用，應(yīng)用范圍也從文檔識別擴(kuò)展到照片分析、車牌識別，圖片廣告過濾，場景理解，商品識別，街景定位，票據(jù)識別等廣泛的領(lǐng)域。

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

文字識別OCR全球測試成績發(fā)布：中國包攬前五

相關(guān)文章