IT之家5月17日消息,繼上線語音速記功能后,網(wǎng)易旗下產(chǎn)品有道云筆記又上線了另一實用的功能——文檔OCR(即文字識別)。據(jù)悉,新上線的OCR功能在原有的掃描功能進(jìn)行了升級,能夠幫助用戶輕松識別圖片、PDF等掃描文檔中的文字,并將其轉(zhuǎn)化成可編輯的文檔。
如果你還不了解新功能OCR究竟能為你做什么,那你一定遇到過以下這些情況,而OCR功能就是對這些“癥結(jié)”的那款“靈丹妙藥”:
· 工作或者科研學(xué)習(xí)中,要應(yīng)對大量的紙質(zhì)文件、書刊雜志、PDF格式的電子資料,很難對這些格式的資料進(jìn)行編輯和整理
· 讀書時,看到不錯的文章段落想要做書摘筆記,但又懶得去打字或是手抄整理
· 在微信、微博等內(nèi)容平臺看到有價值的圖片內(nèi)容會隨手保存mark,或是用截屏把手機(jī)頁面內(nèi)容保存到相冊,但這些圖片信息散亂在手機(jī)各處,很難進(jìn)行歸納、整理和檢索
以上難題,只需要5秒就能搞定!
那么,如何用OCR識別功能將紙質(zhì)資料、圖片和PDF文件,轉(zhuǎn)換為可以自由編輯的文本格式呢?
「紙質(zhì)文檔」OCR識別
把紙書、合同等紙質(zhì)文件、甚至墻體海報,轉(zhuǎn)換成可編輯的文本格式,只需三步:
step1:智能掃描
將有道云筆記升級為最新版后,點擊加號按鈕,新建一篇“文檔掃描”。
接下來就是見證實力的時刻,掃描過程中無需任何人工操作,軟件可以自動、精準(zhǔn)識別掃描圖像的邊框,去除掃描區(qū)域以外的多余背景,并且矯正偏斜,穩(wěn)!準(zhǔn)!狠!地將資料掃描進(jìn)來。
如果對自動掃描結(jié)果不夠滿意,還可以選擇手動調(diào)節(jié)模式進(jìn)行微調(diào)。
在掃描過程中,請盡量將文字?jǐn)[正,盡量剔除圖片中無關(guān)的部分,這樣可以大大提高文字識別的準(zhǔn)確度啊~
step2:掃描圖片濾鏡美化
掃描后的圖片會自動調(diào)節(jié)亮度和對比度,可以便捷的設(shè)置為增強(qiáng)或黑白模式,讓圖片更清晰。
step3:OCR識別,提取圖片內(nèi)文字
在進(jìn)行OCR之前,請先將掃描文檔進(jìn)行同步保存。選擇需要進(jìn)行文字識別的圖片后,點擊底部的“識別”按鈕,就能將這張掃描圖片內(nèi)的文字識別出來并轉(zhuǎn)換成一篇文字筆記。
識別出的文本會直接保存到有道云筆記內(nèi),多平臺同步,你可以在手機(jī)版、PC端、網(wǎng)頁端等任意平臺的有道云筆記內(nèi)進(jìn)行修改、編輯、整理。
在掃描圖片足夠清晰的情況下,文本識別的準(zhǔn)確率可以達(dá)到95%以上。
原圖片
識別文字
「圖片」OCR識別
如何將那些“鎖在”圖片里的文字提取出來?我們用一張hin長(包含了2000多字內(nèi)容)的微博長圖來為大家演示圖片OCR的用法和文字識別效果。
首先,進(jìn)入有道云筆記,選擇“上傳圖片”,將要識別處理的圖片同步保存到有道云筆記。
然后,在頁面底部找到“更多”按鈕,點擊“文本識別OCR”,就可以看到長圖內(nèi)的文字被完美識別出來了!
雖然網(wǎng)絡(luò)圖片的分辨率不是很高,并且單張圖片文字內(nèi)容較多,但是文字識別效果一點不含糊。
圖片 ←→ 識別文本
「PDF文檔」OCR識別
除掃描文檔、圖片外,有道云筆記(限會員)還可以PDF文本識別服務(wù),PDF輕松轉(zhuǎn)Word!
將PDF文檔上傳到有道云筆記,并完成同步后,點擊底部的“OCR”按鈕,經(jīng)過幾秒的等待后(視PDF文檔大小而定),就可以看到PDF內(nèi)的文字被識別出來,輕松轉(zhuǎn)化為可以自由編輯的筆記格式。
PDF文檔
識別文本
目前雙欄布局PDF文檔的文本識別支持度較差,暫時建議選擇一欄布局的PDF文檔進(jìn)行OCR識別。
另外,你還可以通過有道云筆記微信公眾號使用圖片OCR功能!只要在微信對話框內(nèi)把圖片發(fā)給云筆記,就能為你將圖片識別成文字。就像這樣↓
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。