Ocr技術(shù)識(shí)別率的影響因素有很多,所以提高Ocr技術(shù)識(shí)別率的方法也有很多。福昕全能王可以利用提高掃描圖片的質(zhì)量、顏色來提高
Ocr技術(shù)識(shí)別率,同時(shí)也可以提升福昕全能王的掃描設(shè)備來提高Ocr技術(shù)識(shí)別率。
Ocr技術(shù)識(shí)別率有多高
通用文字識(shí)別率:印刷體整體識(shí)別準(zhǔn)確率達(dá)95%以上,手寫體達(dá)90%以上。
卡證文字識(shí)別率:識(shí)別以身份證識(shí)別為例,身份證號(hào)碼識(shí)別準(zhǔn)確率達(dá)99.9%以上,姓名識(shí)別準(zhǔn)確率達(dá)99%以上。
票據(jù)單據(jù)識(shí)別率:以增值稅發(fā)票為例,發(fā)票代碼、價(jià)稅合計(jì)、合計(jì)金額、購買方識(shí)別號(hào)、開票日期等識(shí)別準(zhǔn)確率達(dá)到99%以上。
汽車相關(guān)識(shí)別率:行駛證和駕駛證的總體識(shí)別準(zhǔn)確率達(dá)96%以上,車牌識(shí)別、車輛 VIN 碼的準(zhǔn)確率達(dá)98%以上,算法精度均處于業(yè)內(nèi)領(lǐng)先水平。
行業(yè)文檔識(shí)別率:基于業(yè)內(nèi)領(lǐng)先的深度學(xué)習(xí)算法、表格文字的識(shí)別準(zhǔn)確率在92%以上,算式識(shí)別的準(zhǔn)確率在94%以上。
提高Ocr技術(shù)識(shí)別率的方法
1、選擇印刷質(zhì)量較好的文字文稿
文字文稿印刷質(zhì)量的好壞,直接影響著掃描后得到的文稿圖像的質(zhì)量,也必將影響到OCR的識(shí)別率。通常選擇正版的書籍、雜志等,再通過正確的掃描方法,就可得到質(zhì)量較高的
掃描文稿圖像,并得到較高的OCR識(shí)別率。掃描印刷質(zhì)量粗糙的文字文稿(如紙質(zhì)較差的報(bào)紙、盜版書籍等),很難得到滿意的OCR識(shí)別率。
2、正確設(shè)置和操作掃描儀
正確操作和設(shè)置掃描儀對(duì)掃描文稿的圖像質(zhì)量、OCR識(shí)別率有著至關(guān)重要的影響。在掃描過程中,除了文稿要擺放端正、平整(防止走光)外,還應(yīng)對(duì)掃描的彩色模式、分辨率等參數(shù)進(jìn)行正確的設(shè)置。
?、偕誓J剑荷誓J酵ǔ槿N:彩色、灰度和黑白二值。在運(yùn)用OCR識(shí)別軟件進(jìn)行掃描時(shí),一般將色彩模式設(shè)置為黑白二值,即通過掃描得到的圖像只有黑白兩種顏色。
?、诜直媛实脑O(shè)置:分辨率不能設(shè)置的過小,通常為300dpi,分辨率過小就不能保證OCR的識(shí)別效果.但分辨率數(shù)值也不要設(shè)得過高,數(shù)值過高會(huì)影響掃描速度,而且得到的掃描文稿圖像過大,使計(jì)算機(jī)的運(yùn)行速度降低。
3、利用圖像處理軟件提高掃描文稿的圖像質(zhì)量
對(duì)紙質(zhì)較差、印刷質(zhì)量不佳的文字文稿,可以在掃描后,再用圖形圖像處理軟件進(jìn)行處理,先改善掃描文稿的圖像質(zhì)量,然后再進(jìn)行OCR識(shí)別。
Ocr技術(shù)識(shí)別率影響因素
1.圖片的質(zhì)量,一般建議150dpi以上。
2.顏色,一般對(duì)彩色識(shí)別很差,黑白的圖片較高,因此建議ocr的為黑白tif格式。
3.最重要的就是字體,如果是手寫識(shí)別率很低。國內(nèi)OCR識(shí)別簡體差錯(cuò)率為萬分之三,如果要求更高的精度需要投入更大的人工干預(yù)。繁體識(shí)別由于繁體字庫的不統(tǒng)一性(民國時(shí)期的字庫和現(xiàn)在繁體字庫不統(tǒng)一),導(dǎo)致識(shí)別困難,在人工干預(yù)下,精度能達(dá)到90%以上。
Ocr技術(shù)識(shí)別率直接影響Ocr技術(shù)識(shí)別的結(jié)果,所以我們要提高Ocr技術(shù)識(shí)別率,提高Ocr技術(shù)識(shí)別率的方法有很多,大家可以去了解一下。