掃一掃添加福昕福利官
文字識別 ocr
文字識別 ocr的原理是什么?
OCR文字識別的原理是計(jì)算機(jī)對圖像進(jìn)行版面分析?處理和模式識別?圖像版面分析是指通過對圖像文字的預(yù)處理,文字圖像的分割和坐標(biāo)定位;文字模式識別是通過檢測暗?亮的模式,放大圖像確定其形狀特征并進(jìn)行提取和判斷,最終通過圖像黑白點(diǎn)二進(jìn)制與字符編碼進(jìn)行匹配,根據(jù)最相近的匹配度將文字圖像特征進(jìn)行PDF文字轉(zhuǎn)換?
標(biāo)準(zhǔn)的OCR文字識別系統(tǒng)主要包括圖像處理模塊?版面分析模塊?文字識別模塊?文字校對模塊和輸出模塊?
(一)圖像處理模塊
主要是通過掃描儀設(shè)備將紙質(zhì)的期刊?學(xué)位等文獻(xiàn)數(shù)據(jù)進(jìn)行掃描,一般建議掃描成線圖模式(灰圖或彩色圖識別率低),擴(kuò)展名為tif圖格式,圖像分辨率為300DPI,圖像要進(jìn)行去污點(diǎn)?去黑邊?圖像居中和圖像糾偏等工作,最好不要有底紋,總之保持圖像為白底黑字,圖像頁面整潔從而提高文字識別率?
(二)版面分析模塊
可以分為自動(dòng)和手工兩種方式,自動(dòng)版面分析程序主要使用黑白二值法,逐頁將所有文字區(qū)域部分進(jìn)行畫框定位并存儲(chǔ)相應(yīng)的區(qū)域塊坐標(biāo);手工版面分析是指人工通過鼠標(biāo)在圖像文字區(qū)域進(jìn)行畫框,選擇特定區(qū)域進(jìn)行文字識別,這種方式主要應(yīng)用于需要從圖像提取特定區(qū)域的文字,有針對性的文字識別?另外還可以設(shè)置圖像文字的橫豎排版方式以及中外文字體信息等以提高文字識別率?版面分析模塊原理主要是對版面劃分?更改劃分,即對版面的理解?字切分?歸一化等,可選擇自動(dòng)或手動(dòng)兩種版面劃分方式?目的是告訴OCR軟件將同一版面的中英文字體?圖像?表格?橫版豎版方式等分開,以便于分別處理,并按照怎樣的順序進(jìn)行識別?
(三)文字識別模塊
文字識別模塊是OCR軟件的核心部分,文字識別主要使用了黑白二值法,以單個(gè)漢字“一”為例,將文字顏色取反,也就是白變成黑,黑變成白,以單字圖像區(qū)域分為上下兩部分,這種方式將每個(gè)字都可以劃分為不同區(qū)域,將不同區(qū)域的反選區(qū)域用二進(jìn)制的方式進(jìn)行轉(zhuǎn)換,將每個(gè)文字區(qū)域劃分后生成一個(gè)二進(jìn)制編碼,我們預(yù)先對每個(gè)標(biāo)準(zhǔn)的文字進(jìn)行二進(jìn)制編碼存放到數(shù)據(jù)庫中,用OCR文字識別完的結(jié)果與標(biāo)準(zhǔn)數(shù)據(jù)庫中的二進(jìn)制編碼進(jìn)行比對,從而選擇最接近的二進(jìn)制編碼文字,最終得到文字識別結(jié)果,如果沒有找到相似度高的編碼,則系統(tǒng)識別認(rèn)為有誤文字會(huì)以醒目的紅色顯示,提示用戶需進(jìn)行人工修改?文字識別模塊主要對單個(gè)圖像文字進(jìn)行識別,所以必須對圖像進(jìn)行逐行切割,對每行漢字通常也是逐字進(jìn)行識別,即單字識別,再進(jìn)行歸一化處理?
(四)文字校對模塊
文字校對主要分縱向校對和橫向校對,縱向校對是指按照順序把文字識別結(jié)果進(jìn)行排列,將識別結(jié)果所有相同文字進(jìn)行調(diào)用,顯示識別結(jié)果中所有相同的文字,調(diào)用識別結(jié)果同時(shí)調(diào)出對應(yīng)原圖進(jìn)行人工比對?橫向校對是指按照我們的閱讀習(xí)慣逐行進(jìn)行校對,顯示一行識別結(jié)果和對應(yīng)的原圖進(jìn)行校對,發(fā)現(xiàn)錯(cuò)字進(jìn)行人工修改,對識別結(jié)果經(jīng)常出錯(cuò)的文字,需要重新進(jìn)行標(biāo)準(zhǔn)文字編碼庫改寫,以達(dá)到文字精準(zhǔn)識別?
(五)輸出模塊
將校對無誤的文字可以輸出為文本或XML等格式,輸出的文本文字完全可以編輯了,同時(shí)原圖像文檔可以輸出PDF文檔用于瀏覽原圖,也可輸出符合移動(dòng)閱讀的電子出版ePub格式等?
文字識別 ocr
文字識別 ocr應(yīng)用場景
銀行身份認(rèn)證場景中,只需提交身份證信息,OCR 就能自動(dòng)識別出身份證上的姓名?性別?地址等信息并填報(bào)到系統(tǒng)中;
在企業(yè)資質(zhì)審核場景中,通過上傳營業(yè)執(zhí)照,OCR 將營業(yè)執(zhí)照的注冊號?企業(yè)名稱等信息識別出并填報(bào)到系統(tǒng)中,再通過營業(yè)執(zhí)照校驗(yàn)接口,自動(dòng)完成企業(yè)資質(zhì)校驗(yàn)?
如果大家想運(yùn)用文字識別 ocr技術(shù),可以使用文字識別軟件?如果大家想要證件識別?人臉識別?車牌識別都可以去福昕編輯器個(gè)人版?
版權(quán)聲明:除非特別標(biāo)注,否則均為本站原創(chuàng)文章,轉(zhuǎn)載時(shí)請以鏈接形式注明文章出處。
政企
合作
了解平臺(tái)產(chǎn)品
預(yù)約產(chǎn)品演示
申請產(chǎn)品試用
定制合作方案
福昕
福利官
掃一掃添加福昕福利官
了解平臺(tái)產(chǎn)品
預(yù)約產(chǎn)品演示
申請產(chǎn)品試用
定制合作方案
添加福昕福利官
微信掃碼
免費(fèi)獲取合作方案和報(bào)價(jià)