在工作中,我們經(jīng)常會(huì)識(shí)別很多的掃描件,有的小伙伴在識(shí)別的時(shí)候發(fā)現(xiàn)結(jié)果不準(zhǔn)確,今天小編就給大家介紹一下
掃描件識(shí)別的步驟是什么?ocr識(shí)別不準(zhǔn)的原因有哪些?大家可以了解一下。
掃描件識(shí)別的步驟是什么?
1、如果想對(duì)掃描件圖片進(jìn)行識(shí)別,我們就需要借助相關(guān)
OCR文字識(shí)別工具來實(shí)現(xiàn)。
2、通過百度搜索下載福昕全能王并安裝運(yùn)行,從打開的程序主界面中,通過視圖查看以選擇相應(yīng)的圖片文件進(jìn)入掃描過程。
3、當(dāng)成功打開相應(yīng) 的圖片文件后,我們就可以在工具欄界面中,點(diǎn)擊‘頁面解析“按鈕,此時(shí)就自動(dòng)針對(duì)文字區(qū)域進(jìn)行識(shí)別。
4、對(duì)于自動(dòng)識(shí)別后的文字區(qū)域,我們還可以對(duì)其進(jìn)行更近一步的編輯操作。右擊對(duì)應(yīng)的文字區(qū)域選擇“刪除”項(xiàng)即可刪除區(qū)域。
5、同時(shí)我們還可以利用鼠標(biāo)針對(duì)想要進(jìn)行識(shí)別的區(qū)域進(jìn)行框選,之后點(diǎn)擊“識(shí)別”按鈕,即可針對(duì)相關(guān)文字區(qū)域進(jìn)行識(shí)別。
6、針對(duì)識(shí)別后的文字內(nèi)容,我們還可以更近一步的進(jìn)行編輯操作。在此可以直接對(duì)相關(guān)文字區(qū)域內(nèi)容進(jìn)行編輯。也可以將文字內(nèi)容導(dǎo)出到Word文檔中進(jìn)行操作。
ocr識(shí)別不準(zhǔn)的原因有哪些?
1:是否是常規(guī)字體,手寫體和特殊藝術(shù)字體,OCR很難有準(zhǔn)確的識(shí)別率。
2:是否有大量特殊符號(hào),行業(yè)特殊符號(hào)OCR也無法保證識(shí)別準(zhǔn)確率。
3:注意掃描文件或者圖片的背景與文字前景的對(duì)比度,對(duì)比度是影響識(shí)別率和準(zhǔn)確率的核心參數(shù)??捎霉ぞ呷コ尘爸械碾s色,雜點(diǎn),噪點(diǎn)。
4:掃描文件或者圖片的亮度,調(diào)整到合適的亮度,可以有效提高識(shí)別率和準(zhǔn)確率。
5:設(shè)置合適的分辨率。
6:如果原圖像或者掃描件歪斜,請(qǐng)校正。
7:選擇正確的識(shí)別區(qū)域。
8:在
掃描文檔時(shí),設(shè)置合適的掃描參數(shù),或者在拍攝時(shí),擺正文字區(qū)域,切忌歪斜。
ocr文字識(shí)別是什么?
OCR是英文optical character recognition的縮寫,意思是:文字識(shí)別
OCR(optical character recognition)文字識(shí)別是指電子設(shè)備(例如掃描儀或數(shù)碼相機(jī))檢查紙上打印的字符,然后用字符識(shí)別方法將形狀翻譯成計(jì)算機(jī)文字的過程;即,對(duì)文本資料進(jìn)行掃描,然后對(duì)圖像文件進(jìn)行分析處理,獲取文字及版面信息的過程。
OCR文字識(shí)別很重要的一個(gè)技術(shù)參數(shù),就是識(shí)別率。就拿身份證識(shí)別來舉例子,就會(huì)涉及到兩個(gè)問題。身份證識(shí)別出來的最終目的是要有格式,供直接錄入系統(tǒng),姓名項(xiàng)、地址項(xiàng)、身份證號(hào)項(xiàng)都黏在一起,就沒辦法使用了;
目前身份證識(shí)別率能達(dá)到98%以上,如果拿通用OCR文字識(shí)別來識(shí)別,識(shí)別率達(dá)不到如此高識(shí)別率,需要專門針對(duì)身份證進(jìn)行校正優(yōu)化。所以O(shè)CR文字識(shí)別根據(jù)特殊識(shí)別內(nèi)容,形成了多個(gè)產(chǎn)品出來。
以上就是小編給大家介紹的掃描件識(shí)別的步驟是什么?ocr識(shí)別不準(zhǔn)的原因有哪些?大家可以了解一下,在識(shí)別的時(shí)候,一定要選擇清晰的圖片。