ocr光學(xué)識(shí)別系統(tǒng)是ocr技術(shù)的一部分,福昕全能王就是利用
ocr光學(xué)識(shí)別系統(tǒng)進(jìn)行掃描工作。福昕全能王有構(gòu)成ocr光學(xué)識(shí)別系統(tǒng)的基本硬件和軟件。下面我就帶大家一起來了解ocr光學(xué)識(shí)別系統(tǒng)。
ocr光學(xué)識(shí)別系統(tǒng)概念
光學(xué)字符識(shí)別是一種將鍵入或手寫的文本以及包含文本的打印圖像轉(zhuǎn)換為機(jī)器可讀的數(shù)字?jǐn)?shù)據(jù)格式的技術(shù)。OCR 算法有助于將大量紙質(zhì)文檔轉(zhuǎn)換為數(shù)字文件,從而促進(jìn)文本存儲(chǔ)、處理和搜索。
OCR 系統(tǒng)由硬件和軟件組成。硬件部分可以是
光學(xué)掃描儀或可以將紙質(zhì)文檔轉(zhuǎn)換為數(shù)字格式的類似設(shè)備。軟件部分是OCR算法本身。
OCR技術(shù)起源
OCR最早的概念是由德國(guó)人Tausheck最先提出的,1966年他們發(fā)表了第一篇關(guān)于
漢字識(shí)別的文章,采用了模板匹配法識(shí)別了1000個(gè)印刷體漢字。早在60、70年代,世界各國(guó)就開始有OCR的研究,而研究的初期,多以文字的識(shí)別方法研究為主,且識(shí)別的文字僅為0至9的數(shù)字。以同樣擁有方塊文字的日本為例,1960年左右開始研究OCR的基本識(shí)別理論,初期以數(shù)字為對(duì)象,直至1965至1970年之間開始有一些簡(jiǎn)單的產(chǎn)品,如印刷文字的郵政編碼識(shí)別系統(tǒng),識(shí)別郵件上的郵政編碼,幫助郵局作區(qū)域分信的作業(yè);也因此至今郵政編碼一直是各國(guó)所倡導(dǎo)的地址書寫方式。
OCR文字識(shí)別軟件系統(tǒng)
開發(fā)一個(gè)OCR文字識(shí)別軟件系統(tǒng),其目的很簡(jiǎn)單,只是要把影像作一個(gè)轉(zhuǎn)換,使影像內(nèi)的圖形繼續(xù)保存、有表格則表格內(nèi)資料及影像內(nèi)的文字,一律變成計(jì)算機(jī)文字,使能達(dá)到影像資料的儲(chǔ)存量減少、識(shí)別出的文字可再使用及分析,當(dāng)然也可節(jié)省因鍵盤輸入的人力與時(shí)間。
從影像到結(jié)果輸出,須經(jīng)過影像輸入、影像前處理、文字特征抽取、比對(duì)識(shí)別、最后經(jīng)人工校正將認(rèn)錯(cuò)的文字更正,將結(jié)果輸出。
通過ocr光學(xué)識(shí)別系統(tǒng)可以有效的促進(jìn)ocr識(shí)別技術(shù)的發(fā)展,目前我們?nèi)粘I町?dāng)中已經(jīng)很多的領(lǐng)域都運(yùn)用了ocr光學(xué)識(shí)別系統(tǒng)。