ocr字符識別是二十一世紀的產物,目前ocr字符識別技術的應用無處不在。我們在平時生活中可能察覺不到它的存在,例如福昕全能王這款軟件就是利用的
ocr字符識別技術。下面我?guī)Т蠹襾砹私鈕cr字符識別。
ocr字符識別是什么?
OCR是英文Optical Character Recognition的縮寫,意思是光學字符識別,也可簡單地稱為文字識別或字符識別,是文字自動輸入的一種方法。它通過掃描和攝像等光學輸入方式獲取紙張上的文字圖像信息,利用各種模式識別算法分析文字形態(tài)特征,可以將票據、報刊、書籍、文稿及其它印刷品轉化為圖像信息,再利用字符識別技術將圖像信息轉化為可以使用的計算機輸入技術。目前字符識別技術已廣泛應用于生產線,能夠對產線產品、原料上面的字進行
自動掃描、識別并存儲備用。
ocr字符識別發(fā)展歷程
OCR的概念是在1929年由德國科學家Tausheck最早提出來的,后來美國科學家Handel也提出了利用技術對文字進行識別的想法。而最先對印刷體漢字識別進行研究的是IBM公司的Casey和Nagy,1966年他們發(fā)表了第一篇關于漢字識別的文章,采用了模板匹配法識別了1000個印刷體漢字。
早在60、70年代,世界各國就開始有OCR的研究,而研究的初期,多以文字的識別方法研究為主,且識別的文字僅為0至9的數字。以一樣擁有方塊文字的日本為例,1960年左右開始研究OCR的基本識別理論,初期以數字為對象,直至1965至1970年之間開始有一些簡單的產品,如印刷文字的郵政編碼識別系統(tǒng),識別郵件上的郵政編碼,幫助郵局做區(qū)域分信的做業(yè);也所以至今郵政編碼一直是各國所倡導的地址書寫方式。
20世紀70年代初,日本的學者開始研究漢字識別,并作了大量的工做。中國在OCR技術方面的研究工做起步較晚,在70年代才開始對數字、英文字母及符號的識別進行研究,70年代末開始進行漢字識別的研究,到1986年,我國提出“863”高新科技研究計劃,漢字識別的研究進入一個實質性的階段,清華大學的丁曉青教授和中科院分別開發(fā)研究,相繼推出了中文OCR產品,現為中國最領先漢字OCR技術。早期的OCR軟件,因為識別率及產品化等多方面的因素,未能達到實際要求。同時,因為硬件設備成本高,運行速度慢,也沒有達到實用的程度。只有個別部門,如信息部門、新聞出版單位等使用OCR軟件。進入20世紀90年代之后,隨著平臺式掃描儀的普遍應用,以及我國信息自動化和辦公自動化的普及,大大推進了OCR技術的進一步發(fā)展,使OCR的識別正確率、識別速度知足了廣大用戶的要求。
ocr字符識別應用有哪些?
1、證件識別:主要識別證件信息,用于金融、銀行、保險、汽車等領域(互聯(lián)網),支持大陸二代身份證、臺灣身份證、香港身份證、澳門身份證、護照、行駛證、駕駛證、港澳臺通行證等20余種證件識別。
福昕全能王 2.銀行卡識別:主要識別銀行卡卡號,用于移動支付綁卡,提升APP用戶體驗(互聯(lián)網)。
3.車牌識別:主要識別車牌號碼、車牌顏色、車牌類型、車標、車身顏色等車輛特征信息,用于移動警務,占道停車,停車場管理,車險等領域(互聯(lián)網)中,支持識別普通藍牌、黃牌(雙層)、軍牌(雙)、武警牌(雙)、警牌、農用車牌、大使館車牌等各種常見規(guī)格的汽車號牌。
4.名片識別:主要識別名片內容,用于移動展業(yè)、CRM客戶管理系統(tǒng)等領域(互聯(lián)網),支持橫版、豎版名片識別,及其他板式的各種名片,還支持多語種名片識別。
5.營業(yè)執(zhí)照識別:主要識別營業(yè)執(zhí)照信息(統(tǒng)一社會信用代碼、公司名稱、二維碼等),用于需要代替人工提取營業(yè)執(zhí)照信息的領域(互聯(lián)網)。
6.汽車VIN碼識別:主要識別車架號(汽車VIN碼),用于汽車管理、汽車服務、二手車交易、租車等領域(互聯(lián)網)。
7.票據類OCR識別:主要識別增值稅發(fā)票等不同格式的票據內容,用于財務管理、汽車、銀行、金融等領域(互聯(lián)網),基于模板機制,針對不同的票據,定制不同的識別要素。
8.文檔文字OCR識別:主要識別文檔文字,用于圖書館,報社等針對圖書、報紙、雜志等文本類,需要把這些紙質文檔進行電子化的領域(互聯(lián)網),需借助在掃描儀,目前有移動端的文檔OCR識別、文檔識別掃描儀,隨著掃描儀分辨率的提升,OCR軟件也在不斷升級,掃描儀廠商現在已經把專業(yè)的OCR軟件搭配自己生產的掃描儀出售。
我們可以利用ocr字符識別技術進行身份證識別、人臉識別、文件和車牌識別,福昕全能王就是利用了ocr字符識別這些功能來完成掃描工作。