現(xiàn)在很多人都會(huì)使用手機(jī)來(lái)拍攝資料,這樣比較方便,在拍攝完之后,都會(huì)使用識(shí)別軟件去識(shí)別這些資料,今天小編就給大家介紹一下
手機(jī)版圖片文字識(shí)別的步驟是什么?ocr識(shí)別率是怎么評(píng)估的?
手機(jī)版圖片文字識(shí)別的步驟是什么?
方法一:文字識(shí)別工具
第一步:首先,點(diǎn)擊【相冊(cè)識(shí)別】。
第二步:將需要識(shí)別圖片添加進(jìn)去,之后點(diǎn)擊【下一步】。接著靜靜等待識(shí)別完成。
第三步:圖片完成識(shí)別之后,可以根據(jù)自己的需求進(jìn)行【復(fù)制】或者【導(dǎo)出】。
方法二:微信識(shí)別
微信是大家都經(jīng)常用的溝通工具,但微信的功能也并不只有溝通,還能夠進(jìn)行
圖片文字識(shí)別的操作。具體步驟如下:
第一步:首先,將需要識(shí)別的圖片發(fā)送到任意一個(gè)對(duì)話框中去。長(zhǎng)按圖片點(diǎn)擊【提取文字】,接著等待文字提取完成。
第二步:提取完成之后可以將文字進(jìn)行【復(fù)制】或者【分享】。
ocr識(shí)別率是怎么評(píng)估的?
同一OCR算法對(duì)于不同質(zhì)量的樣本的識(shí)別率是不一樣的,圖像清晰的印刷掃描件的識(shí)別率絕對(duì)比手寫(xiě)體的識(shí)別率要高,這是肯定的,在不說(shuō)明樣本的前提下評(píng)估單個(gè)OCR算法識(shí)別率沒(méi)有實(shí)質(zhì)意義。所以要評(píng)估OCR算法應(yīng)該是要做幾種算法之間的對(duì)比。
首先,要準(zhǔn)備好一批足夠有區(qū)分度的樣本,就是樣本質(zhì)量的偏差要大一些,有好有壞,這樣才能檢測(cè)出不同算法的優(yōu)劣。
然后,看可識(shí)別字符的比例。如果有質(zhì)量過(guò)低的樣本,OCR識(shí)別可能是不輸出結(jié)果的,所以要考慮哪些算法對(duì)圖像的寬容度更高。
接下來(lái)才是統(tǒng)計(jì)準(zhǔn)確率。在準(zhǔn)確率的統(tǒng)計(jì)上也有幾種不同的標(biāo)準(zhǔn)。
第一種是字符準(zhǔn)確率,單字識(shí)別率,就是按單字算,一百個(gè)字里錯(cuò)5個(gè)字,識(shí)別率95%。
第二種是字段準(zhǔn)確率,整行識(shí)別率,一個(gè)字段算一個(gè)整體,假如100個(gè)字分為20個(gè)字段,里面錯(cuò)了5個(gè)字,分布在4個(gè)字段里,那么識(shí)別率是16/20=80%。
第三種是整張準(zhǔn)確率。通常在票據(jù)證件里面有這種計(jì)算方式,假設(shè)一張票據(jù)上有20字,4個(gè)字段,5張票上100個(gè)字,20字段,錯(cuò)了5個(gè)字,分布在4個(gè)字段里,分布在3張票據(jù)上。那么識(shí)別率只有2/5=40%。而且票據(jù)字段越多,容易出錯(cuò)的概率越高,整張識(shí)別率這個(gè)要求就越嚴(yán)苛。實(shí)測(cè)過(guò)程中也會(huì)有一些特別約定,說(shuō)整張識(shí)別里錯(cuò)一兩個(gè)字可以忽略的,這種再另說(shuō)。
ocr識(shí)別技術(shù)的優(yōu)勢(shì)是什么?
ocr文字識(shí)別技術(shù)的智能化程度非常高,所以簡(jiǎn)化了使用的操作步驟,實(shí)現(xiàn)一鍵式識(shí)別。如果使用過(guò)其它文字識(shí)別軟件,一定知道軟件的操作非常的繁瑣,首先文件要進(jìn)行預(yù)處理,文件添加后還要在軟件中進(jìn)行各種調(diào)整達(dá)到軟件的識(shí)別要求才能進(jìn)行識(shí)別,這些對(duì)于新手來(lái)說(shuō)是難以接受的。
以上就是小編給大家介紹的手機(jī)版圖片文字識(shí)別的步驟是什么?ocr識(shí)別率是怎么評(píng)估的?大家在識(shí)別圖片文字的時(shí)候,也可以使用福昕全能王,福昕全能王可以在手機(jī)上下載,也可以在電腦上下載。