當(dāng)前位置: 首頁 > 儀表工具產(chǎn)品 > 專用工具 > 長度測量工具 > 直尺
發(fā)布日期:2022-07-14 點(diǎn)擊率:28
什么是OCR?
OCR (Optical Character Recognition,光學(xué)字符識別)是指電子設(shè)備(例如掃描儀或數(shù)碼相機(jī))檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機(jī)文字的過程,即針對印刷體字符,采用光學(xué)的方式將紙質(zhì)文檔中的文字轉(zhuǎn)換成為黑白點(diǎn)陣的圖像文件,并通過識別軟件將圖像中的文字轉(zhuǎn)換成文本格式,供文字處理軟件進(jìn)一步編輯加工的技術(shù)。
如何除錯或利用輔助信息提高識別正確率,是OCR最重要的課題,也是難點(diǎn)。衡量一個OCR系統(tǒng)性能好壞的主要指標(biāo)有:拒識率、誤識率、識別速度、用戶界面的友好性,產(chǎn)品的穩(wěn)定性,易用性及可行性等。所以在以往的案例中,OCR應(yīng)用一直是一項(xiàng)挑戰(zhàn)比較大的應(yīng)用類型。
OCR應(yīng)用的操作步驟如上所示,這其中字符的分割和示教是OCR應(yīng)用的難點(diǎn)。
先來講字符的分割,讓我們看看下面這些例子。在下圖中:每個字符之間有足夠的空隙,根據(jù)好字符的長寬尺寸,甚至不用刻意設(shè)置,軟件就很容易將每個字符獨(dú)立開來進(jìn)行識別,這是理想狀態(tài),會有很好的檢測穩(wěn)定性。
當(dāng)然也有糟糕的情況,而且這些情況還很常見,比如下面這些圖:點(diǎn)陣字符、字符間距很近。這樣的字串在分割的時候難度就比較大,很容易將一個字拆分成兩個,或者徹底分割不清,從而導(dǎo)致錯誤識別。如果字符分割不清對后續(xù)的字符示教會產(chǎn)生極為不利的影響。當(dāng)然這種情況有時可以調(diào)整噴碼機(jī)參數(shù)讓字符間距適當(dāng)加大。
更多的情況是由于生產(chǎn)線的抖動、包裝表面不平整、噴碼設(shè)備的性能降低等因素導(dǎo)致的字符位置變化、歪斜、波浪、彎曲、脫線、模糊等問題。二這些問題會使得打印出的字符和當(dāng)初示教的字符存在差異,當(dāng)差異過大時則會產(chǎn)生拒識、誤識。當(dāng)然我們可以將拒識的字符再次進(jìn)行示教錄入字庫,可是隨著時間的推移,我們可能需要不斷對拒識字符進(jìn)行示教,從而導(dǎo)致字庫過大,檢測速度降低。同時這套檢測設(shè)備的操作體驗(yàn)也會極差。
對于上述情況,BVI系列視覺軟件的OCR功能在操作體驗(yàn)上就有很大的提升,事實(shí)上也是性能的全面提升。讓我們盤點(diǎn)一下BVI軟件在OCR應(yīng)用上的優(yōu)勢:
1、內(nèi)置字庫,無需手動示教字符(也支持手動示教);
2、可定義格式字符格式,防止外形接近的數(shù)字和字母混亂;
3、一個ROI讀取多行字符;
4、OCR工具專屬定位功能;
5、預(yù)處理工具強(qiáng)化字符對比度;
6、讀取系統(tǒng)時間參與日期碼比對。
如上所述,BVI軟件的OCR操作就變成:拍照→設(shè)定ROI→設(shè)定字符大小→選擇字庫→讀取比對。“字符分割”變成“設(shè)定字符大小”后,從參數(shù)的輸入變成了圖形化區(qū)域繪制,操作更友好。“示教字符”變成“選擇字庫”后將繁重的示教工作變成了幾秒鐘的字庫選擇。這一切的性能提升就是為了讓OCR應(yīng)用更簡單更穩(wěn)定。
下一篇: PLC、DCS、FCS三大控
上一篇: AI賦能智能制造(一) |