光學字符識別(OCR)是工業(yè)環(huán)境中的重要技術。OCR技術在辦公室通信中尤為出色。紙張文件(如發(fā)票,發(fā)貨單和其他記錄)的掃描可以將其快速轉換為數(shù)字格式,從中提取相關信息,并將這些數(shù)據整合到一個連續(xù)的電子信息流中。

字符識別中機器視覺如何深度學習技術?-機器視覺_視覺檢測設備_3D視覺_缺陷檢測

  機器視覺使得可以基于印刷或沖壓字符可靠地識別整個價值鏈中的工件和產品。借助于現(xiàn)代深度學習技術和卷積神經網絡(CNN),某些字體可以以字體識別率顯著提高的方式進行訓練。該方法也在工業(yè)設計和生產過程中發(fā)揮關鍵作用,特別是在工業(yè)4.0或工業(yè)物聯(lián)網的背景下。

  印刷字母或數(shù)字組合使得可以清楚和快速地識別組件并使其可用于自動化過程鏈。使用光學字符識別,諸如掃描儀和攝像機之類的圖像采集設備記錄數(shù)字圖像信息,并將其轉換成光柵圖形,將文本準確地表示為后面一個像素。 OCR軟件讀出這些圖形,識別數(shù)字組合或字母,并將它們組合成單詞或甚至整個句子。機器視覺技術支持設計和生產過程中字符組合的光學識別。這些技術包括針對工業(yè)環(huán)境的特殊要求的特定功能。

  例如,經過深思熟慮的分類技術即使在困難的條件下也能確保非常高的識別率。也可以毫無問題地識別模糊或傾斜的文字,即使是打印到或蝕刻到反射表面或高度紋理的彩色背景上的扭曲的字母或字符。

  深度學習技術的特點是分析大量的數(shù)字圖像數(shù)據,從而訓練必須識別的某些對象的模型。這對于物理對象以及字母或數(shù)字都有用。標簽附加到標識對象的數(shù)據,例如“狗”或“字母A”。現(xiàn)在可以基于經過訓練的模型對新記錄的圖像信息的內容進行可靠的聲明。因此,每當新圖像被“標記”時,該技術就會得到學習。這增加了可靠地識別盡可能多的不同版本的圖像內容的可能性,例如其他種類的狗或具有變化的字體或形狀的字符。