光學特徵識別是將文本圖像轉換為機器可讀文本格式的過程。
該技術的發明是為了解決與文本編輯者無法編輯,搜索或計算圖像文件中的單詞相關的問題。
OCR特別重要,因為增加數字化要求企業從印刷媒體中接收信息,而傳統上很難存儲和管理。這包括對身份文檔的掃描,例如護照或駕駛執照,其中還包括可用於生物特徵識別綁定的照片。
通過OCR掃描圖像消除了手動干預,並可以將文本圖像轉換為文本數據,以後可以通過其他業務軟件對此進行分析。
公司可以使用數據來進行分析,簡化操作,自動化流程並提高生產力。
OCR如何工作?
OCR系統包括硬件和軟件組件。該硬件用於物理掃描文檔,而軟件則負責對字符的分析及其轉換為機器可讀文本。
從技術角度來看,OCR軟件將文檔轉換為兩種(通常是黑白)版本。隨後對掃描的圖像或位圖進行了分析,以顯示光和黑暗區域,後者將其確定為要識別的字符。相比之下,前者被歸類為背景,因此被排除在進一步的處理之外。
分析黑暗區域以找到字母字母或數字數字。該過程的這一部分通常針對字符,並使用兩種類型的算法之一來識別它們:模式匹配或特徵提取。
模式匹配隔離角色圖像(稱為字形),並將其與類似存儲的字形進行比較。值得注意的是,模式識別僅在存儲的字形具有與輸入字形相似的字體和比例的情況下起作用。因此,該方法最適合依賴標準字體的文檔圖像。
第二種類型的算法使用特徵提取,該方法將字形分解為線,閉環,線方向和線相交等特徵。然後,這些功能用於在存儲的字形中找到最佳匹配。
分析後,系統將提取的文本數據轉換為數字文件。該文件也可以用於自動化表單的完成。
使用該技術與生物識別技術結合的公司包括OCR實驗室,,,,DataTang和智能引擎。