解释器：什么是OCR，它如何工作？

2022-11-21

光学特征识别是将文本图像转换为机器可读文本格式的过程。

该技术的发明是为了解决与文本编辑者无法编辑，搜索或计算图像文件中的单词相关的问题。

OCR特别重要，因为增加数字化要求企业从印刷媒体中接收信息，而传统上很难存储和管理。这包括对身份文档的扫描，例如护照或驾驶执照，其中还包括可用于生物特征识别绑定的照片。

通过OCR扫描图像消除了手动干预，并可以将文本图像转换为文本数据，以后可以通过其他业务软件对此进行分析。

公司可以使用数据来进行分析，简化操作，自动化流程并提高生产力。

OCR如何工作？

OCR系统包括硬件和软件组件。该硬件用于物理扫描文档，而软件则负责对字符的分析及其转换为机器可读文本。

从技术角度来看，OCR软件将文档转换为两种（通常是黑白）版本。随后对扫描的图像或位图进行了分析，以显示光和黑暗区域，后者将其确定为要识别的字符。相比之下，前者被归类为背景，因此被排除在进一步的处理之外。

分析黑暗区域以找到字母字母或数字数字。该过程的这一部分通常针对字符，并使用两种类型的算法之一来识别它们：模式匹配或特征提取。

模式匹配隔离角色图像（称为字形），并将其与类似存储的字形进行比较。值得注意的是，模式识别仅在存储的字形具有与输入字形相似的字体和比例的情况下起作用。因此，该方法最适合依赖标准字体的文档图像。

第二种类型的算法使用特征提取，该方法将字形分解为线，闭环，线方向和线相交等特征。然后，这些功能用于在存储的字形中找到最佳匹配。

分析后，系统将提取的文本数据转换为数字文件。该文件也可以用于自动化表单的完成。

使用该技术与生物识别技术结合的公司包括OCR实验室，，，，DataTang和智能引擎。