开源资产管理系统_OCR在资产管理系统的应用

发布时间:2023-03-25 19:30

OCR是通过算法识别出图像中的文字内容,算是图像识别的一个分支。那为什么固定资产管理系统中会用到 OCR 呢?

开源资产管理系统_OCR在资产管理系统的应用_第1张图片

一、从业务说起:为什么需要 OCR?

为什么固定资产管理系统中会用到 OCR 呢?就得从梳理需求时遇到的问题说起。

开源资产管理系统_OCR在资产管理系统的应用_第2张图片

固定资产的全生命周期管理的第一步是“资产入库”,而入库是一个非常繁琐的过程,需要将大量信息录入系统。通过前期调研发现录入过程费时费力,还经常出现录入错误的问题(比如设备型号、序列码是较长的数字、字母序列,人工录入很容易出错)。

有没有办法解决这个痛点呢?受证件识别的启发,我们想到了 OCR 辅助人工录入,那么接下来就是调研这种方案的可行性了。

二、关于 OCR

OCR,也就是 optical character recognation(光学字符识别),是通过算法识别出图像中的文字内容,算是图像识别的一个分支。OCR 对纯文本的识别已经比较成熟,识别率普遍可以达到 90%以上,百度、阿里、腾讯等各大厂都有相应的服务可以直接调用。

1. OCR 分类

开源资产管理系统_OCR在资产管理系统的应用_第3张图片

OCR 技术可以按字体类别、识别语言、识别场景进行细分,每个细分的算法有所不同,现在暂时还没有非常通用的算法同时适用于多个分类。

其中:

  • 印刷体识别成熟度要高于手写体(原因也比较好理解,印刷体比较规范,手写体五花八门有时候人都难以辨认)。
  • 中文和西文的识别成熟度高于小语种,中英文混合识别也能比较好的解决。
  • 自然环境中的文字识别难度也要大于文档图片识别,因为自然环境中文字所处环境要更加复杂,文字检测难度要大于文档图片。
  • 对特定格式文档(如身份证、发票、成绩单)的识别要好于自由文档(文字、表格、图片、公式混排)。

ItVuer - 免责声明 - 关于我们 - 联系我们

本网站信息来源于互联网,如有侵权请联系:561261067@qq.com

桂ICP备16001015号