发布时间:2023-03-25 19:30
OCR是通过算法识别出图像中的文字内容,算是图像识别的一个分支。那为什么固定资产管理系统中会用到 OCR 呢?
为什么固定资产管理系统中会用到 OCR 呢?就得从梳理需求时遇到的问题说起。
固定资产的全生命周期管理的第一步是“资产入库”,而入库是一个非常繁琐的过程,需要将大量信息录入系统。通过前期调研发现录入过程费时费力,还经常出现录入错误的问题(比如设备型号、序列码是较长的数字、字母序列,人工录入很容易出错)。
有没有办法解决这个痛点呢?受证件识别的启发,我们想到了 OCR 辅助人工录入,那么接下来就是调研这种方案的可行性了。
OCR,也就是 optical character recognation(光学字符识别),是通过算法识别出图像中的文字内容,算是图像识别的一个分支。OCR 对纯文本的识别已经比较成熟,识别率普遍可以达到 90%以上,百度、阿里、腾讯等各大厂都有相应的服务可以直接调用。
OCR 技术可以按字体类别、识别语言、识别场景进行细分,每个细分的算法有所不同,现在暂时还没有非常通用的算法同时适用于多个分类。
其中:
使用StanfordCoreNLP的句法树以及NLTK的Tree建立DGL的图数据结构
Linux笔记3(用户权限类,搜索查找类,压缩解压类,磁盘管理类,进程管理类,系统定时任务)
MySQL中delete、drop、truncate三种删除操作的区别
Attention deep neural network for lane marking detection解析
运筹学修炼日记:TSP中两种不同消除子环路的方法及callback实现(Python调用Gurobi求解,附以王者荣耀视角解读callback的工作逻辑)
【Linux篇】第二十篇——HTTP协议(认识协议+HTTP协议+HTTPS)
YOLOv5改进之十七:CNN+Transformer——融合Bottleneck Transformers