HaaS轻应用(Python):基于HaaS-AI的文字识别

发布时间:2023-01-22 08:00

 

1、序言

HaaS 即 Hardware as a Service,它是加速AIoT开发者创新的一个积木平台.

Python轻应用是跑在HaaS积木平台上的一套应用框架.他是基于MicroPython进行开发,继承了python优美简介的语法,同时提供了便捷的嵌入式硬件操作库。HaaS100作为阿里云IoT推出的一款 Iot 开发板,它适配了MicroPython的运行引擎,提供了各种丰富的硬件操作接口,同时提供阿里云物联网平台和云端AI相关的能力。通过这块芯片,可以轻松通过python程序实现硬件控制,云端AI以及云端互通的能力。

今天就来讲解下,怎么基于Python轻应用框架,来实现文字识别(OCR)功能.

 

2、方案

2.1、总体思路

方案涉及主要涉及Minicv,Alibaba Cloud SDK 等功能模块.

MiniCV 是一套轻量级视觉框架,支持数据获取,图像处理,图像编解码,视频编解码,机器学习,UI呈现。

Alibaba Cloud SDK是阿里达摩院视觉智能开放平台的端上的引覆盖人脸、人体、视频、文字等150+场景。

关于视觉视觉智能平台的详细信息可以参考官网:https://vision.aliyun.com/

数据处理流程为:通过MiniCV模块,完成数据源的封装处理,图片的解码,图片数据的格式转换和缩放等功能,最后将处理好的数据喂给ML 模块,ML 模块通过Alibaba Cloud SDK引擎和达摩院的视觉开放智能平台进行交互,得到预期结果.

由于HaaS100的板子默认没有配置LCD,所以为了方便开发者使用,我通过打印LOG 的方式将结果输出.

HaaS轻应用(Python):基于HaaS-AI的文字识别_第1张图片

 

2.2、具备功能

文字识别技术基于阿里云深度学习技术,为您提供通用的印刷文字识别和文档结构化等能力。文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求

 

2.3、效果呈现

测试资源图片:"/data/python-apps/ml/recognize-character/res/test.jpg"

HaaS轻应用(Python):基于HaaS-AI的文字识别_第2张图片

输出结果:

# -------------------Welcome HaasAI MicroPython--------------------

-----ml ucloud RecognizeCharacter demo start-----



results size:1

index:0

probability:0.441612

text:飞猪旅行

left:199

angle:-5

top:166

height:373

width:781



bytearray(b'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00')

-----ml ucloud RecognizeCharacter demo end-----

 

3、OCR技术介绍

3.1、概念介绍

OCR是Optical Character Recognition的缩写,意思是光学字符识别,简称文本识别。

  • 光学输入: 扫描仪,摄像机等
  • 算法处理,文字提取和识别

ItVuer - 免责声明 - 关于我们 - 联系我们

本网站信息来源于互联网,如有侵权请联系:561261067@qq.com

桂ICP备16001015号