发布时间:2023-01-22 08:00
HaaS 即 Hardware as a Service,它是加速AIoT开发者创新的一个积木平台.
Python轻应用是跑在HaaS积木平台上的一套应用框架.他是基于MicroPython进行开发,继承了python优美简介的语法,同时提供了便捷的嵌入式硬件操作库。HaaS100作为阿里云IoT推出的一款 Iot 开发板,它适配了MicroPython的运行引擎,提供了各种丰富的硬件操作接口,同时提供阿里云物联网平台和云端AI相关的能力。通过这块芯片,可以轻松通过python程序实现硬件控制,云端AI以及云端互通的能力。
今天就来讲解下,怎么基于Python轻应用框架,来实现文字识别(OCR)功能.
方案涉及主要涉及Minicv,Alibaba Cloud SDK 等功能模块.
MiniCV 是一套轻量级视觉框架,支持数据获取,图像处理,图像编解码,视频编解码,机器学习,UI呈现。
Alibaba Cloud SDK是阿里达摩院视觉智能开放平台的端上的引覆盖人脸、人体、视频、文字等150+场景。
关于视觉视觉智能平台的详细信息可以参考官网:https://vision.aliyun.com/
数据处理流程为:通过MiniCV模块,完成数据源的封装处理,图片的解码,图片数据的格式转换和缩放等功能,最后将处理好的数据喂给ML 模块,ML 模块通过Alibaba Cloud SDK引擎和达摩院的视觉开放智能平台进行交互,得到预期结果.
由于HaaS100的板子默认没有配置LCD,所以为了方便开发者使用,我通过打印LOG 的方式将结果输出.
文字识别技术基于阿里云深度学习技术,为您提供通用的印刷文字识别和文档结构化等能力。文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求
测试资源图片:"/data/python-apps/ml/recognize-character/res/test.jpg"
输出结果:
# -------------------Welcome HaasAI MicroPython--------------------
-----ml ucloud RecognizeCharacter demo start-----
results size:1
index:0
probability:0.441612
text:飞猪旅行
left:199
angle:-5
top:166
height:373
width:781
bytearray(b'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00')
-----ml ucloud RecognizeCharacter demo end-----
OCR是Optical Character Recognition的缩写,意思是光学字符识别,简称文本识别。