瑞芯微：基于RK3568的ocr识别

光学字符识别（Optical Character Recognition, OCR）是指对文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。亦即将图像中的文字进行识别，并以文本的形式返回。
OCR的应用场景

卡片证件识别类：大陆、港澳台身份证、通行证、护照识别，卡类识别，车辆类驾驶证识别、行驶证识别，执照识类识别，企业证件类识别
文字信息结构化视频类识别：字幕识别和文字检测，表格；
票据类识别：增值税发票识别、全电发票识别、银行支票识别、承兑汇票识别、银行票据识别、物流快递识别；
其他识别：二维码识别、一维码识别、车牌识别、数学公式识别、物理化学符号识别、音乐符号识别、工程图识别、流程图识别、古迹文献识别、手写输入识别；
除了以上列举的之外，还有自然场景下的文字识别、菜单识别、横幅检测识别、图章检测识别、广告类图文识别等围绕审核相关的业务应用。
１）提供通用的识别服务；

２）部分能提供结构化文本的特定场景识别服务如身份证识别等，能保留识别文字结构。但这些应用还存在一些明显缺点：１）通用识别服务对图像要求高，通常针对扫描文档，要求输入图像背景干净、字体简单且文字排布整齐，对自然场景图像中的文字识别效果差；２）大多缺少常见特定场景文字识别如营业执照、银行卡、驾驶证
等卡证类图像的识别，只注重识别文字内容本身，没有特定场景的版面分析；３）特定场景文字识别，识别场景较为单一，如汉王ＯＣＲ的特定场景只提供身份证识别等，无常见场景识别的功能整合；４）无法进行定制化的功能扩展；５）数据安全由厂商保证

下面我们基于PPocrv3在rk3568上进行部署：具体模型请在ppocr下载

导出onnx之后转为RKNN，，

具体如何转请参考我之前的博客。。。。。。

展示效果：

具体代码整理之后上传。。。。代码写的太烂了。。。。0.0

相关阅读:
微信文件如何直接打印及打印功能在哪里设置？
Linux文件编程(lseek函数和stat函数)
String 地址引用问题
go语言unsafe.Pointer与uintptr
[物联网] OneNet 多协议TCP透传
洛谷 P2922 / bzoj1590【Trie】
TikTok环境设置教程，小白也能轻松上手‼️
最新版的Dubbo Admin 3.0 本地启动方式
程序员新手村常见问题
Spring高手之路14——深入浅出：SPI机制在JDK与Spring Boot中的应用

原文地址：https://blog.csdn.net/zhangdaoliang1/article/details/133125306