码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • PaddleOCR安卓Demo存在的问题


    文章目录

    • 一、前言
    • 二、英文模型输出文本错误
    • 三、图片宽度过长导致识别失败

    一、前言

    在使用 PaddleOCR 项目中预设置的安卓程序时, 出现了两个问题.

    这里对两个问题进行一些初步分析并给出自己的猜测和之后将会进行的解决方案.

    二、英文模型输出文本错误

    一个是使用英文模型识别时会出现类似于 xxxxxxxx 这样的符号, 但是其识别率还是能够保证在 80% 左右.

    例如对如下图片进行识别

    手机端运行效果如下图:

    Android Studio 端日志结果如下图(红框内为识别率):

    也就是说识别出来之后, 不能进行正常的输出. 首先想到的是字典的问题, 因为官方文档中提醒到, 如果是纯英文模型就需要更新字典. 但是实验之后发现既不是字典问题, 也不是字典编码问题.

    这和之前出现的识别中文乱码有些相似. 中文识别乱码是因为编译运行库时出现问题 (通过 Github 和 Gitee 下载的运行库源码有所区别, 所以造成了乱码).

    在这里也可以考虑是否还是因为运行库而出现的错误, 但是如果要匹配上此安卓 Demo, 需要考虑到很多方面, 尤其是 SDK 和 NDK 的版本. 这其中的兼容性错综复杂, 尤其是当升高 NDK 版本之后会出现众多的头文件缺失.

    显然这个方案有待商榷, 那么解决的思路将随着下一个问题的提出而展现.

    三、图片宽度过长导致识别失败

    现有如下一张图片, 在安卓 Demo 中无论采用哪种模型都不能识别成功.

    Android Studio 端日志结果如下图:

    但是我们对图片裁剪一半后得到这样的图片

    对它使用 ch_ppocr_server_v2.0 模型进行识别, 可以在 Android Studio 端日志得到下图:

    那么针对这个问题的解决方法就是修改安卓端的源码, 查看是否对输入文件的尺寸进行了相应的处理.

    同时我们使用 PaddleOCR 的 PC 端工具的中英文识别模型对未裁剪图进行识别, 可以在终端中得到如下结果:

    然后指定其使用英文模型进行识别:

    可以看到, 除了中文识别错误外, 英文的识别率高且无类似 xxxxxxxx 符号出现.

    可以了解到, PaddleOCR 给出的各个平台的各个模型其实存在一定问题, 或许是转换时参数出现问题, 或许是模型未更新.

    总之, 可以看见纯英文模型在特殊环境下还是能够保证其运行和识别功能的完整. 具体细节就需要对框架和各种参数进行进一步的了解.

  • 相关阅读:
    Windows电脑部署Jellyfin服务端并进行远程访问配置详细教程
    基于matlab的图像复原仿真GUI
    3D角色建模师和3D角色动画师哪个更有前景?哪个更适合小白入门?
    ShardingSphere 异构迁移最佳实践:将3.5亿量级的顾客系统 RTO 减少60倍
    Pyppetter结合beautifulSoup爬虫定位支付宝SDK和华为SDK更新的最新版本
    实时矢量搜索如何彻底改变各行各业?
    k8s~动态生成pvc和pv
    带你刷(牛客网)C语言百题(第三天)
    软件测试工程师在工作中需要的Linux知识,一篇文章就够了
    打工人都在用的AI工具(第一期)
  • 原文地址:https://blog.csdn.net/qq_44309220/article/details/126404257
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号