码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Python3-图片文字识别库ddddocr的使用,验证码的识别


    1 ddddocr简介:

    ddddocr是一个开源图片识别库,Github地址:

    https://github.com/sml2h3/ddddocr

    经测试发现,ddddocr在识别验证码类型的图片时,准确率还是很高的。 

    2 ddddocr的安装:

    pip install ddddocr
    或
    pip install ddddocr -i 镜像,例如:

    pip install ddddocr -i https://pypi.tuna.tsinghua.edu.cn/simple

    常用国内镜像源:

    清华:https://pypi.tuna.tsinghua.edu.cn/simple

    阿里云:http://mirrors.aliyun.com/pypi/simple/

    中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/

    华为云:https://mirrors.huaweicloud.com/python/

    豆瓣:https://pypi.douban.com/simple/

    3 ddddocr的使用:

    图片识别举例:

    代码: 

    1. # -*- coding: utf-8 -*-
    2. import os
    3. import ddddocr
    4. # 图片识别函数
    5. def img2text(img_file):
    6. ocr = ddddocr.DdddOcr() #法1
    7. # ocr = ddddocr.DdddOcr(det=True) #法2
    8. cPath = os.getcwd()
    9. print(cPath)
    10. with open(img_file, 'rb') as f:
    11. print("file",f)
    12. img_bytes = f.read()
    13. #获取文字
    14. res = ocr.classification(img_bytes)
    15. print('res:',res)
    16. print("func end.")
    17. # main function
    18. if __name__ == '__main__':
    19. jpg_ch_file="img1_ch.jpg";
    20. jpg_file="img02.jpeg";
    21. png_file="img03.png";
    22. bmp_file = "img04.bmp"
    23. img2text(jpg_ch_file);
    24. print("main end")

    运行:

    1) bmp文件:

    img04.bmp:

     

    % python3 ddd_img2text2.py

    欢迎使用ddddocr,本项目专注带动行业内卷,个人博客:wenanzhe.com

    训练数据支持来源于:http://146.56.204.113:19199/preview

    爬虫框架feapder可快速一键接入,快速开启爬虫之旅:https://github.com/Boris-code/feapder

    file <_io.BufferedReader name='img04.bmp'>

    res: AFtf

    func end.

    main end

    2)png图片:

    img03.png:

     

    % python3 ddd_img2text2.py

    file <_io.BufferedReader name='img03.jpeg'>

    res: 2bghz 

    3)jpeg图片:

     img2.jpg:

     

    % python3 ddd_img2text2.py

    file <_io.BufferedReader name='img02.jpeg'>

    res: 2acd

    4) 汉字的识别:

     img1_ch.jpg:

     

    % python3 ddd_img2text2.py

    file <_io.BufferedReader name='img1_ch.jpg'>

    res: 中进优搜蔡系和度优先搜索是两种最常见的优先搜索方法它们破泛地运用在图对等

    可以看出,对于验证码类型的图片识别,准确率比较高;

    而对于汉字的识别,准确率不高。 


  • 相关阅读:
    Unity IL2CPP 游戏分析入门
    京东技术负责人纯手写:小团队构建大网站中小研发团队架构实战
    基于Java+SpringBoot+Vue的在线音乐网站设计和实现
    中国智能马桶行业未来发展及投资可行性建议报告2022-2028年版
    rk3588 大小核启动
    外包干了2个月,技术退步明显.......
    如何通过 API 获取 Cookie
    R语言使用plot函数可视化数据散点图,使用lines函数在可视化图像中添加线条、使用lwd参数自定义线条的粗细
    每日一个设计模式之【工厂模式】
    C语言《超详细解析内存函数》
  • 原文地址:https://blog.csdn.net/liranke/article/details/126405660
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号