在 github 上找到一个开源库,而且还很强大。这个库叫 ddddocr ,
GitHub - sml2h3/ddddocr: 带带弟弟 通用验证码识别OCR pypi版
pip install ddddocr -i https://pypi.douban.com/simple

参数说明:
Ddddocr 接受两个参数
| 参数名 | 默认值 | 说明 |
|---|---|---|
| use_gpu | False | Bool 是否使用gpu进行推理,如果该值为False则device_id不生效 |
| device_id | 0 | int cuda设备号,目前仅支持单张显卡 |
classification
| 参数名 | 默认值 | 说明 |
|---|---|---|
| img | 0 | bytes 图片的bytes格式 |
单个图片的识别:
- # -*- coding:utf-8 -*-
- import ddddocr # 导入 ddddocr
- ocr = ddddocr.DdddOcr() # 实例化
- with open('002.png', 'rb') as f: # 打开图片
- img_bytes = f.read() # 读取图片
- res = ocr.classification(img_bytes) # 识别
- print(res)

多个图片识别:
- # -*- coding:utf-8 -*-
- import ddddocr # 导入 ddddocr
- ocr = ddddocr.DdddOcr()
- for i in range(1, 4):
- with open(str(i) + '.png', 'rb') as f:
- img_bytes = f.read()
- res = ocr.classification(img_bytes)
- print(res)


有些大小写还是不能识别出来。
封装一下:
- # -*- coding:utf-8 -*-
- import ddddocr
- ocr = ddddocr.DdddOcr()
-
- def ddocr(file):
- try:
- with open(file, 'rb') as f:
- img_bytes = f.read()
- res = ocr.classification(img_bytes)
- return res
- except:
- print("获取验证码失败,请继续!")
-
- r = ddocr('3.png')
- print(r)
结合抠图一起使用,即获取验证码图片,然后用dddr 识别验证码。
- from selenium import webdriver
- import time
- from PIL import Image
- import ddddocr
- ocr = ddddocr.DdddOcr()
-
-
- # 抠图
- def matting():
- # 打开谷歌浏览器
- browser = webdriver.Chrome()
- # 打开网站首页
- # browser.get("https://v3pro.houjiemeishi.com/PC/pages/login/login.html")
- browser.get("http://192.168.139.129:8081/jpress/admin/login")
- # 网页最大化
- browser.maximize_window()
- # 登录页图片
- picture_name1 = 'login'+'.png'
- # 保存第一张截图
- browser.save_screenshot(picture_name1)
- # 定位元素
- ce = browser.find_element_by_id("captchaImg")
- # ce = browser.find_element_by_xpath('//*[@class="codeImg"]')
- # 打印元素位置、元素尺寸
- print(ce.location, ce.size)
- # 要抠验证码的图,先获取元素参数
- left = ce.location.get('x')
- top = ce.location.get('y')
- right = ce.size.get('width') + left
- height = ce.size.get('height') + top
- # 读取刚才截的第一张图
- im = Image.open(picture_name1)
- # 抠图
- img = im.crop((left, top, right, height))
- # 验证码块的图片
- picture_name2 = 'code'+'.png'
- # 保存图片
- img.save(picture_name2)
- time.sleep(5)
- browser.close()
-
-
- # 通过 ddddocr 模块识别验证码
- def ddocr(file):
- try:
- with open(file, 'rb') as f:
- img_bytes = f.read()
- res = ocr.classification(img_bytes)
- return res
- except:
- print("获取验证码失败,请继续!")
-
-
- if __name__ == '__main__':
- print("抠图")
- matting()
- print("识别")
- code = ddocr('code.png')
- print(code)
运行过程中,有可能会遇到这个问题。
ddddocr模块的项目使用pyinstaller 打包后报错 ImportError: Microsoft Visual C++ Redistributable for Visual Studio 2019 not installed on the machine.

解决办法:
安装Microsoft Visual C++ Redistributable 2019https://aka.ms/vs/16/release/VC_redist.x64.exe
直接点击就可以下载了,下载后直接安装即可。