地址:https://digi.bib.uni-mannheim.de/tesseract/
使用版本:tesseract-ocr-w64-setup-v5.0.0.20190623.exe
设置环境变量

验证安装是否成功(tesseract -v)

pip install wheel

3. 安装tesserocr
下载地址:https://github.com/simonflueckiger/tesserocr-windows_build/releases

pip install tesserocr-2.5.2-cp39-cp39-win_amd64.whl

pip install pillow
pip install tesserocr

tesseract.exe number.jpg result -l eng
其中result表示输出结果文件txt名称,eng表示用以识别的语言文件为英文。

在tesseractv5.0.0根目录下面生成一个result.txt 存放识别的结果
使用python语言需要将tesseract默认的语言库放入python安装根目录下

import tesserocr
from PIL import Image
image = Image.open(f'C:\\Users\\Administrator\\Desktop\\1667979197(1).jpg')
res = tesserocr.image_to_text(image)
print(res)

使用默认的语言库识别,识别率不高。Tesseract提供了一套训练样本的方法,用以生成自己所需的识别语言库