• python实现截图识别文字(已打包成exe程序)


    目录

    1、简介

    2、如何使用

    3、完整代码

    4、免费下载⭐⭐


    在这里给大家安利一个自己开发的截图识别文字的程序!

    程序使用的前提,是电脑本机装了Python环境!(版本不限)

    1、简介

    这段代码创建了一个屏幕截图工具的GUI应用程序,允许用户选择区域截图并进行文字识别。

    它解决了以下问题:

    1. 提供了一个GUI界面,让用户选择屏幕上的区域进行截图。
    2. 使用Tesseract OCR进行文字识别,将截取的文本复制到剪贴板。
    3. 根据配置文件中的设置,可以自动删除截图。
    4. 它比微信提取文字更精确

    下面是对比情况:

    204ce6881de94796b0853f7d4d2d02f0.png

    2、如何使用

    首先会得到一个初始的文件夹,各个文件的作用如下所示(未提及的文件均不可动):

    f87d2b56b30f43868582375505213614.png

    切记:仔细查看说明文档!

    执行了初始化准备环境之后,得到的文件夹结果是:

    70ab8aedc0c64131b64052f5f2606118.png

    运行了extraction.exe之后会得到一个窗口(这个用处不大):

    ce17dcad850c4796880b3dcc73d92de5.png

    看到这个就证明运行成功了。接下来就可以双击设置好的快捷键,开始截图:

    9b47c614c58e48ad983982c0d4296433.png

    0c0b8b95560946a79520657f332d1c7a.png

    这个就是截图的应用程序。

    如果双击快捷键之后截图界面没有出来,则在自己电脑的状态栏打开即可。

    3、完整代码

    完整代码如下,代码即注释:

    1. # 导入必要的模块
    2. from datetime import datetime # 用于获取当前日期和时间
    3. from tkinter import * # 用于创建 GUI 界面
    4. import pyautogui # 用于屏幕截图
    5. from PIL import ImageGrab # 用于处理图像数据
    6. import os # 用于文件和目录操作
    7. import pytesseract # 用于文字识别
    8. import pyperclip # 用于剪贴板操作
    9. # 设置 Tesseract OCR 的路径和配置
    10. tesseract_exe = r'.\Tesseract-OCR\tesseract.exe'
    11. tessdata_dir = r'.\Tesseract-OCR\tessdata'
    12. pytesseract.pytesseract.tesseract_cmd = tesseract_exe
    13. tessdata_dir_config = '--tessdata-dir "{}"'.format(tessdata_dir)
    14. # 创建一个名为 ScreenCaptureApp 的类
    15. class ScreenCaptureApp:
    16. def __init__(self, root):
    17. # 初始化应用程序的根窗口
    18. self.root = root
    19. self.root.attributes('-fullscreen', True) # 设置窗口全屏
    20. self.root.attributes('-alpha', 0.1) # 设置窗口透明度
    21. self.root.title("Area capture") # 设置窗口标题
    22. # 获取屏幕的宽度和高度
    23. self.screen_width, self.screen_height = pyautogui.size()
    24. # 创建一个 Canvas 控件用于显示截图区域
    25. self.canvas = Canvas(self.root, cursor="cross")
    26. self.canvas.pack(fill=BOTH, expand=YES)
    27. # 绑定鼠标事件处理函数
    28. self.canvas.bind("", self.on_press)
    29. self.canvas.bind("", self.on_drag)
    30. self.canvas.bind("", self.on_release)
    31. # 初始化一些坐标和变量
    32. self.start_x = None
    33. self.start_y = None
    34. self.end_x = None
    35. self.end_y = None
    36. self.rect = None
    37. self.mask_rect = None
    38. self.image_path = None
    39. # 更新窗口大小
    40. self.update_window_size()
    41. # 更新窗口大小
    42. def update_window_size(self):
    43. screen_width = self.root.winfo_screenwidth()
    44. screen_height = self.root.winfo_screenheight()
    45. self.root.geometry("%dx%d" % (screen_width, screen_height))
    46. # 鼠标按下事件处理函数
    47. def on_press(self, event):
    48. self.start_x = self.canvas.canvasx(event.x)
    49. self.start_y = self.canvas.canvasy(event.y)
    50. if self.rect:
    51. self.canvas.delete(self.rect)
    52. if self.mask_rect:
    53. self.canvas.delete(self.mask_rect)
    54. self.rect = self.canvas.create_rectangle(self.start_x, self.start_y, self.start_x, self.start_y, outline="blue", fill="blue",
    55. stipple='gray25', width=3)
    56. # 鼠标拖动事件处理函数
    57. def on_drag(self, event):
    58. cur_x = self.canvas.canvasx(event.x)
    59. cur_y = self.canvas.canvasy(event.y)
    60. self.canvas.coords(self.rect, self.start_x, self.start_y, cur_x, cur_y)
    61. self.update_mask(cur_x, cur_y)
    62. # 鼠标释放事件处理函数
    63. def on_release(self, event):
    64. self.end_x = self.canvas.canvasx(event.x)
    65. self.end_y = self.canvas.canvasy(event.y)
    66. # 计算截图区域的坐标
    67. if self.start_x < self.end_x and self.start_y < self.end_y:
    68. left = self.start_x
    69. top = self.start_y
    70. right = self.end_x
    71. bottom = self.end_y
    72. # ... (其他情况的计算省略)
    73. # 使用 ImageGrab.grab 截取屏幕图像
    74. screenshot = ImageGrab.grab(bbox=(left, top, right, bottom))
    75. # 获取当前脚本的目录和当前日期时间
    76. script_directory = os.path.dirname(os.path.abspath(__file__))
    77. current_datetime = datetime.now().strftime("%Y-%m-%d-%H%M%S")
    78. # 构建图像文件名
    79. file_name = f"xzlScreenshot-{current_datetime}.png"
    80. self.image_path = os.path.join(script_directory, "image/" + file_name)
    81. # 保存截图到文件
    82. screenshot.save(self.image_path)
    83. # 配置 Tesseract OCR 参数
    84. custom_config = r'--oem 3 --psm 6 -c preserve_interword_spaces=1'
    85. # 使用 pytesseract 进行文字识别
    86. text = pytesseract.image_to_string(screenshot, lang='+'.join(['eng', 'chi_sim']), config=f'--tessdata-dir "{tessdata_dir}" {custom_config}')
    87. # 将识别结果复制到剪贴板
    88. pyperclip.copy(text)
    89. # 读取配置文件并检查是否需要自动删除截图
    90. with open('config.txt', 'r', encoding="utf-8") as file:
    91. content = file.read()
    92. key_value_pairs = content.strip().split('\n')
    93. for i in range(0, len(key_value_pairs)):
    94. key = key_value_pairs[i].split('=')
    95. value = key[1]
    96. if str(key[0]) == "autoDeleteImg":
    97. auto_delete_img_value = value
    98. break
    99. if int(auto_delete_img_value) == int(1):
    100. if self.image_path:
    101. os.remove(self.image_path)
    102. # 关闭应用程序窗口
    103. self.root.destroy()
    104. # 更新遮罩效果
    105. def update_mask(self, cur_x, cur_y):
    106. if self.mask_rect:
    107. self.canvas.delete(self.mask_rect)
    108. self.mask_rect = self.canvas.create_rectangle(0, 0, self.root.winfo_screenwidth(), self.root.winfo_screenheight(), fill="black", )
    109. self.canvas.tag_lower(self.mask_rect)
    110. self.canvas.coords(self.mask_rect, self.start_x, self.start_y, cur_x, cur_y)
    111. # 主函数,创建应用程序对象并运行
    112. def main():
    113. root = Tk()
    114. app = ScreenCaptureApp(root)
    115. root.mainloop()
    116. # 检查脚本是否作为主程序运行
    117. if __name__ == "__main__":
    118. main()

    4、免费下载⭐⭐

    下载的安装包是不需要独立安装第三方模块的,都已经集成好了。

    应用程序的压缩包已经上传到云服务器了,访问公网地址就可以下载了:截图提取文字应用程序压缩包.zip

    如果本地没有环境或者不想配置,可以看这一篇:

    python实现截图识别文字v2.0[脱离开发环境]-CSDN博客icon-default.png?t=N7T8https://blog.csdn.net/qq_60735796/article/details/135687196?csdn_share_tail=%7B%22type%22%3A%22blog%22%2C%22rType%22%3A%22article%22%2C%22rId%22%3A%22135687196%22%2C%22source%22%3A%22qq_60735796%22%7D

  • 相关阅读:
    算法---分割字符串的方案数
    Angular知识点系列(1)-每天10个小知识
    二、一起来学习Java 开发环境配置
    【Algorithms 4】算法(第4版)学习笔记 09 - 3.2 二叉查找树
    租车小程序系统开发制作功能介绍
    seleuium 自动测试工具
    证件照快速抠图更换背景 - Python OpenCV图像分割
    如何报考产品总监认证(UCPD)?
    人工智能——大白话熟悉目标检测基本流程
    在用户同意隐私政策前,您的应用获取了用户的ANDROID ID,不符合华为应用市场审核标准。
  • 原文地址:https://blog.csdn.net/qq_60735796/article/details/133916453