• python-百度API文字识别


    最近公司通过网络查询到我们部门有人工作时间逛b站次数太多,这事惊动了上层领导,搅得人心惶惶。突然星期某信服的一套监控员工电脑的系统,不经一颤。想着自己也尝试玩玩电脑屏幕文字识别-----抓取关键字,然后将图片保存下来。

    这里将使用python,通过百度API识别电脑屏幕文字,并将含有关键字的截图保存下来。

    一、百度API获取

    1.进入百度云官网,先注册/登录,在首页顶端搜索文字识别,然后进入:
    百度云官网
    在这里插入图片描述
    在这里插入图片描述
    2.先领取免费的体验票,然后再创建应用(务必先“免费尝鲜”,再“创建应用”)
    在这里插入图片描述
    3.按要求填写“应用名称”和“应用描述”等信息。
    4.记住三个参数AppID、API Key、Secret Key,后面代码中需要用到。
    在这里插入图片描述

    二、python代码实现

    在晚上应用的创建后,接下来就可以编写代码了,在编写代码之前,需要安装几个Module:

    pip3 install chardet
    pip3 install pyautogui
    pip3 install baidu-aip
    
    • 1
    • 2
    • 3

    接着就可以编写代码了,这里直接贴出:

    import pyautogui
    from datetime import datetime
    import time
    import os
    from aip import AipOcr
    
    
    APP_ID = '28704805'
    API_KEY = 'YChehXrQqmV9c1pp48NziMWV'
    SECRET_KEY = '4VmGz8Dt4NxjOIyEWdgXOIzPsXST9kFA'
    client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
    
    
    def pic_text_recognition(picname):
        with open(picname, 'rb') as fp:
            image = fp.read()
        dic_result = client.basicAccurate(image)
        print(dic_result)
        res = dic_result['words_result']
        result = ''
        for m in res:
            result += str(m['words'])
        return result
    
    while True:
        # 截取电脑全屏
        img = pyautogui.screenshot()
    
        # 获取实时时间
        screen_time = datetime.now().strftime('%Y%m%d%H%M%S')
    
        png_name = screen_time + '.jpg'
        # 标记截屏时间
        img.save(png_name)
    
        try:
            string = pic_text_recognition(png_name)
            print(string)
            if string.index("离职"):
                print(png_name + "have key")
            else:
                print(png_name + " have no string2!")
                os.remove(png_name)
        except:
            print(png_name + " have no string1!")
            os.remove(png_name)
    
            # 截屏间隔时间(秒)
        time.sleep(10)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49

    代码中,

    APP_ID = '28704805'
    API_KEY = 'YChehXrQqmV9c1pp48NziMWV'
    SECRET_KEY = '4VmGz8Dt4NxjOIyEWdgXOIzPsXST9kFA'
    
    • 1
    • 2
    • 3

    为在百度云创建应用时给出的三个参数。

    三、测试结果

    运行代码,每过10s会获取当前屏幕截图,然后获取屏幕文字,检测这些文字中是否有“离职”的关键字,有的话,则保存接入,如果没有,则舍弃截图。
    如下:
    在这里插入图片描述
    在这里插入图片描述

    四、总结

    1.如果你也用的是pycharm,而电脑里有很多个版本的python,且python不同版本安装时都是自定义安装目录,那么你有概率代码编译会报错没有某些Module,注意当前工程的编译环境配置,比如我电脑安装有两个版本的python,这里我使用的是python3.8。有关python不同版本的切换,请查看自己电脑的“环境变量”配置。
    在这里插入图片描述
    在这里插入图片描述
    2.工作需要注意隐私!

  • 相关阅读:
    Java 【异常】
    QT中的OpenGLWidget
    双向链表的实现(增删查改)——最好理解的链表
    微服务项目:尚融宝(46)(核心业务流程:借款申请(3))
    NoSQL之 Redis配置与优化
    旋转的骰子(二)
    一文带你GO语言入门
    优雅草蜻蜓z系统暗影版前台崩溃,后台提示:系统接口异常502,java项目管理yyc-admin后台管理系统服务无法启动的解决方案
    算法-递归算法
    服务器Debian 12.x中安装Jupyer并配置远程访问
  • 原文地址:https://blog.csdn.net/LH_SMD/article/details/128093556