码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 基于springboot的图片文字识别,支持中英文识别


    概述

    基于springboot的图片文字识别,支持中英文识别. 页面上传图片即可转换为中文或者英文.

    详细

    1.需求(要做什么) 

        识别图片文字,   实现页面上传图片即可转换为中文或者英文.

    2.理论概述

            OCR,即Optical Character Recognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程。

        Tesseract 是一个 OCR 库,  Tesseract 是目前公认最优秀、最精确的开源 OCR 系统,除了极高的精确度,Tesseract 也具有很高的灵活性。它可以通过训练识别出任何字体,也可以识别出任何 Unicode 字符。

    3. 代码分析

    1. public static void main(String[] args) throws TesseractException, FileNotFoundException {
    2. //加载待读取图片
    3. File imageFile = new File("E://123.png");
    4. //创建tess对象
    5. ITesseract instance = new Tesseract();
    6. //设置训练文件目录
    7. instance.setDatapath("D:\\Program Files\\Tesseract-OCR\\tessdata");
    8. //设置训练语言
    9. instance.setLanguage("eng");
    10. //执行转换
    11. String result = instance.doOCR(imageFile);
    12. System.out.println(result);
    13. }

    4.项目文件结构截图 

    image.png

    5.安装部署

    1. 安装Tesseract-OCR

    点击tesseract-ocr-w64-setup-v5.0.0.20190623.exe文件,按提示安装就行,安装成功之后如下张图:

    增加系统变量TESSDATA_PREFIX,变量值为Tesseract的安装路径

    如: C:\Program Files (x86)\Tesseract-OCR\tessdata

    增加系统变量如下图:

    把中文库: chi_sim.traineddata , 英文库: eng.traineddata  拷贝到 C:\Program Files (x86)\Tesseract-OCR\tessdata

    2. 启动项目

    eclipse导入maven项目springboot-ocr, 待maven依赖jar包加载完成后, 修改application.yml, 配置Tesseract的安装路径

    image.png

    启动项目,右击DemoApplication --> run as -->Java Application, 启动成功后访问: http://localhost:10008/

    6.演示效果

    转中文

    image.png

    转英文

    image.png

  • 相关阅读:
    CT0514是一个完善的单片锂离子电池恒流/恒压线形 电源管理芯片
    个保法(PIPL)颁布实施一周年,给行业带来了哪些变化?
    浏览器中的history详解
    LNMP动静分离,负载均衡及高可用搭建
    深度学习验证码项目
    面试题:MyBatis批量插入的五种方式,哪种最强?
    Lock锁:ReentrantLock的可打断和可重入特性
    3D孪生场景搭建:3D漫游
    前端工作小结80-title写活
    《图解Pandas》内容汇总-20220822
  • 原文地址:https://blog.csdn.net/hanjiepo/article/details/132735622
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号