码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • DBnet检测加分类,提取身份证要素


    08a546ef4669c751cd0c0fd1d04fa931.gif

    向AI转型的程序员都关注了这个号👇👇👇

    机器学习AI算法工程   公众号:datayx

    DBnet文本检测网络加入多分类,可以实现模型很小又能够区分类别的功能,然后可以根据检测框的标签快速提取目标字段,在端侧部署的话就能达到非常高的精度和效率。

    1.标注数据

    标注方法和标注目标检测的数据一样,一个框加一个标签

    pip install labelImg ==1.8.6

    安装完毕后,键入命令:

    labelImg

    或者下载工具  labelImg.exe链接:https://pan.baidu.com/s/14iBlyr3ahhymMukeWjtTEA 提取码:c1dx

    24a2c89fc451c2609d14d4f9cfcb9d16.png

    二 . 数据增强

    步骤:

    1.将标注数据集的标签(xml文件)放入./DataAugForObjectDetection/data/Annotations

    2.将标注数据集的图片放入./DataAugForObjectDetection/data/images

    3.修改./DataAugForObjectDetection/DataAugmentForObejctDetection.py/中的need_aug_num,即每张图片需要扩增的数量,然后运行./DataAugForObjectDetection/DataAugmentForObejctDetection.py

    注意:DataAugmentForObejctDetection_pool.py 是多进程增强版本,耗时较少。代码中的process不宜设置过大否则可能会报错,默认即可。

    三. 格式转换

    将标注的数据集转换成 dbnet 训练需要用到的格式。

    步骤:

    1.将标注数据集的标签(xml文件)放入Annotations,图片放入images;

    2.修改voc_to_coco.py的输入输出路径,并运行,然后手动分开训练集和测试集;

    3.修改get_train_list.py 的输入输出路径,并运行。训练集运行一次,测试集运行一次。

    四. 修改模型配置文件

    修改模型配置文件 config/det_DB_resnet50_mul.yaml

    8f5dd61cc66043d78feae14894ca7e01.png

    修改为三.3生成的数据集文件路径

    730de91f76a7ce7c1d663ffda00f5fdd.png

    五. 开启训练

    修改det_train.py 的模型配置文件路径,并运行

    9d4993174be9284ed2efb6e41e1794c4.png

    六. 测试

    修改det_infer.py的模型路径、模型文件路径、和图片路径

    f89594fd501cbfc16d37ef302a1d5c8b.png

    项目全部代码,预训练模型获取方式:

    关注微信公众号 datanlp  然后回复 db分类 即可获取。

    搜索公众号添加: datanlp

    e59cb899776b9561329a28dd745fe93f.jpeg

    长按图片,识别二维码

    效果展示

    dbnet不仅检测出文本行,还自动给文本行分类标签,一个框一个标签,可以按标签提取目标文本行。

    a41c816fc7424fc4d43036a437c0d01f.jpeg

    fc4370f5ed7499a548b1c055e65b61c6.jpeg

    7207cd2fa6ac637716a2dbdad4b30a8c.jpeg

    80ae8b6705c2b9a4de99f6f3b6a9cbb6.jpeg

    4af64257d7af4e2368db539fb3df87bc.jpeg

    0abf7540436e2422b0d677c44d3d5b4a.jpeg

    935dc9a5e9cb23f01e6bbb8f5ac4ff44.jpeg

    机器学习算法AI大数据技术

     搜索公众号添加: datanlp

    c3213ceeeab7357543518255ee0a1cb3.jpeg

    长按图片,识别二维码


    阅读过本文的人还看了以下文章:

    TensorFlow 2.0深度学习案例实战

    基于40万表格数据集TableBank,用MaskRCNN做表格检测

    《基于深度学习的自然语言处理》中/英PDF

    Deep Learning 中文版初版-周志华团队

    【全套视频课】最全的目标检测算法系列讲解,通俗易懂!

    《美团机器学习实践》_美团算法团队.pdf

    《深度学习入门:基于Python的理论与实现》高清中文PDF+源码

    《深度学习:基于Keras的Python实践》PDF和代码

    特征提取与图像处理(第二版).pdf

    python就业班学习视频,从入门到实战项目

    2019最新《PyTorch自然语言处理》英、中文版PDF+源码

    《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码

    《深度学习之pytorch》pdf+附书源码

    PyTorch深度学习快速实战入门《pytorch-handbook》

    【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》

    《Python数据分析与挖掘实战》PDF+完整源码

    汽车行业完整知识图谱项目实战视频(全23课)

    李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材

    笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!

    《神经网络与深度学习》最新2018版中英PDF+源码

    将机器学习模型部署为REST API

    FashionAI服装属性标签图像识别Top1-5方案分享

    重要开源!CNN-RNN-CTC 实现手写汉字识别

    yolo3 检测出图像中的不规则汉字

    同样是机器学习算法工程师,你的面试为什么过不了?

    前海征信大数据算法:风险概率预测

    【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类

    VGG16迁移学习,实现医学图像识别分类工程项目

    特征工程(一)

    特征工程(二) :文本数据的展开、过滤和分块

    特征工程(三):特征缩放,从词袋到 TF-IDF

    特征工程(四): 类别特征

    特征工程(五): PCA 降维

    特征工程(六): 非线性特征提取和模型堆叠

    特征工程(七):图像特征提取和深度学习

    如何利用全新的决策树集成级联结构gcForest做特征工程并打分?

    Machine Learning Yearning 中文翻译稿

    蚂蚁金服2018秋招-算法工程师(共四面)通过

    全球AI挑战-场景分类的比赛源码(多模型融合)

    斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)

    python+flask搭建CNN在线识别手写中文网站

    中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程

    不断更新资源

    深度学习、机器学习、数据分析、python

     搜索公众号添加: datayx  

    a9c938166e01b2487369b9ef44f25605.jpeg

  • 相关阅读:
    TypeScript断言
    用HTML+CSS做一个简单的新闻门户 1页网页
    NET Core使用Grpc通信(一):一元请求
    Spring系列五:Spring怎么解决循环依赖
    【navicat 密码查看】小技巧navicat 如何查看密码
    nodejs基础:浅聊url和querystring模块
    2023/9/20 -- C++/QT
    风控模型启用前的最后一道工序,80%的童鞋在这都踩坑
    2024年6月 青少年python一级等级考试真题试卷
    HTML期末大学生网页设计作业——奇恩动漫HTML (1页面) HTML CSS JS网页设计期末课程大作业
  • 原文地址:https://blog.csdn.net/demm868/article/details/125814610
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号