码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • python图片预标注


    文本标注流程

    标注基础知识丨文本标注的一般流程及常用的数据标注工具

    预标注

    1、准备文件:PDF/JPG

    2、(将pdf文件转化为图片jpg格式)将jpg转化成jpg和xml格式文件,即预标注

    3、生成xml格式文件,需要对标注细节进行规范操作,在labelImg工具下对images中的图片进行标注操作,并覆盖保存之前的预标注文件。

    需要用到的python库(不完全统计)

    1. from os.path import join, dirname, exists
    2. import os
    3. import cv2
    4. import re
    5. import csv
    6. import pandas as pd
    7. import shutil
    8. from util import logging
    9. import numpy as np
    10. import pdf2image
    11. import fitz
    12. import datetime
    13. from PIL import Image
    14. import statistics
    15. import glob
    16. import time
    17. from lxml import etree
    18. from io import StringIO
    19. import json
    20. import time
    21. from aip import AipOcr

    矩形框标注又叫拉框标注,是目前应用最广泛的一种图像标注方法,能够以一种相对简单、便捷的方式在图像或视频数据中,迅速框定指定目标对象。

    opencv-python 读取和保存图像_runtao123的博客-CSDN博客_opencv python 保存图像

    根据指定格式的文件生成XML标注文件,可以方便使用LabelImg打开进行编辑和查看。其原始文件默认使用逗号进行分隔,

    • 第1个值:原始图片中切图小文件,以AIpng_x,其中x代表原始图片的第几个切图文件
    • 第2~5值:分别对应于ymin, xmin, ymax, xmax
    • 第6个值:代表对应的标签标注

     在生成XML文件时,需要对其进行汇总,即将属于同一个原始文件的切图小文件的标注汇总到一起

    Python应用基础-根据指定文件生成XML - Surpassme - 博客园

    python使用fitz_三种方法,Python轻松提取PDF中全部图片_几木木的博客-CSDN博客

    用 Python 做科学计算(工具篇)—— scipy 使用指南 - 知乎

    python中os.path.join()、os.path.dirname()、os.path.absname()函数的用法 - 喵小超 - 博客园

    python util 模块

    python之shutil模块 - 九尾cat - 博客园

    python lxml中etree的简单应用

    exists的用法 python_10个Python中最常用到的文件操作_无敌小羊历险记的博客-CSDN博客

    python os模块介绍

    python中正切函数_Python tan() 函数_weixin_39582737的博客-CSDN博客

    Python:glob - ShineLe - 博客园

    Python中shutil模块的使用详解

    python标准库之glob介绍 - luminousjj - 博客园

    OCR图片转文字

    OCR转写是对图像中的文字内容进行标记与转写,帮助训练和完善图片与文本识别模型。目前,景联文支持简体中文、繁体中文、英语、日语、韩语、法语、德语、西班牙语、阿拉伯语等十余种语言印刷或手写图片的转写。

    OCR图片转文字两种python方法实现_死磕的斯坦张的博客-CSDN博客_python实现图片转文字

    python 使用百度AI实现OCR文字识别 - Acheng1011 - 博客园

    python-通过AipOcr百度库对图片验证码进行ocr识别

    图像滤波方法

    非局部平均滤波(NonLocalMeans)

    Python气象数据处理与绘图:常见的10种图像滤波方法 - 腾讯云开发者社区-腾讯云

    python实现DBSCAN_张##的博客-CSDN博客_python的dbscan

  • 相关阅读:
    K8S-基本介绍和集群安装
    自动化运维监控展示三剑客:Telegraf+Influxdb 2.4+ Grafana
    360 度评估中的提问示范
    【目的:windows下VS2017/2022配置使用opengl - 初探-创建一个空窗口】
    leetcode每天5题-Day43(二叉树8)
    【微信小程序】项目初始化
    【程序填空】单链表类定义 C++
    java-php-python-ssm基于水果商城设计计算机毕业设计
    淘宝/天猫API:item_sku-获取sku详细信息
    Windows 内网渗透之委派攻击
  • 原文地址:https://blog.csdn.net/weixin_44740756/article/details/126284904
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号