文本标注流程
预标注
1、准备文件:PDF/JPG
2、(将pdf文件转化为图片jpg格式)将jpg转化成jpg和xml格式文件,即预标注
3、生成xml格式文件,需要对标注细节进行规范操作,在labelImg工具下对images中的图片进行标注操作,并覆盖保存之前的预标注文件。
需要用到的python库(不完全统计)
- from os.path import join, dirname, exists
- import os
- import cv2
- import re
- import csv
- import pandas as pd
- import shutil
- from util import logging
- import numpy as np
- import pdf2image
- import fitz
- import datetime
- from PIL import Image
- import statistics
- import glob
- import time
- from lxml import etree
- from io import StringIO
- import json
- import time
- from aip import AipOcr
矩形框标注又叫拉框标注,是目前应用最广泛的一种图像标注方法,能够以一种相对简单、便捷的方式在图像或视频数据中,迅速框定指定目标对象。
opencv-python 读取和保存图像_runtao123的博客-CSDN博客_opencv python 保存图像
根据指定格式的文件生成XML标注文件,可以方便使用LabelImg打开进行编辑和查看。其原始文件默认使用逗号进行分隔,
在生成XML文件时,需要对其进行汇总,即将属于同一个原始文件的切图小文件的标注汇总到一起
Python应用基础-根据指定文件生成XML - Surpassme - 博客园
python使用fitz_三种方法,Python轻松提取PDF中全部图片_几木木的博客-CSDN博客
用 Python 做科学计算(工具篇)—— scipy 使用指南 - 知乎
python中os.path.join()、os.path.dirname()、os.path.absname()函数的用法 - 喵小超 - 博客园
exists的用法 python_10个Python中最常用到的文件操作_无敌小羊历险记的博客-CSDN博客
python中正切函数_Python tan() 函数_weixin_39582737的博客-CSDN博客
python标准库之glob介绍 - luminousjj - 博客园
OCR转写是对图像中的文字内容进行标记与转写,帮助训练和完善图片与文本识别模型。目前,景联文支持简体中文、繁体中文、英语、日语、韩语、法语、德语、西班牙语、阿拉伯语等十余种语言印刷或手写图片的转写。
OCR图片转文字两种python方法实现_死磕的斯坦张的博客-CSDN博客_python实现图片转文字
python 使用百度AI实现OCR文字识别 - Acheng1011 - 博客园
python-通过AipOcr百度库对图片验证码进行ocr识别
非局部平均滤波(NonLocalMeans)