• 标注工具—labelme, label-studio



    最近在学习使用标注工具,图像领域比较知名的标注工具如labelme,最近又发现了一款十分好用的集成标注工具label-studio,功能十分强大。故做下记录,以便于需要时使用。

    实验环境:
    Ubuntu 20.04, 下面的配置都是基于anaconda进行的。

    一、Labelme

    安装

    安装非常简单,

    # conda create --name labelme python=3.8
    # conda activate labelme
    # pip install pyqt5
    # pip install labelme
    
    • 1
    • 2
    • 3
    • 4

    使用

    进入labelme环境以后,运行# labelme 命令,可以看到打开的labelme界面,如下,比较简陋,
    在这里插入图片描述如上图所示,加载一张图片以后可以通过Create Polygons来标注目标的边界框,然后通过Edit Polygons进行微调, 标注完成后可以在右边看到label_list, polygon list,.

    导出

    点击左侧的save,标注信息保存为json文件,打开后如下:
    在这里插入图片描述可以看到标注信息实际上就是边界框(4个points)和label。

    二、label-studio

    简介

    Label-studio是一款功能十分强大的标注工具IDE, 具有如下特点:
    可配置: 使用jsx tags配置,自定义配置标注页面,所以可标注格式很多,样式也可以自定义
    协作标注: 由两个或更多人label同一任务,然后比较结果,还支持用户名密码简单的认证。 支持按预测的模型预测的probability的大小顺序标注,默认按导入数据的索引顺序标注。
    多种数据类型: 您定义自己的具有不同的label类型, Images, Audios, Texts, HTMLs,已有大量模板,直接使用接口
    支持导入格式: JSON, CSV, TSV, RAR and ZIP archives,支持API导入数据。
    NPM嵌入: 前端是NPM包, NPM package. 您可以将其包含在您的项目中 .机器学习: 机器学习的集成支持。 可视化并比较来自不同模型的预测。
    pre-labeling功能很好,可以实现用训练的模型预标注数据,那么结果人工标注前就比较方便,而且还知道模型预测的怎么样支持docker容器部署方便的API接口

    安装

    # conda create --name label-studio python=3.8
    # conda activate label-studio
    #  pip install label-studio
    
    • 1
    • 2
    • 3

    注:因为网络原因我湿了好多次才安装成功。

    使用

    label-studio环境下,执行 # label-studio即可打开界面,如下图所示,

    在这里插入图片描述点击右边的“Create” 来创建Projects,Project的创建分为3步:
    (1) 设置项目名称和描述信息
    在这里插入图片描述

    (2)导入数据,可以通过URL导入或者本地文件夹,支持 文本,视频,音频数据,各种格式都支持哈。
    在这里插入图片描述

    (3)指定具体的标注任务,指定以后进一步设置相关所需的信息
    在这里插入图片描述

    例子

    我创建了一个NLP -text classification的Project, 在labeling setup这一步我设置了共三个类别:Command, Non-Command, Neutral。创建完成以后如下图所示:
    在这里插入图片描述由于我导入的是一个文本数据,每一行对应一个样本,也就是上图中的一个个task, 接下来要对每个task设置标记。
    随便选择一个task右击打开如下图,直接从上一步设置label space中选中一个标记即可,记得点击Submit进行提交, 提交之后可以看到左边的对应Task的Total anacontation per task状态由0变为1。
    当然也可以点击上边的label all tasks, 然后连续地进行宁标注任务。
    在这里插入图片描述
    所有tasks标注完成以后, 就可以导出了,直接点击右上角的Export导出为指定格式的文件即可。

    当然也可以使用模型进行辅助标记, 这个对于图像标注任务非常有帮助,能够大幅提升标注的效率, 后边有时间再细说。

    总结

    Label-studio功能非强大,并且本身也在不断升级,推荐使用。

  • 相关阅读:
    支持导入ics文件的提醒待办类工具
    项目基于MVC的.Net技术类门户网站源码
    leetcode - 22 672. 灯泡开关 Ⅱ
    12 | 使用 Spark SQL执行CURL
    LeetCode知识点总结 - 89
    【力扣】994.腐烂的橘子
    Dubbo中的Triple协议和应用级服务发现
    Kotlin 设置和获取协程名称
    ChatGPT高效提问——角色提示
    【C语言】还有柔性数组?
  • 原文地址:https://blog.csdn.net/QKK612501/article/details/126754772