• 使用 OpenCV 收集数据


    OpenCV 是“开源计算机视觉”的缩写,是一个机器学习库,旨在实现图像处理和计算机视觉应用。与对象检测和识别相反,OpenCV 还有一个应用是它收集数据的能力。更准确地说,它可以通过在你的机器中本地保存图像来创建数据集。请允许我详细说明。

    这是一个简单的代码片段。(我将使用 Python v 3.9.7 进行演示)

    导入库:我们需要 Python 的 OpenCVOS 库来执行数据收集。如果你没有预先安装这些软件包,你可以通过在命令提示符中执行以下命令来安装它们:

    • OpenCV: pip install opencv-python

    • OS: pip install os-sys

    1. import cv2
    2. import os

    初始化:下一步涉及创建一个 VideoCapture 对象,该对象从系统的网络摄像头实时捕获视频。这是原始文档的链接:https://docs.opencv.org/4.x/dd/d43/tutorial_py_video_display.html

    我们还需要三个变量:

    • flag_collecting:这是一个布尔变量,用作暂停/恢复按钮。

    • images_collected:这是一个整数变量,用于指示系统中收集和保存的图像数量。

    • images_required:这是一个整数变量,用于指示我们打算收集的图像数量。

    然后,我们必须使用 OS 库中的mkdir(make-directory 的缩写)命令创建一个文件夹/目录(在本例中为 testing_demo )。

    1. cap = cv2.VideoCapture(0)
    2. flag_collecting = False
    3. images_collected = 0
    4. images_required = 50
    5. directory = 'testing_demo'
    6. os.mkdir(directory)

    代码的关键:如果这是你第一次使用 OpenCV,建议你阅读此文档以了解代码:https://docs.opencv.org/4.x/dd/d43/tutorial_py_video_display.html

    将逐行解释对标准代码的所有修改,以确保它更容易理解。

    第 3 行:使用*flip()*命令沿 y 轴翻转帧,以确保视频以正确的方式显示。

    第 5 行:while 循环将持续运行,直到收集的图像等于所需的图像。

    第 8 行:使用 cv2.rectangle 命令画一个黑色方块。

    第 11-14 行:提取黑色方块内的切片帧或屏幕的一部分。然后我会将这些提取的帧保存在上面创建的目录中。这将产生尺寸为 240x240 像素的图像。

    OpenCV 中坐标系的原点位于左上角。(80,320) 是从原点开始的 y 坐标,它随着向下移动而增加。(380, 620) 是从原点开始的 x 坐标,它随着向右移动而增加。所以 (380, 80) 和 (620, 320) 对应黑色方块的左上角和右下角坐标。

    第 16-18 行:显示在给定坐标处收集的图像数量。

    第 21–22 行:键盘字符“s”(用于开始/停止)用于暂停或恢复图像收集。它本质上是一个切换按钮。

    第 23 行:键盘字符 'q'(用于退出)用于关闭窗口

    1. while True:
    2.     ret, frame = cap.read()
    3.     frame = cv2.flip(frame, 1)
    4.     
    5.     if images_collected == images_required:
    6.         break
    7.     cv2.rectangle(frame, (380,80),(620,320), (000), 3)
    8.     if flag_collecting == True:
    9.         sliced_frame = frame[80:320,380:620]
    10.         save_path = os.path.join(directory, '{}.jpg'.format(images_collected + 1))
    11.         cv2.imwrite(save_path, sliced_frame)
    12.         images_collected += 1
    13.     cv2.putText(frame, "Saved Images: {}".format(images_collected), (40050),
    14.                 cv2.FONT_HERSHEY_SIMPLEX, 0.7, (000), 2)
    15.     cv2.imshow("Data Collection", frame)
    16.     
    17.     k = cv2.waitKey(10)
    18.     if k == ord('s'):
    19.         flag_collecting = not flag_collecting
    20.     if k == ord('q'):
    21.         break
    22. print(images_collected, "images saved to directory")
    23. cap.release()
    24. cv2.destroyAllWindows()

    应用:最初使用这种技术收集手部符号的图像来创建图像数据集(数据集可以在 Kaggle 上获得:https://www.kaggle.com/datasets/abhinowww/hand-cricket-symbols。你可以用任何东西创建图像数据集。发挥创意!

    实施:已经添加了这个代码的一些图像。建议你在身后有一面空白墙壁来收集数据,以确保框架中没有外部噪音。

    下图是在运行代码之后,在按下键盘上的字符“s”之前拍摄的,这将启动图像收集过程。

    4576bde43b7f7c264c8b6652c4618c17.png

    图像收集前的初始状态

    现在这张图片是在运行代码并按键“s”之后拍摄的。如你所见,收集的图像数量显示在黑色方块上方。这个黑色方块的大小可以根据用户的意愿更改为任何形状或大小。

    fd8b8b3f901831c09447eac5ad7aa312.png

    图像收集过程中的中间状态

    这是图像收集的结果。

    6358ffc36520059f17dda77d7b5972fe.png

    收集的样本图像

    这是遇到过的收集和格式化图像数据的最简单方法之一!

    ☆ END ☆

    如果看到这里,说明你喜欢这篇文章,请转发、点赞。微信搜索「uncle_pn」,欢迎添加小编微信「 woshicver」,每日朋友圈更新一篇高质量博文。

    扫描二维码添加小编↓

    79a8da2ea9c7076f913c6d7958ff5d24.jpeg

  • 相关阅读:
    【生日快乐】SpringBoot SpringBoot 基础篇(第一篇) 第4章 SpringBoot 综合案例 4.8 删除客户
    第18节 动态规划一讲
    西华师范大学 数学考研真题及解析(全收录) 考研 数学分析 708 高代代数 810 真题
    【SimpleFunction系列二.3】Redisson分布式锁8种锁模式剖析
    【Matplotlib绘制图像大全】(二十七):Matplotlib将数组array保存为图像
    锁竞争导致的慢sql分析
    requests 实践
    beamManagement(三)connected mode DL Beam training
    在Ubuntu 系统下开发GUI,用哪种开发工具比较好?
    【SpringMVC源码三千问】@RequstMapping和RequestCondition
  • 原文地址:https://blog.csdn.net/woshicver/article/details/126476566