• OpenCV实现单目相机检测物体尺寸


    目录

    步骤:

    Canny边缘检测算法介绍:

    多边形逼近

    代码实现:

    效果展示:


    步骤:

    1. 导入必要的库:cv2用于图像处理,numpy用于数组操作。
    2. 定义了一个函数preprocess,用于对图像进行预处理。首先将图像转换为灰度图,然后进行高斯模糊来平滑图像。接着使用腐蚀操作进一步去除噪声,并最后通过Canny边缘检测算法得到图像的边缘。
    3. 定义了一个函数get_object_contour,用于获取物体的轮廓并进行多边形逼近。它使用cv2.findContours函数来获取图像中的轮廓,并找出最大的轮廓。然后使用cv2.approxPolyDP进行多边形逼近,并绘制出逼近的多边形。
    4. 打开摄像头,创建VideoCapture对象。
    5. 进入循环,读取摄像头捕获的图像。
    6. 调用preprocess函数对图像进行预处理和边缘检测。
    7. 调用get_object_contour函数获取物体的轮廓并进行多边形逼近。
    8. 在原图上绘制出逼近的多边形。
    9. 显示处理后的图像。
    10. 如果按下ESC键,则退出循环。
    11. 释放摄像头和窗口。

    这段代码可以实现实时检测物体边缘并进行可视化显示。您需要根据实际情况调整摄像头的索引(例如0表示默认摄像头,1表示外部摄像头)。

    Canny边缘检测算法介绍:

    Canny边缘检测算法是一种经典且广泛应用的图像边缘检测算法,由John F. Canny于1986年提出。它的主要目标是发现图像中最明显的边缘,并尽量减少误检和漏检。

    Canny边缘检测算法的步骤如下:

    1. 高斯模糊(Gaussian Blur):为了减少噪声对边缘检测的影响,首先对图像进行高斯模糊处理。高斯模糊通过使用一个高斯核函数对图像进行卷积操作,使得图像的细节被模糊化,从而平滑图像。

    2. 计算图像梯度(Gradient Computation):使用Sobel算子计算图像在水平和垂直方向上的梯度值。梯度表示图像中像素强度变化最大的方向,可以用来定位边缘。

    3. 非极大值抑制(Non-maximum Suppression):在图像的梯度方向上,对每个像素点进行非极大值抑制。这一步的目的是保留梯度变化最大的像素点,抑制其他像素点,进一步细化边缘。

    4. 双阈值处理和边缘连接(Double Thresholding and Edge Tracking):根据设定的阈值,将梯度幅值分为强边缘、弱边缘和非边缘三个部分。其中,高于高阈值的像素被确定为强边缘,低于低阈值的像素被排除,而介于两个阈值之间的像素被标记为弱边缘。然后,通过强边缘像素附近连接的方式,将弱边缘像素与强边缘像素进行连接,形成完整的边缘。

    Canny边缘检测算法利用了梯度和边缘灰度变化的特点,具有良好的准确性和较低的误检率。它在计算机视觉、图像处理等领域广泛应用,常用于目标检测、边缘提取、图像分割等任务。

    多边形逼近

    approx = cv2.approxPolyDP(max_contour, epsilon, True)

    原理:

    cv2.approxPolyDP是OpenCV中的一个函数,用于对轮廓进行多边形逼近。

    多边形逼近的原理是通过使用Douglas-Peucker算法来近似表示一条曲线(即轮廓)为更简单的多边形。该算法会选择曲线上的关键点,并删除其中一些点,以保持逼近误差在可接受范围内。这样可以将复杂的曲线轮廓逼近为近似的多边形轮廓。

    函数cv2.approxPolyDP的参数包括输入的轮廓、所需逼近的精度(即逼近的程度)以及布尔值closed用于指示是否封闭多边形。逼近的精度由一个称为ε(epsilon)的参数决定,它定义了逼近的最大距离。

    首先,cv2.approxPolyDP会根据输入的轮廓计算出逼近的多边形轮廓。然后,根据逼近的结果,将多边形的顶点绘制在图像上。

    通过调整逼近的精度参数ε,可以控制多边形逼近的程度。较小的ε会得到更接近原始轮廓的多边形,而较大的ε会得到更简化的多边形。

    多边形逼近在图像处理中常用于边缘检测、轮廓分析、形状识别等任务。它可以将复杂的轮廓简化为更易处理的形状,并提取出物体的大致形状和结构信息。

    代码实现:

    1. import cv2
    2. import numpy as np
    3. def preprocess(image):
    4. # 进行图像预处理(例如灰度化、高斯模糊等)
    5. gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    6. blurred = cv2.GaussianBlur(gray, (5, 5), 0)
    7. kernal = np.ones((5, 5), np.uint8)
    8. blurred = cv2.erode(blurred, kernal) # 腐蚀
    9. blurred = cv2.erode(blurred, kernal)
    10. edges = cv2.Canny(blurred, 50, 150)
    11. return edges
    12. def get_object_contour(image):
    13. # 获取物体轮廓
    14. _, contours, _ = cv2.findContours(image, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
    15. if len(contours) > 0:
    16. # 找出最大的轮廓
    17. max_contour = max(contours, key=cv2.contourArea)
    18. # 进行多边形逼近
    19. epsilon = 0.02 * cv2.arcLength(max_contour, True)
    20. approx = cv2.approxPolyDP(max_contour, epsilon, True)
    21. # 绘制逼近的多边形
    22. cv2.drawContours(frame, [approx], 0, (0, 255, 0), 2)
    23. return approx
    24. return None
    25. # 打开摄像头
    26. cap = cv2.VideoCapture(1)
    27. while True:
    28. ret, frame = cap.read()
    29. if not ret:
    30. break
    31. # 图像预处理及边缘检测
    32. edges = preprocess(frame)
    33. # 获取物体轮廓并进行多边形逼近
    34. approx = get_object_contour(edges)
    35. # 显示图像
    36. cv2.imshow('Object Detection', frame)
    37. # 按下ESC键退出
    38. if cv2.waitKey(1) == 27:
    39. break
    40. # 释放摄像头和窗口
    41. cap.release()
    42. cv2.destroyAllWindows()

    效果展示:

  • 相关阅读:
    详细介绍 Oracle中的Materialized Views(物化视图/快照)
    【Python系列】数字的bool值
    ROS2: 定义新的数据类型并使用
    【备忘录】JavaScript代码段儿
    UE源码分析:Slate 鼠标/触摸输入处理
    zabbix监控触发器与报警动作
    LeetCode 155.最小栈&&牛客 栈的压入、弹出序列
    76页智慧物流园区综合解决方案2022(附下载)
    实验四 内核线程管理-实验部分
    开发GD32遇到的坑B点
  • 原文地址:https://blog.csdn.net/qq_53545309/article/details/133703064