在 OpenCV 中,图像形态学操作是一组基于图像形状的处理技术,其中膨胀(Dilation)是其中之一。膨胀操作可用于图像处理中的特征增强、去噪、分割和边缘检测等。其基本原理是利用结构元素(Kernel 或 Structuring Element)对图像进行局部区域的最大值操作,将核与图像进行卷积,用核的最大值替代当前像素值,从而使目标物体区域扩张。膨胀操作可以根据具体的应用场景选择不同的结构元素大小和形状,以达到最佳效果。
膨胀操作的数学定义为:对于图像
A
A
A 和结构元素
B
B
B,膨胀操作可表示为
A
⊕
B
A \oplus B
A⊕B,其中膨胀操作可以用以下数学公式表示:
(
A
⊕
B
)
(
x
,
y
)
=
⋃
(
i
,
j
)
∈
B
A
(
x
+
i
,
y
+
j
)
(A \oplus B)(x, y) = \bigcup_{(i, j) \in B} A(x + i, y + j)
(A⊕B)(x,y)=(i,j)∈B⋃A(x+i,y+j)
其中,
(
x
,
y
)
(x, y)
(x,y) 是图像
A
A
A 上的像素坐标,
(
i
,
j
)
(i, j)
(i,j) 是结构元素
B
B
B 的坐标。
在 OpenCV 中,你可以使用 cv2.dilate() 函数来进行图像的膨胀操作。以下是一个简单的 Python 代码示例,演示如何使用 OpenCV 进行图像膨胀操作:
import cv2
import numpy as np
def show_images(image):
cv2.namedWindow('image',cv2.WINDOW_KEEPRATIO)
cv2.imshow('image',image)
cv2.waitKey()
cv2.destroyAllWindows()
def Dilated(image):
# 定义膨胀操作的结构元素(这里使用3x3的矩形结构元素)
kernel = np.ones((3, 3), np.uint8)
# 进行膨胀操作
dilated_image = cv2.dilate(image, kernel, iterations=1)
return dilated_image
if __name__ == '__main__':
# 读取图像
img = cv2.imread('cat-dog.png', flags=0)
re_img=Dilated(img)
# top_row = np.hstack((img, re_img[0]))
# bottom_row = np.hstack((re_img[1], re_img[2])) #水平
# combined_img = np.vstack((img, re_img))# 垂直
combined_img=np.hstack((img,re_img))
show_images(combined_img)
适用场景: