方向梯度直方图(Histogram of Oriented Gradient, HOG)使用梯度方向的分布作为特征来构造描述符,应用非常广泛。
梯度的幅值是边缘和角点检测的基础,梯度的方向也包含着丰富的图像特征。HOG的基本思想,就是图像的局部特征可以用梯度幅值和方向的分布描述。HOG的基本方法是,将图像划分成多个单元格,计算单元格的方向梯度直方图,把每个单元格的直方图连接起来构造为HOG特征向量。
HOG描述符的向量维数不是固定不变的,取决于检测图像大小和单元格的大小。HOG描述符不具有尺度和旋转不变性,但具有有良好的几何和光学不变性,特别适合人体检测。
OpenCV提供了cv::HOGDescriptor类实现HOG描述符。在Python语言中,OpenCV提供了HOG类的接口函数cv.HOGDescriptor。
函数原型
cv.HOGDescriptor(_winSize, _blockSize, _blockStride, _cellSize, _nbins) → retval
hog.compute(img[, _winStride=Size(), _padding=Size()]) → descriptors
参数说明
winSize:检测窗口大小,形如(w,h)的元组,默认值(64,128)。
blockSize:子块的大小,形如(w,h)的元组,默认值(16,16)。
blockStride:子块的滑动步长,形如(w,h)的元组,默认值(8,8)。
cellSize:单元格大小,形如(w,h)的元组,默认值(8,8)。
nbins:直方图的条数,整数,默认值9。
img:输入图像,单通道,数据类型CV_8U。
winStride:窗口大小,可选项,必须是blockStride的整数倍。
descriptors:HOG描述符,形为(lenHOG,)的Numpy 数组,数据类型CV_32F。
函数说明
⑴ 计算每个单元格cell的HOG:方向梯度的取值范围0~180度,等分为nbins个区间,单元格像素的梯度方向分配到nbins个扇形区间,累加每个区间内的像素数,得到nbins位的HOG向量。
⑵ 构造子块block的HOG:多个单元格cell组合为子块,子块的HOG描述符就是多个单元格HOG向量的串联,长度为nbins*blockSize/cellSize。
⑶ 整个检测窗口的HOG:子块block以步长blockStride在检测窗口内滑动,遍历检测窗口,检测窗口的HOG就是每个子块block的HOG的串联。
因此,检测窗口的HOG的向量维数是:
lenHOG = nbins * (blockSize[0]/cellSize[0]) * (blockSize[1]/cellSize[1])
* ((winSize[0]-blockSize[0])/blockStride[0] + 1)
* ((winSize[1]-blockSize[1])/blockStride[1] + 1)
注意问题
# 构造 HOG 检测器
winSize = (40, 40)
blockSize = (20, 20)
blockStride = (10, 10)
cellSize = (10, 10)
nbins = 8
hog = cv.HOGDescriptor(winSize, blockSize, blockStride, cellSize, nbins)
# hog = cv.HOGDescriptor(_winSize=(40,40), _blockSize=(20,20),
# _blockStride=(10,10), _cellSize=(10,10), _nbins=8)
本例程示例HOG描述符的使用。为了便于解释HOG原理和绘图,例程中将检测窗口、子块和单元格设为相同的尺寸,实际应用时可以参考函数默认值来设置。
# 【1609】特征描述之 HOG 描述符
import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
def drawHOG(image, descriptors, cx, cy, rad):
angles = np.arange(0, 180, 22.5).astype(np.float32) # start, stop, step
normGrad = descriptors/np.max(descriptors).astype(np.float32)
gx, gy = cv.polarToCart(normGrad*rad, angles, angleInDegrees=True)
for i in range(angles.shape[0]):
px, py = int(cx+gx[i]), int(cy+gy[i])
cv.arrowedLine(image, (cx,cy), (px, py), 0, tipLength=0.1) # 黑色
return image
if __name__ == '__main__':
# (1) 读取样本图像,构造样本图像集合
img = cv.imread("../images/Fig1101.png", flags=0) # 灰度图像
height, width, wCell, d = 200, 200, 20, 10
img = cv.resize(img, (width, height)) # 调整为统一尺寸
# (2) 构造 HOG 检测器
winSize = (20, 20)
blockSize = (20, 20)
blockStride = (20, 20)
cellSize = (20, 20)
nbins = 8
hog = cv.HOGDescriptor(winSize, blockSize, blockStride, cellSize, nbins)
lenHOG = nbins * (blockSize[0]/cellSize[0]) * (blockSize[1]/cellSize[1]) \
* ((winSize[0]-blockSize[0])/blockStride[0] + 1) \
* ((winSize[1]-blockSize[1])/blockStride[1] + 1)
print("length of descriptors:", lenHOG)
# (3) 计算检测区域的 HOG 描述符
xt, yt = 80, 80 # 检测区域位置
cell = img[xt:xt+wCell, yt:yt+wCell]
cellDes = hog.compute(cell) # HOG 描述符,(8,)
normGrad = cellDes/np.max(cellDes).astype(np.float32)
print("shape of descriptors:{}".format(cellDes.shape))
print(cellDes)
# (4) 绘制方向梯度示意图
imgGrad = cv.resize(cell, (wCell*10, wCell*10), interpolation=cv.INTER_AREA)
Gx = cv.Sobel(img, cv.CV_32F, 1, 0, ksize=5) # X 轴梯度 Gx
Gy = cv.Sobel(img, cv.CV_32F, 0, 1, ksize=5) # Y 轴梯度 Gy
magG, angG = cv.cartToPolar(Gx, Gy, angleInDegrees=True) # 极坐标求幅值与方向 (0~360)
print(magG.min(), magG.max(), angG.min(), angG.max())
angCell = angG[xt:xt+wCell, yt:yt+wCell]
box = np.zeros((4, 2), np.int32) # 计算旋转矩形的顶点, (4, 2)
for i in range(wCell):
for j in range(wCell):
cx, cy = i*10+d, j*10+d
rect = ((cx,cy), (8,1), angCell[i,j]) # 旋转矩形类
box = np.int32(cv.boxPoints(rect)) # 计算旋转矩形的顶点, (4, 2)
cv.drawContours(imgGrad, [box], 0, (0,0,0), -1)
# (5) 绘制检测区域的方向梯度直方图
cellHOG = np.ones((201,201), np.uint8) # 白色
cellHOG = drawHOG(cellHOG, cellDes, xt+d, yt+d, 40)
# (6) 绘制图像的方向梯度直方图
imgHOG = np.ones(img.shape, np.uint8)*255 # 白色
for i in range(10):
for j in range(10):
xc, yc = 20*i, 20*j
cell = img[xc:xc+wCell, yc:yc+wCell]
descriptors = hog.compute(cell) # HOG 描述符,(8,)
imgHOG = drawHOG(imgHOG, descriptors, xc+d, yc+d, 8)
imgWeight = cv.addWeighted(img, 0.5, imgHOG, 0.5, 0)
plt.figure(figsize=(9, 6.2))
plt.subplot(231), plt.title("1. Original")
cv.rectangle(img, (xt,yt), (xt+wCell,yt+wCell), (0,0,0), 2) # 绘制 block
plt.axis('off'), plt.imshow(img, cmap='gray')
plt.subplot(232), plt.title("2. Oriented gradient")
angNorm = np.uint8(cv.normalize(angG, None, 0, 255, cv.NORM_MINMAX))
plt.axis('off'), plt.imshow(angNorm, cmap='gray')
plt.subplot(233), plt.title("3. Image with HOG")
cv.rectangle(imgWeight, (xt,yt), (xt+wCell,yt+wCell), (0,0,0), 2) # 绘制 block
plt.axis('off'), plt.imshow(imgWeight, cmap='gray')
plt.subplot(234), plt.title("4. Grad angle of cell")
plt.axis('off'), plt.imshow(imgGrad, cmap='gray')
plt.subplot(235), plt.title("5. HOG of cell")
strAng = ("0", "22", "45", "67", "90", "112", "135", "157")
plt.bar(strAng, cellDes*wCell*wCell)
plt.subplot(236), plt.title("6. HOG diagram of cell")
plt.axis('off'), plt.imshow(cellHOG, cmap='gray')
plt.tight_layout()
plt.show()
程序说明:
参考文献:Navneet Dalal, Bill Triggs. Histograms of oriented gradients for human detection. In Computer Vision and Pattern Recognition, 2005. CVPR 2005. IEEE Computer Society Conference on, volume 1, pages 886–893. IEEE, 2005.
【本节完】
版权声明:
youcans@xupt 原创作品,转载必须标注原文链接:(https://blog.csdn.net/youcans/article/details/127970587)
Copyright 2022 youcans, XUPT
Crated:2022-11-20