关于HOG特征的一些理解

我们最后得到的HOG向量是一个1 * n的特征向量,其中n是HOG的特征维数。这个向量的每个元素的值代表着每一个block在x个bin上的梯度值之和。
例如700 * 700的灰度图,9个bins,每一个block有10 * 10个cell,每一个cell有20 * 20个pixels,每一个滑动步长stride默认为一个cell的长和宽
那么这个图片的特征维数就是{ [(700-200)/20]+1 } * { [(700-200)/20]+1 } 1009=608400。即HOG向量是一个1 * 608400的行向量。而这个向量的每个元素的值代表着每一个block在9个bin上的梯度值之和。如图
在这里插入图片描述
则第一个值0.03644248表示第一个cell中20个像素在方向0-20°上的梯度值之和。

HOG统计直方图的计算是根据如下法则。假设a像素点的梯度幅值为0.1,方向为10°,那么就在bin=1处增加0.1

代码如下
import numpy as np
from skimage.feature import hog
import cv2
import matplotlib.pyplot as plt
size = 700

path = ‘F:/1/2-1.jpg’
image = cv2.imread(path)
#cv2.imshow(‘1’,image)
#cv2.waitKey(0)
image1 = cv2.resize(image, (size, size))
image2=cv2.cvtColor(image1,cv2.COLOR_BGR2GRAY)
cv2.imshow(‘2’,image2)
cv2.waitKey(0)
print(image2.shape)

fd = hog(image2, orientations=9, pixels_per_cell=[20,20], cells_per_block=[10,10], visualize=False, transform_sqrt=True,block_norm=‘L2-Hys’)

print(fd.shape)
print(fd)
#cv2.waitKey(0)

结果如图
关于HOG特征的一些理解_第1张图片

你可能感兴趣的:(关于HOG特征的一些理解)