HOG 特征提取算法(原理篇)

摘要:
首先HOG会接受一张图像,如这张薄饼图,然后计算每个像素的梯度幅值和方向。如果是8乘8的单元那就有64个梯度值,HOG会计算每个单元相同的梯度方向有多少,将这些梯度的幅值相加得到梯度强度。HOG会对图像的每个单元进行同样的处理,这个方向梯度直方图实际上就是个特征向量。后记本文是Udacity计算机视觉纳米学位课程笔记,下一步实践篇将在OpenCV中实现HOG算法。

在计算机视觉中人们设计了很多算法来提取空间特征,并利用图像梯度信息来识别物体。

HOG 特征提取算法(原理篇)第1张

其中一种技术叫做 HOG,也即方向梯度直方图(Histogram of Oriented Gradient)。方向梯度直方图听着太高深了,我们先来讲一下这些术语。

HOG 特征提取算法(原理篇)第2张

直方图就是数据分布的一种图形表现,看起来有点像柱形图,其柱形有不同的高度,每个柱形代表一组处于一定值范围的数据。这些柱形也称为组(bins),柱形越高意味着某组数据越多。

以灰度图像为例,假设你想绘制出这张薄饼图的强度数据直方图。

HOG 特征提取算法(原理篇)第3张

我们知道像素值的范围在 0 到 255 之间,所以我们可以把这些值分成若干组。我要创建 32 个组,每组包含 8 个像素值,所以第一组范围是 0 到 7,然后 8 到 15 以此类推一直到 248 到 255。
要创建直方图,我们得来看看这张图里的各个像素值,将各像素值放到对应的组里。这张图的薄饼里有很多亮值,背景则很黑,所以直方图看起来是这样的。

HOG 特征提取算法(原理篇)第4张

在这个直方图里黑色像素明显堆积在一起,蓝色框标识的是背景的像素,这些像素都在这些低值范围里。明亮的像素也聚集在一起,基本上都在灰度值 200 左右,这肯定是薄饼的大部分像素值。
看完灰度值的直方图,我们来讲下一个术语“方向梯度”。
方向很简单,指的就是图像梯度的方向或朝向。我们已经了解怎么用 Sobel 算子来计算梯度幅值和方向了。把三个术语结合在一起,HOG 就是指一张有关图像梯度方向的直方图。首先 HOG 会接受一张图像,如这张薄饼图,然后计算每个像素的梯度幅值和方向。

HOG 特征提取算法(原理篇)第5张

这其中蕴含的信息可不少,所以 HOG 实际上会把这些像素分成若干个较大的正方形单元,单元大小通常是 8 乘 8 如果图片小一些单元也就小一些。如果是 8 乘 8 的单元那就有 64 个梯度值,HOG 会计算每个单元相同的梯度方向有多少,将这些梯度的幅值相加得到梯度强度。接着 HOG 会把所有方向数据放到直方图里,这个直方图有九组,也就是九个值范围。不过你可以建立更多组来进一步分类数据。

HOG 特征提取算法(原理篇)第6张

HOG 会对图像的每个单元进行同样的处理,这个方向梯度直方图实际上就是个特征向量。接下来我们要用这些 HOG 特征来训练分类器,思路就是对于物体相同但大小、方向不同的图像,我们可以利用相同的 HOG 特征模式来检测物体,而不管物体的位置和呈现方式。

后记

本文是 Udacity 计算机视觉纳米学位课程笔记,下一步实践篇将在 OpenCV 中实现 HOG 算法。

免责声明:文章转载自《HOG 特征提取算法(原理篇)》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇Mysql性能优化《游戏引擎架构》笔记三下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

CS231N 数据预处理(data proprecessing)

原文链接:https://blog.csdn.net/weixin_38646522/article/details/79534677 一些数据预处理的标准方法有均值化数据和归一化数据。 零中心化的意义在上面已经详细的讲述了,这里就不在细讲。 归一化数据的意义在于让所有的特征都在相同的值域之内,并且让这些特征有相同的贡献。对于图像处理,在大部分情况下会进...

字体单位大小对照换算表(字号、磅、英寸、像素)

字号“数值”越大,字就越小。   中文字号 英文字号(磅) 毫米 像素 1英寸 72pt 25.30mm 95.6px  大特号 63pt 22.14mm 83.7px 特号 54pt 18.97mm 71.7px  初号 42pt 14.82mm 56px 小初 36pt 12.70mm 48px 一号 26pt 9.17mm...

Logistic模型原理详解以及Python项目实现

此文转载自:https://blog.csdn.net/master_hunter/article/details/111158447#commentBox 目录 前言 一、Logistic回归模型 二、Logit模型 三、几率 四、Logistic模型 五、基于最优化方法的最佳回归系数确定 5.1梯度上升算法 5.1.1梯度 5.1.2使用梯度上升找到最...

图像处理之bayer格式

转自知乎:https://zhuanlan.zhihu.com/p/72581663 bayer格式介绍 Bayer格式是相机内部的原始图片, 一般后缀名为.raw。bayer 格式图片在一块滤镜上设置的不同的颜色,通过分析人眼对颜色的感知发现,人眼对绿色比较敏感,所以一般bayer格式的图片绿色格式的像素是是r和g像素的和。 如下图,为bayer色彩滤波...

Histogram of Oriented Gridients(HOG) 方向梯度直方图

Histogram of Oriented Gridients,缩写为HOG,是目前计算机视觉、模式识别领域很常用的一种描述图像局部纹理的特征。这个特征名字起的也很直白,就是说先计算图片某一区域中不同方向上梯度的值,然后进行累积,得到直方图,这个直方图呢,就可以代表这块区域了,也就是作为特征,可以输入到分类器里面了。那么,接下来介绍一下HOG的具体原理和计...

深度学习——卷积神经网络入门

传统神经网络:   是全连接形式,即样本的每个特征属性都通过所有的隐藏层节点映射,最后输出数据。由于是全连接,所以计算极为复杂,且模型不易学习。 卷积神经网络:卷积神经网络(Convolutional Neural Networks, CNN), CNN可以有效的降低反馈神经网络(传统神经网络)的复杂性,常见的CNN结构有LeNet-5、AlexNet、Z...