单阶多层检测器: SSD(一)

摘要:
1.SSD概述作为一阶网络,SSD算法从多个角度对对象检测进行了创新。这是一个优雅而高效的检测网络。本节将从算法层面简要介绍SSD的总体流程。1.SSD算法的算法流程如图5.1所示。输入图像首先通过VGGNet的基本网络,在该网络上添加了几个卷积层,然后3×3的卷积核在不同大小和深度的六个特征层上进行预测,获得预选框的分类和回归预测值,并最终直接预测结果或获得网络损失。

  对于物体检测任务, 第4章的Faster RCNN算法采用了两阶的检测架构, 即首先利用RPN网络进行感兴趣区域生成, 然后再对该区域进行类别的分类与位置的回归, 这种方法虽然显著提升了精度, 但也限制了检测速度。 YOLO算法利用回归的思想, 使用一阶网络直接完成了物体检测, 速度很快, 但是精度有了明显的下降。

  在此背景下, SSDSingle Shot Multibox Detecor) 算法借鉴了Faster RCNNYOLO的思想, 在一阶网络的基础上使用了固定框进行区域生成, 并利用了多层的特征信息, 在速度与检测精度上都有了一定的提升。

  本章将首先介绍SSD方法的主要思想, 然后针对重要的结构模块,从代码层面一一解读其实现方法, 最后将分析SSD的优缺点, 并介绍一些经典的改进算法。

1. SSD总览
  作为一阶网络, SSD算法从多个角度对物体检测做了创新, 是一个既优雅又高效的检测网络, 本节将从算法层面简要介绍SSD的总体过程
1.1 SSD的算法流程
  SSD算法的算法流程如图5.1所示, 输入图像首先经过了VGGNet的基础网络, 在此之上又增加了几个卷积层, 然后利用3×3的卷积核在6个大小与深浅不同的特征层上进行预测, 得到预选框的分类与回归预测值, 最后直接预测出结果, 或者求得网络损失。

SSD的算法思想, 主要可以分为4个方面:
  ·数据增强: SSD在数据部分做了充分的数据增强工作, 包括光学变换与几何变换等, 极大限度地扩充了数据集的丰富性, 从而有效提升了模型的检测精度。
  ·网络骨架: SSD在原始VGGNet的基础上, 进一步延伸了4个卷积模块, 最深处的特征图大小为1×1, 这些特征图具有不同的尺度与感受野, 可以负责检测不同尺度的物体。
  ·PriorBox与多层特征图: 与Faster RCNN类似, SSD利用了固定大小与宽高的PriorBox作为区域生成, 但与Faster RCNN不同的是, SSD不是只在一个特征图上设定预选框, 而是在6个不同尺度上都设立预选框, 并且在浅层特征图上设立较小的PriorBox来负责检测小物体, 在深层特征图上设立较大的PriorBox来负责检测大物体。
  ·正、 负样本的选取与损失计算: 利用3×3的卷积在6个特征图上进行特征的提取, 并分为分类与回归两个分支, 代表所有预选框的预测值, 随后进行预选框与真实框的匹配, 利用IoU筛选出正样本与负样本, 最终计算出分类损失与回归损失。

 单阶多层检测器: SSD(一)第1张

 

免责声明:文章转载自《单阶多层检测器: SSD(一)》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇Azkaban-3.x 配置信息说明大数据查询——HBase读写设计与实践下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

deepfake 资源总结

  1. https://zhuanlan.zhihu.com/p/34042498   深度解密换脸应用Deepfake 2. 在 1 里面提到的PixelShuffle,具体见参考3: https://mathematica.stackexchange.com/questions/181587/how-to-define-a-pixelshuffle...

TCP 的那些事儿(下)

本文转载自TCP 的那些事儿(下) 导语 这篇文章是下篇,所以如果你对TCP不熟悉的话,还请你先看看上篇《TCP的那些事儿(上)》 上篇中,我们介绍了TCP的协议头、状态机、数据重传中的东西。但是TCP要解决一个很大的事,那就是要在一个网络根据不同的情况来动态调整自己的发包的速度,小则让自己的连接更稳定,大则让整个网络更稳定。在你阅读下篇之前,你需要做好准...

【tensorflow2.0】模型层layers

深度学习模型一般由各种模型层组合而成。 tf.keras.layers内置了非常丰富的各种功能的模型层。例如, layers.Dense,layers.Flatten,layers.Input,layers.DenseFeature,layers.Dropout layers.Conv2D,layers.MaxPooling2D,layers.Conv1D...

手把手教你搭建卷积神经网络(CNN)

本文是基于吴恩达老师的《深度学习》第四课第一周习题所做,如果本文在某些知识点上描述得不够透彻的可以参见相关章节的具体讲解,同时极力推荐各位有志从事计算机视觉的朋友观看一下吴恩达老师的《深度学习》课程。1.卷积神经网络构成总的来说,卷积神经网络与神经网络的区别是增加了若干个卷积层,而卷积层又可细分为卷积(CONV)和池化(POOL)两部分操作(这两个重要概念...

机器学习算法与Python实践之(七)逻辑回归(Logistic Regression)

http://blog.csdn.net/zouxy09/article/details/20319673 机器学习算法与Python实践之(七)逻辑回归(Logistic Regression) zouxy09@qq.com http://blog.csdn.net/zouxy09 机器学习算法与Python实践这个系列主要是参考《机器学习实战》这本书...

Nand flash 三种类型SLC,MLC,TLC【转】

转自:https://blog.csdn.net/fc34235/article/details/79584758 转载自:http://diy.pconline.com.cn/750/7501340.html 从前,大家谈TLC色变;如今,TLC攻占SSD半壁江山。是的,这个世界就是这么奇妙。 虽然TLC早已占据主流地位,但传言多了、百度多了,不少消费者...