小目标检测的增强算法

摘要:
结果表明,小真实目标与预测锚之间的重叠度远低于期望的IoU阈值。与目前最新的基于MS-COCO的Mask-R-CNN方法相比,本文在实例分割和小目标检测方面分别取得了9.7%和7.1%的相对改进。2.RelatedWork实例分割实例分割超出了对象检测的范围,需要预测每个对象的准确掩码。然后讨论了MS-COCO数据集的问题和训练中使用的锚匹配过程,这有助于小目标检测的困难。其次,提出了一种基于复制粘贴小对象的增强算法。

小目标检测的增强算法

Augmentation for small object detection

摘要

近年来,目标检测取得了令人瞩目的进展。尽管有了这些改进,但在检测小目标和大目标之间的性能仍有很大的差距。本文在一个具有挑战性的数据集上分析了当前最先进的模型Mask RCNN,MS COCO。结果表明,小真实目标与预测锚之间的重叠度远低于期望的IoU阈值。本文推测这是由于两个因素造成的:(1)只有少数图像包含小对象,并且(2)即使在包含它们的每个图像中,小对象也不足以出现。因此,本文建议用小对象对这些图像进行过采样,并通过多次复制粘贴小对象来增强每个图像。它允许本文在大物体和小物体上权衡探测器的质量。本文评估了不同的粘贴增强策略,最终,本文在实例分割和小目标检测方面分别比MS-COCO上的现有方法提高了9.7%和7.1%。

1. Introduction

本文关注的是最先进的物体探测器Mask R-CNN[18],一个具有挑战性的数据集,COCO女士。本文注意到这个数据集关于小对象的两个属性。首先,本文观察到数据集中包含小对象的图像相对较少,这可能会使任何检测模型偏向于更集中于中大型对象。其次,小物体覆盖的区域要小得多,这意味着小物体的位置缺乏多样性。本文推测,这使得当小目标出现在图像中不易被探测的部分时,目标检测模型很难在测试时间内推广到小目标。本文通过对包含小物体的图像进行过采样来解决第一个问题。第二个问题通过在包含小对象的每个图像中多次复制粘贴小对象来解决。粘贴每个对象时,本文确保粘贴的对象不会与任何现有对象重叠。这增加了小对象位置的多样性,同时确保这些对象出现在正确的上下文中,如图3所示。每幅图像中小物体数量的增加进一步解决了少量正匹配锚的问题,本文在第3节中对其进行了定量分析。与目前最新的基于MS-COCO的Mask-R-CNN方法相比,本文在实例分割和小目标检测方面分别取得了9.7%和7.1%的相对改进。

小目标检测的增强算法第1张

2. Related Work

实例分割实例分割超出了对象检测的范围,需要预测每个对象的准确掩码。多任务网络级联(MNC)[9]构建一个预测和屏蔽的级联。全卷积实例感知语义分割(FCIS)[23]是一个全卷积模型,它计算每个感兴趣区域共享的位置敏感得分图。[14] ,这也是一种完全卷积的方法,学习像素嵌入。Mask R-CNN[18]扩展了FPN模型的一个分支,用于预测掩模,并引入了新的不同裁剪操作,用于对象检测和实例分割。

可以通过提高输入图像分辨率[7,26]或将高分辨率特征与低分辨率图像的高维特征融合来处理检测小目标的小目标[36,2,5,27]。然而,这种使用更高分辨率的方法增加了计算开销,并且没有解决大小对象之间的不平衡。[22]取而代之的是,使用世代对抗网络(GAN)在复杂网络中构建特征,在交通标志和行人检测的背景下,这些特征在小物体和大物体之间是不可区分的。[12] 使用基于区域建议网络中不同分辨率层的不同锚定比例。[13] 根据锚定大小的正确分数移动图像特征以覆盖它们之间的间隙。[6,33,8,19]裁剪小对象建议时添加上下文。

小目标检测的增强算法第2张

3. Identifying issues with detecting small objects

在这一部分中,本文首先概述了MS-COCO数据集和在本文的实验中使用的目标检测模型。然后讨论了MS-COCO数据集的问题和训练中使用的锚匹配过程,这有助于小目标检测的困难。

小目标检测的增强算法第3张

小目标检测的增强算法第4张

4. Result and Analysis

小目标检测的增强算法第5张

小目标检测的增强算法第6张

小目标检测的增强算法第7张

小目标检测的增强算法第8张

5. Conclusion

本文研究了小目标检测问题。本文发现,小目标平均精度差的原因之一是训练数据中缺少小目标的表示。这尤其适用于现有的最先进的物体探测器,它要求有足够的物体供预测的锚在训练期间匹配。为了克服这个问题,本文提出了两种扩充原始MS-COCO数据库的策略。首先,本文展示了在训练过程中,通过对包含小对象的图像进行过采样,可以很容易地提高对小对象的性能。其次,提出了一种基于复制粘贴小对象的增强算法。实验证明,与Mask R-CNN在MS-COCO上获得的最新技术相比,实例分割和小目标检测分别提高了9.7%和7.1%。正如实验所证实的,所提出的一套增强方法可以在预测大小物体的质量之间进行权衡。

免责声明:文章转载自《小目标检测的增强算法》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇对于根目录磁盘满的了问题项目开发规范(编码规范、命名规范、安全规范、前端优化、源码提交规范、代码维护规范、产品发布规范)...下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

基于OpenCV进行图像拼接原理解析和编码实现(提纲 代码和具体内容在课件中)

一、背景 1.1概念定义 我们这里想要实现的图像拼接,既不是如题图1和2这样的“图片艺术拼接”,也不是如图3这样的“显示拼接”,而是实现类似“BaiDU全景”这样的全部的或者部分的实际场景的重新回放。 对于图像拼接的流程有很多定义方式,本教程中主要介绍实现主流方法,总结梳理如下: 图像采集->投影变换->特征点匹配...

基于深度学习的视觉实例搜索研究进展

原文:http://chuansong.me/n/543805151251 近些年,深度学习在各种计算机视觉任务上都取得了重大的突破,其中一个重要因素就是其强大的非线性表示能力,能够理解图像更深层次的信息。本文对基于深度学习的视觉实例搜索方法做了简单的总结和概括,希望能给读者们带来启发。前言给定一张包含某个物体的查询图片,视觉实例搜索的任务就是从候选的图片...

基于CNN的人群密度图估计方法简述

人群计数的方法分为传统的视频和图像人群计数算法以及基于深度学习的人群计数算法,深度学习方法由于能够方便高效地提取高层特征而获得优越的性能是传统方法无法比拟的。本文简单了秒速了近几年,基于单张图像利用CNN估计人群密度图和计数的方法。 传统的人群计数方法传统的人群计数方法可以分为两类,基于检测的方法和基于回归的方法。 基于检测的方法早期的计数方法主要...

faiss索引基于数量级和内存限制的选择

它是一个能使开发者快速搜索相似多媒体文件的算法库。而该领域一直是传统的搜索引擎的短板。借助Faiss,Facebook 在十亿级数据集上创建的最邻近搜索(nearest neighbor search),比此前的最前沿技术快 8.5 倍,并创造出迄今为止学术圈所见最快的、运行于 GPU 的 k-selection 算法。Facebook 人工智能实验室(F...

基于视频的目标检测调研 2017-10-25

视频目标检测调研 1.主要问题: 与图像目标检测的主要区别是: 视频信息具有大量冗余,这些冗余会如果能合理的利用或者去除,会大大提高处理速度; 视频信息中的目标经常会出现变形、遮挡、模糊,这会导致检测结果的不稳定,出现漏检。 2.基本方法: - 基于单帧图像的 - 结合上下文和时间信息的: 双流法 三维卷积 基于流特征的 LSTM 3.基于单帧图像...

图像切割之(五)活动轮廓模型之Snake模型简单介绍

图像切割之(五)活动轮廓模型之Snake模型简单介绍 zouxy09@qq.com http://blog.csdn.net/zouxy09 在“图像切割之(一)概述”中咱们简单了解了眼下主流的图像切割方法。以下咱们主要学习下基于能量泛函的切割方法。这里学习下Snake模型简单的知识,Level Set(水平集)模型会在后面的博文中说到。 基于能量泛...