YOLOv5的改进

摘要:
输入图像的focus结构这个是从右到左的方向,将高分辨率的图片,分成r*r个小的channel这样输入就变小了增加正样本,加快训练速度本文也采用了增加正样本anchor数目的做法来加速收敛,这其实也是yolov5在实践中表明收敛速度非常快的原因。这里最终的结果并不是一个正方形了,此外,需要注意的是:a.这里大白填充的是黑色,即,而Yolov5中填充的是灰色,即,都是一样的效果。只是在测试,使用模型推理时,才采用缩减黑边的方式,提高目标检测,推理的速度。

输入图像的focus 结构

YOLOv5的改进第1张

这个是从右到左的方向,将高分辨率的图片,分成r*r个小的channel

这样输入就变小了

增加正样本,加快训练速度

本文也采用了增加正样本anchor数目的做法来加速收敛,这其实也是yolov5在实践中表明收敛速度非常快的原因。其核心匹配规则为:

(1) 对于任何一个输出层,抛弃了基于max iou匹配的规则,而是直接采用shape规则匹配,也就是该bbox和当前层的anchor计算宽高比,如果宽高比例大于设定阈值,则说明该bbox和anchor匹配度不够,将该bbox过滤暂时丢掉,在该层预测中认为是背景

(2) 对于剩下的bbox,计算其落在哪个网格内,同时利用四舍五入规则,找出最近的两个网格,将这三个网格都认为是负责预测该bbox的,可以发现粗略估计正样本数相比前yolo系列,至少增加了三倍

YOLOv5的改进第2张

如上图所示,绿点表示该Bbox中心,现在需要额外考虑其2个最近的邻域网格也作为该bbox的正样本anchor。从这里就可以发现bbox的xy回归分支的取值范围不再是0~1,而是-0.5~1.5(0.5是网格中心偏移,请仔细思考为啥是这个范围),因为跨网格预测了。

Neck PANet 和SPP,并且在Neck 中也添加了CSP

CIoU loss +DIoU NMS

输入图片的自适应缩放, 减少黑边

第一步:计算缩放比例

YOLOv5的改进第3张

原始缩放尺寸是416*416,都除以原始图像的尺寸后,

可以得到0.52,和0.69两个缩放系数,选择小的缩放系数。

第二步:计算缩放后的尺寸

YOLOv5的改进第4张

原始图片的长宽都乘以最小的缩放系数0.52,宽变成了416,而高变成了312。

第三步:计算黑边填充数值

YOLOv5的改进第5张

将416-312=104,得到原本需要填充的高度。

再采用numpy中np.mod取余数的方式,得到40个像素,再除以2,即得到图片高度两端需要填充的数值。

这里最终的结果并不是一个正方形了,

此外,需要注意的是:

a.这里大白填充的是黑色,即(0,0,0),而Yolov5中填充的是灰色,即(114,114,114),都是一样的效果。

b.训练时没有采用缩减黑边的方式,还是采用传统填充的方式,即缩放到416*416大小。只是在测试,使用模型推理时,才采用缩减黑边的方式,提高目标检测,推理的速度。

来自 <https://jishuin.proginn.com/p/763bfbd2a0ad>

来自 <https://i.cnblogs.com/posts/edit;postId=13691388>

免责声明:文章转载自《YOLOv5的改进》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇Xilinx DCM 使用---- 输出频率问题[LOJ6220] sum下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

随便看看

怎么使用vscode合并分支

1.切换分支到本地开发2.代码完成后提交代码到本地仓库3.切换分支到需要merge的test分支先pull一下,之后再合并分支—我开发的是这个feature,就合并这个分支4.当合并分支后,需要重新提交到远程:点击一下,直接提交...

Linux 安装.src.rpm源码包的方法

接下来是rpm安装过程。...

dBFs和dBm

dBFs和dBmdBFs是用来表征数字域功率值的大小,一般情况下我们定义0dBFs为数字域满刻度功率值,即数字域中功率的最大值;因此看到的dBFs的值都是负的。...

sqlserver2016安装

2008以前的版本在SQLserver配置管理其中设置。...

AcWing算法基础课

第二行包含n个整数,表示整数序列。输出格式对于每个输出指令PM,输出表示当前集合中最小值的结果。每个结果占据一行。数据范围1≤ N≤ 105109≤ x(x)≤ 109是合法的。输入示例:8I-10PMI-10D1C28I6PMDM输出示例:-106分析:对于向上和向下操作,请注意ph和hp的应用,这相当于指针ph[k]=t;插入堆中的Kth的位置为t;hp...

选包

安装系统后,将不会安装一些基本工具。此时,您可以根据yum的要求安装它们。你也可以使用任何你想要的时尚。...