YOLOv4
YOLOv4 - note
arxiv.org/abs/2004.10934 -> translation: https://tongtianta.site/paper/89863
提高accuracy的通用功能:加权残差链接(WRC)、跨阶段部分连接(CSP)、跨小批量标准化(CmBN)、自对抗训练(SAT)、Mish-activation。
本文结合WRC、CSP、CmBN、SAT、Mish-activation、镶嵌数据增强(augmentation mosaic)、DropBlock regularization、CIoU loss

bags of freebies
数据增强:
- photomatric distortion-> 调整图像亮度,对比度,色相,饱和度和噪点
- geometric distortion -> 随机缩放,裁剪,翻转和旋转
模拟对象遮挡:
- random erase、CutOut -> 随机选择图像中的矩形区域填充为0的随机或互补值
- hide-and-seek、grid mask -> 随机或均匀地选择图像中的多个矩形区域替换为全0
类似概念应用于feature map有:DropOut、DropConnect、DropBlock
DIoU考虑了对象中心的距离、CIoU同时考虑了重叠区域 -> 更好的收敛速度和准确性
bags of specials
plugin modules:
- 增强接收域:SPP、ASPP、RFB
- 引入注意力机制(channel-wise、point-wise):Squeeze-and-Excitation(SE)、Spatial Attention Module(SAM)
- 集成特征:SFAM、ASFF、BiFPN
- 激活函数:LReLU、
PReLU、ReLU6、SELU、Swish、hard-Swish、Mish
post-processing:DIoU NMS
架构选择
CSPDarknet53、CSPResNext50