YOLOv4

Posted on Apr 27, 2020

YOLOv4 - note

arxiv.org/abs/2004.10934 -> translation: https://tongtianta.site/paper/89863

提高accuracy的通用功能:加权残差链接(WRC)、跨阶段部分连接(CSP)、跨小批量标准化(CmBN)、自对抗训练(SAT)、Mish-activation。

本文结合WRC、CSP、CmBN、SAT、Mish-activation、镶嵌数据增强(augmentation mosaic)、DropBlock regularization、CIoU loss

bags of freebies

数据增强:

  • photomatric distortion-> 调整图像亮度,对比度,色相,饱和度和噪点
  • geometric distortion -> 随机缩放,裁剪,翻转和旋转

模拟对象遮挡:

  • random erase、CutOut -> 随机选择图像中的矩形区域填充为0的随机或互补值
  • hide-and-seek、grid mask -> 随机或均匀地选择图像中的多个矩形区域替换为全0

类似概念应用于feature map有:DropOut、DropConnect、DropBlock

DIoU考虑了对象中心的距离、CIoU同时考虑了重叠区域 -> 更好的收敛速度和准确性

bags of specials

plugin modules:

  • 增强接收域:SPP、ASPP、RFB
  • 引入注意力机制(channel-wise、point-wise):Squeeze-and-Excitation(SE)、Spatial Attention Module(SAM)
  • 集成特征:SFAM、ASFF、BiFPN
  • 激活函数:LReLU、PReLUReLU6SELU、Swish、hard-Swish、Mish

post-processing:DIoU NMS

架构选择

CSPDarknet53、CSPResNext50