目标检测

YOLOv3

数据处理

  • 可输入任意大小的图片(特征图大小最好是32倍数)
  • Anchor:K-Means聚类+IOU+NMS

模型结构

  • Backbone
    • Darknet53
      • 无最大池化,步长2卷积层进行下采样
      • 每个Conv后 + BN + LeakyReLU
      • 引入残差结构
      • 中间层和某一层上采样拼接
    • 模块
      • CBL = Conv + BN + LeakyReLU
      • ResUnit = CBL + 残差
      • ResX = CBL + N个ResUnit
  • Head
    • Conf置信度:Logistic分类器(逻辑回归预测每个框的置信度分数)
    • Cls分类:BCELoss
    • Bbox目标框:MSELoss

YOLOv5

数据处理

  • 马赛克增强
  • Anchor-Based,K-means计算锚框(自适应锚框)

模型结构

  • Backbone
    • 输入进行特征提取
    • CSPDarkNet53或ResNet网络
    • 模块
      • CBS = Conv2d + BN + SILU
      • C3 = Conv + ResNet + Add + Concat
      • SPPF = Conv + Maxpool + Concat
  • Neck
    • FPN特征金字塔:上采样+下采样+横向连接,多尺度特征融合
    • 自顶向下:上采样融合不同层次特征融合
    • 自底向上:卷积层融合不同层次特征图
  • Head
    • Conf置信度:BCELoss
    • Cls分类:BCELoss
    • Bbox目标框:CIOU

迭代

  • 300

YOLOv8

数据处理

  • Mosaic增强
  • CutMix、Mixup增强
  • Anchor-Free无锚框

模型结构

  • Backbone
    • CSPDarkNet
    • C3–>C2f
  • Neck
    • PANet,一个双向通路网络,引入了自下向上的路径
  • Head
    • Cls分类:BCELoss
    • Bbox目标框:CIOU + DFL(Distribution Focal Loss)

迭代

  • 500
  • 最后10轮,Mosaic增强替换为推理式的Letter box

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部