mmlab基础班训练营——04

目标检测

  • 下游视觉任务
    • 两阶段,例如提取图片区域再生成文字;人体提取IOU再生成skeleton

滑窗

  • 基本理念(效率低

    • 固定一个窗口
    • 便利图片
    • 用窗口扫描图片
  • 启发式算法——不可训练,违背深度学习思想

  • 减少冗余计算

    • 重叠部分多次计算——用卷积一次性计算所有特征,去除特征来分类
      • 原计算方式在这里插入图片描述
  • 密集预测

    • 变成用1×1的卷积去扫,隐式滑窗
    • 在这里插入图片描述