模型汇总—分类、检测、分割

FCN UNet

缺点:

在这里我们要注意的是FCN的缺点:

ParseNet

OCRNet

segnet

SegNet的优点包括:1)改善边界轮廓;2)参数数量减少,优化了算法空间复杂度;3)能够端到端地训练;4)这种上采样形式只需稍微修改一下就能被任意encoder-decoder架构的网络采用;

PSPNet

What:PsPNet主要是通过金字塔池化提取多尺度信息。按论文的描述:更好的提取全局上下文信息,同时利用局部和全局信息,使得场景识别更加可靠。(从技术的角度来说,我觉得就是从不同的视野去寻找特征,类似放大镜放大,放大倍数大,视野小,物体清楚,但是看不清物体之间的关系;放大倍数小,视野大,物体模糊,但是可以看清楚物体之间的关系。)除此之外,文章还通过Ablation study (类似控制变量法,移除一个结构,研究这个结构的影响)研究金字塔多尺度池化,池化的方式,辅助损失函数,预训练模型的作用。

Why:PsPNet提出的原因,可以总结为一句话:获取全局环境信息,利用全局信息和局部信息获得更加可靠地结果。怎么做到的?提取多尺度信息。为什么提取多尺度信息可以获取全局环境信息?经验总结。

RefineNet

DeepLab V1

  • 要解决什么问题?
  • 使用CNN解决图像分割问题是,主要存在两个问题:

  • 用了什么方法解决?

  • 使用带孔卷积解决下采样问题。

  • 使用Dense CRF解决空间不变形问题。

  • 效果如何?

  • 在VOC2012上获得了当时的最优性能,在测试集上达到71.6%的IOU。

  • 同时,运行效率达到8 frames per second。

  • 还存在什么问题?

  • 基于VGG提取特征,有些落后(从现在的角度看)。

  • 从目前来看,效果一般。

Original: https://blog.csdn.net/qq_28057379/article/details/122927744
Author: King的王国
Title: 模型汇总—分类、检测、分割

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/667669/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球