特征融合的分类和方法

1、特征融合的定义

特征融合方法是模式识别领域的一种重要的方法,计算机视觉领域的图像识别问题作为一种特殊的模式分类问题,仍然存在很多的挑战,特征融合方法能够综合利用多种图像特征,实现多特征的优势互补,获得更加鲁棒和准确性的识别结果。

2、特征融合的分类

按照融合和预测的先后顺序,分类为早融合和晚融合(Early fusion and Late fusion)

早融合(Early fusion):就是在特征上进行融合,进行不同特征的连接,输入到一个模型中进行训练。(先融合多层的特征,然后在融合后的特征上训练预测器,只有在完全融合之后,才进行检测。)这类方法也被称为skip connection,即采用concat、add操作。这一思路的代表是Inside-Outside Net (ION)和HyperNet.

两个经典的特征融合的方法:

(1)concat:系列特征融合,直接将连个特征进行连接。两个输入特征x和y的维数若为p和q,输出特征z的维数为p+q。

(2)add:并行策略,将这两个特征向量组合成复合向量,对于输入特征x和y,z=x+iy,其中i是虚数单位。

晚融合(Late fusion):指的是在预测分数上进行融合,做法就是训练多个模型,每个模型都会有一个预测分数,我们对所有模型的结果进行融合,得到最后的预测结果。(通过结合不同层的检测结果改进检测性能,尚未完成最终融合之前,在部分融合的层上就开始检测,会有多层的检测,最终将多个检测结果进行融合)。

这一类研究思路的代表有两种:

(1)feature不融合:多尺度的feture分别进行预测,然后对预测结果进行综合,如Single Shot MultiBox Detector(SSD),Multi-scale CNN(MS-CNN).

注意:SSD,全称Single Shot MultiBox Detector,是Wei Liu在ECCV 2016上提出的一种目标检测算法,截至目前是主要的检测框架之一,相比Faster RCNN有明显的速度优势,相比YOLO又有明显的mAP优势(不过已经被CVPR 2017的YOLO9000超越)。

MS-CNN:cNN多尺度

(2)feature进行金字塔融合,融合后进行预测,如Feature Pyramid Network(FPN)等

注意:FPN全称是Feature Pyramid Network, 也就是特征金字塔网络,主要是针对图像中目标的多尺度的这个特点提出的,多尺度在目标检测中非常常见,而且对应不同的问题应该设计不同的FPN。

3、深度特征融合和高低层特征融合的方法

(1)早融合,用经典的特征融合的方法 ,在现有的网络(如VGG19)中,用concat或add融合其中的某几层。

变种:用DCA特征融合方法替代concat和add操作。

(2)晚融合,采用类似特征金字塔网络(FPN)的思想,对特征融合进行预测。(FPN一般用于目标检测,提高小目标检测能力)。

三个变种:

  • YOLO2的方法,只在金字塔的top-down路径的最后一层进行预测,此外还有 U-Net [31] and SharpMask for segmentation, Recombinator networks for face detection, and Stacked Hourglass networks for keypoint estimation;
  • YOLO3的方法,在金字塔的每一层都进行预测;
  • FSSD的方法,对 FPN进行细微改造;

feature不融合,多尺度的feature分别进行预测,然后对预测结果进行综合。

(3)用一个具有高低特征融合能力的网络代替普通的网络,如Densenet。

(4)不进行高低层特征融合,而是在高层特征预测的基础上,再用底层特征进行预测结果的调整。

4、DCA特征融合的方法

特征融合的目的,是把从图像中提取的特征,合并成一个比输入特征更具有判别能力的特征。

基于CCA(典型关联分析)的融合方法,就是使用两个输入特征间的相关关系,计算两种变换后的特征比输入的两个特征集具有更高的相关性。CCA的主要不足,在于忽略了数据集中类结构间的关系,所以将每组特征中类分开,为了解决CCA的弱点,引入了DCA。DCA最大化两个特征及中对应特征的相关关系,同时最大化不同类之间的差异。

5、改进的SSD目标检测算法(DeseNet)

改进在于使用Dense net代替原始SSD结构中的VGG,以提高目标检测准确性,改进后的SSD网络对小物体产生很好的拟合。

DeseNet(密集卷积网络)

6、FPN(特征金字塔)

特征金字塔是识别不同尺度的目标时常用的结构,但是特征金字塔需要较大的计算量和显存,所以为了解决这一问题,开发了一种构建特征金字塔的新方法,可以减少额外的对计算量和显存的消耗。

7、YOLO

YOLOv2网络结构中有一个特殊的转换层(Passthrough Layer),假设最后提取的特征图的大小是1313,转换层的作用就是将前面的2626的特征图和本层的1313的特征图进行堆积(扩充特征维数据量),而后进行融合,再用融合后的特征图进行检测。这么做是为了加强算法对小目标检测的精确度。为达更好效果,YOLOv3将这一思想进行了加强和改进。

YOLO v3采用(类似FPN)上采样和融合做法,融合了3个尺度(13×13、26X26和52×52),在多个尺度的融合特征图上分别独立做检测,最终对于小目标的检测效果提升明显。(有些算法采用多尺度特征融合的方式,但是一般是采用融合后的单一特征图做预测,比如YOLOv2,FPN不一样的地方在于其预测是在不同特征层进行的。)

Original: https://blog.csdn.net/qq_42012782/article/details/123202419
Author: 橙子吖21
Title: 特征融合的分类和方法

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/670358/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • Neo4j安装图算法(附参考链接+我遇到的错误)

    首先说明,我下载的是 Neo4j-community-4.3.7,下载的图算法的jar包是 GDS1.7.2版本。 (1)Neo4j v3.5前使用的是Neo4j Graph Al…

    人工智能 2023年6月1日
    0126
  • YOLOv5改进之YOLOv5+GSConv+Slim Neck

    论文题目:Slim-neck by GSConv: A better design paradigm of detector architectures for autonomou…

    人工智能 2023年7月29日
    063
  • opencv-python支持h264编码 anaconda也可支持

    老版参考跳转 由于浏览器播放的视频常用h264编码格式,所以cv这边保存时希望能够以h264支持,但是奈何因为其开源许可,默认的包安装不支持h264。开开心心指定h264报错: C…

    人工智能 2023年6月19日
    0109
  • 将yolov5项目打包成exe可执行文件

    在进行此项工作之前,原本计划是将yolov5项目部署到android,无奈水平不足,部署到手机后,存在很多的问题,效果太差了,所以退而求其次,将其打包成exe文件。 直接白嫖一下别…

    人工智能 2023年7月12日
    071
  • opencv(11):训练自己的opencv级联分类器

    一 采集数据并制作正负样本数据集 1.1 录制视频 1.2 将单个视频截取为指定分辨率的图像 1.3 处理负样本视频 1.4 本次训练正负样本数量选择与图片重编号 二 利用matl…

    人工智能 2023年5月26日
    076
  • fNIRS功能近红外数据处理服务

    在脑科学和神经科学领域,功能近红外成像技术(functionalnear-infrared spectroscopy, fNIRS)已经逐渐成为研究大脑活动的重要技术手段之一。该技…

    人工智能 2023年7月15日
    085
  • 图像风格迁移实战

    最近看了一些基于深度学习的Style Transfer, 也就是风格迁移相关的paper,感觉挺有意思的。 所谓风格迁移,其实就是提供一幅画(Reference style ima…

    人工智能 2023年7月5日
    057
  • keras、tensorflow安装详解-神经网络第一个脚本

    目录 一、基本概念 二、操作步骤详解 2.1实现规划:(建议版本是自己运行的版本) 2.2详细操作步骤: 1、安装pycharmIDE编辑软件。 2、安装Anaconda 3、安装…

    人工智能 2023年5月24日
    0109
  • 神经网络硕士就业前景,计算神经科学就业前景

    算法工程师 就业前景 一、算法工程师简介(通常是月薪15k以上,年薪18万以上,只是一个概数,具体薪资可以到招聘网站如拉钩,猎聘网上看看)算法工程师目前是一个高端也是相对紧缺的职位…

    人工智能 2023年7月13日
    055
  • 【Binder 源码】APP 进程的创建

    啊哦~你想找的内容离你而去了哦 内容不存在,可能为如下原因导致: ① 内容还在审核中 ② 内容以前存在,但是由于不符合新 的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。 可…

    人工智能 2023年6月28日
    065
  • MMDetection亲测安装教程

    MMDetection是一个基于 PyTorch 的目标检测开源工具箱。接下来就安装看看吧。 本人安装环境: 系统环境:Ubuntu 20.04.2 LTS cuda版本:11.0…

    人工智能 2023年5月26日
    096
  • MMLab

    MMLab MMLab的主要研究方向: 机器学习、强化学习、半监督/弱监督/自监督学习等方向的前沿方法和理论长视频理解、3D视觉、生成模型等的计算机视觉新兴方向物体检测、动作识别等…

    人工智能 2023年6月24日
    089
  • PyTorch nn.RNN 参数全解析

    目录 一、简介 二、前置知识 三、解析 * 3.1 所有参数 3.2 输入参数 3.3 输出参数 四、通过例子来进一步理解 nn.RNN 五、从零开始手写一个单隐层单向RNN 最后…

    人工智能 2023年6月16日
    068
  • 【知识图谱系列】知识图谱表示学习综述 | 近30篇优秀论文串讲

    作者:CHEONG公众号:AI机器学习与知识图谱研究方向:自然语言处理与知识图谱 本文分享一篇知识图谱表示学习汇报ppt,将知识图谱表示学习方法粗略分为四大类,涉及将近30篇优秀论…

    人工智能 2023年6月1日
    088
  • SLAM【十】回环检测

    SLAM【十】回环检测 回环检测的作用及意义 * 作用 意义 回环检测方法 * 准确率和召回率 词袋模型 字典 * 字典的结构 字典的创建 相似度计算 相似度评分的处理 关键帧的处…

    人工智能 2023年6月24日
    099
  • 自动驾驶决策规划控制工程师技术要求

    具体要求 1.首先作为自动驾驶从业人员一定要学习自动驾驶平台,如开源的百度apollo,apollo具有大量的开源资料和仿真平台,为无车的大家提供了一个很好的学习平台,通过apol…

    人工智能 2023年6月10日
    065
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球