【文献调研】多模态生理信号的特征提取与特征融合

2023年6月15日下午12:37 • 人工智能 • 阅读 62

项目原因进行了一些调研，慢慢更新~

文章目录

多模态情绪识别研究综述 2020
*
多模态混合策略
–
多模态混合形式
论文[1] 基于深度学习和脑电信号的情感分类方法研究方法：DBN
论文[2] 基于多生理信息融合的驾驶疲劳检测方法研究方法：DBN+SVM 2018
论文[3] 融合EEG-EMG生理信号的人机协作装配意图识别方法研究方法：SVM+D-S
论文[4] 基于GA-BP网络的脑电与心电融合疲劳识别算法研究方法：GA-BP

多模态情绪识别研究综述 2020

由于主要是研究多模态生理信号的特征融合，所以先从一篇关于情绪识别的综述开始，但实际上可以应用到各个领域。

; 多模态混合策略

利用不同类别的信号相互支持，对互补信息进行融合处理，能够有效地提高最终的识别效果[46]。根据目前已有的研究，模态融合的方式大致可分为 4 种， 分别是数据级融合 (传感层融合)、特征级融合、决策级融合、模型层融合。

数据级融合

又称传感器层融合。数据级融合是直接对各个传感器采集到的最原始的、没有经过特殊处理的数据进行组合，从而构造一组新的数据。

目前数据级融合处理的方法有数值处理、参数估计。具体为使用线性、非线性估计和统计运算方法对来自多个数据源的数据进行计算处理。

优点：可以很好地保留各个模态传感器上的数据信息，避免信息的丟失，保持信息的完整性。
缺点：因为数据是在原始状态下进行融合，因此处理过程极为繁琐复杂。

; 特征级融合

将多种模态数据经过提取、构建成相应的模态特征之后，再拼接成一个集成各个模态特征的特征集。

常用的融合策略：将经特征提取后全部模态特征数据级联为特征向量后再送入一个情感分类器。

【举例】：
Emerich 等[52] 将长度归一化的 语音情感特征和 面部表情特征级联起来，构造一个特征向量。实验结果表明语音信息系统提取的特征包含有价值的情感特征，这些特征是无法从视觉信息中提取出来的。
优点：两种模式融合时，情绪识别系统的性能和鲁棒性都得到了提高
缺点：直接级联拼接的方式新特征空间不完备，融合后维数过高，当特征维数达到一定规模后，模型的性能将会下降。

Yan 等[53] 提出了一种基于稀疏核降秩回归 (SKRRR) 特征级融合策略，SKRRR 方法是传统降秩回归 (RRR) 方法的非线性扩展，将预测量和响应特征向量分别通过两个非线性映射映射到两个高维特征空间中进行核化。openSMILE 特征提取器和 SIFT 描述子分别
从 语音模态和 面部表情模态中提取有效特征，然后使用 SKRRR 融合方法融合两种模态的情感特征。

Mansoorizadeh 等[54] 提出了一种异步的特征级融合方法，在单个信号测量之外创建一个统一的混合特征空间，他们使用提出的方法从 语音韵律和 面部表情来识别基本的情绪状态。结果表明，与基于单模态人脸和基于语音的系统相比，基于特征级融合的系统性能明显提高。

特征级融合的优缺点：
优点：当模态信息针对同一内容而又不互相包含时，特征级融合方法虽然能最大限度地保留原始信息，在理论上能达到最佳的识别效果[49]
缺点：没有考虑到不同模态情绪特征之间的差异性。

决策级融合

找出各个模态的 可信度，再进行协调、联合决策，如图 4。决策级融合与特征级融合相比， 更容易进行，但关键是要 探究各个模态对情绪识别的重要度。

决策级采用的融合策略：基于统计学规则[57] (总和规则、乘积规则、最大/最小/中位数规则等)、
枚举权重[58-59]、自适应增强[60-61]、贝叶斯推论及其推广理论 (Dempster-Shafer 理论[62]、动态贝叶斯网络[63])、模糊积分[64] 等。

【举例】：
Huang 等[65] 同时使用 枚举权重及 adaboost 两种不同决策级融合策略来比较情绪识别效果，使用 面部表情分类器和 脑电图分类器作为增强分类器的子分类器，并分别应用于两个学习任务 (效价和唤醒)。结果表明这两种方法都能给出最后的效价和唤醒结果，在公开数据集 DEAP、MAHNOBHCI 以及在线应用均取得不错的效果。

基于统计规则和概率理论均依赖于所有分类器相互独立的假设，这与实际情况不符。因此，预测结果在一定程度上是不准确的。 Lu 等[66] 采用了一种称为 模糊积分的融合策略。模糊积分是关于模糊测度的实函数的积分。实验发现 眼球运动特征和 脑电图对情绪识别具有互补作用，模糊积分融合策略的最佳准确率为 87.59%，相比于其他融合方式，模糊积分融合能显著提高情绪识别的准确性。

决策级融合的缺点：
通常情况下，多种模态间的信息并非完全独立， 决策级融合会丢失不同模态之间的相关性，所以在实际应用环境下识别的结果未必会比单模态识别的效果好。

; 模型级融合

模型级模态融合[67-68] 不依赖于以上 3 种融合层次的体系结构。
决策级融合关键在于找出不同模态在决策阶段的可信程度，但 模型级融合并不需要重点去探究各模态的重要程度，而是根据模态特性需要建立合适的模型，联合学习关联信息。
特征级融合则主要先通过构建特征集合或混合特征空间，再送入到分类模型进行分类决策。 模型级融合可以将不同模态特征分别输入到不同模型结构再进行进一步特征提取。
如 Zheng 等[17]采用 将堆叠的受限玻尔兹曼机展开成深度置信网络，首先以手工提取出来的脑电和眼动特征分别作为两个玻尔兹曼机的输入并从神经网络中学习两种模式的共享表示，实验结果表明，基于深度神经网络的模型级融合能显著提高性能。总的来说， 模型级融合相较于决策级融合和特征级融合最大的优势在于可以灵活地选择融合的位置。

模型级融合主要策略：通过构建深度网络模型，建立多层结构，逐层学习可以学习到更加复杂的变换，从而可以拟合更加复杂的特征，增加非线性表达能力。

【举例】
Zhang 等[67] 提出一种充分利用深度神经网络强大的特征学习能力的混合深度学习模型，将视听数据经 卷积神经网络 (CNN) 和 3DCNN 产生视听片段特征，然后将视听片段特征融合到 深度置信网络中，联合学习了一种视听特征表示，在情感识别任务上比先手工特征再深度学习融合方法表现得更好。

多模态混合形式

; 论文[1] 基于深度学习和脑电信号的情感分类方法研究方法：DBN

结合EEG的同时有效利用EOG、EMG生理信号对情感分析作进一步的提高，尝试利用三种信号对情感进行分类。

EEG信号特征提取：ResNets-50网络，可以减轻消失梯度的问题，用于学习数据中更深刻的语义信息。
EOG、EMG信号特征提取：梅尔频率倒谱系数（MFCC），常用于语音识别。

多模态数据的融合方式：从定义上理解，多模式融合是指两个或两个以上模态的集成，以便改善系统的性能。在对于选择多种模态的信息来进行融合时，按照不同的融合时期，可分为早期融合、中期融合以及晚期融合。

早期融合：从不同模态获得的特征需要在将它们馈送到学习阶段之前，以单个模态的组合来表示。
中期融合能够处理不完美的数据以及不同模态之间的异步问题，从而提高数据的可靠性。
后期融合，也称为决策级融合，是基于模态的语义信息。多模式数据处理的主要问题是数据应该单独处理，并且只应在最后组合，讨论了一般的融合架构和模态的联合处理。

本文选择了 基于DBN的中期融合方式，模型况下如下图所示：

原始EEG信号首先以不同的方式对ResNet-50和MFCC进行 预处理，然后从预处理的EEG信号中提取MFCC和ResNet-50特征并通过DBN进行融合。最终，所有融合的特征被输入到分类器中以识别情绪。

对于分类，使用4种不同的分类方式来对经ResNet-50网络和MFCC网络提取出来的特征，这四种分类方式分别为：KNN，支持向量机(SVM)，朴素贝叶斯(NB)和具有3个密集层和2个丢失层的完全连接的神经网络(FC)。

论文[2] 基于多生理信息融合的驾驶疲劳检测方法研究方法：DBN+SVM 2018

本文通过开展室内模拟驾驶实验同步获取驾驶员行驶过程中 脑电、肌电及心电信息，基于动态特征提取方法分别获取三类生理信号的多层次时域及频域特征，通过多源特征融合及模式识别实现疲劳状态的有效辨识，进而实现从精神和行为层面对驾驶员疲劳状态的有效监测和评估。主要工作包括：
(1) （2）（3）预处理
(4) 进行多生理信号特征级融合及降维处理，采用 支持向量机分类器进行驾驶疲劳检测；同时为提高识别的准确性，提出基于深度信念网络的驾驶疲劳检测方法，采用深度信念网络模型对多生理信号进行特征融合以及疲劳状态检测，并对两种分类模型的疲劳检测效果做出对比分析。

算法流程：

EEG、EMG和ECG信号特征融合
PCA融合特征降维、去除冗余信息。针对实验采集的所有生理信号进行特征提取后，组成的共计 120 组特征样本，按 PCA 降维方法，将所有样本特征作为 PCA 算法的输入矩阵，通过 PCA 变换得到主成分空间， 设定累积贡献率阈值为 95%，得到降维后特征集。
DBN深度置信网络特征分类。该方法通过多层神经元进行能量传递，训练其神经元间的权重，可以使整个神经网络按照最大概率生成特征数据。

论文[3] 融合EEG-EMG生理信号的人机协作装配意图识别方法研究方法：SVM+D-S

为提高人机协作(HRC)装配的柔顺性，需要对人的协作意图进行识别，从而引导协作机器人更好的辅助工人完成装配作业。针对人机协作装配场景下基于单源生理电信号识别协作意图准确率不高、稳定性不好的问题，首先采用支持向量机方法（SVM）分别从 EEG 脑电和 EMG 肌电信号识别单源协作装配意图，然后采用 D-S 证据理论对多源协作装配意图识别结果进行融合，提出了一种融合EEG-EMG 生理信号的人机协作装配意图识别方法。实验结果表明所提方法可以有效提高人机协作装配意图识别的准确率和稳定性。

; 论文[4] 基于GA-BP网络的脑电与心电融合疲劳识别算法研究方法：GA-BP

针对脑电信息在识别疲劳时不能完全反应疲劳状态和传统ＢＰ神经网络识别率低的问题，提出了一种基于改进ＧＡ－ＢＰ神经网络的脑电信号与心电信号融合的疲劳识别算法，运用到单兵精神疲劳状态的预测。

首先，利用无线数据采集装置进行脑电和心电的数据采集．然后，对生物电数据进行伪迹去除和噪声滤
波的数据预处理，利用小波包变换和Ｐａｎ－Ｔｏｍｐｋｉｎｓ算法分别对脑电和心电数据进行特征提取，再将高维特征数据进行ＰＣＡ降维来加快网络的学习速度．最后，将遗传算法优化后的改进ＢＰ神经网络参数作为其初始权重和阈值进行疲劳预测．疲劳实验对３０位受试者的疲劳状态进行了识别预测，结果表明：融合了两种生物电信号的改进ＧＡ－ＢＰ网络模型的识别正确率为９０．８％，优于传统ＢＰ神经网络和支持向量机的识别率。

Original: https://blog.csdn.net/FelicityXu/article/details/122656094
Author: Lucy@IshtarXu
Title: 【文献调研】多模态生理信号的特征提取与特征融合

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/614723/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【自动驾驶】车辆运动学模型

文章目录参考资料 1. 以车辆重心为中心的单车运动学模型 * 1.1 参数说明 1.2 几何关系 – 1.2.1 偏航角ψ \psi ψ的关系 1.2.1 滑移角 β…

人工智能 2023年6月15日
00102
Point Cloud Transformer的pytorch代码实现

目录 1. Attention 1.1 Self Attention 1.2 Offset Attention 2. Sampling and Grouping 2.1 KNN 2…

人工智能 2023年7月23日
0070
【pytorch 和torchvision 版本对应关系及安装】

参考链接： GitHub – pytorch/vision: Datasets, Transforms and Models specific to Computer …

人工智能 2023年7月21日
0042
c++ 模糊搜索正则表达式_模糊搜索算法（近似字符串匹配算法）

考虑到您正在尝试对学校名称列表进行模糊搜索，因此我认为您不希望使用Levenshtein距离之类的传统字符串相似性。我的假设是，您正在接受用户的输入(键盘输入或通过电话说出)，并…

人工智能 2023年5月27日
0075
知识图谱构建实战

知识图谱实践的系统工程观念## 知识图谱实践是一种典型的大规模知识工程，也是典型的系统工程，在实践过程中应该坚持工程观和系统观；工程观利用数学和科学原理提出有效解决方案解决…

人工智能 2023年6月1日
0067
YOLOv5之Focus与6×6卷积的理解

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Foucs * 1.Focus简介 2.对Focus的疑问二.Focus为何又被替换成卷积层…

人工智能 2023年7月21日
0067
【吴恩达】机器学习作业 ex3data1 — 多分类逻辑回归（Python）

一.前言本次是多分类逻辑回归的代码，主题是让你预测5000个手写数字对应的真正数字，每张图片有400个特征值，可以用20*20的方阵表示出来，一共5000行数据，此次的数据集是….

人工智能 2023年7月2日
0075
【自然语言处理】【多模态】UniT：基于统一Transformer的多模态多任务学习

UniT：基于统一Transformer的多模态多任务学习《UniT：Multimodal Multitask Learning with a Unified Transform…

人工智能 2023年5月31日
0072
DataFrame 求存在空值的行或列

非转置：df.isnull().any()，得到的每一列求any()计算的结果，输出为列的Series。转置：df.isnull().T.any()，得到的每一行求any()计算…

人工智能 2023年7月7日
0037
用Python将jpg格式文件逐个打标签之后再写入hdf5文件

在用CNN进行图片分类的任务时，发现很多demo都是使用已有的h5文件数据集进行训练但是其他人的数据集毕竟不能100%契合每个项目所以还是想自己准备数据集可照片好拍，打标签和…

人工智能 2023年7月2日
0072
yolov5的head修改为decouple head

yolov5的head修改为decouple head yolox的decoupled head结构本来想将yolov5的head修改为decoupled head，与yolox…

人工智能 2023年7月4日
0062
目标检测（三）传统目标检测与识别的特征提取——基于HOG特征的目标检测原理

目录简介提取HOG特征的步骤 1、预处理获取要计算其特征的输入图像 2、计算图像的梯度 3、计算8×8细胞梯度直方图 4、直方图归一化 5、计算HOG特征向量 Opencv利用…

人工智能 2023年7月10日
0077
Xception迁移学习：玉米叶片病害识别分类

Xception迁移学习：玉米叶片病害识别分类数据集：来自网上公开的PlantVillage数据集中的玉米叶片部分。运行环境：Tensorflow深度学习开源框架，选用Pyth…

人工智能 2023年5月26日
0065
【论文精读】Point-NeRF:Point-based Neural Radiance Fields

CVPR2022 oral的一篇文章，文章还行，代码比较乱，超参非常多且没有注释，代码也有bug原文链接：https://arxiv.org/abs/2201.08845代码链接：…

人工智能 2023年7月12日
0058
SQL如何删除重复数据

SQL去重 1 SQL去重 2 distinct 3 group by 4 总结 1 SQL去重 SQL中去除完全相同数据可以用distinct关键字，任意字段去重可以用group…

人工智能 2023年7月29日
0054
python中相关系数_day-14 回归中的相关系数和决定系数概念及Python实现

衡量一个回归模型常用的两个参数：皮尔逊相关系数和R平方一、皮尔逊相关系数在统计学中，皮尔逊相关系数( Pearson correlation coefficient)，又称皮尔…

人工智能 2023年6月18日
0060

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31