脑电数据集提取微分熵特征(以SEED数据集为例)

2023年6月15日上午3:34 • 人工智能 • 阅读 79

前言

SEED数据集是常用的脑电信号情绪识别数据集，在该数据集的Preprocessed_EEG文件夹中是原始的脑电数据，在ExtractedFeatures文件夹中是官方提取特征后的数据(提取了多种特征可直接使用)。

既然官方已经把特征提取好了为什么还要自己做特征提取？

官方并没有开源提取特征的代码。
为了处理其他数据集或者自己的数据。
微分熵(de)作为脑电中非常好的脑电特征目前在网上却很难找到实现的放发，收费的代码大多也是错的或者是不完整的。

带通滤波器

人类的脑电图中脑波频率可以在0.5到几十赫兹，通常按照频率进行分类以表示各种成分：
δ波(0.5-4Hz) ，θ波(4-8Hz)，α波(8-13Hz)，β波(13-32Hz)，γ波(32-50Hz)，这个地方很多人写的频率范围都不大一样但也没有很大的差别。我们这里使用带通滤波器来实现频段的提取。

带通滤波器代码实现

from scipy import signal

fStart = [0.5, 4, 8, 13, 32]
fEnd = [4, 8, 13, 32, 50]

results = []
for band_index, band in enumerate(fStart):
    b, a = signal.butter(4, [fStart[band_index]/fs, fEnd[band_index]/fs], 'bandpass')
    result = signal.filtfilt(b, a, data)
    results.append(result)

最终提取到的五个频段都会存入 results 中。

微分熵

微分熵实际上是香农熵在连续信号上的推广

香农熵：对概率分布中的不确定性总量进行量化，公式如下：

微分熵：对连续性随机变量的概率分布中的不确定性总量进行量化，公式如下：

; 微分熵代码实现

def compute_DE(signal):
    variance = np.var(signal, ddof=1)
    return math.log(2 * math.pi * math.e * variance) / 2

这个代码看起来貌似和上面的公式不一样，实际上这个是微分熵的化简式。

完整代码（SEED数据集）

from scipy.io import loadmat
from sklearn.preprocessing import MinMaxScaler
from scipy import signal
import numpy as np
import math
import os

def compute_DE(signal):
    variance = np.var(signal, ddof=1)
    return math.log(2 * math.pi * math.e * variance) / 2

def load_data():
    data_dir = "../SEED/Preprocessed_EEG/"
    fs = 200
    fStart = [0.5, 4, 8, 13, 32]
    fEnd = [4, 8, 13, 32, 50]
    channel = [3, 7, 13, 23]

    filename_label = "label"
    label = loadmat(data_dir + filename_label)
    label = label["label"][0]

    datasets_X, datasets_y = [], []
    for filename_data in os.listdir(data_dir):
        if filename_data in ["label.mat", "readme.txt"]:
            continue
        data_all = loadmat(data_dir + filename_data)
        scenes = list(data_all.keys())[3:]
        for index, scene in enumerate(scenes):
            dataset_X = []
            data = data_all[scene][channel]
            scaler = MinMaxScaler()
            data = scaler.fit_transform(data)

            for band_index, band in enumerate(fStart):
                b, a = signal.butter(4, [fStart[band_index]/fs, fEnd[band_index]/fs], 'bandpass')
                filtedData = signal.filtfilt(b, a, data)
                filtedData_de = []

                for lead in range(len(channel)):
                    filtedData_split = []

                    for de_index in range(0, filtedData.shape[1] - fs, fs):
                        filtedData_split.append(compute_DE(filtedData[lead, de_index: de_index + fs]))

                    if len(filtedData_split) < 265:
                        filtedData_split += [0.5] * (265-len(filtedData_split))
                    filtedData_de.append(filtedData_split)
                filtedData_de = np.array(filtedData_de)
                dataset_X.append(filtedData_de)

            datasets_X.append(dataset_X)
            datasets_y.append(label[index])

    datasets_X, datasets_y = np.array(datasets_X), np.array(datasets_y)

if __name__ == "__main__":
    datasets_X, datasets_y = load_data()
    print(datasets_X.shape)
    print(datasets_y.shape)

Original: https://blog.csdn.net/YuqingF/article/details/125873032
Author: 余磬
Title: 脑电数据集提取微分熵特征(以SEED数据集为例)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/613559/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python在振动信号处理中的应用（四）：振动信号时域滤波处理（IIR、FIR）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月23日
00104
C++ Reference: Standard C++ Library reference: C Library: cwctype: wctype

C++官网参考链接：https://cplusplus.com/reference/cwctype/wctype/ 函数 string passed asproperty desc…

人工智能 2023年6月29日
00109
4G工业路由器的硬件保护作用是什么

4G工业路由器拥有诸多硬件保护的主要目标是保证设备的稳定运行，不断网不宕机。这也是选择联网设备中首要条件。原因非常简单，这是保证远程联网数据传输的基本，如果出现联网中断，必然导致项…

人工智能 2023年6月6日
00114
【自然语言处理】BERT,Transformer的模型架构与详解

文章目录 1. BERT,Transformer的模型架构与详解 * 1.1 认识BERT – BERT的架构 BERT的预训练任务 1.2 Transformer的结…

人工智能 2023年5月30日
0075
Vibe算法简介、优缺点、代码

ViBe检测方法 * – 算法简介 – + 1.背景模型的初始化 + 2.前景检测过程 + 3.背景模型的更新方法 – Vibe算法优缺点 &#…

人工智能 2023年7月9日
0065
drift）问题

问题描述对于无人驾驶汽车或飞行器等自主移动设备来说，精确的定位和导航是非常重要的。然而，在实际应用中，由于多种原因（如传感器误差、环境变化等），车辆或飞行器可能会产生偏离期望路径…

人工智能 2024年1月4日
0055
论文精读：Generative Adversarial Imitation Learning（生成对抗模仿学习）

生成对抗模仿学习论文分享（Generative Adversarial Imitation Learning） 1.背景介绍 1.1.论文背景这篇论文是2016年由斯坦福大学研究…

人工智能 2023年6月24日
0067
记录一下wandb的用法

Javascript小技巧一箩筐事件源对象 event.srcElement.tagName event.srcElement.type 捕获释放 event.srcElemen…

人工智能 2023年7月13日
0050
Learning算法中的SVM是指什么

问题：SVM是指什么？ SVM，全称为支持向量机（Support Vector Machine），是一种常用的机器学习算法，主要用于二分类和多分类问题。它在解决线性和非线性问题上表…

人工智能 2024年1月1日
0035
【Pytorch-从一团乱麻到入门】：6、Pytorch 选择最终模型的方式：save best model & early stop

在模型训练时一般会进行多轮，那么到底哪一轮训练出来的模型是最优的呢？如果在脚本中挑选出最合适的模型呢？针对上述问题，一般会有如下几种解决方法； 1、最占用存储但是却是最稳妥的方法…

人工智能 2023年7月23日
0086
相似文本聚类

聚类方法原型聚类原型是指样本空间中具有代表性的点。此类算法假设聚类结构能通过一组原型刻画，在现实聚类中极为常用。如：k-means、高斯混合聚类高斯混合聚类：：层次聚类 [T…

人工智能 2023年6月3日
00153
使用BERT+BiGRU对京东手机评论进行情感分析

1. 设置参数，使模型结果具有可重现性（非必须）确定性操作通常比非确定性操作慢，因此您的模型的单次运行性能可能会降低。但是，确定性可以通过促进实验、调试和回归测试来节省开发时间。…

人工智能 2023年6月30日
0076
机器学习（二）对航空公司客户价值进行聚类分析

## 机器学习（二）对航空公司客户价值进行聚类分析使用sklearn.cluester的KMeans类对航空公司客户数据进行聚类分析，把乘客分到不同的类别中 数据集：air_d…

人工智能 2023年5月31日
0079
深度学习环境配置：Windows安装TensorFlow并在Jupyter notebook上使用

前言深度学习环境配置：Windows安装TensorFlow并在Jupyter notebook上使用安装Anaconda 官网下载地址：https://www.anacond…

人工智能 2023年5月25日
0097
[机器学习与scikit-learn-51]：模型评估-图解回归模型的评估指标MSE、MAE、RMSE、R2、RSS与代码示例

作者主页(文火冰糖的硅基工坊)：文火冰糖（王文兵）的博客_文火冰糖的硅基工坊_CSDN博客本文网址：https://blog.csdn.net/HiWangWenBing/art…

人工智能 2023年6月15日
0059
基于matlab的车牌识别系统的实现

项目背景及目标随着人们生活水平的提高，机动车辆的数量也逐渐增加，2020年全国的机动车保有总数量为3.72亿辆，其中汽车保有量为2.81亿辆，占75.54%。如此庞大的汽车保有量…

人工智能 2023年6月25日
00144

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

脑电数据集提取微分熵特征(以SEED数据集为例)

前言

带通滤波器

带通滤波器代码实现

微分熵

; 微分熵代码实现

完整代码（SEED数据集）

大家都在看