Matlab-基于短时神经网络的声音分类

2023年7月2日上午5:23 • 人工智能 • 阅读 76

这个例子展示了如何使用深度学习过程对声音进行分类。

1、数据集生成

生成1000个白噪声信号、1000个棕色噪声信号和1000个粉色噪声信号。假设采样率为44.1 kHz，每个信号表示0.5秒的持续时间。

fs = 44.1e3;

duration = 0.5;

N = duration*fs;

wNoise = 2*rand([N,1000]) - 1;

wLabels = repelem(categorical("white"),1000,1);

bNoise = filter(1,[1,-0.999],wNoise);

bNoise = bNoise./max(abs(bNoise),[],'all');

bLabels = repelem(categorical("brown"),1000,1);

pNoise = pinknoise([N,1000]);

pLabels = repelem(categorical("pink"),1000,1);

2、数据可视化

听声音信号，并使用melSpectrogram函数将其可视化。

sound(wNoise(:,1),fs)

melSpectrogram(wNoise(:,1),fs)

title('White Noise')

undefined

sound(bNoise(:,1),fs)

melSpectrogram(bNoise(:,1),fs)

title('Brown Noise')

undefined

sound(pNoise(:,1),fs)

melSpectrogram(pNoise(:,1),fs)

title('Pink Noise')

3、将数据集分为训练集和验证集

创建一个由800个白噪声信号、800个棕色噪声信号和800个粉色噪声信号组成的训练集。

audioTrain = [wNoise(:,1:800),bNoise(:,1:800),pNoise(:,1:800)];

labelsTrain = [wLabels(1:800);bLabels(1:800);pLabels(1:800)];

使用剩余的200个白噪声信号、200个棕色噪声信号和200个粉色噪声信号创建验证集。

audioValidation = [wNoise(:,801:end),bNoise(:,801:end),pNoise(:,801:end)];

labelsValidation = [wLabels(801:end);bLabels(801:end);pLabels(801:end)];

4、信号提取

音频数据是高维的，通常包含冗余信息。通过首先提取特征，然后使用提取的特征训练模型，可以降低维数。创建audioFeatureExtractor对象以提取mel光谱随时间变化的质心和斜率。

aFE = audioFeatureExtractor("SampleRate",fs, ...

    "SpectralDescriptorInput","melSpectrum", ...

    "spectralCentroid",true, ...

    "spectralSlope",true);

调用extract从音频训练数据中提取特征。

featuresTrain = extract(aFE,audioTrain);

[numHopsPerSequence,numFeatures,numSignals] = size(featuresTrain)

5、数据准备

在下一步中，您将把提取的特征视为序列，并使用sequenceInputLayer作为深度学习模型的第一层。当使用SequenceInputLayers作为网络中的第一层时，trainNetwork希望将训练和验证数据格式化为序列的单元数组，其中每个序列随时间由特征向量组成。sequenceInputLayer要求时间维度沿第二维度。

featuresTrain = permute(featuresTrain,[2,1,3]);

featuresTrain = squeeze(num2cell(featuresTrain,[1,2]));

numSignals = numel(featuresTrain)

numSignals = 2400

[numFeatures,numHopsPerSequence] = size(featuresTrain{1})

numFeatures = 2

numHopsPerSequence = 42

提取特征

featuresValidation = extract(aFE,audioValidation);

featuresValidation = permute(featuresValidation,[2,1,3]);

featuresValidation = squeeze(num2cell(featuresValidation,[1,2]));

6、定义和训练网络

定义网络架构。

layers = [ ...

    sequenceInputLayer(numFeatures)

    lstmLayer(50,"OutputMode","last")

    fullyConnectedLayer(numel(unique(labelsTrain)))

    softmaxLayer

    classificationLayer];

要定义train选项，请使用option选项（深度学习工具箱）。

options = trainingOptions("adam", ...

    "Shuffle","every-epoch", ...

    "ValidationData",{featuresValidation,labelsValidation}, ...

    "Plots","training-progress", ...

    "Verbose",false);

要训练网络，请使用trainNetwork（深度学习工具箱）。

net = trainNetwork(featuresTrain,labelsTrain,layers,options);

7、验证网络

使用经过训练的网络对新的白噪声、棕色噪声和粉色噪声信号进行分类。

wNoiseTest = 2*rand([N,1]) - 1;

classify(net,extract(aFE,wNoiseTest)')

ans = categorical

     white

bNoiseTest = filter(1,[1,-0.999],wNoiseTest);

bNoiseTest= bNoiseTest./max(abs(bNoiseTest),[],'all');

classify(net,extract(aFE,bNoiseTest)')

ans = categorical

     brown

pNoiseTest = pinknoise(N);

classify(net,extract(aFE,pNoiseTest)')

ans = categorical

     pink

Original: https://blog.csdn.net/qingfengxd1/article/details/121346021
Author: studyer_domi
Title: Matlab-基于短时神经网络的声音分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/664784/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

多类别目标计数 Dilated-Scale-Aware Category-Attention ConvNet for Multi-Class Object Counting 论文笔记

多类别目标计数 Dilated-Scale-Aware Category-Attention ConvNet for Multi-Class Object Counting 论文笔…

人工智能 2023年7月10日
0040
mmrotate旋转目标检测框架的学习与使用

目录前言一、环境配置 1. 下载checkpoint文件 2. 运行demo 二、制作自己的数据集 1. 标注数据 2. 标签格式转换 3. 可视化数据集 4. 数据集裁剪三…

人工智能 2023年7月9日
0040
今天面了个阿里拿27k出来的小哥，让我见识到了什么是天花板

2022年堪称大学生就业最难的一年，应届毕业生人数是1076万。失业率超50%！但是我观察到一个数据，那就是已经就业的毕业生中，计算机通信等行业最受毕业生欢迎！计算机IT行业薪资…

人工智能 2023年7月10日
0078
R语言——（五）、探索性数据分析

文章目录一、分析工具 * 1.图形的展示和解释 2.数据的类型二、单变量数据探索性分析 * 1.分类数据的探索性分析 – 1.1 分类频数表 1.2 条形图（Bar…

人工智能 2023年7月15日
0083
17届智能车图像处理部分讲解

目录须知寻边线寻拐点补线最后须知讲解代码使用的摄像头为总钻风摄像头，图像像素为188*120，图像进行了二值化，这里建议如果需要对光线有要求的同学使用灰度处理。没有使…

人工智能 2023年6月17日
00113
Pyecharts简单实战——文章词云（Pyecharts库+jieba库）

题主最近要做一个政策可视化的小项目参加学校的比赛。想做一个简介凝练可以传达文章主题的图表，于是自然地想到了词云图。词云图需要原料，就是词语和词频。为了解决这个原料需求，简单利用…

人工智能 2023年5月28日
0079
深度神经网络算法有哪些,最简单的神经网络算法

常见的深度学习算法主要有哪些？深度学习常见的3种算法有：卷积神经网络、循环神经网络、生成对抗网络。卷积神经网络(ConvolutionalNeuralNetworks,CNN)…

人工智能 2023年7月12日
0080
OpenCV图像缩放插值之BiCubic双三次插值

转载请注明出处。文章链接：https: 图像缩放算法简介在图像的仿射变换中，很多地方需要用到插值运算，常见的插值运算包括最邻近插值，双线性插值，双三次插值（立体插值），兰索思插…

人工智能 2023年6月18日
00128
spring整合fastdfs客户端

Boot可以很方便地与，实现文件上传和下载的功能。首先，需要在pom.xml文件中添加的依赖： </p> <p>.tobato</p> &…

人工智能 2023年6月30日
0083
Python时间序列分析–ARIMA模型实战案例

Python时间序列分析–ARIMA模型实战案例,利用ARIMA模型对时间序列进行分析的经典案例（详细代码）本文将介绍使用Python来完成时间序列分析ARIMA模型的完整步骤与…

人工智能 2023年7月26日
0081
10分钟Window本地部署stable diffusion AI绘图【入门教程】

前言自从Stable Diffusion在今年8月份开源以来，着实把AI绘图推向一个新的高潮，官网也同时发布了在线版本，大家可以去体验下。体验网址：https://beta.d…

人工智能 2023年7月26日
0062
用自己的数据集跑LINS—LiDAR-inertial-SLAM

用自己的数据集跑LINS—LiDAR-inertial-SLAM 前言一、下载运行代码二、运行自己的bag包 * 1.话题 2.–clock 用自己的数…

人工智能 2023年6月11日
0085
pandas如何进行优雅的列转行、行转列？

一、列转行 1、背景描述在日常处理数据过程中，你们可能会经常遇到这种类型的数据：而我们用pandas进行统计分析时，往往需要将结果转换成以下类型的数据： ; 2.方法描述准备数…

人工智能 2023年7月14日
0056
正大杯黑客马拉松数据解析竞赛

正大杯黑客马拉松数据解析竞赛基础包导入import pandas as pdimport numpy as npimport matplotlib.pyplot as pltim…

人工智能 2023年7月8日
0061
java音频之ffmpeg

在maven中引入 <dependency> <groupid>org.bytedeco</groupid> <artifactid&gt…

人工智能 2023年5月27日
0064
neo4j的使用（以红楼梦人物关系为例）

参考：知识图谱实战：构建红楼梦知识图谱_任萌新的小生活-CSDN博客_知识图谱构建实战https://blog.csdn.net/RHJlife/article/details/1…

人工智能 2023年6月1日
0069

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Matlab-基于短时神经网络的声音分类

6、定义和训练网络

7、验证网络

大家都在看