语音信号处理-概念（二）：幅度谱（短时傅里叶变换谱/STFT spectrum）、梅尔谱（Mel spectrum）【语音的深度学习主要用幅度谱、梅尔谱】【用librosa或torchaudio提取】

2023年5月25日下午5:06 • 人工智能 • 阅读 99

语音的深度学习使用了什么样的频谱？

[En]

What kind of spectrum is used in the in-depth learning of speech?

答：以”幅度谱”和”梅尔谱”为主，通常可以用librosa库或者torchaudio库进行提取。

Mel谱：在幅值谱的基础上，乘以“Mel变换”，得到80维的Mel谱。这一频谱的80个频率组更接近人耳的听觉感知范围。但相应地，所包含的语音信息小于幅度谱。因此，它更常用于一些以人为本的语音任务中。

[En]

Mel spectrum: on the basis of the amplitude spectrum, multiply by a “Mel transform” to get the 80-dimensional Mel spectrum. The 80 frequency groups of this spectrum are closer to the auditory perception range of the human ear. But correspondingly, the speech information contained is less than the amplitude spectrum. Therefore, it is more commonly used in some human-oriented voice tasks.

请注意，深度学习中的Mel谱在大多数情况下是指对数Mel谱！！

[En]

Note that the Mel spectrum in deep learning refers to * logarithmic Mel spectrum in most cases! !*

“幅度谱”的频率组中的频率以 线性等间隔增加；10Hz、20Hz、30Hz、…
“梅尔谱”的频率组中的频率以 对数间隔增加；10Hz、15Hz、17Hz、18Hz、…

语音信号处理-概念（二）：幅度谱（短时傅里叶变换谱/STFT spectrum）、梅尔谱（Mel spectrum）【语音的深度学习主要用幅度谱、梅尔谱】【用librosa或torchaudio提取】

从2015年深度学习广泛取得较好的效果以来，大多数语音任务普遍采用STFT(amp) 谱或者melspec作为训练输入。
melspec在大多数论文中默认是取对数的，即使论文本身使用的单词是melspec,但是实际上训练的时候，代码中会加上log ( ) 函数。
STFT谱的特征维度可以随意，一般习惯使用1024、512、256维，但是较多的训练过程的melspec还是采用80维。

一般而言，参数设置如下：

[En]

In general, the parameters are set as follows:

幅度谱：n_fft = 1024（n_dim = 513）;
梅尔

Original: https://blog.csdn.net/u013250861/article/details/125476186
Author: u013250861
Title: 语音信号处理-概念（二）：幅度谱（短时傅里叶变换谱/STFT spectrum）、梅尔谱（Mel spectrum）【语音的深度学习主要用幅度谱、梅尔谱】【用librosa或torchaudio提取】

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/515172/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【练习八结构体(强化)编程题7. 公共钥匙盒】

【问题描述】有一个学校的老师共用N个教室，按照规定，所有的钥匙都必须放在公共钥匙盒里，老师不能带钥匙回家。每次老师上课前，都从公共钥匙盒里找到自己上课的教室的钥匙去开门，上完课后…

人工智能 2023年6月29日
0094
数学建模 – 汽车行驶工况构建（2019年中国研究生数学建模竞赛D题）

2022.11.7日更新为了方便大家，我直接把代码和文章搞进百度网盘，自行获取。链接失效的话，可以私信或者评论告诉我。链接：https://pan.baidu.com/s/1…

人工智能 2023年7月15日
0088
Fibonacci数列那些事！

对于 Fibonacci数，相信我们都不陌生，在初学编程时，算 Fibonacci数往往是一个不错的编程习题，那么接下来一起深入了解一下 Fibonacci数吧先假设一个初始条件…

人工智能 2023年6月28日
0086
10个免费素材网站盘点，有大量优质贴图和纹理素材

哈喽大家好，我是 Renderbus瑞云渲染的小编小瑞，今天要给大家分享一些我私藏的一些宝藏素材网站！这些网站里包含大量的免费贴图和纹理素材，而且因其信息组织清晰而上榜，为大家节省…

人工智能 2023年6月20日
00110
matlab数字图像处理实验一：图像的读取显示存储、平移镜像放大缩小及旋转

灵活运用csdn来完成一下实验作业题目一：读取、显示、存储题目二：平移、镜像、放大、缩小、旋转 * 平移镜像放大缩小旋转题目一：读取、显示、存储读入一幅RGB图像，…

人工智能 2023年6月18日
00200
Python抓取腾视频所有电影，不用钱就可以看会员电影

大家好，今天我们来学习如何抓取电影，实现看剧自由~ 运行环境 IDE丨pycharm 版本丨Python3.6 系统丨Windows 实现目的与思路目的：实现对腾讯视频目标ur…

人工智能 2023年7月4日
0071
Large-Scale Relation Learning for Question Answering over Knowledge Bases with Pre-trained Langu论文笔记

文章目录 * – 一. 简介 – + 1.知识库问答（KBQA）介绍 + 2.知识库问答（KBQA）的主要挑战 + 3.以往方案 + 4.本文方法 &#82…

人工智能 2023年6月1日
0070
python爬虫——爬取小说

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月4日
0072
美赛 6：相关性模型、回归模型（十大模型篇）

目录三、相关性模型（SPSS） 1.皮尔逊相关系数 2.皮尔逊相关系数假设检验 3.数据正态分布检验 4.斯皮尔曼相关系数四、回归模型（Stata） 1.多元线性回归分析 2….

人工智能 2023年7月14日
00249
Cy3 PEG N-羟基琥珀酰亚胺，花菁染料CY3标记N-羟基琥珀酰亚胺，CY3-N-Hydroxy succinimide

产品名称：Cy3 PEG N-羟基琥珀酰亚胺，花菁染料CY3标记N-羟基琥珀酰亚胺英文名称：CY3-N-Hydroxy succinimide N-羟基丁二酰亚胺，白色至类白色结…

人工智能 2023年6月28日
0056
torch使用gpu的环境配置

简介 gpu（图形处理器），全称Graphics Processing Unit。GPU虽然只能做简单的运算，但其核心数多以及应用并行运算，非常适合矩阵运算。CPU单核运算能力强大…

人工智能 2023年6月16日
0075
【LSTM回归预测】基于matlab布谷鸟算法优化LSTM回归预测【含Matlab源码 2037期】

⛄一、布谷鸟算法优化LSTM预测 1 布谷鸟搜索算法布谷鸟算法是一种新型的群智能搜索算法，布谷鸟算法具有参数数目少、鲁棒性强、通用性好和全局寻优能力突出等多方面综合优势。布谷鸟算法…

人工智能 2023年6月16日
0086
11.WPF绘图

11.绘图 WPF基本的图形包括： Line，直线段 Rectangle，矩形 Ellipse，椭圆 Polygon，多边形，由多条直线段围成的闭合区域 Polylin，折线，不闭…

人工智能 2023年6月29日
0074
中的异常检测算法如何实现

问题描述异常检测是数据分析中一个重要的任务，它被应用于各个领域，例如网络入侵检测、金融欺诈检测、设备故障检测等。在这个问题中，我们将探讨如何使用统计学方法进行异常检测。介绍异…

人工智能 2023年12月31日
0034
windows上配置深度学习（李沐-动手学深度学习）

1、安装miniconda windows下安装，去清华大学开源镜像下载，速度比较快。选中Miniconda3-latest-Windos-x86_64.exe下载安装包（目前最…

人工智能 2023年6月25日
00126
JDBC与Spring事务及事务传播性原理解析-上篇

这篇我们主要介绍下JDBC的各种简单操作，例如增删改查、事务、事务保存点，以及介绍下Spring的传播机制，同时试着简单说明下Spring事务传播机制是怎样操作JDBC事务的组装来…

人工智能 2023年6月30日
0071

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

语音信号处理-概念（二）：幅度谱（短时傅里叶变换谱/STFT spectrum）、梅尔谱（Mel spectrum）【语音的深度学习主要用幅度谱、梅尔谱】【用librosa或torchaudio提取】

大家都在看