python音频特征提取_音频特征提取方法和工具汇总

2023年5月27日下午4:23 • 人工智能 • 阅读 59

本文首发于：行者AI

大多数音频特征源于语音识别任务，可以简化原始波形采样信号，从而加快机器对音频语义的理解。自20世纪90年代末以来，这些音频特征也被应用于乐器识别等音乐信息检索任务，并出现了更多的音频音乐设计特征。

[En]

Most audio features originate from speech recognition tasks, which can simplify the original waveform sampling signals, thus accelerating the machine’s understanding of the semantic meaning of audio. Since the late 1990s, these audio features have also been applied to music information retrieval tasks such as musical instrument recognition, and more features for audio music design have emerged.

音频特征的类别

理解音频特征的不同类别并不是为了准确地对一个特征进行分类，而是加深我们对该特征的物理含义的理解。一般来说，我们可以从以下几个维度区分音频特征：

[En]

Understanding the different categories of audio features is not to accurately classify a feature, but to deepen our understanding of the physical meaning of the feature. Generally speaking, we can distinguish audio features from the following dimensions:

(1)特征是由模型从信号中直接提取还是基于模型的输出得到的统计，如均值、方差等；

(2)特征表示的是瞬态还是全局上的值，瞬态一般以帧为单位而全局则覆盖更长的时间维度；

(3)特征的抽象程度，底层特征抽象程度最低也是最易从原始音频信号中提取，它可以进一步被处理为高一级的中间特征代表乐谱中常见的音乐元素，如音高、音符的起始时间等；高层特征最为抽象大多用于音乐的曲风和情绪任务；

(4)根据特征提取过程的差异可以分为：从原始信号中直接提取的特征(如过零率)、将信号转换为频率得到的特征(如谱心质)、需经过特定的模型得到的特征(如旋律)、受人耳听觉认知启发改变量化特征尺度得到的特征(如MFCCs)。

我们以”特征提取过程的差异”为主要分类基准，列出各类下比较常见的特征：

同时我们也发现部分特征并非完全属于其中一个类别例如MFCC，因为提取MFCC会将信号从时域转换至频域然后根据模仿人类听觉响

Original: https://blog.csdn.net/weixin_33314238/article/details/113994367
Author: vsoo粉
Title: python音频特征提取_音频特征提取方法和工具汇总

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/526868/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

豆瓣电影TOP250爬虫及可视化分析笔记

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月18日
0069
【智能优化算法】基于差分进化优化数据聚类附matlab代码

1 简介本文提供了一种基于差分Kmeans负荷聚类方法,包括以下步骤:步骤1,采集用户用电的负荷数据,并对负荷数据进行预处理;步骤2,根据负荷数据曲线的局部密度得到聚类初始中心;…

人工智能 2023年6月3日
00180
正则表达式

文章目录一、正则初体验二、匹配规则三、字符串方法的使用 ; 一、正则初体验正则表达式是特殊的字符序列，利用事先定义好的特定字符以及他们的组合组成了一个规则，然后检查一个字符…

人工智能 2023年7月30日
0053
R语言计算dataframe所有数据列的平均值：将dataframe转化为矩阵或者向量后再计算

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月18日
0042
万字胶囊网络超详细总结（原理加pytorch代码）

目录 1.胶囊网络概念与理解 * 1.1 胶囊网络概述 1.2 一个胶囊的组成（与普通神经元进行对比） 1.3 胶囊之间的动态路由（Dynamic Routing) –…

人工智能 2023年6月16日
0078
OpenAI 以 10 亿美元出售「灵魂」，网友热评不再「Open」

编译 | 禾木木出品 | AI科技大本营（ID:rgznai100） OpenAI 如何以 10 亿美元的价格出售其灵魂：GPT-3 和 Codex 背后的公司并不像它声称的那样…

人工智能 2023年5月31日
0073
srt格式导入pr乱码_如何给Final Cut Pro快速加字幕(PR也适用)

最近我刚开始做自媒体，不出意外的是在剪辑中我遇到了各种各样问题，所以我想把遇到什么样的问题，然后我是怎么解决的，用知乎记录下来。给视频上字幕今天向大家推荐一个急速上字幕的方法…

人工智能 2023年5月25日
0094
计算机网络：网络层

网络层的目的是实现两个端系统之间的数据透明传送，具体功能包括寻址和路由选择、连接的建立、保持和终止等。它提供的服务使传输层不需要了解网络中的数据传输和交换技术。网络层提供两种服务…

人工智能 2023年5月30日
0088
《机器学习》西瓜书第三章回归（南瓜书辅助）

第三章 3.1一元线性回归假如说现在有一个正态分布，正态分布由mu和sigama决定，极大似然估计就是用来确定正态分布的这两个参数的 ; 3.2多元线性回归对线性回归方程进行化…

人工智能 2023年6月17日
0061
ValueError: No gradients provided for any variable（TensorFlow2！绝对详细！）

今天的代码一直遇见下列错误，烦不胜烦。其实就是因为在进行优化求损失函数最小值的时候，找不到需要梯度下降的变量，提示的是要检查损失函数。 ([str(v) for _, v in …

人工智能 2023年5月26日
00114
CV2逐步学习-2:cv2.GaussianBlur()详解

目录高斯模糊GaussianBlur()中参数详解 1.1. 由参数解释产生的问题深入理解前的准备：高斯函数、图像滤波处理及卷积核解释1.1的问题权重矩阵、高斯模糊的…

人工智能 2023年6月17日
0049
图像风格迁移实战

最近看了一些基于深度学习的Style Transfer, 也就是风格迁移相关的paper，感觉挺有意思的。所谓风格迁移，其实就是提供一幅画(Reference style ima…

人工智能 2023年7月5日
0051
PointNet介绍

论文：PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation代码：https://…

人工智能 2023年6月16日
00107
图像检测系列之（12）异常检测（13）拼接伪造（14）deepfake | ICCV2021生成对抗GAN汇总梳理…

** 十二、图像检测-异常检测 35 Learning Unsupervised Metaformer for Anomaly Detection 图像异常检测 (Anomaly …

人工智能 2023年5月28日
0080
FCOS3D: Fully Convolutional One-Stage Monocular 3D Object Detection

Paper name FCOS3D: Fully Convolutional One-Stage Monocular 3D Object Detection Paper Readi…

人工智能 2023年6月17日
0066
Pandas对Excel进行写入操作

from genericpath import exists import pandas as pd import os file_dir = ‘D:/program/…

人工智能 2023年6月15日
0054

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

python音频特征提取_音频特征提取方法和工具汇总

大家都在看