VAD检测原理及其过程

2023年5月27日上午8:33 • 人工智能 • 阅读 72

    &#x987E;&#x540D;&#x601D;&#x4E49;&#xFF0C;VAD&#xFF08;Voice Activity Detection&#xFF09;&#x7B97;&#x6CD5;&#x7684;&#x4F5C;&#x7528;&#x662F;&#x68C0;&#x6D4B;&#x662F;&#x5426;&#x662F;&#x4EBA;&#x7684;&#x8BED;&#x97F3;&#xFF0C;&#x5B83;&#x7684;&#x4F7F;&#x7528;

范围极广，降噪，语音识别等领域都需要有vad检测。vad检测有很多方法，这里我们之介绍一
下webrtc里面的vad检测。
webrtc的vad检测原理是根据人声的频谱范围，把输入的频谱分成六个子带
（80Hz250Hz，250Hz500Hz,500Hz1K,1K2K,2K3K,3K4K。）分别计算这六个子带的、
能量。然后利用高斯模型的概率密度函数得到对数似然比函数。对数似然比得分

[En]

Energy. Then the probability density function of Gaussian model is used to obtain a logarithmic likelihood ratio function. Logarithmic likelihood ratio score

全局和局部，全局是六个子带的加权和，局部意味着每个子带都是局部的，所以语音判断将

[En]

Global and local, global is the weighted sum of six subbands, and local means that each subband is local, so voice judgment will

先判子带，当没有判子带时，就判断全局，只要一方过关，哪怕有声音。

[En]

First judge the subband, when the subband is not judged, it will judge the overall situation, as long as one party passes, even if there is a voice.

webrtc的vad检测代码比较简洁，核心代码只在三个文件中。
webrtc_vad.c 该文件是用户调用的API函数，使用vad一般只需要调用该里面的函数即可。
使用函数：WebRtcVad_Create WebRtcVad_Init 申请内存和初始化一些参数。

使用函数：WebRtcVad_set_mode 设置vad要处理的采样率，一般是8000或16000
使用函数：WebRtcVad_Process 核心函数，完成检测是否有人声的核心。
vad_core.c 该文件是webrtc_vad.c 文件中函数的实现代码，也是vad最深层的核心代码。

　使用方法：

　　初始化调用：

　　WebRtcVad_Create（）；

　　WebRtcVad_Init（）；

　　WebRtcVad_set_mode（）；

　　处理调用：

　　WebRtcVad_Process（）；

注意事项：
这里共有三种帧长可以用到，分别是80/10ms，160/20ms，240/30ms。其它采样率
的48k，32k，24k，16k会重采样到8k来计算VAD。之所以选择上述三种帧长度，是因为语

音信号是短时平稳信号，其在10ms~30ms之间可看成平稳信号，高斯马尔科夫等比较
的信号处理方法基于的前提是信号是平稳的，在10ms~30ms，平稳信号处理方法是可
以使用的。
从vad的代码中可以看出，实际上，系统只处理默认10ms,20ms,30ms长度的数据，
其它长度的数据没有支持，笔者修改过可以支持其它在10ms-30ms之间长度的帧长度
发现也是可以的。
vad检测共四种模式，用数字0~3来区分，激进程度与数值大小正相关。
0: Normal，1：low Bitrate， 2：Aggressive；3：Very Aggressive 可以根据实际的使用
它可以在初始化期间进行配置。

[En]

It can be configured during initialization.

动也会带来影响，所以取了80Hz以上的信号。

Original: https://blog.csdn.net/sdsszk/article/details/110143331
Author: sdsszk
Title: VAD检测原理及其过程

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/525171/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

第2章：知识表示–实践：Protégé本体构建

实践：Protégé本体构建知识建模本体本体（Ontology）：领域共享知识的描述方式，是语义Web、语义搜索、知识工程和很多人工智能应用的基础。 ; 知识建模方法知识图谱…

人工智能 2023年6月1日
00102
通信网信息传输与分发技术国家级重点实验室2021年度预研基金项目申请指南

通信网信息传输与分发技术国家级重点实验室2021年度预研基金项目申请指南人工智能技术与咨询人工智能技术与咨询北京龙腾亚太教育咨询有限公司依托中国管理科学研究院职业资格认证培训…

人工智能 2023年6月1日
0077
再次飙升 GitHub 榜首，这份“保姆级”的 SpringBoot 笔记，不服不行

Spring Boot 延续了 Spring 框架的核心思想 IOC 和 AOP，简化了应用的开发和部署，通过少量的代码就能创建一个独立的、产品级别的 Spring 应用。在继承了…

人工智能 2023年6月29日
0065
论文阅读 Enhancing knowledge graph embedding with relational constraints

Enhancing knowledge graph embedding with relational constraints 利用关系约束增强知识图嵌入发表于：Neurocom…

人工智能 2023年6月1日
00102
图像去雾概述

概念：随着图像处理技术和计算机视觉技术的蓬勃发展，对特殊天气下的场景检测和图像处理成为该领域的重要研究方向。其中在雾天拍摄的图像容易受雾或霾的影响，导致图片细节模糊、对比度低以至于…

人工智能 2023年7月21日
0074
2022各顶会NAS论文（不全）

CVPR 2022 1.Shapley-NAS: Discovering Operation Contribution for Neural Architecture Search…

人工智能 2023年6月4日
0063
windows上yolov5 opencv dnn c++部署 cuda加速

目录前置环境前言一，安装cuda，cudnn 二，重新编译opencv+opencv_contrib 1，cmake编译opencv+opencv_contrib 2，VS生…

人工智能 2023年6月19日
0083
huggingface.transformers速成笔记：Pipeline推理和AutoClass

诸神缄默不语-个人CSDN博文目录本文属于huggingface.transformers全部文档学习笔记博文的一部分。全文链接：huggingface transformers…

人工智能 2023年5月28日
00111
K-均值(K-Means)聚类算法——数据建模及MATLAB实现

数据建模及MATLAB实现(四) 随着信息技术的发展和成熟，各行业积累的数据越来越多，因此需要通过数据建模的方法，从看似杂乱的海量数据中找到有用的信息。 K-均值(K-Means)…

人工智能 2023年6月15日
0093
Cocoa-window

Application的结构在AppDelegate文件中获取当前appDelegate和app对象 AppDelegate *appDelegate = (AppDelegat…

人工智能 2023年6月30日
0072
【自然语言处理】【表格问答】简单有效的表格问答模型RCI

在基于Transformer的表格问答上捕获行列语义《Capturing Row and Column Semantics in Transformer Based Questi…

人工智能 2023年5月30日
0087
Google Earth Engine 教程——栅格矢量数据转化和导出

本教程提供了将栅格要素转换为矢量并导出美国科罗拉多州落基山国家公园的栅格和矢量要素的工作流程函数： reduceToVectors(reducer, geometry, scal…

人工智能 2023年6月26日
0070
【数字图像处理】实验（1）——图像基本变换

图像基本变换一、实验意义及目的二、实验内容三、实验原理四、Matlab相关函数介绍五、代码及结果 * （1）将Image1色彩通道互换，并显示效果；（2）将Image1…

人工智能 2023年6月17日
00158
Pandas 二十四：怎么处理日期索引的缺失？

Pandas 二十四：怎么处理日期索引的缺失？ * – 问题：如果缺失了索引该怎么填充？ – 方法1：使用pandas.reindex方法 – …

人工智能 2023年7月7日
0046
Gavin老师Transformer直播课感悟 – Rasa对话机器人Debugging项目实战之电商零售对话机器人运行流程调试全程演示(七十八)

本文继续围绕工业级业务对话平台和框架Rasa，对Rasa项目实战之电商零售Customer Service智能业务对话机器人运行流程进行剖析，并使用Rasa shell debug…

人工智能 2023年5月28日
0098
T-SNE可视化高维数据，亮瞎审稿人

文章目录 * – 经典案例-MNIST手写数字降维可视化 – 论文中使用 t-SNE 案例 – t-SNE 实战 – + MNIST…

人工智能 2023年6月23日
00116

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

VAD检测原理及其过程

大家都在看