语音认别—唤醒技术KWS介绍

2023年5月27日上午6:40 • 人工智能 • 阅读 105

语音认别—唤醒技术KWS介绍

由于目前终端（如手机）上的CPU还不足够强劲，不能让语音识别的各种算法跑在终端上，尤其现在语音识别都是基于深度学习来做了，更加不能跑在终端上，所以目前主流的语音识别方案是声音采集和前处理在终端上做，语音识别算法则放在服务器（即云端）上跑。虽然这种方案有泄漏隐私（把终端上的语音数据发给服务器）和没有网络不能使用等缺点，但也是不得已而为之的，相信在不久的将来等终端上的CPU足够强劲了会把语音识别的所有实现都放在终端上的。

是不是意味着终端上做不了语音识别相关的算法了？其实也不是，语音唤醒功能是需要在终端上实现的。语音唤醒是指设定一个唤醒词，如Siri的”Hi Siri”，只有用户说了唤醒词后终端上的语音识别功能才会处于工作状态，否则处于休眠状态。这样做主要是为了降功耗，增加续航时间。目前很多终端都是靠电池供电的，对功耗很敏感，是不允许让语音识别功能一直处于工作状态的。

G oogle 基于CNN实现的算法，属于Deep KWS方案

评判标准：FRR (False Reject Rate), “漏警率”， CNN的FRR比DNN的FRR提升了27%~44%.

它限制了乘法运算和参数的数量。

[En]

It limits the operation of multiplication and the number of parameters.

很早以前大家使用HMM，后来2014年，Google使用了DNN的方案SMALL-FOOTPRINT KEYWORD SPOTTING USING DEEP NEURAL NETWORKS – 2014 IEEE，然后2014年有人使用CNN进行语音识别Deep Convolutional Neural Networks for large-scale speech tasks, 但是这种CNN架构对计算量要求比较大，而KWS方案对计算量要求有一定的限制，所以本论文中他们提出了优化了版本的CNN方案。

Baidu基于CRNN实现的算法KWS方案

又一个Deep KWS方案

CRNN (Convolutional Recurrent Neural Networks)： CNN+RNN,

流程：PCEN -> CNN -> BRNN -> DNN -> SoftMax

RNN对信噪比大的场景很有帮助

Apple基于DNN实现的算法KWS方案

没找到Apple发的相关论文，只找到两篇Apple官方提供的文档，Apple对音频的识别是基于DNN模型实现的，但是他有2个DNN模型，首先会用一个计算量较小的模型进行预检，然后再用更加精确的Large DNN进行计算，语音识别后，在通过HMM Scorer计算得分，如果分数满足阈值要求，会触发Siri。但是如果不满足要求，系统也会进入几秒的敏感期，这个敏感期内，如果用户再次重复这个主题，那么会快速识别，这样降低了漏报率。
手表中使用的DNN模型只有一个，是介于Small DNN和Large DNN之间的模型。

Original: https://blog.csdn.net/baiyibin0530/article/details/113933435
Author: 宁静以致墨
Title: 语音认别—唤醒技术KWS介绍

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/524769/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

一篇比较明白的共现矩阵解读

文章目录前言一、词向量是什么？ * 1.1离散表示（one-hot representation） 1.2分布式表示（distribution representation） …

人工智能 2023年5月27日
0079
量化感知训练QAT，quantization aware training

神经网络的量化可以分为两类，一类是训练后量化，另一类是训练时量化。 [En] Neural network quantization can be divided into two…

人工智能 2023年5月23日
00162
Coursera课程答案分享

Coursera课程答案分享大家好，我是Three~ 欢迎大家到访我的GitHub，这个仓库里面有我之前写过的Coursera课程的题目。目前，仓库中有以下课程的答案： Dee…

人工智能 2023年5月26日
0094
实现基于区域的图像分割方法-区域生长法

目录基于区域的图像分割方法区域生长法算法步骤区域分裂与合并阈值分割区域合并实现区域生长法代码分割结果基于区域的图像分割方法基于区域的分割是以直接寻找区域为基础…

人工智能 2023年6月24日
0091
通过anaconda升级、安装jupyter notebook内核kernel的python版本

本来我是要通过重装的方式来升级到最新版本python内核的，然后在看了很多帖子之后终于成功、免于卸载了，现在就把完整的步骤分享出来。使用环境：Windows10 目录 0 准备工…

人工智能 2023年7月28日
0078
python_tensorflow安装失败:ERROR: Could not find a version that satisfies the requirement tensorflow

文章目录版本兼容(适配)问题 * 再安装一个稍微旧一点的python版本检查降级情况 tensorflow 对python版本的适配情况版本兼容(适配)问题这个大概就是因为…

人工智能 2023年6月16日
00152
【PyTorch深度学习项目实战100例】—— 基于pytorch使用LSTM实现新闻本文分类任务 | 第9例

; 前言大家好，我是阿光。本专栏整理了《PyTorch深度学习项目实战100例》，内包含了各种不同的深度学习项目，包含项目原理以及源码，每一个项目实例都附带有完整的代码+数据集…

人工智能 2023年7月28日
0082
第四章 STM32+LD3320+SYN6288+DHT11实现语音获取温湿度数值（上）

前面三章，我们介绍了LD3320、SYN6288和DHT11温湿度传感器，并把代码资料一一分享给大家了，拿到代码后，我们就可以做一个简单的语音识别毕设了，即通过语音命令获取当前环境…

人工智能 2023年5月25日
0068
中的图片文字识别_识别图片中公式和文字的最佳组合：天若文字识别和Mathpix…

谢松兴蒙宗灿盘俊春广西南宁市第八中学发表于《中国信息技术教育》2020年第22期。 [En] Published in the 22nd issue of China In…

人工智能 2023年5月27日
0064
利用L1范数的CNN模型剪枝

文章目录 1.原理 2.修改模型 3.数据集 4.代码实现 * 4.1.正常训练 4.2.稀疏训练 4.3.剪枝 4.4.微调参考文献 1.原理缩放因子和稀疏性引起的惩罚。…

人工智能 2023年7月9日
0091
YOLO算法之YOLOv5

目录一、什么是YOLOv5？二、YOLO目标检测技术发展史 * 1、发展历程一览 2、各版本差异三、YOLOv5网络结构和组件一、什么是YOLOv5？参考学习：了解YO…

人工智能 2023年6月16日
0082
Openpilot EP1：Openpilot开源项目深度解析

目录 0.前言 1.整体介绍 2.系统架构与硬件配置 2.1 系统架构 2.2 硬件配置 3.量产安全规范体系 4.生态体系 5.软件算法分析 5.2 Supercombo模型 5…

人工智能 2023年6月2日
0089
C++OpenCV系统学习（14）——图像分割与抠图（1）_KMeans

目录 1.概述 1.1K-means方法 1.2基本流程 2.K-means图像分割 2.1图像分割 2.2K-means算法原理 2.3实验案例 1.概述 [TencentClo…

人工智能 2023年6月2日
00138
关于SSML音频合成是否成功的判断

判断SSML音频是否合成成功 1.创建SpeechConfig对象 var config = SpeechConfig.FromSubscription("e1f258d…

人工智能 2023年5月25日
0090
SALNet: Semi-Supervised Few-Shot Text Classification with Attention-based Lexicon Construction

AAAI2021.本文考虑了低资源文本分类情境下对class对应的关键词进行扩充的问题，每个类收集一组被称为lexicon的词集，根据分类任务计算的注意力权重，并根据注意力系数对关…

人工智能 2023年7月1日
0076
DDPM代码详细解读(2)：Unet结构、正向和逆向过程、IS和FID测试、EMA优化

以下是将 Unet_和门 _结构_结合的 _PyTorch 代码： import torch import torch.nn as nn import torch.nn.funct…

人工智能 2023年7月21日
0042

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

语音认别—唤醒技术KWS介绍

语音认别—唤醒技术KWS介绍

大家都在看