触发字检测（Trigger Word Detection）

2023年5月25日下午6:21 • 人工智能 • 阅读 109

来源：Coursera吴恩达深度学习课程

随着语音识别的发展，越来越多的设备可以通过你的声音来唤醒，这有时被叫做 触发字检测系统（rigger word detection systems）。我们来看一看如何建立一个触发字系统。

触发字系统的例子包括Amazon echo，它通过单词Alexa唤醒；还有百度DuerOS设备，通过”小度你好”来唤醒；苹果的Siri用Hey Siri来唤醒；Google Home使用Okay Google来唤醒，这就是触发字检测系统。假如你在卧室中，有一台Amazon echo，你可以在卧室中简单说一句: Alexa, 现在几点了?就能唤醒这个设备。它将会被单词”Alexa”唤醒，并回答你的询问。Andrew想教会我们如何构建一个触发字检测系统。

如上图所示，现在有一个这样的RNN结构，我们要做的就是把一个音频片段（an audio clip）计算出它的声谱图特征（spectrogram features）得到特征向量x^

还有一个解决方法，虽然听起来有点简单粗暴，但确实能使其变得更容易训练。如上图所示，比起只在一个时间步上去输出1，其实你可以在输出变回0之前，多次输出1，或说在固定的一段时间内输出多个1。这样就稍微提高了1与0的比例。在音频片段中，触发字刚被说完之后，就把多个目标标签设为1，这里触发字又被说了一次。说完以后，又让RNN去输出1。在之后的编程练习中，你可以进行更多这样的操作。

Andrew：这就是触发字检测，希望你能对自己感到自豪。因为你已经学了这么多深度学习的内容，现在你可以只用几分钟时间，就能用一张幻灯片来描述触发字能够实现它，并让它发挥作用。你甚至可能在你的家里用触发字系统做一些有趣的事情，比如打开或关闭电器，或者可以改造你的电脑，使得你或者其他人可以用触发字来操作它。

说明：记录学习笔记，如果错误欢迎指正！转载请联系我。

Original: https://blog.csdn.net/csdn_xmj/article/details/119319586
Author: 双木的木
Title: 触发字检测（Trigger Word Detection）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/515424/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

多分类问题的混淆矩阵

混淆矩阵、查准率P和召回率R 参加夏令营时候遇到过混淆矩阵、查准率和召回率的计算方法的问题，今天看书又回顾到这个概念，个人觉得对这个概念还是需要有非常清醒的认识的，做个记录。二分…

人工智能 2023年7月1日
0080
【路径规划】局部路径规划算法——B样条曲线法（含python实现）

文章目录参考资料 1. 算法简介 * 1.1 贝塞尔曲线的缺点 2. 公式原理 * 2.1 B样条曲线方程 2.2 B样条计算 3. B样条分类 * 3.1 均匀B样条曲线 3….

人工智能 2023年7月3日
0097
《动手学深度学习》第三章-softmax回归总结

《动手学深度学习》第三章-softmax回归总结 softmax回归总结《动手学深度学习》第三章-softmax回归总结 * 1.从fashion_mnist导入数据(d2l.l…

人工智能 2023年6月17日
00133
pandas.DataFrame 中的insert(), pop()

pandas.DataFrame 中的insert(), pop() 在pandas中，del、drop和pop方法都可以用来删除数据，insert可以在指定位置插入数据。可以看看…

人工智能 2023年6月2日
00112
利用 OpenCV 和 Python 进行 3D 重建

OpenCV 是一个实时计算机视觉库。它具有非常强大的功能，使处理图像和获取有关图像的信息变得容易。在这篇文章中，我们将回顾一些用于从图像进行 3D 重建以制造自主机械臂的功能。 …

人工智能 2023年7月19日
0068
Python深度学习12——Keras实现注意力机制(self-attention)中文的文本情感分类（详细注释）

Keras封装性比较高，现在的注意力机制都是用pytorch较为多。但是使用函数API也可以实现，Keras处理文本并且转化为词向量也很方便。本文使用了一个外卖评价的数据集，标签…

人工智能 2023年6月16日
00145
python中的join函数连接dataframe_python中的join函数连接dataframe_python pandas DataFrame.

连接另一个DataFrame的列。与连接列other索引或键列上的DataFrame。通过传递一个列表，一次有效地通过索引连接多个DataFrame对象。参数： other：D…

人工智能 2023年7月8日
0088
selenium用法详解【从入门到实战】【Python爬虫】【4万字】

👉跳转文末👈 获取实战源码与作者联系方式，共同学习进步文章目录 * – 简介 – selenium安装 – 安装浏览器驱动 –…

人工智能 2023年7月3日
0096
Spring JdbcTemplate.queryForObject()

Spring JdbcTemplate 是JDBC核心包中的中心类。它简化了 JDBC 与 Spring 的使用，并有助于避免常见错误。在此页面上，我们将学习使用它的 queryF…

人工智能 2023年6月29日
0087
yolov5数据集

如果想跳过步骤直接获取YOLOv5格式的kitti数据集评论获取阿里云盘提取码我们再yolov5/dataset下创建文件夹kitti再kiiti中放入我们的数据数据集结构…

人工智能 2023年6月29日
00129
python opencv实现找到图像的轮廓，填充颜色

我想找到图片中的闭合圈，然后填充颜色所需要的cv函数： 1。OpenCV提供的findContours()方法可以通过计算图像梯度来判断出图像的边缘，然后将边缘的点封装成数组返回…

人工智能 2023年6月17日
00114
MMPose姿态估计+人体关键点识别效果演示

MMPose——开源姿态估计算法库（附人体关键点识别效果演示）一、简介 1.1 背景首先姿态估计属于计算机视觉领域的一个基础研究方向。MMPose是基于Pytorch的姿态估计…

人工智能 2023年6月23日
0080
机器翻译学习1：pytorch官方教程与代码逐行详解

官方教程网址：https://pytorch.org/tutorials/intermediate/seq2seq_translation_tutorial.html 代码所需数据…

人工智能 2023年5月31日
00101
我国机器视觉的发展趋势

概要：在智能制造过程中，机器视觉主要用计算机来模拟人的视觉功能，也就是把客观事物的图像信息提取、处理并理解，最终用于实际检测、测量和控制。实现”中国制造2025&#8…

人工智能 2023年6月20日
0074
1维线性回归

w= 1.0595238095237538 b= -117.79761904760 undefined Original: https://www.cnblogs.com/canx…

人工智能 2023年6月4日
0094
模式识别和机器学习实战- 朴素贝叶斯分类 – Python实现 – 实战之文档分类和过滤垃圾邮件

文章目录前言一、贝叶斯决策论概述二、实战之文档分类三、过滤垃圾邮件三、实验结果与分析总代码前言实验目的和要求：使用概率分布进行分类学习朴素贝叶斯分类器进行文本分…

人工智能 2023年7月1日
0079

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

触发字检测（Trigger Word Detection）

大家都在看