触发字检测(Trigger Word Detection)

来源:Coursera吴恩达深度学习课程

随着语音识别的发展,越来越多的设备可以通过你的声音来唤醒,这有时被叫做 触发字检测系统(rigger word detection systems)。我们来看一看如何建立一个触发字系统。

触发字检测(Trigger Word Detection)

触发字系统的例子包括Amazon echo,它通过单词Alexa唤醒;还有百度DuerOS设备,通过”小度你好”来唤醒;苹果的Siri用Hey Siri来唤醒;Google Home使用Okay Google来唤醒,这就是触发字检测系统。假如你在卧室中,有一台Amazon echo,你可以在卧室中简单说一句: Alexa, 现在几点了?就能唤醒这个设备。它将会被单词”Alexa”唤醒,并回答你的询问。Andrew想教会我们如何构建一个触发字检测系统。

触发字检测(Trigger Word Detection)

如上图所示,现在有一个这样的RNN结构,我们要做的就是把一个音频片段(an audio clip)计算出它的声谱图特征(spectrogram features)得到特征向量x^

触发字检测(Trigger Word Detection)

还有一个解决方法,虽然听起来有点简单粗暴,但确实能使其变得更容易训练。如上图所示,比起只在一个时间步上去输出1,其实你可以在输出变回0之前,多次输出1,或说在固定的一段时间内输出多个1。这样就稍微提高了1与0的比例。在音频片段中,触发字刚被说完之后,就把多个目标标签设为1,这里触发字又被说了一次。说完以后,又让RNN去输出1。在之后的编程练习中,你可以进行更多这样的操作。

Andrew:这就是触发字检测,希望你能对自己感到自豪。因为你已经学了这么多深度学习的内容,现在你可以只用几分钟时间,就能用一张幻灯片来描述触发字能够实现它,并让它发挥作用。你甚至可能在你的家里用触发字系统做一些有趣的事情,比如打开或关闭电器,或者可以改造你的电脑,使得你或者其他人可以用触发字来操作它。

说明:记录学习笔记,如果错误欢迎指正!转载请联系我。

Original: https://blog.csdn.net/csdn_xmj/article/details/119319586
Author: 双木的木
Title: 触发字检测(Trigger Word Detection)

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/515424/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球