语音识别中强制对齐_AI语音评测技术简述与应用层级

语音识别中强制对齐_AI语音评测技术简述与应用层级

一、前言

「AI语音评测」技术,指的是针对口语发音水平和差错,进行自动评价、检错并提供指导纠正的技术。

经过几十年的发展,这项技术在中英发音标准、口语表达能力等测评任务上均已超过专家水平。目前,该技术广泛应用于中英文口语测评和评分中。

[En]

After decades of development, this technology has surpassed the level of experts in the evaluation of Chinese and English pronunciation standards, oral expression ability and other evaluation tasks. at present, this technology is widely used in Chinese and English oral evaluation and grading.

接下来我们会讨论:

  • 「AI语音评测」技术简述;
  • 「AI语音评测」多维度应用层级。

二、AI语音评测基本技术简述

1. AI语音评基本规则

对于AI语音评测技术,目前相对流行的是基于DNN-HMM的声学模型,获得音素级别的解码结果以及单词和音素级别的强制对齐结果的方法。

音素:根据语音的自然属性划分出来的最小语音单位。
DNN-HMM:深层神经网络-隐藏马尔科夫模型(Deep Neural Network-Hidden Markov Model),是目前相对流行的声学模型。它的出现基本替代了之前的GMM-HMM模型。

简而言之,它可以评估和指导音素、单词、句子、段落等层面的发音;评估的维度包括发音准确性(音素/声调)和流利度、语调、断句、完整性等。

[En]

To put it simply, it can evaluate and guide the pronunciation of phonemes, words, sentences, paragraphs and other levels; the dimensions of the assessment include pronunciation accuracy (phoneme / tone) and fluency, intonation, sentence breakage, integrity and so on.

使用该技术方法须

Original: https://blog.csdn.net/weixin_39722188/article/details/112500705
Author: weixin_39722188
Title: 语音识别中强制对齐_AI语音评测技术简述与应用层级

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/515342/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球