语音识别中强制对齐_AI语音评测技术简述与应用层级

2023年5月25日下午5:53 • 人工智能 • 阅读 69

一、前言

「AI语音评测」技术，指的是针对口语发音水平和差错，进行自动评价、检错并提供指导纠正的技术。

经过几十年的发展，这项技术在中英发音标准、口语表达能力等测评任务上均已超过专家水平。目前，该技术广泛应用于中英文口语测评和评分中。

[En]

After decades of development, this technology has surpassed the level of experts in the evaluation of Chinese and English pronunciation standards, oral expression ability and other evaluation tasks. at present, this technology is widely used in Chinese and English oral evaluation and grading.

接下来我们会讨论：

「AI语音评测」技术简述；
「AI语音评测」多维度应用层级。

二、AI语音评测基本技术简述

1. AI语音评基本规则

对于AI语音评测技术，目前相对流行的是基于DNN-HMM的声学模型，获得音素级别的解码结果以及单词和音素级别的强制对齐结果的方法。

音素：根据语音的自然属性划分出来的最小语音单位。
DNN-HMM：深层神经网络-隐藏马尔科夫模型(Deep Neural Network-Hidden Markov Model)，是目前相对流行的声学模型。它的出现基本替代了之前的GMM-HMM模型。

简而言之，它可以评估和指导音素、单词、句子、段落等层面的发音；评估的维度包括发音准确性(音素/声调)和流利度、语调、断句、完整性等。

[En]

To put it simply, it can evaluate and guide the pronunciation of phonemes, words, sentences, paragraphs and other levels; the dimensions of the assessment include pronunciation accuracy (phoneme / tone) and fluency, intonation, sentence breakage, integrity and so on.

使用该技术方法须

Original: https://blog.csdn.net/weixin_39722188/article/details/112500705
Author: weixin_39722188
Title: 语音识别中强制对齐_AI语音评测技术简述与应用层级

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/515342/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

机器学习实战之朴素贝叶斯与垃圾邮件分类

文章目录 * – 一、实现原理 – + 1.1 贝叶斯理论与公式 + 1.2 朴素贝叶斯分类器 + 1.3 拉普拉斯修正 + 1.4 分类小案例 &#821…

人工智能 2023年6月30日
0096
C++中产生概率分布之-均匀分布和标准正态分布

最近闲来无事，发现做一个咸鱼就是好，想做什么做什么。可能码农做久了，还是无法摆脱技术的思维。接了个小活，其中涉及到需要用到C++实现概率分布–0-1均匀分布和标准正态分…

人工智能 2023年6月4日
00135
conda 和 pip 两种方式在anaconda安装pytorch cpu（总结，亲测有效）

上一篇说了在具体安装时踩到的各种坑，有兴趣的可以翻看我过往的博文。现在我再次总结一遍，不讨论犯过的错误，只讨论安装过程中要注意的点以及正确的命令。默认电脑已经安好了anaconda…

人工智能 2023年6月16日
0094
极智AI | centos7源码编译tensorflow

欢迎关注我的公众号 [极智视界]，获取我的更多笔记分享大家好，我是极智视界，本文介绍一下 centos7 源码编译 tensorflow 的方法。之前这篇《极智开发 | cen…

人工智能 2023年7月29日
0068
Ubuntu18.04使用opencv库编写

目录一.示例：图片二.示例：视频 1.虚拟机获取摄像头权限 2.打开摄像头录制视频三.总结四.参考资料一.示例：图片创建test1.cpp文件 gedit test1….

人工智能 2023年7月19日
0061
KITTI数据集3d目标检测的评价的含义

kitti数据集评价的含义 kitti数据集的相关介绍 kitti数据集3d目标检测的评价 KITTI 3D AP Metric 的更新参考文献 kitti数据集的相关介绍论文…

人工智能 2023年6月17日
0074
自建 | 地理与气象数据分析（geographic and meteorological data analysis）（gma）的说明与使用

写在前面对于大部分地学或气象学的学者来说，数据处理是一个很大的工程，动辄数小时或者数天的数据处理时间。如果没有很好的工具或者方法，在面对多时序（例如时序遥感数据），大尺度（例如全…

人工智能 2023年7月17日
0062
三.STM32F030C8T6 MCU开发之UART配置例程

0.总体功能概述使用STD库–en.stm32f0_stdperiph_lib_v1.6.0。 1.UART硬件 USART的全称是universal synchronous a…

人工智能 2023年6月27日
0049
Pandas 模块 – 读写(1)-csv/txt等文档-read_csv/to_csv

目录 1. 读写 csv 或者 txt 文件 1.1 .read_csv（）语法 1.2 .read_csv（）范例 1.2.1 唯一不可缺少的参数 filepath_or_buf…

人工智能 2023年7月6日
0094
Nvidia Jetson TX2入门指南(白话版)

最近要用到jetson tx2，但之前也完全没有接触过。边用边学，这篇文章就是向新手介绍下jetson tx2刚入手的一些事项(适合纯小白~)。一、TX2初认识开发板全称：Nv…

人工智能 2023年7月26日
0063
#计算机视频处理使用ffmpeg对视频进行操作、视频分镜

参考文档：官网音视频处理工具ffmpegffmpeg官方文档音视频合成分割基本用法 ffmpeg 处理视频音频转化方式编码转化格式ffmpeg -i out.mp4 -vcod…

人工智能 2023年5月25日
0087
Java OpenCV 图像处理32.4 视频分析和对象跟踪切换背景

Java OpenCV 图像处理32.4 视频分析和对象跟踪切换背景方法含义解释bitwise_and”与”操作，即对图像（灰度图像或彩色图像均可）每个…

人工智能 2023年6月22日
0070
windows11下编译openpose并通过pyCharm调用

目录前言环境准备工作编译Openpose并运行Demo 在Python中调用结语前言做毕设的时候要用到Openpose提取人体骨骼关键点，且需要在python中调用编…

人工智能 2023年7月19日
0068
一张图看明白Self-Attention机制

镇楼图 ; Illustrated: Self-Attention A step-by-step guide to self-attention with illustration…

人工智能 2023年5月30日
0086
动手强化学习（九）：策略梯度算法

动手强化学习（七）：DQN 改进算法——Dueling DQN 1. 简介 2. 策略梯度 3. REINFORCE 4. REINFORCE 代码实践 5. 小结 6. 扩展：策…

人工智能 2023年6月25日
0070
网上商城项目（购物车下单、支付）

目录一、购物车结算前端功能实现 1.购物车页面实现结算功能，主要是拿到传入后台的gids 二、购物车结算后端功能实现 1.跳转订单页后台，主要是拿到订单页展示数据 2.订单页前台…

人工智能 2023年6月29日
0061

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

语音识别中强制对齐_AI语音评测技术简述与应用层级

一、前言

二、AI语音评测基本技术简述

1. AI语音评基本规则

大家都在看