编辑距离与语音识别中WER的计算

2023年5月25日下午6:31 • 人工智能 • 阅读 82

编辑距离（edit distance）

做语音识别算法工程师好几年，最近才弄清楚wer与插入错误，删除错误和替换错误的统计算法，真是惭愧。

编辑距离，又称Levenshtein Distance，是一位俄罗斯的科学家Vladimir Levenshtein 在1965年在1965年提出来的。编辑距离指的是在两个字符串S1和S2 之间，将S1转换为S2所需要的最少编辑操作次数。

有三种且仅有三种字符编辑操作：

[En]

There are three and only three character editing operations:

插入（Insertion）
删除（Deletion）
替换（Substitution）

编辑距离的算法公式：

我们将两个字符串 a,b 的编辑距离表示为

，其中

和

分别对应字符串a,b的长度。两个字符串 a,b 的编辑距离即可用如下的数学语言表示：

是指字符串a的前

个字符和字符串b的前

个字符之间的编辑距离。这里的

的上限是

的长度

。注意，字符串的第一个字符的index从 1 开始。

当

，表示字符串a或者b有一个是空字符串，所以，将a转化成b就需要

次编辑。

当

, 表示a和b都不是空字符串，a和b的编辑距离等于三种情况下编辑距离的最小值。其中，

表示插入编辑，（个人理解：从末尾删除一个字符后的和的编辑距离只需做一次插入操作就和相等）
表示删除编辑，
且表示替换编辑，
且表示跳过不做编辑

算法举例：

a: “This great machine can recognize speech”

b: “This machine can wreck a nice beach”

首先列一个表格，表格的长度和宽度分别等于|a|+2和|b|+2,行列开头分别填充一个0.

0 this machine can wreck a nice beach 0 this great machine can recognize speech

计算当

0 this machine can wreck a nice beach 0 0 1 2 3 4 5 6 7 this 1 great 2 machine 3 can 4 recognize 5 speech 6

计算第一行：

0 this machine can wreck a nice beach 0 0 1 2 3 4 5 6 7 this 1 0 1 2 3 4 5 6 great 2 machine 3 can 4 recognize 5 speech 6

计算技巧：只需要计算单元格的上+1，左+1，左上+1（或+0）的值，再进行比较即可。比如计算（1，2）时，上面单元2+1=3，左面单元0+1=1，左上单元，由于this = machine，所以是1+0=1。三者取最小值是1
0 this machine 0 0 1 2 this 1 0 1

以此类推，填满整个表格，最右下角的值就是a和b的编辑距离5。
0 this machine can wreck a nice beach 0 0 1 2 3 4 5 6 7 this 1 0 1 2 3 4 5 6 great 2 1 1 2 3 4 5 6 machine 3 2 1 2 3 4 5 6 can 4 3 2 1 2 3 4 5 recognize 5 4 3 2 2 3 4 5 speech 6 5 4 3 3 3 4 5

如，红色路径，对应的回溯路径是c-d-c-c-s-s-i-i.

那么：ref :This great machine can recognize speech

hyp:This machine can wreck a nice beach

再比如绿色路径，对应的额回溯路径是：c-d-c-c-s-i-i-s

那么：ref :This great machine can recognize speech

hyp:This machine can wreck a nice beach

橙色和蓝色回溯路径，同样会导致ref和hyp对应方式不同。但是这些不同的回溯方式不影响最终的识别率wer的值。

上面的例子，不同的回溯路径恰好会使I-D-S相同，但是，有的时候，不用的回溯路径会导致不同的I-D-S。例如：

ref: x, y, z；

hyp: a,b,c,y

回溯路径1：

ref： x y z

hyp: a b c y

回溯路径2：

ref: x y z

hyp:a b c y

上面两种不同的对齐方式，编辑距离一样，wer也一样，但是I-D-S一个是2-1-1，另外一个是 1-0-3。可见，在语言识别wer统计过程中，不同的对其方式会产生不同的I-D-S统计结果。

Original: https://blog.csdn.net/yishujixiaoxiao/article/details/114373775
Author: HELLO BUGs
Title: 编辑距离与语音识别中WER的计算

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/515466/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

MySQL索引分类及相关概念辨析

之前的一篇《MySQL索引底层数据结构及原理深入分析》很受读者欢迎，成功地帮大家揭开了索引的神秘面纱，有读者留言说分不清各种索引的概念，希望能讲一下。确实，数据库中索引种类很多，如…

人工智能 2023年7月1日
0070
机器学习项目实战——04逻辑回归算法之糖尿病预测项目

数据集的详细说明如下：从最后一列的输出值可以看出为0或1，属于二分类，因此可以使用逻辑回归实现。用pandas读取csv文件，前面几个都用的是np.genfromtxt文件读取…

人工智能 2023年6月16日
00234
【附源码】Python计算机毕业设计全国生鲜溯源平台

项目运行环境配置：Pychram社区版+ python3.7.7 + Mysql5.7 + HBuilderX+list pip+Navicat11+Django+nodejs。 …

人工智能 2023年6月27日
0059
机器学习数据集划分留出法，留一法，交叉法，自助法

实验一模型评估方法-数据集划分 1.数据集划分方法对于一个包含m个样例的数据集，划分训练集S和测试集T的方法有：留出法（hold-out）、交叉验证法（cross valida…

人工智能 2023年6月26日
0090
外包 | LBP/HOG/CNN 实现对 CK/jaffe/fer2013 人脸表情数据集分类

外包 | LBP/HOG/CNN 实现对 CK/jaffe/fer2013 人脸表情数据集分类文章目录外包 | LBP/HOG/CNN 实现对 CK/jaffe/fer2013…

人工智能 2023年6月20日
0084
js基础笔记学习227练习3之1

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月29日
0068
OpenCV：图像锐化

目录 1.简介 2.滤波 2.1 Sobel算子 1.Sobel输出类型为CV_8U 2.Sobel输出类型为CV_16S 2.2 Laplacian算子 1.没有高斯平滑的拉普拉…

人工智能 2023年5月28日
00124
Python实现12种概率分布（附代码）

今天给大家带来的这篇文章是关于机器学习的，机器学习有其独特的数学基础，我们用微积分来处理变化无限小的函数，并计算它们的变化；我们使用线性代数来处理计算过程；我们还用概率论与统计学…

人工智能 2023年6月25日
0077
Python数据可视化大杀器之地阶技法：matplotlib（含详细代码）

最近小伙伴问我有什么刷题网站推荐，在这里推荐一下牛客网，里面包含各种面经题库，全是免费的题库，可以全方面提升你的职业竞争力，提升编程实战技巧，赶快来和我一起刷题吧！牛客网链接|py…

人工智能 2023年7月5日
0091
【语音识别】kaldi安装心得

环境：Ubuntu 21.10，VMware Workstation Pro 时间：根据您的网络和虚拟机的不同，时间从半小时到一两天不等 [En] time: depending …

人工智能 2023年5月23日
00144
机器学习笔记 – 使用scikit-learn创建混淆矩阵

一、混淆矩阵概述在训练了有监督的机器学习模型（例如分类器）之后，您想知道它的工作情况。这通常是通过将一小部分称为测试集的数据分开来完成的，该数据用作模型以前从未见过的数据。 …

人工智能 2023年7月28日
0047
在部署AI算法时，应该如何处理算法的扩展性和可扩展性

问题描述在部署AI算法时，我们需要考虑算法的扩展性和可扩展性。具体地说，我们希望能够在不改变算法的基本结构的情况下，方便地对其进行扩展，以适应不同的数据集或问题。本文将详细介绍如…

人工智能 2024年1月3日
0042
模型剪枝概述

定义：剪枝方法探索模型权重中的冗余，并尝试删除/修剪冗余和非关键的权重。目的：减小模型大小并加速模型训练/推断，同时不会显着降低模型性能。分类：根据剪枝位置：非结构化剪枝和结构化…

人工智能 2023年6月16日
0080
回归统计绘图_「首席架构师推荐」统计软件一览表

统计软件是专门用于统计和计量经济学分析的计算机程序。 Open-source ADaMSoft 一个通用的统计软件与数据挖掘算法和方法的数据管理 ADMB 一个基于c++的非线性统…

人工智能 2023年6月18日
0073
KNN实现鸢尾花分类

因为我们有已知品种的鸢尾花的测量数据，所以这是一个监督学习问题。在这个问题中，我们要在多个选项中预测其中一个（鸢尾花的品种）。这是一个分类问题，可能的输出（鸢尾花的不同品种）叫做类…

人工智能 2023年7月27日
0059
【头歌】重生之CNN图片分类基础

创作不易，参考之前，点个赞，收藏，关注一下不过分吧，家人们任务描述本关任务：本关的小目标是编写一个实现卷积操作的函数编程要求根据提示，在右侧编辑器补充代码，计算输入矩阵在指…

人工智能 2023年7月2日
00115

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

编辑距离与语音识别中WER的计算

编辑距离的算法公式：

算法举例：

大家都在看