通俗理解隐马尔可夫模型（HMM）

2023年5月25日下午9:43 • 人工智能 • 阅读 72

HMM（隐马尔可夫模型）

对于一个观测序列，我们认为这个观测序列是由另一个状态序列输出的，而这个状态序列我们称之为隐马尔可夫链

隐马尔可夫链每次可以输出一个观测值，但是一个观测值一次只能被一个状态输出；
HMM 的每一个状态输出完一个观测值后会根据概率转换到其他状态（其他状态也包括自身状态）然后在下一个状态下在输出下一个观测值，直到输出所有观测值时结束
一个HMM包含三组参数（π , A , B \pi,A,B π,A ,B）我们用λ表示三组参数的集合:
数组π \pi π：表示初始化时每种状态被选择的概率（初始概率分布）;
矩阵A（N * N，N=状态数）用来保存不同状态之间转换的概率；
矩阵B（N * 观测值数量）用来保存每种状态输出每种观测值的概率;

1. HMM的两个假设

1.齐次马尔可夫假设：
在隐马尔可夫链中，t t t 时刻的状态只与 t − 1 t-1 t −1 时刻的状态有关；齐次马尔可夫链中的 齐次是指转移概率和时间无关，只和转移的前后状态有关
2.观测独立假设：
在隐马尔可夫链中，t t t 时刻的观测值只与当前时刻的状态有关

2. HMM的三个问题

2.1 概率计算问题（evaluation）

已知HMM模型参数λ和观测序列，求当前观测序列出现的概率，一般使用前向和后向算法

本质上是求解当前观测序列在所有隐状态序列的加权概率和

2.2 学习问题（learning）

已知观测序列和隐层状态序列，求HMM的参数，一般使用极大似然估计算法（EM）EM算法的详细解析请参考此文章->[#通俗理解# 从极大似然估计（MLE）到最大期望（EM）算法]

2.3 预测问题（decoder）

已知模型参数和观测序列，求解最大概率的隐层序列，具体来说有两种应用，一种是预测下一时刻的状态，一种是已知t时刻观测值，预测t时刻隐层状态

3. 解决三个问题的算法

3.1 概率计算问题-前向算法（后向算法）

概率计算本质上是求解当前观测序列在所有隐状态序列上的概率加权和；前向算法使用的是 动态规划的思想，从第一个观测输出递推得到第N个观测输出，

前向算法首先要定义一个变量 α t ( i ) α_t(i)αt (i ) :
α t ( i ) = ( o 0 , o 1 . . . o t , t i = q i ∣ λ ) α_t(i)=(o_0,o_1…o_t,t_i=q_i|λ)αt (i )=(o 0 ,o 1 …o t ,t i =q i ∣λ)
其中，λ 表示已知的HMM模型参数，o 0 , o 1 . . . o t o_0,o_1…o_t o 0 ,o 1 …o t 表示到t时刻的观测序列，t i = q i t_i=q_i t i =q i 表示 t t t 时刻的状态为 q i q_i q i ；总结一下，α t ( i ) α_t(i)αt (i )就是： 已知参数为λ的HMM模型，在t t t 时刻得到观测序列o 0 , o 1 . . . o t o_0,o_1…o_t o 0 ,o 1 …o t 且t t t 时刻的状态为q i q_i q i 的概率

算法步骤：
1. 设定初始值：
α 1 ( i ) = π i b i ( o 1 ) α_1(i)=\pi_i b_i (o_1)α1 (i )=πi b i (o 1 )
其中，π i \pi_i πi 表示第一个状态为 p i p_i p i 的概率，b i ( o 1 ) b_i(o_1)b i (o 1 ) 表示 q i q_i q i 输出 ( o 1 ) (o_1)(o 1 ) 观测状态的概率

2. 递推α t ( i ) α_t(i)αt (i ):
α t + 1 ( j ) = [ ∑ i = 1 N α ( i ) a i j ] b j ( o t + 1 ) α_{t+1}(j)=[\sum_{i=1}^{N}{α(i)a_{ij}}]b_j(o_{t+1})αt +1 (j )=[i =1 ∑N α(i )a i j ]b j (o t +1 )
∑ i p ( o t + 1 ∣ q t , λ ) p ( q t ∣ λ ) \sum_i{p(o_{t+1}|q_t,λ)p(q_t|λ)}i ∑p (o t +1 ∣q t ,λ)p (q t ∣λ)
上式中，N 表示所有状态数量；中括号内的部分表示 t t t 时刻所有可能状态转换到 t+1 时刻 q j q_j q j 状态的概率（t t t时刻所有 q i q_i q i 状态乘以 i i i 状态到 j j j 状态的转换概率然后对这个数值求和）；中括号外表示 q j q_j q j 状态输出 o t + 1 o_{t+1}o t +1 观测值得概率，这个过程用到了HMM的两个假设：

当前状态之和前一个状态有关
当前观测值之和当前状态有关

3. 终止：
p ( o ∣ λ ) = ∑ i = 1 N α T ( i ) p(o|λ)=\sum_{i=1}^{N}{α_T(i)}p (o ∣λ)=i =1 ∑N αT (i )
上式表示：当所有观测状态输出完毕，对所有α T ( i ) α_T(i)αT (i )求和

通过反复计算步骤2，我们可以依次得到每个时刻的N个状态的概率值，并最终得到 p ( o ∣ λ ) p(o|λ)p (o ∣λ)，这里 p ( o ∣ λ ) p(o|λ)p (o ∣λ) 等价于 p ( o 0 , o 1 . . . o T ∣ λ ) p(o_0,o_1…o_T|λ)p (o 0 ,o 1 …o T ∣λ)

向后算法和前向算法类似，区别是： 后向算法从序列的最后一个观测状态出现的概率递推得到整个观测序列的出现的概率；相对于前向算法，后向算法的计算要相对复杂，这里不做赘述

3.2 学习问题-Baum-Welch算法

Baum-Welch算法是EM算法的一种特例，是专门用来解决HMM学习问题的一种方法

EM算法就是最大期望算法，一般用来解决包含隐变量的参数优化问题；简单来说EM算法就是在给定隐变量分布的情况下求似然函数的期望，或者说是在对似然函数的隐变量进行积分（如果隐变量是离散的，则根据隐变量的分布概率对似然函数进行加权求和）

在HMM中，一个观测序列可以由多个隐层状态序列得到，而每个隐层状态序列是一种隐变量的取值；在EM算法中，我们将HMM模型的参数分成两个部分分别优化，具体实现过程如下：

随机初始化HMM模型的参数λ 其中包括隐层状态初始概率矩阵π \pi π、状态转移矩阵A、观测矩阵B
根据参数λ估计隐变量的概率分布（一个观测序列被不同隐层状态序列得出的概率）
使用向前或向后算法得到当前观测序列的概率计算公式，也就是当前观测序列的似然函数
通过最大化当前观测序列的似然函数得到参数λ的更新值，然后迭代执行步骤2~4，直至模型收敛

关于MLE和EM算法的详细介绍请参考此文章->#通俗理解# 从极大似然估计（MLE）到最大期望（EM）算法

3.3 预测问题-Viterbi算法

预测问题就是： 对于一个观测序列，求出最大概率的隐层状态序列，其中使用的算法是 Viterbi算法
Viterbi算法本质上是使用动态规划的方法递归求解隐层状态序列；Viterbi算法是一种剪枝算法；对于每个时刻，根据转移概率和发射概率，t时刻的n个状态和t+1时刻的n个状态会有n*n条路径，Viterbi算法只保留对于t+1时刻n个状态最优的n条路径以及这n条最优路径的概率

具体计算过程如下：

根据初始状态概率π \pi π计算第一个时刻每个隐层状态输出当前时刻观测值的概率（每个隐层状态的初始概率*每个隐层状态输出当前观测状态的概率）
对于t+1时刻，计算t+1时刻每个隐层状态得到当前观测值的最大概率以及最大概率对应的最优路径（每次只记录n个隐层对应的n条最优路径）

对于一个观测序列，隐层状态序列可能有上图这么多种路径（隐层状态组合），但是使用Viterbi算法我们只计算下图这么多条路径的值即可，提高了计算效率

下一篇文章将介绍如何使用 GMM+HMM 进行语音识别->#透彻理解# GMM+HMM 语音识别模型过程

参考文章：如何通俗地讲解 viterbi 算法？

Original: https://blog.csdn.net/lch551218/article/details/118096043
Author: energy_百分百
Title: 通俗理解隐马尔可夫模型（HMM）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/516195/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

用Python实现K近邻和朴素贝叶斯对文本数据分类

Text Classification with KNN and Naive Bayes Algorithm in Python 简介模型 * knn naive bayes 数…

人工智能 2023年7月2日
0084
【目标检测】YOLO v3

目录 1、超级无敌通俗的YOLO系列讲解 2、论文思想 * 概述改进 3、复现 1、超级无敌通俗的YOLO系列讲解链接 2、论文思想概述 YOLOv3是单阶段目标检测算法YO…

人工智能 2023年7月10日
0045
Pandas数据分析实战（1）——探索Chipotle快餐数据

Python在数据处理和准备一直做得很好，但在数据分析和建模方面就差一些。pandas帮助填补了这一空白，使您能够在Python中执行整个数据分析工作流程，而不必切换到更特定于领域…

人工智能 2023年7月7日
0064
NLP 实战(12): AI小组2022半年小结

AI小组半年研发分析，思考，回顾。改进：CSDN 统一标签标签体系是数据分类的基础之一。我们持续在统一标签上进行改进重构领域标签体系我们的标签体系应该体现技术的潮流，云原生…

人工智能 2023年5月28日
0073
pycharm读取excel中的数据，文章中含有源码

我们首先通过打开pycharm,首先准备个excel，然后将数据读取到文件中** 提取excel中特定的行或者列 ** import xlrd A=[] xx=xlrd.open_…

人工智能 2023年7月7日
0072
Pytorch 官方文档教程整理 (一)

Pytorch 官方文档教程整理 (一) 对应官方的 Instuction to Pytorch 前半部分运行的Python版本： 3.9.12 所使用的库： numpy 1.2…

人工智能 2023年6月16日
0090
基于随机森林实现特征选择降维及回归预测（Matlab代码实现）

💥💥💥💞💞💞 欢迎来到本博客❤️❤️❤️💥💥💥目录摘要：1.随机森林：2.随机森林的特征选取：3.基于Matlab自带的随机森林函数进行特征选取具体步骤（1）加载数据（2）首先建立…

人工智能 2023年6月16日
0096
弱小目标检测跟踪算法研究（2）红外弱小目标数据集准备（红外弱小目标的数据集又来了）

红外弱小目标的数据集又来了！说在前面的话数据集后续 ; 说在前面的话弱小目标，顾名思义：目标信号弱，像素少，由于目标信噪比较低，目标最少可能只有一个像素单元。因此，弱小目标…

人工智能 2023年7月9日
0070
(十三) minAreaRect函数

minAreaRect函数 * – 1.背景 – 2.minAreaRect 函数 – 3.以新版为例 – 参考资料欢迎访问个人网…

人工智能 2023年7月4日
0063
三维重建之条纹投影结构光（一）

该系列为条纹投影结构光学习笔记，一共分为四篇。第一篇记录文献阅读的笔记，对重要知识点进行摘录介绍；第二篇为相位求解和相位展开；第三篇为相高模型的标定；第四篇为重构篇。本篇以理论知…

人工智能 2023年6月17日
0082
yolov5 test.py val.py detec.py 区别在哪里呢?

用户在训练数据的时候必须使用 train.py 来进行数据训练和验证，但我很难理解 detect.py 和 test.py 之间的区别。应该在一个数据集中的（看不见的）测试数据上…

人工智能 2023年7月6日
0059
OpenCV-滤波矩阵（java版）

滤波矩阵 multiply() 用下图做演示 ; multiply() 顾名思义，乘法函数。使用该函数可以将像素的每个通道值乘以这个参数。方法说明multiply(Mat src…

人工智能 2023年6月19日
0059
AlexNet论文解读与代码实现

文章目录 1. 论文解读 * 1.1 泛读 – 1.1.1 标题与作者 1.1.2 摘要 1.1.3 结论(讨论) 1.1.4 重要图 1.1.5 重要表 1.2 精读…

人工智能 2023年7月13日
0060
用opencv的cv2读图并在图像上画框保存（比matplot清晰多了）

官方文档给的定义： Python: cv.Rectangle(img, pt1, pt2, color, thickness=1, lineType=8, shift=0) → N…

人工智能 2023年7月19日
0059
无人机路径规划3：ego-planner三维运动规划实现

XTDrone实现ego-planner三维运动规划编译ego-palnner cp -r ~/XTDrone/motion_planning/3d/ego_planner ~/…

人工智能 2023年6月25日
00144
【目标检测】YOLOv5针对小目标检测的改进模型/添加帧率检测

问题背景众所周知，YOLOv5会对输入的图片进行放缩，并进行32倍下采样。对于一些分辨率很高的遥感/无人机图片，小目标难以被训练识别。本篇博文就来尝试这篇博文YOLOV5 模型和…

人工智能 2023年6月17日
00112

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30