Machine Learning Park–EM（最大期望算法）

2023年5月31日上午11:48 • 人工智能 • 阅读 56

代码说明：

文件名说明gmm.ipynbGMM模型的EM算法实现gmm.data数据集文件

最大期望算法（Expectation-maximization algorithm），是在概率模型中 寻找参数最大似然估计或者 最大后验估计的算法，其中概率模型依赖于无法观测的隐性变量。

算法两个核心步骤：

E（计算期望）
利用对隐藏变量的现有估计值，计算其 最大似然估计值
M（最大化）
最大化在E步上求得的最大似然值来计算参数的值
M步上找到的参数估计值被 用于下一个E步骤计算中，这个过程不断交替进行。
简单的一句话表示就是： 知道结果，反推条件θ \theta θ

似然函数是一种关于统计模型中的参数的函数，表示模型参数中的似然性。 极大似然就相当于最大可能。

最大似然估计是已经知道了结果，然后寻求使该结果出现的可能性最大的条件，以此作为 估计值。

极大似然函数求解步骤

我们通过一个例子来进行求解分析

假定我们要从10万个人当中抽取100个人来做身高统计，那么抽到这100个人的概率就是：

L ( θ ) = L ( x 1 , … , x n ∣ θ ) = ∏ i = 1 n p ( x i ∣ θ ) , θ ∈ Θ L(\theta)=L\left(x_{1}, \ldots, x_{n} \mid \theta\right)=\prod_{i=1}^{n} p\left(x_{i} \mid \theta\right), \theta \in \Theta L (θ)=L (x 1 ,…,x n ∣θ)=∏i =1 n p (x i ∣θ),θ∈Θ

现在，我们的目标就是求解出θ \theta θ值，使得L ( θ ) L(\theta)L (θ)的值最大。

为此我们定义 对数似然函数，将其变成连加的形式：

H ( θ ) = ln ⁡ L ( θ ) = ln ⁡ ∏ i = 1 n p ( x i ∣ θ ) = ∑ i = 1 n ln ⁡ p ( x i ∣ θ ) H(\theta)=\ln L(\theta)=\ln \prod_{i=1}^{n} p\left(x_{i} \mid \theta\right)=\sum_{i=1}^{n} \ln p\left(x_{i} \mid \theta\right)H (θ)=ln L (θ)=ln ∏i =1 n p (x i ∣θ)=∑i =1 n ln p (x i ∣θ)

在本科数学课程当中我们已经学过 偏导数的求解方法，为此，我们对应求L ( θ ) L(\theta)L (θ)对所有参数的偏导数，也就是梯度了，从而n n n个未知的参数，就有n n n个方程，方程组的解就是似然函数的极值点了，最终得到这n n n个参数的值。

极大似然函数估计值求解步骤如下：

同样，我们也通过一个例子来讲解EM算法

两枚硬币A和B，假定随机抛掷后正面朝上概率分别为P A PA P A，P B PB P B。为了估计这两个硬币朝上的概率，咱们轮流抛硬币A和B，每一轮都连续抛5次，总共5轮：

硬币结果统计A正正反正反3正-2反B反反正正反2正-3反A正反反反反1正-4反B正反反正正3正-2反A反正正反反2正-3反

硬币A被抛了15次，在第一轮、第三轮、第五轮分别出现了3次正、1次正、2次正，所以很容易估计出PA，类似的，PB也很容易计算出来(真实值)，如下：

PA = （3+1+2）/ 15 = 0.4 PB= （2+3）/10 = 0.5

问题来了，如果我们 不知道抛的硬币是A还是B呢（即硬币种类是 隐变量），然后再轮流抛五轮，得到如下结果：

硬币结果统计Unknown正正反正反3正-2反Unknown反反正正反2正-3反Unknown正反反反反1正-4反Unknown正反反正正3正-2反Unknown反正正反反2正-3反

现在我们的目标没变，还是估计P A PA P A和P B PB P B，需要怎么做呢？

显然，此时我们多了一个硬币种类的隐变量，设为z，可以把它认为是一个 5维的向量（ z 1 , z 2 , z 3 , z 4 , z 5 ) （z1,z2,z3,z4,z5)（z 1 ,z 2 ,z 3 ,z 4 ,z 5 )，代表每次投掷时所使用的硬币，比如z 1 z1 z 1，就代表第一轮投掷时使用的硬币是A还是B。

但是，这个变量z z z不知道，就无法去估计PA和PB，所以，我们必须先估计出z z z，然后才能进一步估计PA和PB。
可要估计z，我们又得知道PA和PB，这样我们才能用极大似然概率法则去估计z z z，这不是鸡生蛋和蛋生鸡的问题吗，如何解决呢？

解决方法：

先 随机初始化一个P A 和 P B PA和PB P A 和P B，用它来估计z z z
然后基于z z z，还是按照最大似然概率法则去估计新的P A PA P A和P B PB P B
然后依次循环，如果新估计出来的P A 和 P B PA和PB P A 和P B和我们真实值差别很大，继续上一步过程，直到 *PA和PB收敛到真实值为止。

先随便给PA和PB赋一个值，比如：硬币A正面朝上的概率P A = 0.2 PA = 0.2 P A =0 .2 硬币B正面朝上的概率P B = 0.7 PB = 0.7 P B =0 .7

然后，我们看看第一轮抛掷最可能是哪个硬币。

如果是 硬币A，得出3正2反的概率为 :

0.2 ∗ 0.2 ∗ 0.2 ∗ 0.8 ∗ 0.8 = 0.00512 0.2 0.2 0.2 0.8 0.8 = 0.00512 0 .2 ∗0 .2 ∗0 .2 ∗0 .8 ∗0 .8 =0 .0 0 5 1 2

如果是 硬币B，得出3正2反的概率为:

0.7 ∗ 0.7 ∗ 0.7 ∗ 0.3 ∗ 0.3 = 0.03087 0.7 0.7 0.7 0.3 0.3=0.03087 0 .7 ∗0 .7 ∗0 .7 ∗0 .3 ∗0 .3 =0 .0 3 0 8 7

然后依次求出其他4轮中的相应概率。做成表格如下：

轮数若是硬币A若是硬币B10.00512，3正-2反0.03087，3正-2反20.02048，2正-3反0.01323，2正-3反30.08192，1正-4反0.00567，1正-4反40.00512，3正-2反0.03087，3正-2反50.02048，2正-3反0.01323，2正-3反

我们就把概率更大，即更可能是A的，即第2轮、第3轮、第5轮出现正的次数2、1、2相加，除以A被抛的总次数15（A抛了三轮，每轮5次）， 作为z z z 的估计值，B的计算方法类似。然后我们便可以按照最大似然概率法则来估计新的PA和PB。
P A = 2 + 1 + 2 15 = 0.33 P B = 3 + 3 10 = 0.6 PA = \frac{2+1+2}{15} = 0.33 \ PB =\frac{3+3}{10} = 0.6 P A =1 5 2 +1 +2 =0 .3 3 P B =1 0 3 +3 =0 .6
就这样，不断迭代,不断接近真实值，这就是 EM算法的神奇之处。

继续按照上面的思路，用估计出的P A PA P A和P B PB P B再来估计z z z，再用z z z来估计新的P A PA P A和P B PB P B，反复迭代下去，就可以最终得到P A = 0.4 PA = 0.4 P A =0 .4，P B = 0.5 PB=0.5 P B =0 .5，此时无论怎样迭代，P A PA P A和P B PB P B的值都会保持0.4和0.5不变，于是乎，我们就找到了P A PA P A和P B PB P B的最大似然估计。

计算步骤总结

用EM算法求解的模型一般有GMM或者协同过滤，k-means其实也属于EM。EM算法一定会收敛，但是 可能收敛到局部最优。由于求和的项数将随着隐变量的数目 指数上升，会给 梯度计算带来麻烦。

Original: https://blog.csdn.net/Garyboyboy/article/details/122102748
Author: 爱笑的Gary哥
Title: Machine Learning Park–EM（最大期望算法）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/550830/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

（萌新向很详细！）在Anaconda下安装Pytorch环境流程及问题总结

（萌新向很详细！）Anaconda下安装Pytorch环境流程及问题总结目录前言一、Anaconda是什么？Pytorch是什么？ Anaconda是什么？ Pytorch是…

人工智能 2023年6月13日
0061
[学习笔记]neo4j离线导入csv文件——neo4j import

官方文档一、准备好所需的csv文件，文件格式为：节点[node:ID,name,:LABEL]以及关系[:START_ID,:END_ID,:TYPE]，文件存放在neo4j安…

人工智能 2023年5月27日
0073
特征匹配算法GMS(Grid-based Motion Statistics)理论与实践

GMS一种基于运动统计的快速鲁棒特征匹配过滤算法，能明显地改善匹配结果，目前已经集成进入OpenCV之中文章及代码地址项目地址：GMS: Fast and Robust Fea…

人工智能 2023年6月24日
0061
支持向量机回归python_在python中SVM回归更快

我正试图加速在python中使用gridsearchcv(用于调整rbf函数的参数)的过程。然而,这需要永远。我有一个适度小的数据集(尺寸600 x 8),所以我不认为尺寸是一个问…

人工智能 2023年6月18日
0068
手把手教你：基于LSTM的股票预测系统

系列文章第七章、手把手教你：基于深度残差网络（ResNet）的水果分类识别系统第六章、手把手教你：人脸识别的视频打码第五章、手把手教你：基于深度学习的滚动轴承故障诊断目录 …

人工智能 2023年5月24日
00147
李宏毅_机器学习_作业4（详解）_HW4 Classify the speakers

本次作业需要学习完transformer后完成！目录标题 Task 助教样例code解读 * 数据集分析 Dataset Dataloader Model Learning ra…

人工智能 2023年6月16日
0079
（已解决）Solving environment: failed with initial frozen solve. Retrying with flexible solve.

文章目录 * – + 背景 + 原因 + 解决方案 + 解决方案2 背景在安装一个新的包的时候报上述错误： conda install pytorch-lightni…

人工智能 2023年6月13日
0042
train.py: error: the following arguments are required: –config解决办法

train.py: error: the following arguments are required: –config解决办法最近在跑github上的深度学习开…

人工智能 2023年5月23日
00139
python筛选数据并运算_python pandas 对dataframe中的数据进行四则运算及筛选

对dataframe的行，列加减乘除四则运算首先，构建一个dataframe import pandas as pd d={‘one’:{‘a…

人工智能 2023年7月7日
0050
漫画 | 这个北欧小国发明的编程技术，竟然占领全世界了！

上世纪60年代，挪威计算中心。一个新来员工刚上班，发现有两个人居然在一楼的黑板前打架新员工立刻跑到电话接线员那里报告什么样的编程语言，能让两人大动肝火？当时Nygaard…

人工智能 2023年7月30日
0042
pandas 读CSV时间转换问题的终极解决

关于pandas 读CSV遇到时间戳的转换（不会缺失精度）关于pandas 读CSV遇到object类型的时间的转换（不会缺失精度） pandas 读CSV遇到时间戳的转换时间字符…

人工智能 2023年7月15日
0061
把显存用在刀刃上！17 种 pytorch 节约显存技巧

引导 * – + 1. 显存都用在哪儿了？ + 2. 技巧 1：使用就地操作 + 3. 技巧 2：避免中间变量 + 4. 技巧 3：优化网络模型 + 5. 技巧 4：减…

人工智能 2023年7月22日
00391
Multi-hop QA based KG

论文：Improving Multi-hop Question Answering over Knowledge Graphs using Knowledge Base Embed…

人工智能 2023年6月10日
0057
Pytorch：全连接神经网络-MLP分类

Pytorch: 全连接神经网络-多层感知机解决分类问题 copyright: Jingmin Wei, Automation 1801, School of Artificial…

人工智能 2023年6月30日
0085
机器学习——朴素贝叶斯分类

一贝叶斯原理 1.1贝叶斯原理产生背景：贝叶斯原理是英国数学家托马斯·贝叶斯提出的，他写的一篇关于归纳推理的论文直接影响了接下来两个多世纪的统计学，是科学史上著名的论文之一。贝…

人工智能 2023年6月16日
0041
爬虫的基本原理

一、爬虫的基本原理网络爬虫的价值其实就是数据的价值，在互联网社会中，数据是无价之宝，一切皆为数据，谁拥有了大量有用的数据，谁就拥有了决策的主动权。爬虫聚合站点 https:/…

人工智能 2023年7月4日
0060

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Machine Learning Park–EM（最大期望算法）

大家都在看