机器学习算法（二十九）：高斯混合模型（Gaussian Mixed Model，GMM）

2023年6月25日下午11:59 • 人工智能 • 阅读 153

1 混合模型（Mixture Model）

1 混合模型（Mixture Model）

混合模型是一个可以用来表示 在总体分布（distribution）中含有 K 个子分布的概率模型，换句话说，混合模型表示了观测数据在总体中的概率分布，它是一个由 K 个子分布组成的混合分布。混合模型不要求观测数据提供关于子分布的信息，来计算观测数据在总体分布中的概率。

2 高斯模型

2.1 单高斯模型

当样本数据 X 是一维数据（Univariate）时，高斯分布遵从下方 概率密度函数（Probability Density Function）：

机器学习算法（二十九）：高斯混合模型（Gaussian Mixed Model，GMM）

其中

为数据均值（期望），

为数据标准差（Standard deviation）。

当样本数据 X 是多维数据（Multivariate）时，高斯分布遵从下方概率密度函数：

其中，

为数据均值（期望），机器学习算法（二十九）：高斯混合模型（Gaussian Mixed Model，GMM）

为协方差（Covariance），D 为数据维度。

2.2 高斯混合模型

高斯混合模型可以看作是由 K 个单高斯模型组合而成的模型，这 K 个子模型是混合模型的隐变量（Hidden variable）。一般来说，一个混合模型可以使用任何概率分布，这里使用高斯混合模型是因为高斯分布具备很好的数学性质以及良好的计算性能。

说起高斯分布，大家都不陌生，通常身高、分数等都大致符合高斯分布。因此，当我们研究各类数据时，假设同一类的数据符合高斯分布，也是很简单自然的假设；当数据事实上有多个类，或者我们希望将数据划分为一些簇时，可以假设 不同簇中的样本各自服从不同的高斯分布，由此得到的聚类算法称为高斯混合模型。

高斯混合模型是一个生成式模型。可以这样理解数据的生成过程，假设一个最简单的情况，即只有两个一维标准高斯分布的分模型N(0,1)和N(5,1)，其权重分别为0.7和0.3。那么，在生成第一个数据点时，先按照权重的比例，随机选择一个分布，比如选择第一个高斯分布，接着从N(0,1)中生成一个点，如−0.5，便是第一个数据点。在生成第二个数据点时，随机选择到第二个高斯分布N(5,1)，生成了第二个点4.7。如此循环执行，便生成出了所有的数据点。

3 模型参数学习

3.1 单高斯模型

这里我们假设了每个数据点都是独立的（Independent），似然函数由概率密度函数（PDF）给出。

由于每个点发生的概率都很小，乘积会变得极其小，不利于计算和观察，因此通常我们用 Maximum Log-Likelihood 来计算（因为 Log 函数具备单调性，不会改变极值的位置，同时在 0-1 之间输入值很小的变化可以引起输出值相对较大的变动）：

3.2 高斯混合模型

对于高斯混合模型，Log-Likelihood 函数是：

通常我们并不能直接得到高斯混合模型的参数，而是观察到了一系列数据点，给出一个类别的数量K后，希望求得最佳的K个高斯分模型。因此，高斯混合模型的计算，便成了最佳的均值μ，方差Σ、权重π的寻找，这类问题通常通过最大似然估计来求解。遗憾的是，此问题中直接使用最大似然估计，得到的是一个复杂的非凸函数，目标函数是和的对数，难以展开和对其求偏导。

在这种情况下，可以用上一节已经介绍过的EM算法框架来求解该优化问题。

EM算法是在最大化目标函数时，先固定一个变量使整体函数变为凸优化函数，求导得到最值，然后利用最优参数更新被固定的变量，进入下一个循环。具体到高斯混合模型的求解，EM算法的迭代过程如下。

首先，初始随机选择各参数的值。然后，重复下述两步，直到收敛。

（1）E步骤。根据当前的参数，计算每个点由某个分模型生成的概率。

（2）M步骤。使用E步骤估计出的概率，来改进每个分模型的均值，方差和权重。

也就是说，我们并不知道最佳的K个高斯分布的各自3个参数，也不知道每个数据点究竟是哪个高斯分布生成的。所以每次循环时，先固定当前的高斯分布不变，获得每个数据点由各个高斯分布生成的概率。然后固定该生成概率不变，根据数据点和生成概率，获得一个组更佳的高斯分布。循环往复，直到参数的不再变化，或者变化非常小时，便得到了比较合理的一组高斯分布。

首先初始化参数

M-step：计算新一轮迭代的模型参数

至此，我们就找到了高斯混合模型的参数。需要注意的是，EM 算法具备收敛性，但并不保证找到全局最大值，有可能找到局部最大值。解决方法是初始化几次不同的参数进行迭代，取结果最好的那次。

4 高斯混合模型与K均值算法对比

高斯混合模型与K均值算法的 相同点是：

它们都是可用于聚类的算法；
都需要指定K值；
都是使用EM算法来求解；
都往往只能收敛于局部最优。

而它相比于K均值算法的优点是：

可以给出一个样本属于某类的概率是多少；
不仅仅可以用于聚类，还可以用于概率密度的估计；
并且可以用于生成新的样本点。

高斯混合模型（GMM） – 知乎

Original: https://blog.csdn.net/weixin_39910711/article/details/123963434
Author: 意念回复
Title: 机器学习算法（二十九）：高斯混合模型（Gaussian Mixed Model，GMM）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/651786/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

RAW、RGB、YUV 图像格式区别

前言颜色是人的视觉系统对光谱中可见区域的感知效果，它仅存在于人的眼睛和大脑中。为了准确地描述颜色，必须引入色彩空间的概念。正如几何上用坐标空间来描述坐标集合，色彩空间用数学方式来…

人工智能 2023年6月18日
0088
亚马逊商城评论数据分析与可视化（KNN预测评分，绘制云图）

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月19日
0084
哈工大2022机器学习实验一：曲线拟合

这个实验的要求写的还是挺清楚的（与上学期相比），本博客采用python实现，科学计算库采用 numpy，作图采用 matplotlib.pyplot，为了简便在文件开头import…

人工智能 2023年7月5日
0069
数据分析大作战，SQL V.S. Python，来看看这些考题你都会吗 ⛵

💡 作者：韩信子@ShowMeAI📘 数据分析实战系列：https://www.showmeai.tech/tutorials/40📘 本文地址：https://www.showm…

人工智能 2023年6月11日
0091
NLP-D9-第一场大数据比赛D1&知识蒸馏&翻译论文&CATTI备考-第一套综合

，第一步是安装Spark和Spark 。您可以从官方网站下载Spark和Spark 的二进制文件，也可以使用Maven或SBT等构建工具安装它们。安装完成后，您可以使用Spark…

人工智能 2023年5月28日
0081
面经｜缺失值填补的7种方法（使用场景+Python代码）

新专栏《数据挖掘（分析）面经》第一篇：缺失值处理方法对于从事数据相关工作的小伙伴，面试的时候经常会被问到如何进行缺失值/异常值的处理，本文来梳理一下填补缺失值的7种方法。示例…

人工智能 2023年7月14日
0071
【深度学习】肺结节分割项目实战一：处理数据集

主要参考此教程完成的实验一、LIDC-IDRI数据集简介官方网站肺图像数据库协会的图像收集(LIDC-IDRI)包括诊断和带有病变注释标记的肺癌筛查胸部CT。这是一个网络…

人工智能 2023年6月17日
0086
KNN算法Matlab实现

KNN算法Matlab实现简介： KNN全称K-Nearest Neighbors,源于20世纪70年代。属于有监督学习的传统机器学习算法，既可以解决回归问题也可解决分类问题。本…

人工智能 2023年6月15日
0090
粒子群算法（PSO）简介及Python实现

一、概述粒子群算法，也称粒子群优化算法或鸟群觅食算法(Particle Swarm Optimization) ，缩写为PSO.粒子群优化算法是一种进化计算技术(evolutio…

人工智能 2023年7月30日
0066
云GPU（恒源云）训练的具体操作流程

简介这篇博客主要讲一下怎么使用云服务器上的GPU跑程序，主要是一些设置和操作步骤，具体的训练步骤可以看我的另一篇博客。以下步骤可能会有遗漏，也可能和你们有一些差别，有什么问题可…

人工智能 2023年6月16日
00166
卷积神经网络学习笔记-分类网络（一）

目录 1.1 Alexnet 1.2Alexnet构建 2.1VggNet 2.2VggNet构建 3.1GoogleNet 3.2GoogleNet构建 4 、引用…

人工智能 2023年7月2日
0057
通用目标检测开源框架YOLOv6在美团的量化部署实战

基于美团目标检测模型开源框架 YOLOv6，本文介绍了一种通用的量化部署方案，在保持精度的同时大幅提升了检测的速度，为通用检测的工业化部署探索出一条可行之路，希望能给大家带来一些启…

人工智能 2023年7月10日
0097
计算机视觉中的编码-解码器结构总结（持续更新）

文章目录 NLP领域的编码解码器结构机器学习中的编码器 * 自动编码器视觉领域中的编码解码器结构编码器-解码器结构：编码器原始输入信号转化为中间格式，然后解码器将中间格式转化…

人工智能 2023年6月24日
00206
【PyTorch】torch-geometric 安装

文章目录 1. 查看cuda版本 2. 安装依赖 3. 完成安装 4. 遇到的问题任务简介：由于 torch-geometric 的安装需要一定的依赖，所以直接 pip ins…

人工智能 2023年7月14日
0099
机器学习-监督学习及典型算法

文章目录 * – 监督学习(Supervised) – + 原理 + * 输入空间、特征空间、输出空间 + KNN算法(K-Nearest Neighbor…

人工智能 2023年6月15日
0080
【COCO数据集】Annotations标注解析

COCO dataset 是计算机视觉领域中最流行的数据集之一，用于对各种视觉任务进行基准测试，例如目标检测、分割、关键点检测等。在数据集中，有 118K张图像用于训练， 5K张…

人工智能 2023年7月28日
0068

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

机器学习算法（二十九）：高斯混合模型（Gaussian Mixed Model，GMM）

2.1 单高斯模型

2.2 高斯混合模型

3.1 单高斯模型

3.2 高斯混合模型

大家都在看