第三讲 GMM以及EM算法学习笔记

2023年6月3日上午4:54 • 人工智能 • 阅读 67

与之对应，无法直接被观测到，需要通过模型和观测变量进行推断的变量就叫做 潜变量。常用的潜变量模型就包括了 GMM（高斯混合模型）和 HMM（隐马尔可夫模型）。它们能够将将不完全数据（只有观测数据）的边缘分布转换成容易处理的完全数据（观测数据+潜变量）的联合分布。

2.K-Means聚类模型

K-Means聚类属于无监督学习算法，可以看作是一种特殊的，简化的混合高斯模型。它是将n个观测数据点按照一定标准划分到k个聚类中，数据点根据相似度划分。每一个聚类有一个质心，质心是对聚类中所有点的位置求平均值得到的点，每个观测点属于距离它最近的质心所代表的聚类。算法流程为1.先随机选择k个聚类质心。2.将每个观测点按照”距离”划分到离自己最近的质心并划分到此类。3.计算当前划分聚类的新质心。重复第2，3步，直至达到收敛条件。例如两次质心不再发生变化等。
通过K-Means聚类模型，可以对图像进行分割和压缩。

3.GMM模型和参数的估计 **

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:7907cb01-274b-452b-8f80-ef6a4525b8bd

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:ebcfbd2e-3a3e-42ba-ad93-2f291bd83486

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:0deeaf18-4bc9-48e7-985e-b4fd15343f13

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:efc7e2e1-0b03-465f-a765-8dcb17c9d924

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:1cf118bd-200d-44bd-9111-29feacaf5bd6

[En]

GMM模型使用EM算法得到的参数估计
第三讲 GMM以及EM算法学习笔记

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:dd780501-153a-4548-99e1-a881d6877f57

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:b42c706c-e569-4cb7-bcce-a359b93d51d3

; 4.EM算法**

利用迭代，在E步中求期望，在M步中最大化。关键是这个Q函数的构造。

5.总结

GMM模型与EM算法十分重要，但自己目前对于公式的推导还存在许多问题不能解决，课下应继续学习，与同学互相探讨。

6.作业代码


    def calc_log_likelihood(self, X):
        """Calculate log likelihood of GMM

            param: X: A matrix including data samples, num_samples * D
            return: log likelihood of current model
"""

        log_llh = 0.0
        N = X.shape[0]
        for n in range(N):
            tmp = 0.0
            for k in range(self.K):
                tmp += self.pi[k] * self.gaussian(X[n], self.mu[k], self.sigma[k])
            log_llh += np.log(tmp)
        return log_llh


    def em_estimator(self, X):
        """Update paramters of GMM

            param: X: A matrix including data samples, num_samples * D
            return: log likelihood of updated model
"""

        log_llh = 0.0

        N = X.shape[0]
        gama = np.zeros((N, self.K))

        for n in range(N):
            for k in range(self.K):
                gama[n][k] = self.pi[k] * self.gaussian(X[n], self.mu[k], self.sigma[k])

        tmp = np.sum(gama, axis=1)
        for n in range(N):

            gama[n] /= tmp[n]

        Nk = np.sum(gama, axis=0)

        self.pi = Nk/N

        self.mu = list()
        for k in range(self.K):
            tmp = np.zeros(self.dim)
            for n in range(N):
                tmp += X[n]*gama[n][k]
            tmp /= Nk[k]
            self.mu.append(tmp)

        self.sigma = list()
        for k in range(self.K):
            tmp = np.zeros((self.dim, self.dim))
            for n in range(N):
                tmp += gama[n][k] * np.outer(X[n]-self.mu[k], X[n]-self.mu[k])
            tmp /= Nk[k]
            self.sigma.append(tmp)

        log_llh = self.calc_log_likelihood(X)
        return log_llh

作业网址：https://github.com/nwpuaslp/ASR_Course/tree/master/03-GMM-EM

Original: https://blog.csdn.net/weixin_44589825/article/details/125918180
Author: handsomeMB
Title: 第三讲 GMM以及EM算法学习笔记

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/563104/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【Linux】CUDA Toolkit和cuDNN版本对应关系（更新至2022年6月，附官网永久更新链接）

目录一、前言二、对应关系三、如何使用四、总结五、参考一、前言 NVIDIA® CUDA® Toolkit 为创建高性能 GPU 加速应用程序提供了一个开发环境。借助 C…

人工智能 2023年7月21日
0033
Industrial RS(5)

Industrial RS Hongwei et al. Knowledge-aware Graph Neural Networks with Label Smoothness R…

人工智能 2023年6月1日
0055
利用Pandas读取多个文件中相同列的数据并合并到新的表格中

import numpy as npimport pandas as pdimport xlrdimport globimport osfrom tqdm import tqdmi…

人工智能 2023年7月7日
0046
pandas模块的基本使用

numpy能够帮助我们处理数值，但是pandas除了能处理数值之外(基于numpy)，还能够帮助我们处理其他类型的数据pandas技术文档：https://pandas.pydat…

人工智能 2023年7月8日
0084
在anaconda中安装pytorch方法

content 1、安装说明 2、安装步骤 * – (1)打开anaconda prompt (2)建立pytorch虚拟环境 (3)激活环境 (4)安装pytorch…

人工智能 2023年6月19日
00156
halcon提取图像中的红色区域，其他颜色可以模仿

原图方法1、效果图先提取红色通道，然后红色通道一次减去绿色和蓝色通道，最后得到的就是纯红色通道 decompose3 (Image, Image1, Image2, Image…

人工智能 2023年7月20日
0043
第七届工程训练比赛之智能垃圾分类

2021第七届工程训练综合能力竞赛之智能垃圾分类前言写在前面：第一次写博客，想把这半年的备赛经历记录下来分享分享给大家，如有错误欢迎大家指正。有需要代码的请+扣扣：12870…

人工智能 2023年5月26日
00105
类激活图（CAM）代码+原理详解【pytorch亲测有效】

CAM基础知识更新：2023年3月29日22:30:15，发现之前有一些地方有歧义难理解，现在予以更正参考链接：如何利用CAM（类激活图）动态可视化模型的学习过程一、作用类激…

人工智能 2023年6月16日
0072
2022-2028全球与中国枪战类手机游戏市场现状及未来发展趋势

辰宇信息咨询市场调研公司最近发布-《2022-2028全球与中国枪战类手机游戏市场调研报告》内容摘要本文重点分析在全球及中国有重要角色的企业，分析这些企业枪战类手机游戏产品的市…

人工智能 2023年6月11日
0083
YOLOv5基础知识点——目标框回归与跨网格预测策略

目标框PASCAL VOC标注格式 x,y,w,h做了归一化处理目标框的回归 Anchor给出目标宽高的初始值，需要回归的是目标真实宽高与初始宽高的偏移量预测框中心点相对于对应…

人工智能 2023年6月17日
0077
【项目实战】Python实现AdaBoost分类模型(AdaBoostClassifier算法)项目实战

说明：这是一个机器学习实战项目（附带数据+代码+文档+代码讲解），如需数据+代码+文档+代码讲解可以直接到文章最后获取。 1.项目背景 AdaBoost是最优秀的Boostin…

人工智能 2023年7月1日
0051
神经网络的心得体会,神经网络心得体会

简述对深度学习的理解百度文库。现在深度学习在机器学习领域是一个很热的概念，不过经过各种媒体的转载播报，这个概念也逐渐变得有些神话的感觉：例如，人们可能认为，深度学习是一种能够…

人工智能 2023年7月26日
0054
[附源码]计算机毕业设计JAVAjsp-在线排课系统

[附源码]计算机毕业设计JAVAjsp-在线排课系统项目运行环境配置： Jdk1.8 + Tomcat7.0 + Mysql + HBuilderX （Webstorm也行）+…

人工智能 2023年6月29日
0065
yolov5 OpenVINO2022版 windows部署实战

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月28日
0055
Selenium元素定位方法总结

Selenium可以驱动浏览器完成各种操作，比如模拟点击等。要想操作一个元素，首先应该识别这个元素。人有各种的特征（属性），我们可以通过其特征找到人，如通过身份证号、姓名、家庭住址…

人工智能 2023年7月3日
0056
音频文件格式(PCM,WAV, MP3)

啊哦~你想找的内容离你而去了哦内容不存在，可能是由于以下原因造成的： [En] The content does not exist and may be caused by t…

人工智能 2023年5月27日
0048

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

第三讲 GMM以及EM算法学习笔记

目录

大家都在看