什么是最大似然估计

2023年12月31日下午12:36 • 人工智能 • 阅读 56

问题：什么是最大似然估计？

介绍

最大似然估计（Maximum Likelihood Estimation，MLE）是一种常用的统计方法，用于估计概率分布的参数。它的基本思想是，通过找到使观测样本发生的概率最大化的参数值，来估计真实数据的概率分布参数。

在统计学中，我们通常使用参数化的概率分布来描述数据的生成过程。最大似然估计通过最大化给定观测数据的似然函数（likelihood function），找到最有可能生成观测数据的模型参数。

最大似然估计的应用非常广泛，例如线性回归、逻辑回归以及深度学习中的神经网络等都使用了最大似然估计。

算法原理

假设我们有一个参数化的概率分布函数 $P(x|\theta)$，其中 $x$ 是观测样本，$\theta$ 是待估计的参数。我们的目标是找到一个参数值 $\theta_{MLE}$，使得给定观测样本 $x$ 的条件下，概率 $P(x|\theta_{MLE})$ 达到最大。

概率分布函数 $P$ 通常由一个概率密度函数（对于连续分布）或一个概率质量函数（对于离散分布）表示。对于多个独立且同分布的观测样本，其似然函数可以表示为各个观测样本概率的乘积：

$$L(\theta) = P(x_1|\theta) \cdot P(x_2|\theta) \cdot P(x_3|\theta) \cdot … \cdot P(x_n|\theta)$$

其中，$L(\theta)$ 是似然函数。

为了便于推导，我们通常使用对数似然函数（对数是单调递增的）：

$$\log L(\theta) = \log P(x_1|\theta) + \log P(x_2|\theta) + \log P(x_3|\theta) + … + \log P(x_n|\theta)$$

最大似然估计的目标是最大化对数似然函数。

公式推导

推导过程中，我们通常使用普通的 LaTeX 格式的公式。以下是推导最大似然估计的公式推导：

根据前面的介绍，似然函数的对数为：

$$\log L(\theta) = \log P(x_1|\theta) + \log P(x_2|\theta) + \log P(x_3|\theta) + … + \log P(x_n|\theta)$$

最大似然估计的目标是最大化对数似然函数，即找到使对数似然函数最大的参数 $\theta_{MLE}$。为了方便计算，通常使用梯度下降或牛顿法等优化算法找到最大值。

计算步骤

推导完成后，我们可以使用以下步骤来计算最大似然估计的参数值：

选择一个参数化的概率分布函数 $P(x|\theta)$，并定义似然函数 $L(\theta)$。
对似然函数取对数（$\log L(\theta)$）。
计算对数似然函数的导数，并令导数等于零，得到关于参数 $\theta$ 的方程（通常使用优化算法来计算最值）。
解方程得到参数 $\theta_{MLE}$ 的值。
根据参数 $\theta_{MLE}$ 得到估计的概率分布函数。

Python代码示例

下面是使用Python实现的最大似然估计示例。我们使用一个虚拟数据集和高斯分布作为概率分布函数的例子。

首先，我们需要导入所需的库和模块：

import numpy as np
from scipy import stats
import matplotlib.pyplot as plt

定义一个高斯分布的概率密度函数和样本数据：

# 高斯分布参数
mu_true = 5.0
sigma_true = 2.0

# 生成高斯分布样本数据
np.random.seed(0)
data = np.random.normal(mu_true, sigma_true, size=1000)

确定似然函数（高斯分布函数的乘积）：

def likelihood(mu, sigma):
 return np.prod(stats.norm.pdf(data, loc=mu, scale=sigma))

计算似然函数的对数（以便于计算和优化）：

def log_likelihood(mu, sigma):
 return np.log(likelihood(mu, sigma))

通过最大化对数似然函数，计算参数估计值：

# 初始化参数的初始值
mu_initial = 0.0
sigma_initial = 1.0

# 使用优化算法找到最大对数似然函数的参数值
result = minimize(lambda params: -log_likelihood(params['mu'], params['sigma']),
 {'mu': mu_initial, 'sigma': sigma_initial})

# 提取参数估计值
mu_mle = result['x'][0]
sigma_mle = result['x'][1]

绘制原始数据和最大似然估计的高斯分布曲线：

# 绘制原始数据
plt.hist(data, bins=50, density=True, alpha=0.75, label='Data')
# 绘制最大似然估计的高斯分布曲线
x = np.linspace(min(data), max(data), 100)
y = stats.norm.pdf(x, loc=mu_mle, scale=sigma_mle)
plt.plot(x, y, 'r-', label='MLE Gaussian')

plt.xlabel('Value')
plt.ylabel('Density')
plt.title('Maximum Likelihood Estimation')
plt.legend()
plt.show()

代码细节解释

在这个示例中，我们首先生成一个高斯分布的虚拟样本数据，然后定义了概率密度函数和似然函数。接着，我们使用 scipy.optimize.minimize 函数来最大化对数似然函数，得到估计的参数值。最后，我们绘制了原始数据和最大似然估计得到的高斯分布曲线。

在估计参数的过程中，我们使用了 minimize 函数来最大化对数似然函数。minimize 函数使用了优化算法（默认为BFGS算法），并接受一个目标函数和初始参数值作为输入，并返回最优解。

通过最大似然估计，我们得到了估计的高斯分布参数（均值和标准差），并将其绘制成曲线，将其与原始数据进行对比。

注意，这个示例只是展示了一个简单的最大似然估计的实现，实际应用中可能会有更复杂的情况和更多的技巧。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/821988/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

如何用SpringBoot整合Redis（详细讲解~）

大家好，我是卷&#…

人工智能 2023年7月29日
0075
激活函数和最常用的10个激活函数

1. 什么是激活函数 activation function 激活函数是一种添加到ANN中的函数，它决定了最终要发射给下一个神经元的内容。在人工神经网络中，一个节点的激活函数 …

人工智能 2023年6月15日
00100
卷积神经网络(CNN)实现CIFAR100类别分类

卷积神经网络(CNN)实现CIFAR100类别分类 1. CIFAR100数据集介绍这个数据集就像CIFAR-10，除了它有100个类，每个类包含600个图像。，每类各有500个…

人工智能 2023年7月2日
0075
pytorch余弦退火学习率和warmup实现

不说废话，直接上代码warmup_lr_scheduler.py: from torch.optim.lr_scheduler import CosineAnnealingLR i…

人工智能 2023年7月24日
0048
【联邦学习实战】基于FATE框架的MNIST手写数字识别——全连接神经网络

基于FATE框架的MNIST手写数字识别——全连接神经网络前言 1. 下载MNIST数据集 * 1.1 Kaggle 1.2 Python格式转换 2. 数据集分割 * 2.1 …

人工智能 2023年6月16日
00109
pandas中apply/map/applymap函数

目录 apply map applymap 总结 apply 语法：DataFrame.apply(func, axis=0, raw=False, result_type=Non…

人工智能 2023年7月7日
0084
CVPR 2022 结果出炉，最全论文下载及分类汇总（更新中）

CVPR 2022 已经放榜啦，本次一共有2067篇论文被接收，接收论文数量相比去年增长了24%。由于每年的 CVPR 全部论文以及相关细节公布都需要等到六月会议正式召开，因此，…

人工智能 2023年6月22日
0084
sqlflow简介，在线版：使用sqlflow，本地版：在windows上安装sqlflow

一、知识点了解数据血缘关系(data lineage)：视图或者存储过程的数据来自表或其他视图等多个源头，其他一个字段数据也可能来自多个源头表中多个字段的聚集。，而这个表中的数据…

人工智能 2023年6月30日
00120
本体与知识图谱

本体与知识图谱在这篇博客中，将引导您了解本体和知识知识图谱，讲述它们之间的区别以及它们如何组织大量数据和信息。_ 英文原文链接_ 什么是本体？本体是语义数据模型，用于定义dom…

人工智能 2023年6月4日
0093
个人博客系统(附源码)

前面学习了那么多的理论知识,一直比较枯燥,今天就做个小项目,来检验一下前面的学习成果吧!有需要源代码的小伙伴可以来看看:个人博客系统;这个小项目主要是模仿CSDN做的,但是功能还是…

人工智能 2023年7月31日
0064
【opencv3 学习记录】第七章图像上的像素运算

一：图像加法你可以使用函数 cv2.add() 将两幅图像进行加法运算，当然也可以直接使用 numpy，res=img1+img。两幅图像的大小，类型必须一致，或者第二个图像可…

人工智能 2023年6月22日
0088
弱小目标检测跟踪算法研究（5）基于顶帽变换（Top_hat）算法的红外弱小目标检测之背景抑制

基于顶帽变换（Top_hat）算法的红外弱小目标检测之背景抑制 1. 前言 2. 顶帽变换（Top_hat）算法 3. Matlab仿真 4. 小结 ; 1. 前言红外图像中的弱…

人工智能 2023年7月10日
0050
AAAI最佳论文Informer 解读

AAAI最佳论文Informer:效果远超Transformer的神器 1 简介 * 1.1 Informer的整体架构 2 预处理 Preliminary 与样本生成 * 2.1…

人工智能 2023年5月31日
0061
Mybatis-Plus 使用技巧与隐患

回答1：是基于的增强工具包，实现了在中的增删改查等操作的一系列便捷功能，同时还提供了代码自动生成、性能优化等功能。可以大大简化操作的代码量,同时提供了更多的查询方式，例如…

人工智能 2023年6月27日
0084
Text to image论文精读DF-GAN：A Simple and Effective Baseline for Text-to-Image Synthesis一种简单有效的文本生成图像基准模型

目录一、原文摘要二、为什么提出DF-GAN？三、DF-GAN * 3.1、模型结构 3.2、鉴别器（Target-Aware Discriminator） – 3…

人工智能 2023年5月26日
0068
【云原生 • Kubernetes】认识 k8s、k8s 架构、核心概念点介绍

目录一、Kubernetes 简介二、Kubernetes 架构三、Kunbernetes 有哪些核心概念？ 1. 集群 Cluster 2. 容器 Container 3….

人工智能 2023年7月29日
0057

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31