机器学习入门：第三章逻辑(Logistic)回归极大似然估计(2)

2023年6月18日下午12:16 • 人工智能 • 阅读 56

回头过来看，可能会觉得最小二乘法跟我们讨论中的芒果酸甜问题，并不是一回事。但从另外一种概括的角度来讲：通过一种模型，预测一种输出就能够分类。

在监督学习中，当输出变量Y取有限个离散值时，预测问题便成为分类问题。这时，输入变量X可以是离散的，也可以是连续的。监督学习从数据中学习一个分类模型或分类决策函数，称为分类器(classifier)。分类器对新的输入进行输出的预测(prediction)，称为分类(classification)。

用同样的思想，继续一个简单的故事：
某位同学与一位猎人一起出去打猎，一只兔子从前方窜过。只听见一声枪响，野兔应声倒下，如果要你来推测，这一发命中的子弹是谁大的？你会怎么想呢过？正常的情况下，猎人的枪法肯定比你的同学的枪法好，也就是说猎人的命中率比你的同学高。而一枪就打死兔子，命中率是100%的，这么高的命中率，应该是谁打中的呢？显然，猎人开的枪比较符合我们观察的想象了吧。

这就是我们要讲的，极大似然法。

如果试验n次，我们得到n个样本，极大似然估计是要是所求的概率，最大限制的符合我们现在所发生的。

这里我们这样定义似然函数：
假设{y1,…,yn}为独立同分布，则样本数据的联合密度函数为f(y1,θ)f(y2,θ)…f(yn,θ)，定义”似然函数”为，

L ( θ ; y 1 , . . . , y n ) = ∏ f ( y i ; θ ) L(\theta;y_1,…,y_n) = \prod f(y_i;\theta)L (θ;y 1 ,…,y n )=∏f (y i ;θ)

把似然函数取对数，将乘机形式转化为求和形式，

L ( θ ; y 1 , . . . , y n ) = ∑ l n f ( y i ; θ ) L(\theta;y_1,…,y_n) = \sum ln f(y_i;\theta)L (θ;y 1 ,…,y n )=∑l n f (y i ;θ)

为最大似然估计法。

从最大似然估计的思想来看和最小二乘法是有些类似的，使模型在观察到的数据中拥有最小的误差。

为了较好的说明，举一个很简单的例子：两点分布的情况，也是0-1分布。
设某工序生产的产品合格率为p，抽n个产品作检验，发现有T个合格，试求p的极大似然估计值。
在这里我们做了n次的试验，我们所求的概率p要符合我们试验的结果，也就是通过极大似然函数来求解。
似然函数为：

L ( p ) = ∏ p x i ( 1 − p ) 1 − x i L(p) = \prod p^{x_i}(1-p)^{1-x_i}L (p )=∏p x i (1 −p )1 −x i

把它简化一下，它的意思就更加明显了，如果这一次抽到的是不合格的产品，那么xi就为1，p x i ( 1 − p ) 1 − x i p^{x_i}(1-p)^{1-x_i}p x i (1 −p )1 −x i 也就是不合格率，极大似然把所有的结果相乘，也就是这次试验的总可能性。这里刚好可以知道把这次所有抽到合格的总次数为T，即∑ x i = T \sum{x_i}=T ∑x i =T。
使用极大似然估计可以得出：

L ( x 1 , x 2 , . . . , x n ) = ∏ p x i ( 1 − p ) 1 − x i = p ∑ x i ( 1 − p ) n − ∑ x i L(x_1,x_2,…,x_n) = \prod p^{x_i}(1-p)^{1-x_i} = p^{\sum x_i}(1-p)^{n-\sum x_i}L (x 1 ,x 2 ,…,x n )=∏p x i (1 −p )1 −x i =p ∑x i (1 −p )n −∑x i

取对数：

l n L = ( ∑ x i l n p + ( n − ∑ x i ) l n ( 1 − p ) ) lnL=(\sum x_i lnp + (n-\sum x_i)ln(1-p))l n L =(∑x i l n p +(n −∑x i )l n (1 −p ))

为了得到最大值，求导数：

d l n L d p = ∑ x i p − ( n − ∑ x i ) 1 1 − p \frac{dlnL}{dp}=\frac{\sum x_i}{p} – (n-\sum x_i)\frac{1}{1-p}d p d l n L =p ∑x i −(n −∑x i )1 −p 1

∑ x i = n p \sum x_i = np ∑x i =n p

最后可以求得：

p = T n p=\frac{T}{n}p =n T

最大似然函数的思想也就是想使我们求得的概率符合我们所观察的。而最大似然法看起来，好像只是为了求得某个概率，但恰恰是我们Logistic回归中用到的一种方法。

渐渐的进入到我们的主题Logistic回归。

Original: https://blog.csdn.net/weixin_40425640/article/details/124166210
Author: go2coding
Title: 机器学习入门：第三章逻辑(Logistic)回归极大似然估计(2)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/635011/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

单分类算法：One Class SVM

安全检测常用算法有：Isolation Forest，One-Class Classification等，孤立森林参见另一篇，今天主要介绍One-Class Classificat…

人工智能 2023年6月30日
0066
pandas进阶用法（一）筛选条件、多重索引、缺失值

一篇比较好的pandas指南，适合已经熟悉pandas，并想掌握一些进阶用法的读者,不适合对pandas完全不了解的新人。文章大部分是Stack Overflow常见问题集合。 p…

人工智能 2023年7月7日
00101
【Paper】StyTr2: Image Style Transfer with Transformers

CVPR 2022｜快手联合中科院自动化所提出基于Transformer的图像风格化方法论文链接：https://arxiv.org/abs/2105.14576 代码地址：ht…

人工智能 2023年5月28日
0085
会计学原理知识点总结

会计学原理知识整理-第一讲 *会计及其生产与发展 *会计的含义与特点 *会计的发展第二节会计的只能与目标 *会计的职能 *会计的目标（也是财务的目标）第四节会计基本假设与基…

人工智能 2023年6月27日
0077
单链表

链表与顺序表的比较：（1）顺序表便于访问查询，具有随机存取特性，链表便于插入删除。（2）顺序表的存储密度为1，链表的存储密度小于1。存储密度=节点中数据元素所占的存储量 / …

人工智能 2023年6月27日
0068
人工智能 | 基于支持向量机SVM模型的鸢尾花分类识别

一、实验目的通过鸢尾花萼片长度和宽度特征，采用感知器模型对鸢尾花数据集进行种类的分类识别。二、算法步骤 1.数据准备(1)从sklearn库里加载鸢尾花特性数据集；iris =…

人工智能 2023年6月24日
0065
电商数据分析师要用到的4种数据分析方法

随着互联网技术的飞速发展、移动设备的不断普及，电商应运而生并且以快速的增长速度在不断的发展。经过了20余年的发展，电商行业已经趋于成熟。线下许多传统企业也在积极向电商化转型，电商化…

人工智能 2023年6月11日
0075
多视图聚类（+incomplete multi view cluster)

1.A study of graph-based system for multi-view clustering 2.Consistency Meets Inconsistenc…

人工智能 2023年6月19日
0073
相机标定原理与实战【python-opencv】

文章目录为什么要进行相机标定？ 1. 成像几何 * 1.1 坐标系统 1.2 坐标转换 – 1.2.1 世界坐标系转换到相机坐标系 1.1.3 相机坐标系到图像坐标系…

人工智能 2023年7月19日
0044
seed在模型中的应用及用法

SEEDseed在深度学习代码中叫随机种子，设置seed的目的是由于深度学习网络模型中初始的权值参数通常都是初始化成随机数。而使用梯度下降法最终得到的局部最优解对于初始位置点的选择…

人工智能 2023年7月22日
0070
深度学习制作自己的数据集—为数据集打上标签保存为txt文件，并进行划分和加载数据集

目录 0 前言 1 为图片数据集打上标签并保存为txt文件 2 将txt文件中的图片标签数据集随机划分为训练集和测试集 3 加载txt文件中的图片标签数据集 0 前言目前是被封控…

人工智能 2023年7月29日
0058
过滤算法如何在推荐系统中发挥作用

问题背景推荐系统是一种常见的信息过滤系统，在互联网应用中广泛使用。过滤算法在推荐系统中起着重要的作用，可以根据用户的兴趣和行为，过滤出用户可能感兴趣的内容并进行推荐。本文将详细介…

人工智能 2024年1月4日
0037
百度飞桨（Paddle2.0）预训练模型加载、训练、预防过拟合（Dropout）–以柠檬分类数据集为例

课程连接：飞桨开源框架(PaddlePaddle)是一个易用、高效、灵活、可扩展的深度学习框架。自2.0版本颁布以来，简洁的代码设计、高效的数据转换让paddle入门学习不再成为…

人工智能 2023年7月3日
0093
Huggingface transformers 镜像使用，本地使用，tokenizer参数介绍

目录 from_pretrained() 参数清华源还支持huggingface hub自动下载使用方法 Roberta pretrain tokenizer 关于填充（pad…

人工智能 2023年6月17日
00140
MATLAB 三路频分复用通信系统

一、详细设计步骤（1）系统整体框图 ; （2）语音信号采样原理图 1-1 语音信号的采样即为信号的抽样过程，是把连续时间模拟信号转换成离散时间连续幅度的抽样信号。其原理如图所…

人工智能 2023年5月25日
00174
深度学习-nlp系列（2）文本分类（Bert）pytorch

对于 Bert 来说，用于文本分类是最常见的，并且准确率也很高。本文将会对 bert 用于文本分类来做详细的介绍。预训练模型对于不同的数据，需要导入不同的预训练模型。预训练模…

人工智能 2023年7月21日
0053

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

机器学习入门：第三章 逻辑(Logistic)回归 极大似然估计(2)

大家都在看

机器学习入门：第三章逻辑(Logistic)回归极大似然估计(2)