机器学习（二）——贝叶斯分类器

2023年6月15日下午12:51 • 人工智能 • 阅读 55

文章目录

1. 贝叶斯决策论
*
1.1 贝叶斯判定准则
1.2 极大似然估计
2. 朴素贝叶斯分类器
*
2.1 拉普拉斯平滑
2.2 示例
贝叶斯决策论

核心： 将最小化分类错误率转换为最大化先验概率和类条件概率（似然）的乘积。

1.1 贝叶斯判定准则

（1）期望损失R ( c i ∣ x ) R(c_i|x)R (c i ∣x )
假设有N种可能的类别标记，即γ = { c 1 , c 2 , ⋯ , c N } \gamma={c_1,c_2,\cdots,c_N }γ={c 1 ,c 2 ,⋯,c N }。λ i j \lambda_{ij}λi j 是将真实标记为c j c_j c j 的样本误分类为c i c_i c i 所产生的损失。基于后验概率P ( c i ∣ x ) P(c_i|x)P (c i ∣x )可获得将样本x分类为c i c_i c i 所产生的期望损失：
R ( c i ∣ x ) = ∑ j = 1 N λ i j P ( c j ∣ x ) R(c_i|x) = \sum_{j=1}^N \lambda_{ij}P(c_j|x)R (c i ∣x )=j =1 ∑N λi j P (c j ∣x )

（2）最小条件风险的类别标记h ∗ ( x ) h^*(x)h ∗(x )
根据贝叶斯判定准则：为最小化总体风险，需要每个样本选择使条件风险最小的类别标记。
h ∗ ( x ) = arg ⁡ min ⁡ c ∈ γ R ( c ∣ x ) h^*(x)=\arg \min_{c \in \gamma} R(c|x)h ∗(x )=ar g c ∈γmin R (c ∣x )

（3）最小化分类错误率的贝叶斯最优分类器

此时条件风险以及最优分类器为：
R ( c ∣ x ) = 1 − P ( c ∣ x ) h ∗ ( x ) = arg ⁡ max ⁡ c ∈ γ P ( c ∣ x ) R(c|x)=1-P(c|x) \ h^*(x)=\arg \max_{c \in \gamma}P(c|x)R (c ∣x )=1 −P (c ∣x )h ∗(x )=ar g c ∈γmax P (c ∣x )

因此问题转换为了基于有限的训练样本集尽可能准确地估计后验概率P ( c ∣ x ) P(c|x)P (c ∣x )。求最小化条件风险即最大化后验概率。
因此可以采用生成式模型，考虑到贝叶斯定理：
p ( c ∣ x ) = p ( x ∣ c ) p ( c ) p ( x ) p(c|x) = \frac{p(x|c)p(c)}{p(x)}p (c ∣x )=p (x )p (x ∣c )p (c )

其中，P ( c ) P(c)P (c )是类先验概率；P ( x ∣ c ) P(x|c)P (x ∣c )是样本相对于类标记c的类条件概率，也称似然（likelihood）。最大化后验概率即最大化先验概率和似然的乘积。

理解：
①利用λ \lambda λ取值，将条件风险转化为了后验概率P ( c ∣ x ) P(c|x)P (c ∣x )。
②基于贝叶斯准则，我们将后验概率转化为了如何利用训练数据集估计先验概率P ( c ) P(c)P (c )和似然P ( x ∣ c ) P(x|c)P (x ∣c )。
（条件风险 –> 后验概率 –> 先验概率和似然）

根据大数定律，当训练集样本包含充足的独立同分布样本时，P ( c ) P(c)P (c )可通过各类样本出现的概率进行估计。
直接使用概率估计P ( x ∣ c ) P(x|c)P (x ∣c )是不行的，因为现实应用中，很多样本取值在训练集中根本没有出现。因此”未被观察到”不能等效为”出现概率为0″.

; 1.2 极大似然估计

（1）常用策略
假设P ( x ∣ c ) P(x|c)P (x ∣c )具有确定的形式并且被参数向量θ c \theta_c θc 唯一确定，我们将P ( x ∣ c ) P(x|c)P (x ∣c )标记位P ( x ∣ θ c ) P(x|\theta_c)P (x ∣θc )。

极大似然估计（MLE）采用频率主义学派的方法，通过优化似然函数确定参数值。

（2）公式

为了防止连乘操作造成下溢，使用对数似然（log-likelihood）
L L ( θ c ) = ∑ x ∈ D c log ⁡ P ( x ∣ θ c ) LL(\theta_c) = \sum_{x \in D_c}\log P(x|\theta_c)L L (θc )=x ∈D c ∑lo g P (x ∣θc )

此时参数θ c \theta_c θc 的极大似然估计为：
θ c ^ = arg ⁡ max ⁡ θ c L L ( θ c ) \hat{\theta_c} = \arg \max_{\theta_c} LL(\theta_c)θc ^=ar g θc max L L (θc )

（3）优缺点

通过参数化的方法使类条件概率估计变得简单
准确度严重依赖于假设分布形式是否符合潜在的真实数据分布。
朴素贝叶斯分类器
基于1.1的贝叶斯准则，将条件风险转化为了先验概率和似然。
又基于1.2极大似然估计获得了通过优化似然函数得到极大似然估计的方法。
采用”属性条件独立性假设”：假设每个属性独立地对分类结果发生影响。

（1）贝叶斯分类器
基于属性条件独立性假设和贝叶斯准则，可得：
P ( c ∣ x ) = P ( c ) P ( x ∣ c ) P ( x ) = P ( c ) P ( x ) ∏ i = 1 d P ( x i ∣ c ) P(c|x) = \frac{P(c)P(x|c)}{P(x)}=\frac{P(c)}{P(x)} \prod_{i=1}^d P(x_i|c)P (c ∣x )=P (x )P (c )P (x ∣c )=P (x )P (c )i =1 ∏d P (x i ∣c )

为了获得最大化后验概率，根据极大似然估计可得：
h n b ( x ) = arg ⁡ max ⁡ c ∈ γ P ( c ) ∏ i = 1 d P ( x i ∣ c ) h_{nb}(x) = \arg \max_{c \in \gamma} P(c)\prod_{i=1}^d P(x_i|c)h n b (x )=ar g c ∈γmax P (c )i =1 ∏d P (x i ∣c )

其中∏ i = 1 d P ( x i ∣ c ) \prod_{i=1}^d P(x_i|c)∏i =1 d P (x i ∣c )可以通过训练集样本分布获得，先验概率P ( c ) P(c)P (c )：

离散属性：
连续属性：

; 2.1 拉普拉斯平滑

目的
为了避免其他属性携带的信息被训练集中未出现的属性抹去，在估计概率是通常进行平滑。

举例： 假设可以通过8个属性判断西瓜好坏。假设对于一个样本，其中7个属性都指向该西瓜为好瓜。但最后一个属性不在训练集中出现，统计概率为0.这很可能不符合实际预期。

公式：
令N表示训练集可能类别数（标签数），N i N_i N i 表示第i个属性可能的取指数，则拉普拉斯修正为：
P ^ ( c ) = ∣ D c ∣ + 1 ∣ D ∣ + N P ^ ( x i ∣ c ) = ∣ D c , x i + 1 ∣ ∣ D c ∣ + N i \hat{P}(c) = \frac{|D_c|+1}{|D|+N} \ \hat{P}(x_i|c) = \frac{|D_{c,x_i}+1|}{|D_c|+N_i}P ^(c )=∣D ∣+N ∣D c ∣+1 P ^(x i ∣c )=∣D c ∣+N i ∣D c ,x i +1 ∣

2.2 示例

Step2：计算P ( x i ∣ c ) P(x_i|c)P (x i ∣c ) 的概率（未发生平滑）

Step2：考虑拉普拉斯修正后，计算P ( x i ∣ c ) P(x_i|c)P (x i ∣c ) 的概率

由于P(好瓜)>P(坏瓜)，因此将样本判定为好瓜。

Original: https://blog.csdn.net/koulongxin123/article/details/123488232
Author: 冠long馨
Title: 机器学习（二）——贝叶斯分类器

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/614751/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python的5大就业方向，学会一个都是赚

Python语言是这几年比较火爆的编程语言，不少人都开始报名Python培训进行Python的学习，那学会Python语言就只可以使用爬虫吗？并不是的，那Python语言分为那几个…

人工智能 2023年6月19日
0079
python3.7对应的tensorflow2.0版本安装历程

首先，自己在之前安装opencv时已经安装好了Anaconda3（对应4.6.11版本）以及python3.7版本。（安装教程参考博客https://blog.csdn.net/i…

人工智能 2023年5月24日
0062
【Linux】linux中，你不得不爱的命令集（下）

mv -f ： force 强制的意思，如果目标文件已经存在，不会询问而直接覆盖 mv -i ：若目标文件 (destination) 已经存在时，就会询问是否覆盖！ cat /m…

人工智能 2023年7月29日
0036
pytorch 图像分类预测本地图片

def prediect(img_path): img_src = cv2.imread(img_path, 0) #以灰度图的方式读取要预测的图片 img=img_src.cop…

人工智能 2023年7月2日
0066
目标检测网络-yolo

目标检测网络-yolo 本文将根据论文”基于深度学习的户外施工人员违规行为检测”需要掌握的知识进行讲解。常见3大数据集 ImgNet、COCO 、VOC …

人工智能 2023年7月10日
0050
机器人手眼标定

文章目录前言手眼标定标的是什么手眼标定原理 * 眼在手上（Eye_in_hand）眼在手外（Eye_to_hand）怎么求解AX=XB 误差分析以及如何减少误差如何实操…

人工智能 2023年7月19日
0074
SpringBean生命周期

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月30日
0084
【计算机视觉】OpenCV实现单目相机标定

文章目录单目相机标定(基于Python OpenCV) * 1.上期填坑 2.单目相机标定 – 2.1 数据采集 2.2 角点提取 2.3 参数求解 2.4 参数评估…

人工智能 2023年6月24日
0070
一键生成？从照片生成人脸 3D 模型 #AvatarMe

Mixlab 非常多，2D 类制作工具包括 Live2D、Vroid Studio；超写实类制作工具包括 Avatary、MetaHuman Creator 等。知识库除了使用…

人工智能 2023年5月26日
0065
如何使用evo工具评估LeGO-LOAM跑KITTI数据集的结果

如何使用evo工具评估LeGO-LOAM跑KITTI数据集的结果下载KITTI数据集安装kitti2bag 修改LeGO-LOAM代码 * utility.h imagePro…

人工智能 2023年6月1日
0066
吴恩达机器学习课后作业Python实现（一）：线性回归

目录前言单变量线性回归代码实现数据集准备代价函数梯度下降跑模型并预测绘制线性模型及代价函数图多元线性回归代码实现结果图前言写本篇文章的主要目的是记录自己机…

人工智能 2023年6月24日
0076
数据分析 — Pandas③

目录表格合并 * 纵向合并横向合并数据清洗 * 删除缺失数据行数据填充统一数据格式去除重复数据 pandas 中很实用的方法——apply() 方法附：匿名函数表格…

人工智能 2023年7月7日
0077
双目相机IMX219-83 +jetson nano 使用教程

IMX219 摄像头，800 兆像素和 83 FOV。兼容 Jetson nano 开发套件 (B01) 规格： 8 百万像素传感器：索尼IMX219 分辨率：3280 × 24…

人工智能 2023年7月20日
0064
目标检测结果数据分析

在验证集上会得到COCO的评价列表在目标检测上常用的两个公开数据集pascal voc和coco 针对这两个数据集都有一个评判标准目标检测与图像分类明显差距是很大的在图像分类…

人工智能 2023年7月9日
0059
机器学习中的时间序列预测模型

1.概述在机器学习的各类方法中，有一类主要能用于时间序列预测的模型，包括但不限于自回归模型AR、滑动平均MA、融合AR与MA的ARIMA、隐马尔可夫模型HMM、卡尔曼滤波KF、循…

人工智能 2023年6月15日
00110
ubuntu18 CUDA版本降级

用别人的代码训练模型时，由于tensorflow-gpu版本太高，报了很多错，一个个改太麻烦，所以直接降级。tensorflow降级为1.14，与此同时也要换成对应版本的CUDA和…

人工智能 2023年5月23日
0072

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30