分类判别式模型——逻辑斯特回归曲线

2023年6月16日下午8:59 • 人工智能 • 阅读 93

逻辑斯特回归

Discriminative Model

——判别式模型

Function set

σ ( z ) = 1 1 + e x p ( − z ) P w , b ( C 1 ∣ x ) = σ ( z ) z = w ∗ x + b = ∑ i w i x i + b \sigma(z)=\frac{1}{1+exp(-z)}\ P_{w,b}(C_1|x)=\sigma(z)\ z=w*x+b=\sum_iw_ix_i+b σ(z )=1 +e x p (−z )1 P w ,b (C 1 ∣x )=σ(z )z =w ∗x +b =i ∑w i x i +b

因此我们的Function Set：
f w , b ( x ) = P w , b ( C 1 ∣ x ) = σ ( z ) f_{w,b}(x)=P_{w,b}(C_1|x)=\sigma(z)f w ,b (x )=P w ,b (C 1 ∣x )=σ(z )

因为z经过了逻辑斯特回归曲线，因此输出在0-1之间

; Goodness of a Function

给定一组w和b
L ( w , b ) = f w , b ( x 1 ) f w , b ( x 2 ) ( 1 − f w , b ( x 3 ) ) . . . f w , b ( x N ) L(w,b)=f_{w,b}(x^1)f_{w,b}(x^2)(1-f_{w,b}(x^3))…f_{w,b}(x^N)L (w ,b )=f w ,b (x 1 )f w ,b (x 2 )(1 −f w ,b (x 3 ))…f w ,b (x N )
然后找到w ∗ 和 b ∗ w^和b^w ∗和b ∗

使得a r g max ⁡ w , b L ( w , b ) arg\max_{w,b}L(w,b)a r g max w ,b L (w ,b )

数学上 等价于a r g min ⁡ w , b − ln ⁡ L ( w , b ) arg\min_{w,b}-\ln L(w,b)a r g min w ,b −ln L (w ,b )
− ln ⁡ L ( w , b ) = − l n f w , b ( x 1 ) − l n f w , b ( x 2 ) − l n ( 1 − f w , b ( x 3 ) ) . . . -\ln L(w,b)=-lnf_{w,b}(x^1)-lnf_{w,b}(x^2)-ln(1-f_{w,b}(x^3))…−ln L (w ,b )=−l n f w ,b (x 1 )−l n f w ,b (x 2 )−l n (1 −f w ,b (x 3 ))…

—— 当我们将类别用不同的y值做tag时

后面的项数都可以写成如下

最后得到的和项—— 其实是伯努利分布的交叉熵

交叉熵的含义是，代表两个分布有多接近

如果两个分布一模一样，则交叉熵=0

——因此， 本质上，我们是希望找到一个分布，能够与训练集上的分布尽可能的接近

—— 即p ( x ) = f w , b ( x n ) p(x)=f_{w,b}(x^n)p (x )=f w ,b (x n ) 和y ^ n \hat{y}^n y ^n 的分布尽可能接近

——而这一步， 在数学上的表示是，我们希望最小化两个分布之间的交叉熵

Find the best Function

− ln ⁡ L ( w , b ) = ∑ n − [ y ^ n ln ⁡ f w , b ( x n ) + ( 1 − y ^ n ) ln ⁡ ( l − f w , b ( x n ) ) ] -\ln L(w,b)=\sum_n-[\hat{y}^n\ln f_{w,b}(x^n)+(1-\hat{y}^n)\ln (l-f_{w,b}(x^n))]−ln L (w ,b )=n ∑−[y ^n ln f w ,b (x n )+(1 −y ^n )ln (l −f w ,b (x n ))]

如果找到最优的w和b，用 梯度下降法

——求 左式子微分

——求 右式子微分

——得到 整条式子的微分

; 与线性回归比较

——你会发现逻辑斯特回归曲线和线性回归的梯度下降

求微分的式子 一模一样

逻辑斯特曲线为什么不能用square Error

无论最后 预测距离目标有多远，你的微分都是非常的平坦

——因此，用Square error是不容易训练得很好的

; 判别模型 v.s. 生成模型

P ( C 1 ∣ x ) = σ ( w ∗ x + b ) ∙ P ( C 1 ∣ x ) : 直接找 w 和 b P(C_1|x)=\sigma(w*x+b)\ \bullet P(C_1|x):直接找w和b\P (C 1 ∣x )=σ(w ∗x +b )∙P (C 1 ∣x ):直接找w 和b

∙ σ ( w ∗ x + b ) : 找 μ 1 , μ 2 , Σ − 1 然后 w T = ( μ 1 − μ 2 ) T Σ − 1 b = − 1 2 ( μ 1 ) T ( Σ ) − 1 μ 1 + 1 2 ( μ 2 ) T ( Σ ) − 1 μ 2 + ln ⁡ N 1 N 2 \bullet\sigma(w*x+b):找\mu^1,\mu^2,\Sigma^{-1}\ 然后w^T=(\mu^1-\mu^2)^T\Sigma^{-1}\ b=-\frac{1}{2}(\mu^1)^T(\Sigma)^{-1}\mu^1 +\frac{1}{2}(\mu^2)^T(\Sigma)^{-1}\mu^2+\ln\frac{N_1}{N_2}∙σ(w ∗x +b ):找μ1 ,μ2 ,Σ−1 然后w T =(μ1 −μ2 )T Σ−1 b =−2 1 (μ1 )T (Σ)−1 μ1 +2 1 (μ2 )T (Σ)−1 μ2 +ln N 2 N 1

——那么这两个模型找出来的w和b会是同一组吗？

—— 结果不会是一样的

表示的事情是

同一组函数集合里Function set，在不同模型下挑选出来的函数时不一样的
因为，这两个模型的假设是不一样的
在逻辑斯特回归上，我们没有对训练集数据上的分布有任何的假设，我们就是单纯地去寻找w和b使得损失函数最小
但 在生成模型上，我们是有对训练集的分布存在假设的，我们假设它是高斯分布，或者假设它是伯努利分布

——哪一组找出来的w和b效果更好呢？

——某一些文献表示， 一般来说，判别式的模型往往比生成式的模型表现得更好一点

——在朴素贝叶斯中，会忽略维度之间的关联性，认为每个维度之间是独立

生成模型的优势

生成模型的假设本质上是对信息的脑补

这种脑部在以下几个方面，可能会使得生成模型的效果比判别模型更好

数据集过少生成模型受数据集大小的影响很小，判别模型受数据集大小的影响较大
生成模型的鲁棒性更好，能够更好地抗噪声因为生成模型是存在假设的，它有时候甚至会忽略掉你的噪声数据
可以从不同的来源估计先验和与类别相关的概率

多类别分类

——e z 1 ∑ j = 1 3 e z 1 \frac{e^{z_1}}{\sum_{j=1}^3e^{z_1}}∑j =1 3 e z 1 e z 1 本质上是在Normalized(规范化)

而且有
1 > y i > 0 ∑ i y i = 1 1>y_i>0\ \sum_iy_i=1\1 >y i >0 i ∑y i =1

y i = P ( C i ∣ x ) = f w , b ( x i ) y_i=P(C_i|x)=f_{w,b}(x_i)y i =P (C i ∣x )=f w ,b (x i )

——然后继续迭代修改w 1 , w 2 , w 3 w^1,w^2,w^3 w 1 ,w 2 ,w 3

; 为什么是取e

事实上你也可以取别的

或者Google maximum entropy

总流程

——如何去定义target的概率分布

如果使用class1=1,class2=2,class3=3的话，会引入类与类之间距离的问题

因此我们可以做独热编码

然后去做minimize的Cross Entropy

; 逻辑斯特回归的限制性

逻辑斯特曲线 无法解决同或问题

——因为逻辑斯特曲线在两个类的分类任务中， 给出的分界线就是一条直线

但是同或问题，没有办法用一个直线进行分开

解决同或问题

*Feature Transformation

我们可以把特征空间映射到另一片空间上

麻烦的是，我们并不知道怎么做Feature Transformation

——怎么让机器自己去做Transformation

Cascading logistic regression models
级联逻辑回归模型

把多个逻辑斯特模型拼接起来

我们讲x1和x2先经过某个逻辑斯特回归模型，得到它的维数个新替换的东西

当他们在新的Transformer下，能够将class 1和class 2分割开，最后再接一个逻辑斯特回归曲线，得到最后的bounary

每一个逻辑斯特回归的输出都可以作为下一个逻辑斯特回归模型的输入

我们把每一个逻辑斯特回归模型称为”Neuron”
把整个网络称为一个Neural Network

——敬请期待下一章

我们正式进入Deep Learning

Original: https://blog.csdn.net/Hacker_ccc/article/details/127197580
Author: Caaaaaan
Title: 分类判别式模型——逻辑斯特回归曲线

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/626586/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

听音识情绪 | 程序员手把手教你搭建神经网络，更快get女朋友情绪，求生欲max！⛵

💡 作者：韩信子@ShowMeAI📘深度学习实战系列：https://www.showmeai.tech/tutorials/42📘NLP实战系列: https://www.sho…

人工智能 2023年7月13日
0075
【swinUnet官方代码测试自己的数据集（已训练完毕）】

码字不易，收藏之余，别忘了给我点个赞吧！ ———Start 首先参考上一篇的训练过程，因为测试需要用到训练获得的权重。 1、检查相关文件 1.1…

人工智能 2023年5月26日
00113
加权黑猩猩优化算法（WChOA）附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，matlab项目合作可私信。🍎个人主页：Matlab科研工作室🍊个人信条：格物致知。更多Matlab仿真内容点击👇…

人工智能 2023年6月26日
0080
【案例】梯度下降求解逻辑回归

对比线性回归理解逻辑回归，主要包含回归函数，似然函数，梯度下降求解及代码实现线性回归 1.线性回归函数似然函数的定义：给定联合样本值 X下关于(未知)参数的函数似然函数：什么…

人工智能 2023年6月17日
0086
入侵检测领域数据集总结

本文数据引用自以下文献： Yang, Zhen, et al. “A systematic literature review of methods and datas…

人工智能 2023年7月3日
0064
【Pandas】Pandas基础

需要使用的数据数据learn_pandas Pandas基础 Pandas基础 * 文件的读取和写入基本数据结构 – Series DataFrame 基本常用函数 …

人工智能 2023年7月17日
0089
transformer中QKV的通俗理解(渣男与备胎的故事)

transformer中QKV的通俗理解(渣男与备胎的故事) 用vit的时候读了一下transformer的思想,前几天面试结束之后发现对QKV又有点忘记了, 写一篇文章来记录一下…

人工智能 2023年7月26日
00155
xgboost自定义损失函数&评估函数

xgb.train()中的两个参数：obj => 自定义目标/损失函数，模型优化的目标，用来衡量真实值与模型预测值之间的差距feval => 自定义评估函数，评价函数用…

人工智能 2023年6月19日
00108
OpenART mini使用教程

前言 OpenART mini 是我们在 NXP 的 OpenART 套件的基础上，去除非视觉部分而制作出来的迷你版。虽说只是迷你版，但”麻雀虽小，五脏俱全&#8221…

人工智能 2023年7月28日
00181
不知如何选股？不知哪种指标策略可靠？量化分析比较DMA、DMI、MACD、KDJ、BOLL指标策略收益情况

前言从股票市场开始到现在，已经研究出了众多的指标，但是在使用的时候会发现，由于第二天股价的未知波动，指标显示的情况并不一定每次都准确，总是会存在误判的情况。对于这种不可避免的情况…

人工智能 2023年7月7日
0080
Multi-modal Knowledge Graphs for Recommender Systems论文解读

美团2020年发表的《Multi-modal Knowledge Graphs for Recommender Systems》 https://zheng-kai.com/pap…

人工智能 2023年6月10日
0080
009-独立按键与矩阵按键

一、独立按键原理图：基本原理：按下为后，P3^1低电平。松开为高电平。实验一：实现按动一下独立按键1，LED模块第一个灯的状态变化一次 #include<reg52.h…

人工智能 2023年6月6日
0094
有了这个Python程序后，干完饭不用再花时间算账了

大家好，我是翔宇！今天带大家实现一个算账自动化，由于疫情，公司员工吃饭等着食堂送到工位，然后由我来帮大家订餐，每个周五由我来算账，再收大家的饭钱。文章目录 * – +…

人工智能 2023年7月9日
00104
scMRA:一种健壮的深度学习方法，可以用多个参考数据集注释scRNA-seq数据

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、前言二、材料和方法三、结果四、讨论文章地址：https://academic.oup….

人工智能 2023年7月17日
0054
pygame外星人入侵

✅作者简介：大家好我是hacker707,大家可以叫我hacker，新星计划第三季python赛道Top1🥇🥇🥇📃个人主页：hacker707的csdn博客🔥系列专栏：python…

人工智能 2023年7月6日
0055
【C++模板编程入门】模板介绍、模板定义、函数模板、类模板、模板的继承

1、模块的引入 1.1、示例代码 #include #include using namespace std; template <typename T> T add(…

人工智能 2023年6月26日
0070

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31