机器学习——对数几率回归模型及python代码实现

2023年6月16日下午8:14 • 人工智能 • 阅读 68

《机器学习：公式推导与代码实践》鲁伟著读书笔记。上一章介绍了线性回归的数学推导过程以及python实现，可以知道线性回归模型就是对数据进行线性拟合或者说是回归，然后采用训练好的模型对未来数据进行预测。那能否运用线性模型对一些数据进行分类呢，这就需要运用对数几率回归模型（logistics regression，LR）这种线性分类模型。

对数几率回归的数学原理

在对数几率回归中，我们需要将线性回归模型的预测值转化为0/1值，而不是去逼近真实标签y y y。而取值范围为（0，1），单调可微的Sigmoid函数便是对数几率回归的不二之选。Sigmoid函数的表达式为：y = 1 1 + e − z y=\frac{1}{1+e^{-z}}y =1 +e −z 1 。特别的是，Sigmoid函数的导数是可以由其自身来表达的：f ′ ( x ) = f ( x ) ( 1 − f ( x ) ) f^{\prime}(x)=f(x)(1-f(x))f ′(x )=f (x )(1 −f (x ))。
我们知道了对数几率回归模型的重要函数了，下一步便将线性回归模型带入Sigmoid函数中，进行基本数学理论的推导。大致分为以下几步：

定义线性回归模型
我们采用上一节所讲的线性回归模型，令线性回归模型的公式为：y = X ω + b y=X\omega+b y =X ω+b。
通过Sigmoid激活函数
y = 1 1 + e − ( X ω + b ) y=\frac{1}{1+e^{-(X\omega+b)}}y =1 +e −(X ω+b )1
化简后两边同时取对数y + y e − ( X ω + b ) = 1 y+ye^{-(X\omega+b)}=1 y +y e −(X ω+b )=1 1 − y y = e − ( X ω + b ) \frac{1-y}{y} =e^{-(X\omega+b)}y 1 −y =e −(X ω+b )l n 1 − y y = − ( X ω + b ) ln\frac{1-y}{y}=-(X\omega+b)l n y 1 −y =−(X ω+b )l n y 1 − y = X ω + b ln\frac{y}{1-y}=X\omega+b l n 1 −y y =X ω+b上式便为对数几率回归的模型公式，可以将y y y视作样本X X X作为正例的概率，将1 − y 1-y 1 −y视作样本X X X作为反例的概率。所以y 1 − y \frac{y}{1-y}1 −y y 可以称之为”几率”，对几率求对数得到对数几率。
确定ω \omega ω和b b b的梯度
将y y y视为后验概率（先验分布：根据一般的经验认为随机变量应该满足的分布；后验分布：通过当前训练数据修正的随机变量的分布，比先验分布更符合当前数据）估计p ( y = 1 ∣ x ) p(y=1|x)p (y =1 ∣x )，则对数几率回归模型的公式可化简为：
l n p ( y = 1 ∣ x ) p ( y = 0 ∣ x ) = X ω + b ln\frac{p(y=1|x)}{p(y=0|x)}=X\omega+b l n p (y =0 ∣x )p (y =1 ∣x )=X ω+b
展开上式可得
p ( y = 1 ∣ x ) = 1 1 + e − ( X ω + b ) = y ^ p(y=1|x)=\frac{1}{1+e^{-(X\omega+b)}}=\hat {y}p (y =1 ∣x )=1 +e −(X ω+b )1 =y ^p ( y = 0 ∣ x ) = e − ( X ω + b ) 1 + e − ( X ω + b ) = 1 − y ^ p(y=0|x)=\frac{e^{-(X\omega+b)}}{1+e^{-(X\omega+b)}}=1-\hat {y}p (y =0 ∣x )=1 +e −(X ω+b )e −(X ω+b )=1 −y ^综合得：p ( y ∣ x ) = y ^ y + ( 1 − y ^ ) 1 − y p(y|x)=\hat {y}^{y}+(1-\hat {y})^{1-y}p (y ∣x )=y ^y +(1 −y ^)1 −y两边取对数得：l n p ( y ∣ x ) = y l n y ^ + ( 1 − y ) l n ( 1 − y ^ ) lnp(y|x)=yln\hat {y}+(1-y)ln(1-\hat {y})l n p (y ∣x )=y l n y ^+(1 −y )l n (1 −y ^)这就是最经典的 交叉熵损失函数。
令L = l n p ( y ∣ x ) L=lnp(y|x)L =l n p (y ∣x )并对ω \omega ω和b b b求偏导
L = y l n ( 1 1 + e − ( X ω + b ) ) + ( 1 − y ) l n ( e − ( X ω + b ) 1 + e − ( X ω + b ) ) L=yln(\frac{1}{1+e^{-(X\omega+b)}})+(1-y)ln(\frac{e^{-(X\omega+b)}}{1+e^{-(X\omega+b)}})L =y l n (1 +e −(X ω+b )1 )+(1 −y )l n (1 +e −(X ω+b )e −(X ω+b ))L = y ( − l n ( 1 + e − ( X ω + b ) ) ) + ( 1 − y ) [ − ( X ω + b ) − l n ( 1 + e − ( X ω + b ) ) ] L=y(-ln(1+e^{-(X\omega+b)}))+(1-y)[-(X\omega+b)-ln(1+e^{-(X\omega+b)})]L =y (−l n (1 +e −(X ω+b )))+(1 −y )[−(X ω+b )−l n (1 +e −(X ω+b ))]L = − y l n ( 1 + e − ( X ω + b ) ) − ( X ω + b ) − l n ( 1 + e − ( X ω + b ) ) + y ( X ω + b ) + y l n ( 1 + e − ( X ω + b ) ) L=-yln(1+e^{-(X\omega+b)})-(X\omega+b)-ln(1+e^{-(X\omega+b)})+y(X\omega+b)+yln(1+e^{-(X\omega+b)})L =−y l n (1 +e −(X ω+b ))−(X ω+b )−l n (1 +e −(X ω+b ))+y (X ω+b )+y l n (1 +e −(X ω+b ))L = − ( X ω + b ) − l n ( 1 + e − ( X ω + b ) ) + y ( X ω + b ) L=-(X\omega+b)-ln(1+e^{-(X\omega+b)})+y(X\omega+b)L =−(X ω+b )−l n (1 +e −(X ω+b ))+y (X ω+b )∂ L ∂ ω = ∂ − ( X ω + b ) ∂ ω + ∂ − l n ( 1 + e − ( X ω + b ) ) ∂ ω + ∂ y ( X ω + b ) ∂ ω \frac{\partial L}{\partial {\omega}}=\frac{\partial -(X\omega+b)}{\partial {\omega}}+\frac{\partial -ln(1+e^{-(X\omega+b)})}{\partial {\omega}}+\frac{\partial y(X\omega+b)}{\partial {\omega}}∂ω∂L =∂ω∂−(X ω+b )+∂ω∂−l n (1 +e −(X ω+b ))+∂ω∂y (X ω+b )∂ L ∂ ω = − X T + X T 1 1 + e − ( X ω + b ) e − ( X ω + b ) + X T y \frac{\partial L}{\partial {\omega}}=-X^{T}+X^{T}\frac{1}{1+e^{-(X\omega+b)}}e^{-(X\omega+b)}+X^{T}y ∂ω∂L =−X T +X T 1 +e −(X ω+b )1 e −(X ω+b )+X T y ∂ L ∂ ω = − X T + X T ( 1 − y ^ ) + X T y \frac{\partial L}{\partial {\omega}}=-X^{T}+X^{T}(1-\hat {y})+X^{T}y ∂ω∂L =−X T +X T (1 −y ^)+X T y ∂ L ∂ ω = X T ( y − y ^ ) \frac{\partial L}{\partial {\omega}}=X^{T}(y-\hat {y})∂ω∂L =X T (y −y ^)∂ L ∂ b = ∂ − ( X ω + b ) ∂ b + ∂ − l n ( 1 + e − ( X ω + b ) ) ∂ b + ∂ y ( X ω + b ) ∂ b \frac{\partial L}{\partial {b}}=\frac{\partial -(X\omega+b)}{\partial {b}}+\frac{\partial -ln(1+e^{-(X\omega+b)})}{\partial {b}}+\frac{\partial y(X\omega+b)}{\partial {b}}∂b ∂L =∂b ∂−(X ω+b )+∂b ∂−l n (1 +e −(X ω+b ))+∂b ∂y (X ω+b )∂ L ∂ b = − 1 + 1 1 + e − ( X ω + b ) e − ( X ω + b ) + y \frac{\partial L}{\partial {b}}=-1+\frac{1}{1+e^{-(X\omega+b)}}e^{-(X\omega+b)}+y ∂b ∂L =−1 +1 +e −(X ω+b )1 e −(X ω+b )+y ∂ L ∂ b = − 1 + ( 1 − y ^ ) + y \frac{\partial L}{\partial {b}}=-1+(1-\hat {y})+y ∂b ∂L =−1 +(1 −y ^)+y ∂ L ∂ b = y − y ^ \frac{\partial L}{\partial {b}}=y-\hat {y}∂b ∂L =y −y ^
综上所述，对数几率回归算法的参数更新公式为：∂ L ∂ ω = X T ( y − y ^ ) \frac{\partial L}{\partial {\omega}}=X^{T}(y-\hat {y})∂ω∂L =X T (y −y ^)；∂ L ∂ b = y − y ^ \frac{\partial L}{\partial {b}}=y-\hat {y}∂b ∂L =y −y ^。

对数几率回归的NumPy手撕代码

对数几率回归模型的算法思路是建立在线性回归算法之上的，具体过程如下。

初始化与定义Sigmoid函数

def init_params(train_dim)：
    w = np.zeros((train_dim,1))
    b = 0
    return w,b
def sigmoid(x):
    z=1/(1+np.exp(-x))
    return z

定义对数几率回归模型主体

def logistics(X,y,w,b):
    num_train = X.shape[0]
    num_feature = X.shape[1]
    y_hat = sigmoid（np.dot(X,w) + b）
    loss = -1/num_train * np.sum(y*np.log(y_hat)+(1-y)*np.log(1-y_hat))
    dw = np.dot(X.T,(y_hat-y))/num_train
    db = np.sum((y_hat-y))/num_train
    loss = np.squeeze(loss)
    return y_hat, loss, dw, db

定义训练过程

def train(X, y, learning_rate=0.01, epochs=10000):
    '''
    输入：
    X：输入数据
    y：输出标签
    learning_rate：学习率
    epochs：迭代次数
    输出：
    loss_his：每一代的误差
    params：参数字典
    grads：优化后的梯度
    '''
    loss_his = []
    w, b = init_params(X.shape[1])
    for i in range(epochs):
        y_hat, loss, dw, db = logistics(X, y, w, b)
        w += -learning_rate*dw
        b += -learning_rate*db
        loss_his.append(loss)
    params = {'w':w, 'b':b}
    grads = {'dw':dw,'db':db}
    return loss_his, params, grads

定义预测函数

def predict(X, params):
    '''
    输入：
    X：测试数据集
    params：模型训练参数
    输出：
    y_pre：预测值
    '''
    w = params['w']
    b = params['b']
    y_pre = sigmoid(np.dot(X, w) + b)
    for i in range(len(y_pre)):
        if y_pre[i]>0.5:
            y_pre[i]=1
        else:
            y_pre[i]=0
    return y_pre

下一个章节进一步讲解另外一种分类方法，线性判别分析法。

Original: https://blog.csdn.net/qq_43045620/article/details/123117529
Author: Li Changwu
Title: 机器学习——对数几率回归模型及python代码实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/626398/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

目标检测中的BBox 回归损失函数-L2，smooth L1，IoU，GIoU，DIoU，CIoU，Focal-EIoU，Alpha-IoU，SIoU

目标检测的两个任务，分类和位置回归，本帖将经典的位置回归损失函数总结如下，按发表时间顺序。 L1、L2、smooth L1 loss 提出smooth L1 loss的论文： L1…

人工智能 2023年6月17日
00116
Python中py2neo库的基本使用方法

因为需要将处理好的csv文件用neo4j存储，因此想到使用python将数据导入neo4j，就需要用到py2neo库。安装py2neo库： pip install py2neo …

人工智能 2023年6月1日
0095
1.6 回归评估准确性的指标

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月18日
0088
Yolov5添加注意力机制

一、在backbone后面引入注意力机制 1、先把注意力结构代码放到common.py文件中，以SE举例，将这段代码粘贴到common.py文件中 2、找到yolo.py文件里的p…

人工智能 2023年7月25日
0080
机器学习实战-第二章-k-近邻算法

时间：2021.11.02 下午 14：22开始记将文件转换为矩阵格式的代码： def file2Matrix(filename):fr = open(filename)arra…

人工智能 2023年7月2日
0048
Mybatis-动态 SQL详解

1 查询model序列化 1.1、建库建表创建一个db:javacode2018 4张表:t_user(用户表) t_goods(商品表) t_order(订单表) t_orde…

人工智能 2023年6月27日
0072
五、卷积神经网络CNN3（2D与3D卷积、池化）

2D卷积 2D 卷积操作如图 1 所示，为了解释的更清楚，分别展示了单通道和多通道的操作。且为了画图方便，假定只有 1 个 filter，即输出图像只有一个 chanel。其中，…

人工智能 2023年7月13日
0039
超详细！手把手带你轻松用 MMSegmentation 跑语义分割数据集

在带你轻松掌握 MMSegmentation 整体构建流程一文中，我们带大家认识了 MMSegmentation 的整体框架，分享了 MMSegmentation 中已经复现的主流…

人工智能 2023年6月16日
00167
常用激活函数(relu,glu,gelu,swish等)

激活函数的主要作用是提供网络的非线性建模能力。本文简要介绍一些常用的激活函数。 torch.nn.Sigmoidf ( x ) = 1 1 + e − x f(x) = \frac…

人工智能 2023年6月17日
0074
目标检测中边框回归的直观理解 bbox regression

目录 1 摘要 2 算法要解决的问题 3 从结果推原因，算法的实现思路 3.1 最直接的实现 3.2 合理性讨论 4 CNN的尺度不变性的影响 4.1 log函数的非线性问题 5 …

人工智能 2023年6月17日
0062
点云语义分割:使用RandLA-Net训练自己的数据集

记录了如何使用RandLANet实现Semantic3D数据集的语义分割，这里记录下如何使用RandLANet训练我们自己的数据集。声明:我的数据集是无人机获取的点云数据，与Se…

人工智能 2023年5月23日
0099
Python: pip安装Opencv包成功，但在Pycharm中无法使用

背景简述：版本python3.9.7 系统环境：windows10 针对问题：电脑中有多个用户（管理员加另一个），还有把python装到了D盘的系统文件夹（读写需要管理员权限的文…

人工智能 2023年7月19日
0063
CUDA error: device-side assert triggered

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月13日
0070
dataframe转化（二）之 apply(),transform(),agg() 的用法和区别

用法介绍 transform用法 pandas.Series.transform Call func on self producing a Series with transfo…

人工智能 2023年6月2日
0086
【python代码实现】人工神经网络分类算法及其实战案例（股票价格波动分析）

目录前置知识 * 1、前言 2、人工神经网络模型 – 2.1、神经元模型与单层神经网络 2.2、多层人工神经网络模型人工神经网络分类算法 * 1、构建数据集 2、响…

人工智能 2023年7月6日
0058
【研一小白论文精读】SwAV

Unsupervised Learning of Visual Features by Contrasting Cluster Assignments The main contr…

人工智能 2023年5月31日
0089

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

机器学习——对数几率回归模型及python代码实现

初始化与定义Sigmoid函数

定义对数几率回归模型主体

定义训练过程

定义预测函数

大家都在看