Logistic回归可用于二元分类问题和多元分类问题，二元分类中只有两个类别，而多元分类有三个或更多个类别

2024年1月6日上午4:06 • 人工智能 • 阅读 51

介绍

Logistic回归是一种常用的分类算法，用于解决二元分类和多元分类问题。在二元分类问题中，只有两个类别；而在多元分类问题中，有三个或更多个类别。Logistic回归通过将线性回归模型的输出通过一个sigmoid函数进行映射，从而将线性回归的输出转化为对应类别的概率。

算法原理

Logistic回归建立在线性回归模型的基础上，其输出经过一个sigmoid函数进行非线性映射，将结果限制在0和1之间。sigmoid函数在Logistic回归中被称为Logit函数，其形式为:
$$
\sigma(z) = \frac{1}{1 + e^{-z}}
$$
其中，$z$为线性回归模型的输出，可以看作对应类别的得分或概率。

Logistic回归假设输入特征和输出类别之间存在一种概率关系。若记输入特征为$x$，输出类别为$y$，则Logistic回归模型可以表示为:
$$
P(y=1|x) = \sigma(\theta^T x)
$$
其中，$\theta$为模型参数。

公式推导

假设训练数据集中有$m$个样本，特征维度为$n$，则记输入特征数据为$X$，输出类别为$Y$。对于二元分类问题，只有两个类别，可用0和1来表示。对于多元分类问题，将输出类别用独热编码进行表示。

对于Logistic回归，我们的目标是求解最优的模型参数$\theta$，使得给定输入特征下的模型预测概率与实际输出类别之间的差距最小化。为此，我们可以采用最大似然估计方法来推导损失函数。

对于二元分类问题，我们可以使用伯努利分布来建模输出的概率分布。我们假设每个样本的输出类别服从独立且相同的伯努利分布，其概率质量函数为:
$$
P(y|x) = P(y=1|x)^y \cdot (1 – P(y=1|x))^{(1-y)}
$$
其中，$P(y=1|x)$表示模型预测样本为类别1的概率。

对于多元分类问题，我们可以使用多项式分布来建模输出的概率分布。我们假设每个样本的输出类别服从独立且相同的多项式分布，其概率质量函数为:
$$
P(y|x) = \prod_{i=1}^{K} P(y=i|x)^{y_i}
$$
其中，$K$为类别的个数，$P(y=i|x)$表示模型预测样本为类别$i$的概率。

由于多项式分布中的各个类别的概率和为1，我们可以使用Softmax函数进行归一化，得到概率的输出结果。

最大似然估计的目标是最大化给定数据集的似然函数，即最大化所有样本的输出概率:
$$
L(\theta) = \prod_{i=1}^{m} P(y^{(i)}|x^{(i)})
$$
为了方便计算，我们可以取对数似然函数:
$$
l(\theta) = \log L(\theta) = \sum_{i=1}^{m}\log P(y^{(i)}|x^{(i)})
$$
最大化对数似然函数等价于最小化损失函数:
$$
J(\theta) = -\sum_{i=1}^{m}\log P(y^{(i)}|x^{(i)})
$$

对于二元分类问题，代入伯努利分布的概率质量函数并取负号，我们可以得到二元交叉熵损失函数:
$$
J(\theta) = -\sum_{i=1}^{m} [y^{(i)}\log P(y=1|x^{(i)}) + (1-y^{(i)})\log (1 – P(y=1|x^{(i)}))]
$$

对于多元分类问题，代入多项式分布的概率质量函数并取负号，我们可以得到多元交叉熵损失函数:
$$
J(\theta) = -\sum_{i=1}^{m} \sum_{k=1}^{K} y_k^{(i)} \log P(y=k|x^{(i)})
$$

通常情况下，我们采用梯度下降等优化算法来最小化损失函数。

计算步骤

初始化模型参数$\theta$。
根据给定的训练数据集，计算模型的输出概率$P(y|x)$。
使用损失函数计算模型的损失$J(\theta)$。
使用梯度下降等优化算法根据损失函数求解模型参数$\theta$。
重复步骤2-4，直到模型收敛或达到一定的迭代次数。

Python代码示例

下面是一个使用Logistic回归进行二元分类的Python代码示例，使用了Scikit-learn库中的鸢尾花数据集：

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.linear_model import LogisticRegression

# 加载鸢尾花数据集
iris = load_iris()
X = iris.data[:, :2]
y = iris.target

# 使用Logistic回归进行二元分类
logreg = LogisticRegression(C=1e5, solver='lbfgs', multi_class='multinomial')
logreg.fit(X, y)

# 生成绘图所需的网格数据
h = .02
x_min, x_max = X[:, 0].min() - .5, X[:, 0].max() + .5
y_min, y_max = X[:, 1].min() - .5, X[:, 1].max() + .5
xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))

# 绘制决策边界
Z = logreg.predict(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)
plt.figure(1, figsize=(6, 4))
plt.pcolormesh(xx, yy, Z, cmap=plt.cm.Paired)

# 绘制训练数据集的散点图
plt.scatter(X[:, 0], X[:, 1], c=y, edgecolors='k', cmap=plt.cm.Paired)
plt.xlabel('Sepal length')
plt.ylabel('Sepal width')

plt.xlim(xx.min(), xx.max())
plt.ylim(yy.min(), yy.max())
plt.xticks(())
plt.yticks(())

plt.show()

这段代码首先加载鸢尾花数据集，并取前两个特征作为输入特征X，取目标类别作为输出类别y。然后，通过LogisticRegression类进行模型训练。最后，利用网格数据和模型进行决策边界的绘制。

代码细节解释

上述代码中使用了LogisticRegression类来实现Logistic回归。在类的初始化过程中，我们可以设置不同的参数，例如正则化力度C、优化算法solver以及多类问题的处理方式multi_class。

在模型训练过程中，我们使用训练数据集X和y调用fit方法，该方法将自动进行模型训练。

绘制决策边界的过程中，我们首先生成一组网格数据，再使用模型对每个网格点进行预测，得到对应的类别，最后将网格数据和类别结果绘制在图像上。

最后，显示绘制的图像并展示出来。

以上是Logistic回归用于二元分类问题的详细解决方案，涵盖了算法原理、公式推导、计算步骤、Python代码示例以及代码细节解释。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/824183/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Hyperledger Fabric无排序组织以Raft协议启动多个Orderer服务、TLS组织运行维护Orderer服务

前言在实验Hyperledger Fabric无排序组织以Raft协议启动多个Orderer服务、多组织共同运行维护Orderer服务中，我们已经完成了让普通组织运行维护 Ord…

人工智能 2023年6月4日
00100
因子分析原理及结果解析

因子分析原理及结果解析因子分析的起源： 1904年英国的一个心理学家发现学生的英语、法语和古典语成绩非常有相关性，他认为这三门课程背后有一个共同的因素驱动，最后将这个因素定义为&…

人工智能 2023年6月19日
0058
Flink教程（01）- Flink知识图谱

文章目录 01 引言 02 Flink 知识结构 * 2.1 Flink介绍 2.2 环境准备 2.3 Flink编程模型 2.4 DataStream API 2.5 Flink…

人工智能 2023年6月1日
0097
YOLOX改进之损失函数修改（上）

文章内容：如何在YOLOX官网代码中修改– 置信度预测损失环境：pytorch1.8 损失函数修改内容：（1）置信度预测损失更换：二元交叉熵损失替换为 FocalLoss或者 …

人工智能 2023年6月17日
00142
深度学习安装笔记（二）显卡、显卡驱动、CUDA 的关系以及显卡驱动升级

显卡、显卡驱动、CUDA 的关系以及显卡驱动升级介绍如何查看他们的信息 * 显卡显卡驱动 CUDA 显卡驱动与CUDA对应表比较重要但是很少人说显卡驱动升级通过配置各…

人工智能 2023年6月16日
00108
python数据类型之pandas—DataFrame

DataFrame定义： DataFrame是pandas的两个主要数据结构之一，另一个是Series —一个表格型的数据结构 —含有一组有序的列 —大致可看成共享同一个index…

人工智能 2023年6月2日
0067
机器学习之决策树CART算法

接上期：文章目录一、理论知识 * 1.0、特征选择：基尼指数 1.1、决策树的生成 1.2、CART剪枝二、python实战一、理论知识 CART算法是给定输入随机变量X条…

人工智能 2023年6月15日
0083
机器学习-fp16表示

内容简介《你必须知道的495个C语言问题》以问答的形式组织内容，讨论了学习或使用C语言的过程中经常遇到的一些问题。书中列出了C用户经常问的400多个经典问题，涵盖了初始化、数组、…

人工智能 2023年6月15日
0085
【GNN报告】北京大学张牧涵：谱图神经网络有多强大？

目录 1、简介 2、谱图神经网络有多强大？背景核心模块JacobiConv 实验结论 3、小结 4、参考 1、简介报告嘉宾：张牧涵（北京大学）报告题目：谱图神经网络有多强…

人工智能 2023年7月13日
0081
基于yolov5的mjpg-streamer服务器搭建

前言：使用onnxruntime 加载YOLOV5的onnx模型，基于python版本的http.server搭建mjpg-streamer服务器，使用opencv打开电脑摄像头或…

人工智能 2023年7月20日
0050
学生HTML个人网页作业作品下载动漫主题网页设计制作大学生个人网站作业模板 dreamweaver简单个人网页制作

HTML实例网页代码, 本实例适合于初学HTML的同学。该实例里面有设置了css的样式设置，有div的样式格局，这个实例比较全面，有助于同学的学习,本文将介绍如何通过从头开始设计个…

人工智能 2023年6月29日
00101
WGAN-GP：更容易训练的GAN

WGAN-GP又称为具有梯度惩罚的WGAN，一般可以替代WGAN 实际训练中，GAN存在训练困难、生成器和判别器的loss无法指示训练过程、生成样本缺乏多样性等问题。这与GAN的机…

人工智能 2023年6月15日
0086
OpenCV OAK相机经典使用案例集锦（持续更新中）

消息快播：OpenCV众筹了一款ROS2机器人rae，开源、功能强、上手简单。来瞅瞅~ 编辑：OAK中国来源：oakchina.cn版权说明：转载请注明出处前言 Hello，大家…

人工智能 2023年5月28日
00125
Ubuntu18.04/20.04复现算法RandLa-net 数据集S3DIS

原本打算先复现Pointnet++的，现在RandLa-net的性能吊打Pointnet++，先复现这个吧，Pointnet++以后再做。在大场景三维点云语义分割算法RandLA…

人工智能 2023年7月28日
0059
应用于图像的自注意力机制（SENet、CBAM、ECA）+yolo浅析（CSPDarknet53）+ViT

应用于图像的注意力机制自注意力机制应用于图像主要结合CNN或transformer实现相关任务，如图像分割、识别和定位等。自注意力可以分为对通道的或对空间的自注意力，或者两者的结…

人工智能 2023年7月27日
0049
拉普拉斯矩阵（Laplacian matrix）

文章目录 * – + 简单介绍 + 为什么在图中会用到Laplacian matrix + 两种形式 + * 1. 标准拉普拉斯矩阵 * 2. 归一化的拉普拉斯矩阵(S…

人工智能 2023年7月13日
00228

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31