在Logistic回归中，sigmoid函数被用来将线性模型的输出转换为一个概率值，使其落在0到1的范围内

2024年1月6日上午3:21 • 人工智能 • 阅读 40

问题背景

在机器学习中，Logistic回归是一种常用的分类算法。它通过将线性模型的输出转换为一个概率值，从而将数据分为不同的类别。在Logistic回归中，sigmoid函数被用来实现这种转换，使得模型的输出概率落在0到1的范围内。

详细介绍

Logistic回归是一种监督学习算法，适用于二分类问题。它的基本原理是通过拟合一个线性模型，将输入特征与输出类别之间的关系建模。然后通过sigmoid函数将线性模型的输出转换为一个概率值。

算法原理

Logistic回归模型的输出可以表示为:

$$z = w_0 + w_1x_1 + w_2x_2 + … + w_nx_n$$

其中，$z$表示线性模型的输出，$w_0, w_1, …, w_n$是模型的参数，$x_1, x_2, …, x_n$是输入的特征。

为了将线性模型的输出转换为一个概率值，Logistic回归使用了sigmoid函数，其公式为：

$$h(z) = \frac{1}{1 + e^{-z}}$$

sigmoid函数将任意实数映射到0到1的区间，具有以下特点：
– 当$z$接近正无穷大时，$h(z)$趋近于1
– 当$z$接近负无穷大时，$h(z)$趋近于0
– 当$z$等于0时，$h(z)$等于0.5

根据sigmoid函数的特点，我们可以将Logistic回归的输出解释为条件概率。例如，对于二分类问题，$h(z)$表示预测为正类的概率。

公式推导

为了推导Logistic回归的参数估计方法，我们使用极大似然估计。假设训练集包含$m$个样本，每个样本的特征表示为$x^{(i)}$，对应的类别表示为$y^{(i)}$，其中$i=1,2,…,m$。我们的目标是找到最优的参数$w$，使得模型的预测结果与实际类别尽可能接近。

为了实现这个目标，我们首先需要定义似然函数。假设样本的类别是独立同分布的，并且服从伯努利分布，我们可以定义似然函数为：

$$L(w) = \prod_{i=1}^m (h(w^Tx^{(i)}))^{y^{(i)}} (1-h(w^Tx^{(i)}))^{1-y^{(i)}}$$

我们的目标是最大化似然函数，等价于最小化对数似然函数：

$$l(w) = \sum_{i=1}^m y^{(i)} log(h(w^Tx^{(i)})) + (1-y^{(i)})log(1-h(w^Tx^{(i)}))$$

为了寻找最优参数，我们需要求解对数似然函数的最优化问题。常用的方法是梯度下降法。梯度下降法通过迭代更新参数，使得每次迭代的损失函数逐渐减小。

计算步骤

初始化参数$w$为0或随机值
按照以下步骤迭代更新参数：
计算预测结果：$h(x) = \frac{1}{1 + e^{-w^Tx}}$
计算梯度：$grad = \frac{1}{m} X^T(h(x)-y)$
更新参数：$w = w – \alpha \cdot grad$（$\alpha$为学习率）
重复步骤2，直到达到停止条件（例如达到最大迭代次数或损失函数收敛）

复杂Python代码示例

下面是一个使用Python实现Logistic回归算法的示例代码，使用了sklearn库提供的鸢尾花数据集进行训练和预测。

import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

class LogisticRegression:
 def __init__(self, learning_rate=0.01, num_iterations=1000):
 self.learning_rate = learning_rate
 self.num_iterations = num_iterations

 def sigmoid(self, z):
 return 1 / (1 + np.exp(-z))

 def fit(self, X, y):
 # 数据预处理
 scaler = StandardScaler()
 X = scaler.fit_transform(X)
 X = np.hstack((np.ones((X.shape[0], 1)), X)) # 添加偏置项
 self.theta = np.zeros(X.shape[1])

 for _ in range(self.num_iterations):
 z = np.dot(X, self.theta)
 h = self.sigmoid(z)
 gradient = np.dot(X.T, (h - y)) / y.size
 self.theta -= self.learning_rate artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls gradient

 def predict_proba(self, X):
 X = (X - self.scaler.mean_) / self.scaler.scale_ # 数据预处理
 X = np.hstack((np.ones((X.shape[0], 1)), X)) # 添加偏置项
 return self.sigmoid(np.dot(X, self.theta))

 def predict(self, X, threshold=0.5):
 proba = self.predict_proba(X)
 return (proba >= threshold).astype(int)

# 载入数据集
iris = load_iris()
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=42)

# 训练模型
model = LogisticRegression()
model.fit(X_train, y_train)

# 预测
y_pred = model.predict(X_test)
y_pred_proba = model.predict_proba(X_test)

# 输出预测结果
print("预测类别：", y_pred)
print("预测概率：", y_pred_proba)

代码细节解释

LogisticRegression类是一个自定义的Logistic回归模型。
在fit函数中，我们首先对特征进行标准化处理，然后为特征矩阵添加了一列全为1的列向量，用于表示偏置项的影响。
sigmoid函数用于将线性模型的输出转换为概率值。
在训练过程中，我们使用梯度下降法更新参数。梯度的计算使用了矩阵乘法和矩阵转置。
predict_proba函数用于预测样本属于正类的概率。
predict函数用于预测样本的类别，通过设置阈值来进行二分类。
使用sklearn库提供的鸢尾花数据集进行训练和预测。

通过运行这段代码，我们可以得到Logistic回归模型的预测结果，并输出预测类别和概率。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/824175/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

WangDeLiangReview2018 – (5.1&5.2)语音增强&语音增强的泛化

【WangDeLiangOverview2018】 Supervised Speech Separation Based on Deep Learning: An Overview…

人工智能 2023年5月25日
0084
python numpy库中修改某行某列（可多行多列）附加条件的方法

import numpy as np a=np.arange(1,13,1) a=np.reshape(a,(3,4)）输出 [[ 1 2 3 4][ 5 6 7 8][ 9 1…

人工智能 2023年7月16日
0056
举例说明银行如何做反欺诈

金融交易面对严峻的欺诈环境，目前仍有三大急需解决的问题。一是欺诈风险监控需要更丰富的基础数据，二是欺诈风险监控需要更精准的模型方法，三是欺诈风险监控需要更及时的干预措施。面对上述挑…

人工智能 2023年7月17日
0056
安装CPU版本的pytorch

题外话：有些同学的笔记本电脑可能没有显卡或者显卡不太好，建议安装CPU版本的pytorch。这类同学如果实在需要使用GPU加速训练过程，建议使用在线GPU。打开Anaconda P…

人工智能 2023年7月21日
0048
人工智能应用开发流程的权衡

人工智能应用开发过程的挑战很多,主要表现在三个方面:①开发流程复杂冗长;②算法技能要求高,需要应用开发者熟悉算法;③应用维护很频繁,可能超过传统软件应用。因此,考虑到这些挑战,往往…

人工智能 2023年6月5日
0073
【Python Pandas】关于DataFrame行转列，转字典的尝试与记录（有代码和结果展示）

想要实现的数据处理是画出如下表格中，每个城市中的不同店铺随时间变化的支出曲线。 ; 数据预处理首先进行所有操作之前要进行数据预处理，对于城市和店铺这两列来说，它们只要不为空即可，…

人工智能 2023年7月16日
0061
2021中国高校大数据挑战赛A题复盘+解题思路

引言由于个人安排的原因，没有时间参加微信大数据挑战赛，倒是参加了2021年中国高校大数据挑战赛。这次比赛做的是中国电信提供数据集的A题，是一个异常检测的题目，一个人做的本科组二等…

人工智能 2023年7月18日
0070
python数据处理总结

1.numpy 2.pandas Series： s=pd.Series(np.arange(3)) 输出： 0 0 1 1 2 2 dtype: int32 替换索引列： s=p…

人工智能 2023年7月8日
0053
Pandas的DataFrame数据类型

纵轴表示不同索引axis=0,横轴表示不同列axis=1 DataFrame类型创建 1.从二维ndarray对象创建 1 import pandas as pd 2 3 impo…

人工智能 2023年6月2日
00113
Matlab代码提示“svmtrain已删除请改用fitcsvm”，以及svmpredict没有返回结果label和精度accuracy的解决办法

Matlab在运行SVM相关函数时，如果显示”svmtrain已删除请改用fitcsvm”，则表示高版本的Matlab已经采用fitcsvm函数替代了旧版…

人工智能 2023年5月28日
0098
pyspark dataframe 常用操作

spark dataframe派生于RDD类，但…

人工智能 2023年6月2日
00109
halcon图像处理之基于深度学习的分类

halcon提供了基于它自…

人工智能 2023年7月1日
0079
离散型prompt模板构建【转载以学习、回忆】

在看产品观点提取比赛前几名方案有一个用到了P-tuning，这种方法实现了模板的自动构建。但是又查发现prompt构建有连续型又有离散型。因此寻文一篇查看离散型的构建。来源：…

人工智能 2023年6月4日
00104
基于opencv实现透视变换（Python）

透视变换文章目录 * – 透视变换 – + 1、导入opencv等相关库，并封装一个显示图像的函数，方便后面显示图像 + 2、读取图片 + 3、设置输出图…

人工智能 2023年6月19日
0077
Pandas查询数据的几种方式

一、Pandas查询数据的几种方法 1.df.loc方法，根据行、列的标签值查询 2.df.iloc方法，根据行、列的数字位置查询 3.df.where方法， 4.df.query…

人工智能 2023年7月7日
00124
三分钟解决session not created: This version of ChromeDriver only supports Chrome version问题

三分钟解决session not created: This version of ChromeDriver only supports Chrome version问题 1. 第…

人工智能 2023年7月5日
0080

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31