Logistic算法是一种用于解决分类问题的机器学习算法，它基于逻辑回归模型

2023年12月31日上午4:03 • 人工智能 • 阅读 43

问题背景

Logistic回归算法是一种常用的机器学习算法，用于解决分类问题。它基于逻辑回归模型，通过对数据进行拟合来预测输入样本的类别。本文将详细介绍Logistic回归算法的原理、公式推导、计算步骤和Python代码示例。

算法原理

Logistic回归基于逻辑回归模型，该模型假设特征与类别之间存在一个线性关系，并使用sigmoid函数将线性输出映射到[0,1]之间。

更具体地说，给定输入特征向量$x$，Logistic回归模型的线性输出$z$可以表示为:

$$z = w_0 + w_1x_1 + w_2x_2 + … + w_nx_n$$

其中，$w$是模型的权重向量，$n$是特征的数量。将线性输出$z$通过sigmoid函数进行映射，得到属于类别1的概率$y$:

$$y = \frac{1}{1 + e^{-z}}$$

公式推导

为了推导出Logistic回归的代价函数和梯度下降的更新规则，我们需要定义代价函数和假设函数。

假设函数$h_\theta(x)$表示给定参数$\theta$时，输入特征$x$属于类别1的概率。它通过将线性输出$z$通过sigmoid函数进行映射得到:

$$h_\theta(x) = \frac{1}{1 + e^{-\theta^Tx}}$$

为了得到参数$\theta$的最优值，我们需要定义一个代价函数$J(\theta)$来衡量模型预测的偏差。常用的代价函数是交叉熵损失函数(cross-entropy loss)。

给定训练集$D$，包含$m$个样本，每个样本有输入特征$x$和真实类别$y$。给定假设函数$h_\theta(x)$，交叉熵损失函数可以定义为:

$$J(\theta) = -\frac{1}{m}\sum_{i=1}^{m}[y^{(i)}log(h_\theta(x^{(i)})) + (1-y^{(i)})log(1 – h_\theta(x^{(i)}))]$$

通过最小化代价函数$J(\theta)$，我们可以找到最优参数$\theta$。梯度下降是一种常用的优化算法，用于更新参数$\theta$，以减小代价函数$J(\theta)$。

计算步骤

初始化参数$\theta$为零向量或随机值。
计算假设函数$h_\theta(x)$的预测值。
计算代价函数$J(\theta)$的值。
计算代价函数$J(\theta)$对参数$\theta$的偏导数。
使用梯度下降更新参数$\theta$。
重复步骤2-5，直到收敛或达到迭代次数。

复杂Python代码示例 – 手写数字识别

本示例使用scikit-learn库的手写数字数据集，展示了如何使用Logistic回归算法实现手写数字识别。

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# 加载手写数字数据集
digits = load_digits()

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(digits.data, digits.target, test_size=0.2, random_state=42)

# 特征归一化
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# 定义假设函数
def sigmoid(z):
 return 1 / (1 + np.exp(-z))

# 初始化参数
theta = np.zeros(X_train.shape[1])

# 定义代价函数
def cost_func(X, y, theta):
 m = len(y)
 h = sigmoid(np.dot(X, theta))
 cost = -np.sum(y artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls np.log(h) + (1 - y) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls np.log(1 - h)) / m
 return cost

# 定义梯度下降函数
def gradient_descent(X, y, theta, alpha, num_iters):
 m = len(y)
 costs = []
 for i in range(num_iters):
 h = sigmoid(np.dot(X, theta))
 grad = np.dot(X.T, (h - y)) / m
 theta -= alpha artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls grad
 cost = cost_func(X, y, theta)
 costs.append(cost)
 return theta, costs

# 运行梯度下降算法
num_iters = 1000
alpha = 0.01
theta, costs = gradient_descent(X_train, y_train, theta, alpha, num_iters)

# 绘制代价函数的学习曲线
plt.plot(range(1, len(costs) + 1), costs)
plt.xlabel('Iterations')
plt.ylabel('Cost')
plt.title('Cost Function - Learning Curve')
plt.show()

# 预测测试集
y_pred = sigmoid(np.dot(X_test, theta))
y_pred = np.where(y_pred >= 0.5, 1, 0)

# 计算准确率
accuracy = np.sum(y_pred == y_test) / len(y_test)
print("Test Accuracy: {:.2f}%".format(accuracy artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls 100))

代码细节解释

加载手写数字数据集，并划分为训练集和测试集。
对特征进行归一化，使用StandardScaler进行均值方差归一化处理。
定义sigmoid函数，用于将线性输出映射到[0,1]之间。
初始化参数$\theta$为零向量。
定义代价函数cost_func，计算交叉熵损失函数的值。
定义梯度下降函数gradient_descent，使用梯度下降算法更新参数$\theta$。
在指定的迭代次数内运行梯度下降算法，保存每次迭代的代价函数值。
绘制代价函数的学习曲线，观察模型的收敛情况。
预测测试集的类别，并计算准确率。

这就是Logistic回归算法的详细解决方案。通过科学地讲解算法原理和公式推导，以及使用复杂的Python代码示例，希望能帮助你理解该算法的工作原理和实际应用。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/821806/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

计算机视觉基础算法之噪声、滤波

作为CV初学者，日常记录一些学到的小知识一、噪声什么是噪声呢？图像噪声是图像在摄取或传输时所受的随机信号干扰，是图像中各种妨碍人们对其信息接受的因素。很多时候将图像噪声看成是…

人工智能 2023年6月18日
0089
【通信原理】确知信号的性质分析与研究

🚀个人主页：欢迎访问Ali.s的首页 ⏰ 最近更新：2022年8月24日 ⛽ Java框架学习系列：【Spring】【SpringMVC】【Mybatis】 🔥 Java项目实战系…

人工智能 2023年7月26日
0058
数据挖掘1——课后习题

数据挖掘1——课后习题部分习题 * 第一章：引论 – 1.3 1.4 1.5 第二章：认识数据 – 2.5 2.6 第三章：数据预处理 – 3…

人工智能 2023年6月19日
0085
将tensorflow 1.x & 2.x转化成onnx文件（以arcface-tf2人脸识别模型为例）

将tensorflow 1.x & 2.x转化成onnx文件文章目录 * – 将tensorflow 1.x & 2.x转化成onnx文件 &#821…

人工智能 2023年5月23日
00170
【youcans 的图像处理学习课】11. 形态学图像处理（中）

专栏地址：『youcans 的图像处理学习课』文章目录：『youcans 的图像处理学习课 – 总目录』【youcans 的图像处理学习课】11. 形态学图像处理（上）…

人工智能 2023年6月22日
0062
为什么CRM管理策略能增加企业利润？

现代化移动互联时代的快速发展，市场竞争越来越激烈，不少企业借助CRM软件完善日常运作和优化业务流程，增加企业利润。那么，企业是如何通过CRM系统来管理策略，创造更多的利润？首先，…

人工智能 2023年6月28日
0090
汽车中的ECU, VCU, MCU, HCU

ECU Electronic Control Unit，即电子控制单元，也可以叫 “行车电脑”。决定整车性能的最重要的部分就是它的ECU。作为现代汽车电子的…

人工智能 2023年6月10日
0074
neo4j的使用（以红楼梦人物关系为例）

参考：知识图谱实战：构建红楼梦知识图谱_任萌新的小生活-CSDN博客_知识图谱构建实战https://blog.csdn.net/RHJlife/article/details/1…

人工智能 2023年6月1日
0071
window下免安装使用labelImg标注yolo数据集

一、labelImg下载从labelImg的github官网下载window可执行文件压缩包： Release Binary v1.8.1 · tzutalin/labelImg…

人工智能 2023年7月10日
0072
数据分析第七讲 pandas练习数据的合并、分组聚合、时间序列、pandas绘图

文章目录数据分析第七讲 pandas练习数据的合并和分组聚合 * 一、pandas-DataFrame – 练习1 + 对于这一组电影数据，如果我们想runtim…

人工智能 2023年7月8日
0069
python画图配色总结

我对自己python画的图不是很满意，最近对python画图做了一个总结，记录如下参考如下1. https://blog.csdn.net/YMPzUELX3AIAp7Q/arti…

人工智能 2023年7月4日
0070
【windows10卸载并重新安装CUDA、cuDNN】，【TensorFlow-CUDA-cuDNN-GPU版本对应】，【cuDNN系统环境变量设置】

目录 1、卸载之前的旧的或者不匹配的CUDA、cuDNN 2、提前查电脑显卡支持的CUDA版本，便于后续下载对应的CUDA版本 3、下载CUDA、cuDNN 4、tenso…

人工智能 2023年5月23日
00187
理解yolov7网络结构

以下是yolov7网络结构配置的yaml，对每一层的输出加了注释。 parameters nc: 80 # number of classes depth_multiple: 1….

人工智能 2023年6月17日
0072
文档图像分类、信息提取、信息结构化之 LayoutLM、LayoutLMv2、LayoutXLM —— 论文阅读笔记

LayoutLMFT Document Understanding Tasks LayoutLM * Overview LayoutLM – Pre-training …

人工智能 2023年5月30日
0071
线性回归、logit回归、probit回归

回归文章目录 * – 回归 – + 线性回归 + * 古典线性回归模型的假定: * OLS的推导与性质 * – notation &#8211…

人工智能 2023年6月17日
00111
句子重写任务近年有哪些值得关注的工作？看这一篇就够了！

©作者 |叶哲宇单位 |携程旅行网-帝国理工学院研究方向 |文本生成&机器问答在多轮对话问答，端到端对话聊天机器人等多个场景下，不完整的句子在现有框架下的处理显得尤为…

人工智能 2023年6月1日
0073

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31