逻辑回归模型与支持向量机有何联系和区别

2023年12月31日上午3:27 • 人工智能 • 阅读 37

逻辑回归模型与支持向量机的联系和区别

逻辑回归模型和支持向量机(SVM)是两种常用的监督学习算法，都可以应用于二分类问题。它们有一些相似之处，但在模型原理、算法步骤和性能等方面也存在一些区别。

逻辑回归模型

逻辑回归是一种广义线性模型(GLM)，用于建立变量之间的关系和预测一个二分类的概率。在逻辑回归中，我们使用sigmoid函数（或称为逻辑函数）来建立输入特征和输出的关系。

算法原理

逻辑回归模型的目标是通过最大似然估计来优化模型参数。给定一个训练集${(x^{(1)}, y^{(1)}), (x^{(2)}, y^{(2)}), …, (x^{(m)}, y^{(m)})}$，其中$x^{(i)}\in \mathbb{R}^{n}$是输入特征向量，$y^{(i)} \in {0, 1}$是对应的输出标签。对于给定的输入特征$x^{(i)}$，逻辑回归模型预测$y^{(i)}=1$的概率为：

$$
h_{\theta}(x^{(i)}) = \frac{1}{1 + e^{-\theta^{T}x^{(i)}}}
$$

逻辑回归模型的假设函数$H_\theta(X)$是一个以参数$\theta$为权重的线性函数，通过sigmoid函数将结果映射到0和1之间，表示概率值。为了最大化似然函数，我们使得对数似然函数最大化，通过梯度下降算法来更新和优化参数$\theta$。

公式推导

定义预测函数为：

$$
h_{\theta}(x) = g(\theta^{T}x)
$$

其中，$g(z) = \frac{1}{1+e^{-z}}$是sigmoid函数。对于给定的训练集，我们希望最大化似然函数。

似然函数：

$$
L(\theta) = \prod_{i=1}^{m} (h_{\theta}(x^{(i)}))^{y^{(i)}}(1 – h_{\theta}(x^{(i)}))^{1-y^{(i)}}
$$

对数似然函数：

$$
l(\theta) = \sum_{i=1}^{m} [y^{(i)}\log(h_{\theta}(x^{(i)})) + (1-y^{(i)})\log(1 – h_{\theta}(x^{(i)}))]
$$

使用梯度下降算法迭代更新参数$\theta$，使得$l(\theta)$最大化。

计算步骤

初始化参数$\theta$。
计算预测值$h_{\theta}(x)$。
计算损失函数$J(\theta)$，如交叉熵损失函数。
使用梯度下降算法更新$\theta$，使得$J(\theta)$最小化。
重复步骤2-4，直到收敛或达到最大迭代次数。

Python代码示例

下面以一个虚拟数据集为例，演示逻辑回归模型的实现过程。

import numpy as np
import matplotlib.pyplot as plt

# 构造虚拟数据集
np.random.seed(0)
m = 100
X = np.random.randn(m, 2)
y = np.random.randint(0, 2, size=m)

# 定义逻辑回归模型类
class LogisticRegression:
 def __init__(self, n_features):
 self.n_features = n_features
 self.theta = np.zeros((n_features, 1))

 def sigmoid(self, z):
 return 1 / (1 + np.exp(-z))

 def train(self, X, y, learning_rate=0.01, num_iterations=1000):
 m = X.shape[0]
 X = np.hstack((np.ones((m, 1)), X))
 y = y.reshape((m, 1))

 for i in range(num_iterations):
 z = np.dot(X, self.theta)
 h = self.sigmoid(z)

 error = h - y
 gradient = np.dot(X.T, error) / m
 self.theta -= learning_rate artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls gradient

 def predict(self, X):
 m = X.shape[0]
 X = np.hstack((np.ones((m, 1)), X))
 y_pred = self.sigmoid(np.dot(X, self.theta))
 y_pred = (y_pred > 0.5).astype(int)
 return y_pred.flatten()

# 创建模型并训练
model = LogisticRegression(n_features=2)
model.train(X, y)

# 预测结果
y_pred = model.predict(X)

# 绘制数据点和决策边界
plt.scatter(X[:, 0], X[:, 1], c=y)
x_boundary = np.linspace(-3, 3, 100)
y_boundary = -(model.theta[0] + model.theta[1] artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls x_boundary) / model.theta[2]
plt.plot(x_boundary, y_boundary, color='red')
plt.xlabel('X1')
plt.ylabel('X2')
plt.title('Logistic Regression')
plt.show()

代码解释：

首先，我们使用numpy生成一个虚拟数据集X和y。然后定义了一个LogisticRegression类，其中包括sigmoid函数和train方法。sigmoid函数用于计算sigmoid值，train方法用于训练模型。

在train方法中，我们首先对数据进行预处理，添加一个全为1的偏置列，然后使用梯度下降算法更新参数$\theta$。具体地，我们计算预测值h，计算误差error，然后计算梯度gradient，并更新参数$\theta$。

最后，我们创建一个LogisticRegression对象model，并调用train方法进行训练。然后，使用predict方法进行预测，并绘制数据点和决策边界。

支持向量机 (SVM)

支持向量机是一种二分类模型，通过寻找一个最优的超平面对样本进行划分。SVM的目标是找到一个能够最大化边界间隔的超平面。

算法原理

在SVM中，我们试图找到一个超平面，使得样本点到该超平面的距离最大化。这个距离被称为间隔。SVM基于间隔最大化来构建一个决策边界。

SVM模型学习的是一个线性分离器, 即找到一个尽可能将两类样本分开的超平面。如果两类样本不完全线性可分，则可以通过引入松弛变量和软间隔来允许一些样本点处于超平面的错误一侧或在间隔内部。

公式推导

给定一个训练集${(x^{(1)}, y^{(1)}), (x^{(2)}, y^{(2)}), …, (x^{(m)}, y^{(m)})}$，其中$x^{(i)}\in \mathbb{R}^{n}$是输入特征向量，$y^{(i)} \in {-1, 1}$是对应的输出标签。

对于给定的输入特征$x^{(i)}$，我们的目标是找到一个超平面，使得$w^Tx + b =0$。超平面的正负样本之间的函数间隔为：

$$
\hat{y}^{(i)}(w^Tx^{(i)} + b)
$$

其中，$\hat{y}^{(i)}$是真实类别标签。为了进一步得到合适的间隔，我们需要除以$||w||_2$，从而得到几何间隔。

我们的目标是最大化几何间隔，即：

$$
\max \frac{1}{||w||_2} \min_i (\hat{y}^{(i)}(w^Tx^{(i)} + b))
$$

相当于最大化$\frac{1}{2} ||w||_2^2$，并且约束$\hat{y}^{(i)}(w^Tx^{(i)} + b) \geq 1$。

计算步骤

初始化参数$w$和$b$。
将问题转化为凸二次优化问题，并使用拉格朗日乘子法求解。
使用SMO算法或其他优化算法迭代计算最优解。
根据最优解求得超平面的法向量$w$和截距$b$。

Python代码示例

下面以一个虚拟数据集为例，演示支持向量机的实现过程。

import numpy as np
import matplotlib.pyplot as plt
from sklearn import svm

# 构造虚拟数据集
np.random.seed(0)
m = 100
X = np.random.randn(m, 2)
y = np.random.randint(0, 2, size=m)
y = np.where(y==0, -1, 1)

# 创建支持向量机对象并训练
model = svm.SVC(kernel='linear')
model.fit(X, y)

# 预测结果
y_pred = model.predict(X)

# 绘制数据点和决策边界
plt.scatter(X[:, 0], X[:, 1], c=y)
w = model.coef_[0]
b = model.intercept_[0]
x_boundary = np.linspace(-3, 3, 100)
y_boundary = -(w[0] artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls x_boundary + b) / w[1]
plt.plot(x_boundary, y_boundary, color='red')
plt.xlabel('X1')
plt.ylabel('X2')
plt.title('Support Vector Machine')
plt.show()

代码解释：

我们使用numpy生成一个虚拟数据集X和y。然后，我们使用sklearn库中的svm.SVC类来创建一个支持向量机对象model，设置kernel为linear（线性核函数）。

接下来，我们调用fit方法对模型进行训练。然后，使用predict方法进行预测，并绘制数据点和决策边界。

逻辑回归模型与支持向量机的区别和联系

逻辑回归模型和支持向量机(SVM)都是二分类模型，但在一些方面有所不同。

原理：逻辑回归模型基于最大似然估计来建立输入特征和输出标签之间的关系，使用sigmoid函数来模拟概率值。而SVM基于间隔最大化来构建一个决策边界超平面，寻找一个最优的超平面来将样本点分开。
概念：逻辑回归模型的输出是一个概率值，表示正例的概率。SVM不直接输出概率，而是根据决策函数的符号进行类别划分。
决策边界：逻辑回归模型将数据划分为两个类别的超平面是一个线性边界，而SVM可以使用不同的核函数，可以得到非线性边界。
对异常值的敏感性：逻辑回归对异常值敏感，因为它更关注减小损失函数，可能会偏向于较大权重。而SVM对异常值相对较不敏感，因为目标是最大化间隔，只有支持向量(离决策边界最近的样本点)对模型有影响。

综上所述，逻辑回归是一种概率模型，适用于线性可分或线性不可分的数据，计算简单且易于理解。SVM则是一种几何间隔最大化的模型，可用于线性可分和线性不可分的数据，且具有更好的鲁棒性和非线性分类能力。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/821794/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

思科设备BGP配置命令

Cisco(config)#router bgp 100 //配置BGP进程号Cisco(config-router)#bgp router-id 1.1.1.1 //配置BGP的…

人工智能 2023年6月27日
0081
协同过滤算法是否受到平台和商业利益的影响

关于协同过滤算法是否受到平台和商业利益的影响介绍协同过滤算法是一种常用的推荐系统算法，用于根据用户的历史行为和其他用户的行为模式，预测用户可能喜欢的物品或项目。然而，由于协同过…

人工智能 2024年1月2日
0021
Node.js学习笔记

引言 💥为什么 JavaScript 可以在浏览器中执行？不同的浏览器使用不同的 JavaScript 解析引擎 Chrome浏览器 = > V8 ; 💥为什么 JavaS…

人工智能 2023年6月26日
0089
Python 网络数据采集（二）：抓取所有网页

作者：高玉涵时间：2022.5.22 08:35博客：blog.csdn.net/cg_i 不知前方水深浅。在互联网上进行自动数据采集这件事情和互联网存在的时间差不多一样长。虽然…

人工智能 2023年6月19日
0091
YOLOv4网络详解

论文名称：YOLOv4: Optimal Speed and Accuracy of Object Detection论文下载地址：https://arxiv.org/abs/20…

人工智能 2023年6月16日
0075
Unity场景优化工具：Mesh Baker 基础教程（贴图篇）

目录前言一、Mash Baker是什么？二、使用步骤 1.打开场景 2.将Texture Baker添加到场景中 3.使用Texture Baker生成贴图集 4.烘焙新的模…

人工智能 2023年7月30日
0064
基于MATLAB语音信号的处理与滤波

摘要：MATLAB是十分强大的用于数据分析和处理的工程实用软件,利用其来进行语音信号的分析、处理和可视化十分便捷。文中介绍了在MATLAB环境中如何驱动声卡采集语音信号和语音信号采…

人工智能 2023年5月27日
00127
将DataFrame作为邮件正文HTML发送 in Python

OverviewTo convert this question into english, maybe: How to convert a DataFrame into a pe…

人工智能 2023年7月9日
0057
Faster R-CNN最全讲解

文章目录一：Faster R-CNN的改进二：网络架构三：Conv layers模块四：Region Proposal Networks(RPN)模块 * 【Module …

人工智能 2023年7月25日
0070
NeRF 源码分析解读（三）

NeRF 源码分析解读（三）光线的生成上一章节我们对 NeRF 模型的初始化代码进行了分析，即 create_nerf() 部分，本章节我们继续对 NeRF 代码进行分析注释。…

人工智能 2023年7月21日
0075
Linux使用CMake构建OpenCV、onnxruntime模型部署项目

Linux使用CMake构建模型部署项目文章目录 Linux使用CMake构建模型部署项目一、安装opencv和下载onnxruntime 二、构建Cmake项目 * 构建项目…

人工智能 2023年7月18日
0078
【笔记本智能计划】使用OpenCv搭建一个简便实用的智能防盗监控系统

前言本计划是基于笔记本电脑，通过编程打造一个智能笔记本系统，使得我们使用笔记本起来更加智能。整个计划包括但不限于：身份认证、手势控制、手指控制鼠标、防盗监控系统、语音识…

人工智能 2023年7月19日
0049
常见图像增强（python 实现）

反色变换推荐B站UP,十四阿哥很nice几节图像处理课讲的很清楚。用于增强暗背景下的图像，使人眼能够观看到更多细节。假设原始图像的灰度范围是[0,L],L表示该图像最大的灰度值，…

人工智能 2023年6月17日
0092
今年，我只赚了一点点

大家好，我是 Jack。之前一直有小伙伴问我，有没有免费的股票信息查询的 API 接口？我看了一圈，很多免费的 API 接口都年久失修，失效了。那好吧，咱自己写一个。想要…

人工智能 2023年7月31日
0058
为什么6G是下一代无线通信

如果你想知道无线通信的未来是什么样子，那么你并不孤单。世界正在走向一个基于6G的社会。ITU-T最近成立了一个焦点小组来定义未来的网络服务需求。此外，谷歌还启动了Project L…

人工智能 2023年7月23日
0062
大数据的薪资怎么样？想学大数据了？

猎聘大数据研究院发布了《2022未来人才就业趋势报告》从排名来看，2022年1-4月各行业中高端人才平均年薪来看，人工智能行业中高端人才平均年薪最高，为31.04万元；金融行业中…

人工智能 2023年6月19日
0081

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

逻辑回归模型与支持向量机有何联系和区别

逻辑回归模型与支持向量机的联系和区别

逻辑回归模型

算法原理

公式推导

计算步骤

Python代码示例

支持向量机 (SVM)

算法原理

公式推导

计算步骤

Python代码示例

逻辑回归模型与支持向量机的区别和联系

大家都在看