Learning算法中的SVM是指什么

2024年1月1日上午11:04 • 人工智能 • 阅读 36

问题：SVM是指什么？

SVM，全称为支持向量机（Support Vector Machine），是一种常用的机器学习算法，主要用于二分类和多分类问题。它在解决线性和非线性问题上表现出色，并且在处理高维数据时具有很好的鲁棒性。SVM算法的核心思想是寻找一个最佳的超平面，将不同类别的样本分开并使间隔最大化。

SVM算法原理

SVM算法的本质是在特征空间中找到一个最优的超平面，将不同类别的样本划分开来。对于二分类问题而言，我们需要找到一个二维平面，即一个直线，将两个类别的样本分隔开。对于多分类问题，可以将问题转化为多个二分类问题，通过多个二分类器组合来实现多分类。

在SVM中，样本以点的形式表示在特征空间中。每个样本点都有一个对应的标签，标记其所属的类别。SVM的目标是找到最佳的超平面，使得不同类别样本点到超平面的距离最大化。

SVM公式推导

为了开始推导SVM算法的数学公式，我们首先介绍一些基本的符号：

样本点：$(x_1, y_1), (x_2, y_2), …, (x_n, y_n)$，其中$x_i$是样本特征，$y_i$是样本标签，$y_i$只能取1或-1。
超平面：$wx + b = 0$，其中$w$是法向量，决定超平面的方向，$b$是截距。

SVM算法的目标是找到最佳的超平面，使得不同类别样本点到超平面的距离最大化。具体而言，我们希望找到能够最小化以下目标函数的参数$w$和$b$：

$$
\arg\min_{w,b}\frac{1}{2}||w||^2
$$

然而，直接求解上述问题是困难的。为了避免这个问题，我们可以转化为一个约束优化问题。具体而言，我们希望满足以下约束条件：

$$
\begin{cases}
y_i(wx_i + b) \geq 1, \forall i = 1, 2, …, n \
\end{cases}
$$

上述约束条件意味着所有的样本都处于正确的分类一侧，并且距离超平面的距离不小于1。这是因为SVM算法为了保证泛化性能，对于Misclassification Rate的允许限制非常严格。

SVM计算步骤简述

收集样本数据，并为每个样本分配标签。
根据所选的Kernel函数，计算两两样本之间的相似度得分。
基于目标函数和约束条件，求解最优化问题，得到超平面的参数$w$和$b$。
根据得到的超平面，进行新样本的预测。

SVM的Python代码示例

下面是一个SVM算法的Python代码示例，用于解决一个二分类问题。我们将使用一个开源数据集，为了说明算法的实际应用：

import numpy as np
import matplotlib.pyplot as plt

# 创建一个虚拟的二分类数据集
X = np.array([[1, 3], [2, 2], [3, 8], [4, 6], [5, 1], [6, 4], [7, 7], [8, 3], [9, 5], [10, 2]])
y = np.array([-1, -1, 1, 1, -1, 1, 1, -1, 1, -1])

# 绘制数据集的散点图
plt.scatter(X[:, 0], X[:, 1], c=y)
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.show()

from sklearn.svm import SVC

# 创建SVM分类器对象
clf = SVC(kernel='linear')

# 拟合模型
clf.fit(X, y)

# 绘制决策边界
plt.scatter(X[:, 0], X[:, 1], c=y)
ax = plt.gca()
xlim = ax.get_xlim()
ylim = ax.get_ylim()

# 创建网格来评估模型
xx = np.linspace(xlim[0], xlim[1], 30)
yy = np.linspace(ylim[0], ylim[1], 30)
YY, XX = np.meshgrid(yy, xx)
xy = np.vstack([XX.ravel(), YY.ravel()]).T
Z = clf.decision_function(xy).reshape(XX.shape)

# 绘制决策边界和间隔
ax.contour(XX, YY, Z, levels=[-1, 0, 1], alpha=0.5, linestyles=['--', '-', '--'], colors='k')
ax.scatter(clf.support_vectors_[:, 0], clf.support_vectors_[:, 1], s=100, linewidth=1, facecolors='none', edgecolors='k')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.show()

代码解释：

代码的第1和2行导入了numpy和matplotlib库。
第4到12行创建了一个虚拟的二分类数据集，并绘制了散点图来可视化数据。
第14行导入了SVC类，用于创建一个SVM分类器对象，通过指定kernel='linear'来选择线性核函数。
第17行调用分类器对象的fit方法来拟合模型。
第20到31行绘制了决策边界和间隔：
首先，绘制原始数据的散点图。
然后，通过创建网格来评估模型，使用clf.decision_function计算每个网格点到超平面的距离。
最后，使用ax.contour绘制决策边界和间隔，并使用ax.scatter绘制支持向量。

解释代码细节

在代码的第14行，我们使用SVC(kernel='linear')创建了一个SVM分类器对象，并指定了线性核函数。
在代码的第17行，我们使用clf.fit(X, y)拟合了模型，其中X是特征数据，y是标签数据。
在代码的第20到31行，我们绘制了决策边界和间隔的过程：
首先，通过ax.get_xlim()和ax.get_ylim()获取绘图的坐标范围。
然后，使用np.linspace创建一维网格，再使用np.meshgrid将一维网格扩展为二维网格。
接下来，对每个网格点计算到超平面的距离，得到Z。
最后，使用ax.contour绘制决策边界和间隔，使用ax.scatter绘制支持向量。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/822583/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

自动驾驶岗位常见面试笔试题

面试常问问题：1. 自我介绍【时长控制在2分钟左右，提项目可以提两个比较重要的，跟岗位相关的】2. 说说对公司的认识？为什么选择投递公司？为什么选择这个岗位？平时用什么语言？【先上…

人工智能 2023年6月2日
00103
离线学习(岭回归)

学习规则—离线学习(岭回归) 离线学习(岭回归) 离线学习规则是机器学习领域最常见的学习规则。它包括梯度下降和线性回归，在储层计算领域，线性回归可能是最简单以及最常用的训练人工神经…

人工智能 2023年6月18日
0076
用Python实现简单的人脸识别，10分钟搞定！（附源码）

前言让我的电脑认识我，我的电脑只有认识我，才配称之为我的电脑！今天，我们用Python实现简单的人脸识别技术！ Python里，简单的人脸识别有很多种方法可以实现，依赖于pyt…

人工智能 2023年7月29日
0064
归一化层（Normalization）在CNN中的作用是什么

问题概述归一化层（Normalization）在卷积神经网络（Convolutional Neural Networks, CNN）中的作用是什么？详细介绍归一化层是CNN中…

人工智能 2024年1月1日
0023
spss线性回归

连续性变量与连续性变量之间，就有使用线性回归或者是相关相关表示的是两个变量之间或者是多个变量之间相关关系的方向和强弱关系如果我们想要知道两个变量或者多个变量之间具体的关系，那么我们…

人工智能 2023年6月18日
0069
卡尔曼滤波详解

卡尔曼滤波是一个强大的工具，可以融合存在误差的信息，提取到更加精确的信息。什么是卡尔曼滤波？我们可以在任何包含不确定信息的动态系统中使用卡尔曼滤波，对系统下一步的状态做出有根…

人工智能 2023年6月4日
00117
LSTM时间序列预测

文章目录 1、tensorflow张量的形状 2、RNN 3、LSTM * 3.1 深入了解LSTM结构 4、keras的LSTM – 4.1 参数return_seq…

人工智能 2023年5月24日
0084
GANs系列：CGAN(条件GAN）原理简介以及项目代码实现

一、原始GAN的缺点生成的图像是随机的，不可预测的，无法控制网络输出特定的图片，生成目标不明确，可控性不强。针对原始GAN不能生成具有特定属性的图片的问题， Mehdi Mirz…

人工智能 2023年6月23日
00162
李宏毅（2020）作业9：无监督学习降维、聚类、自编码

文章目录数据集作业 * 任务1 任务2 任务3 数据下载数据集准备训练数据一些工具函数模型训练降维和聚类问题1（作图）问题2 问题3 ; 数据集 valX.np…

人工智能 2023年5月31日
0088
通过Excel+Word批量生成文档及批量提取和修改文档名字

excel和word是日常的办公软件，最近老师给了我一个任务，任务内容如下：给了我一个班级同学成绩单excel表格和一个给家长的一封信word模板，在word模板中有相应的成绩表格…

人工智能 2023年7月8日
00375
Pycharm创建虚拟环境，conda创建虚拟环境，安装Pytorch

一、在Pycharm里设置虚拟环境在软件的左上角选择：File – Settings – Project: pythonProject – Python Interpreter…

人工智能 2023年7月21日
0094
加强数据模型建设助力企业数字化转型 — 前篇

工信部将我国数字化转型分为信息化（Information Digitization，1956-2003年）、业务数字化（Business Digitization，2003&#8…

人工智能 2023年6月19日
0087
本科生如何入门GNSS算法（四）- rtklib单点定位解算源码说明

目录单点定位 LSQ 设计矩阵残差阵后记欢迎关注个人公众号单点定位单点定位的过程就是最小二乘平差的过程，所涉及到的卫星位置计算/大气误差计算等都是为了计算残差。关于最小…

人工智能 2023年7月15日
0082
Seaborn系列(五)：回归(Regression)及矩阵(Matrix)绘图

Seaborn系列目录文章目录 1. 回归及矩阵绘图API概述 2. 回归统计绘图 * 2.1 lmplot、regplot绘图 2.2 residplot绘图 3. 矩阵图 *…

人工智能 2023年6月17日
0094
利用MATLAB绘制箱线图—箱线图在高光谱图像处理中的应用

利用MATLAB绘制箱线图一、箱线图在高光谱图像处理中的应用二、箱线图具体MATLAB代码分享三、参考文献欢迎学习交流！邮箱： z…@1…6.com…

人工智能 2023年6月18日
0076
关于opencv库的安装以及一些常见的问题

对opencv库的安装以及在使用中遇到的一些问题做一下总结，最大的一个问题就是安装好后，cv2下的自带的函数都显示不出来，也不能用。安装首先说一下安装，可以直接在Anacond…

人工智能 2023年7月19日
0046

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31