【超详细】支持向量机（SVM）数学推导

2023年6月24日下午5:53 • 人工智能 • 阅读 101

一、硬间隔SVM（Hard Margin SVM)

四、软间隔SVM（Soft Margin SVM)

1.Hinge Loss的引入

2.软间隔SVM的形式

SVM是一种无监督机器学习方法，常用于二分类问题。其相较于逻辑回归，引入了核函数的概念，对非线性关系有更好的分类效果；同时由于对偶问题的引入，使得计算的复杂性由维度的大小转变为样本的数量，避免了维度爆炸。但是由于SVM的本质是二次规划问题，样本数量大的时候，需要占用大量的存储空间和时间，不容易实现；同时SVM解决多分类问题存在一定困难。

一、硬间隔SVM（Hard Margin SVM)

硬间隔SVM是一个二次凸规划问题，其形式为：

其推导过程为：

（1）列出原始目标函数和约束条件。

目标函数：使间隔最大（间隔指离分隔线最近点到分隔线的距离）

约束条件：分隔线两侧的所有点均属于同一类别

即：

其中，间隔（最小距离）的推导过程如下：

（2）表达式化简

目标函数中，由于w与x无关，所以可以将1/||w||提出来；

由第一步得到的约束条件可知，必定存在一个γ>0，使得所有样本到分隔线的距离>γ，即：

这样，可以将目标函数中的min后所有元素进行替换，即：

（3）最终形式

目标函数：将max化为min，转化为二次型

约束条件：由于最小距离等于1，所以所有样本的距离大于等于1

二、对偶问题（Dual Problem)

在本问题中，可以将上面推出的二次规划问题转化为对偶形式：

引入对偶形式后，其目的为：

（1）方便引入核函数

（2）使约束函数从由维度、样本数量有关，变为仅与样本数量有关，方便计算。

其推导过程使用了拉格朗日(Lagrange）乘子法，拉格朗日乘子法方法的推导可参考下面博客。我们在这里仅套用Lagrange乘子法。

深入理解拉格朗日乘子法（Lagrange Multiplier) 和KKT条件_lijil168的博客-CSDN博客_拉格朗日乘子法

1.将有约束问题转变为无约束问题

带入Lagrange函数以及KKT条件，得到如下形式：

2.强对偶关系

拉格朗日为凹函数，其仅有最小值，没有最大值。

而目前的形式需要求拉格朗日函数的最大值，无法求得。所以需要对问题进行转变。
拉格朗日函数满足强对偶关系，即min max f(x) = max min f(x），可将上式化简为：

3.计算拉格朗日函数的最小值

拉格朗日函数有唯一最小值，故极小值即为最小值。

极小值的计算方式为：令偏导数等于0

4.得到对偶形式

代回原目标函数，即可得到最终结果。

三、对偶形式的求解

1.KKT条件的引入

由KKT条件的第三个式子可知，只有处于支持向量上的点（yf(x)-1=0)才可以满足第三个条件。所以在SVM中，仅有在支持向量上的点才有意义

2.计算w和b

w和b即为确定超平面的参数。

w*的求解：直接带入

条件即可

b的求解：由于仅有支持向量上的点起作用，所以代回支持向量上的样本点，对b进行求解。

四、软间隔SVM（Soft Margin SVM)

引入软间隔SVM的目的是：防止由于噪声数据而产生的过拟合现象。

1.Hinge Loss的引入

Hinge Loss设置了一个阈值，使得偏差数值尽可能小。其函数图像如下。

2.软间隔SVM的形式

Original: https://blog.csdn.net/weixin_48228548/article/details/124133393
Author: 力扣刷穿
Title: 【超详细】支持向量机（SVM）数学推导

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/649493/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

LeetCode刷题总结文档

前言本文的刷题顺序依照代码随想录进行，因此题目板块的划分也和代码随想录一致。每个版块我会按照以下内容进行组织：该类型题目的特征时间复杂度值得一讲的相关题目知识文章目录 &…

人工智能 2023年7月30日
0047
分类——K-Means聚类分析

1、作用聚类分析是一种基于中心的聚类算法（K 均值聚类），通过迭代，将样本分到 K 个类中，使得每个样本与其所属类的中心或均值的距离之和最小。与分层聚类等按照字段进行聚类的算法不…

人工智能 2023年5月31日
0060
机器学习（4）——弱监督学习

什么是弱监督学习？监督学习技术通过学习大量标记的训练样本来构建预测模型，在很多领域获得了巨大成功。但由于数据标注的本身往往需要很高成本，在很多任务上都很难获得全部真值标签这样比较…

人工智能 2023年6月24日
0093
GiraffeDet：Heavy Neck的目标检测框架

关注并星标从此不迷路计算机视觉研究院公众号ID｜ ComputerVisionGzq 学习群｜扫码在主页获取加入方式获取论文：关注并回复” GD &#8220…

人工智能 2023年7月12日
0055
python-新闻文本分类详细案例-(数据集见文末链接）

文章目录分析思路所用数据集一、导入相关包二、数据分析 * 1.读取数据 2. jieba分词并去除停用词 3. TF-IDF 4. 网格搜索寻最优模型及最优参数 5. 预测…

人工智能 2023年6月15日
0060
三维开源点云数据

以前总结过一次点云下载的相关网站（免费的激光雷达数据的下载方法_依然吧的博客-CSDN博客），这次再更新下。 1.The Stanford 3D Scanning Reposito…

人工智能 2023年6月2日
0085
华为云专家讲述知识图谱构建流程及方法

摘要：随着AI技术的发展和普及，当今社会已经进入了智能化时代。与以往不同的是，在这一波浪潮中，企业不仅是向数字化转型，更是向知识化转型。那么，如何助力企业破解智能化知识挖掘和管理难…

人工智能 2023年6月10日
0054
目标检测-常见网络的梳理

整合了一些博主的博文:ID分别为太阳花的小绿豆、AI菌、Bubbliiiing！！！感谢上述博主！！！从B站一个博主视频里听到的一句话，觉得很有道理，就写在博文的前面了：学习一…

人工智能 2023年7月9日
0056
判断回文链表

题目描述：给定一个链表，判断_该 _链表_是否是 _回文_结构。例如：1->2->3->2->1 是 _回文链表。 1->2->3-&…

人工智能 2023年6月30日
0058
论文《A convolutional neural network for modelling sentences》的学习笔记

论文原文及译文下载算法实现 1. 引言自然语言处理的基础问题在于句子的语义语法表示，其他特定任务如分类等都是在语义语法表示的基础上进行高层次的处理，因此，如何对句子进行表达就成为…

人工智能 2023年5月31日
0088
优化 | Pick and delivery problem的简介与建模实现（二）

优化 | Pick and delivery problem的介绍与建模实现（二） * – One-to-many-to-one (1-M-1) problems &#…

人工智能 2023年7月7日
0072
SAS|proc sort(排序)&proc transpose(转置)

proc sort排序，基本格式： proc sort data=<dataset> (out=<newset>) (nodupkey); by (desc…

人工智能 2023年7月15日
0043
线性回归

预测函数单变量线性回归：(h{\theta(x)} = \theta{_0} + \theta{_1}x)；令(x_0 = 1)；则(h{\theta(x)} = \theta{…

人工智能 2023年6月4日
0077
Keras调用plot_model报错解决方案

1.报错信息在建立神经网络模型的时候，可以调用keras中的plot_model模块画出模型示意图，方便对模型结构做出调整： from tensorflow.keras.mo…

人工智能 2023年5月25日
0096
Ros结合科大讯飞linuxSDK进行离线语唤醒、命令识别

慢慢更新中… 工程:多智能车室内ROS编队，现想加入语音功能，选择科大讯飞。参考：1.https://blog.csdn.net/u013834525/article/…

人工智能 2023年5月25日
10182
A Toolkit for Generating Code Knowledge Graphs生成代码知识图谱的工具

事实证明，知识图谱在多种支持语义搜索和自然语言理解的应用程序方面非常有用。本文提出GraphGen4Code，一种工具集构建代码的知识图谱，支持程序搜索，代码理解，bug检测和代码…

人工智能 2023年6月1日
00125

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

【超详细】支持向量机（SVM）数学推导

一、硬间隔SVM（Hard Margin SVM)

二、对偶问题（Dual Problem)

1.将有约束问题转变为无约束问题

2.强对偶关系

3.计算拉格朗日函数的最小值

4.得到对偶形式

三、对偶形式的求解

1.KKT条件的引入

2.计算w和b

四、软间隔SVM（Soft Margin SVM)

1.Hinge Loss的引入

2.软间隔SVM的形式

大家都在看