支持向量机分类算法

2023年7月1日下午12:35 • 人工智能 • 阅读 112

🚀 优质资源分享 🚀

学习路线指引（点击解锁）知识定位人群定位
🧡 Python实战微信订餐小程序 🧡

进阶级本课程是python flask+微信小程序的完美结合，从项目搭建到腾讯云部署上线，打造一个全栈订餐系统。
💛Python量化交易实战💛

入门级手把手带你打造一个易扩展、更安全、效率更高的量化交易系统

支持向量机SVM

支持向量机原理

1.寻求最有分类边界

正确：对大部分样本可以正确的划分类别

泛化：最大化支持向量间距

公平：与支持向量等距

简单：线性、直线或平面，分割超平面

2.基于核函数的生维变换

通过名为核函数的特征变换，增加新的特征，使得低维度的线性不可分问题变为高维度空间中线性可分问题。

一、引论

使用SVM支持向量机一般用于分类，得到低错误率的结果。SVM能够对训练集意外的数据点做出很好的分类决策。那么首先我们应该从数据层面上去看SVM到底是如何做决策的，这里来看这样一串数据集集合在二维平面坐标系上描绘的图：

现在我们需要考虑，是否能够画出一条直线将圆形点和星星点分开。像first第一张图片来看，圆点和星点就分的很开，很容易就可以在图中画出一条直线将两组数据分开。而看第二张图片，圆点和星点几乎都聚合在一起，要区分的话十分困难。

我们要划线将他们区分开来的话，有有无数条可以画，但是我们难以找到一条最好区分度最高的线条将它们几乎完全区分。那么在此我们需要了解两个关于数据集的基本概念：

二、理论铺垫

线性可分性（linear separability）

而对机器学习来说，涉及的多是高维空间（多维度）的数据分类，高维空间的SVM，即为超平面。机器学习的最终目的就是要找到最合适的（也即最优的）一个分类超平面（Hyper plane），从而应用这个最优分类超平面将特征数据很好地区分为两类。

决策边界

SVM是一种优化的分类算法，其动机是寻找一个最佳的决策边界，使得从决策边界与各组数据之间存在margin，并且需要使各侧的margin最大化。那么这个决策边界就是不同类之间的界限。

总而言之：在具有两个类的统计分类问题中，决策边界或决策表面是超平面，其将基础向量空间划分为两个集合，一个集合。分类器将决策边界一侧的所有点分类为属于一个类，而将另一侧的所有点分类为属于另一个类。

支持向量（support vector ）

在了解了超平面和决策边界我们发现SVM的核心任务是找到一个超平面作为决策边界。那么满足该条件的决策边界实际上构造了2个平行的超平面作为间隔边界以判别样本的分类：

核方法

以回避内积的显式计算。

常见的核函数：

kernel : {'linear', 'poly', 'rbf', 'sigmoid', 'precomputed'}, default='rbf'

当多项式核的阶为1时，其被称为线性核，对应的非线性分类器退化为线性分类器。RBF核也被称为高斯核（Gaussian kernel），其对应的映射函数将样本空间映射至无限维空间。

SMO序列最小优化算法

三、Python sklearn 代码实现：

sklearn.svm.SVC语法格式为：

class sklearn.svm.SVC(  *,
 C=1.0,
 kernel='rbf',
 degree=3,
 gamma='scale',
 coef0=0.0,
 shrinking=True,
 probability=False,
 tol=0.001,
 cache\_size=200,
 class\_weight=None,
 verbose=False,
 max\_iter=- 1,
 decision\_function\_shape='ovr',
 break\_ties=False,
 random\_state=None)

基于鸢尾花数据的实现及解释

代码如下：

 1 # &#x5BFC;&#x5165;&#x6A21;&#x5757;
 2 import numpy as np
 3 import matplotlib.pyplot as plt
 4 from sklearn import svm, datasets
 5 from sklearn.model\_selection import train\_test\_split
 6
 7 # &#x9E22;&#x5C3E;&#x82B1;&#x6570;&#x636E;
 8 iris = datasets.load\_iris()         #&#x539F;&#x59CB;&#x6570;&#x636E;
 9 feature = iris.data[:, :2] # &#x4E3A;&#x4FBF;&#x4E8E;&#x7ED8;&#x56FE;&#x4EC5;&#x9009;&#x62E9;2&#x4E2A;&#x7279;&#x5F81;&#xFF08;&#x6839;&#x636E;&#x524D;&#x4E24;&#x5217;&#x6570;&#x636E;&#x548C;&#x7ED3;&#x679C;&#x8FDB;&#x884C;&#x5206;&#x7C7B;&#xFF09;
10 target = iris.target
11
12 #&#x6570;&#x7EC4;&#x5206;&#x7EC4;&#x8BAD;&#x7EC3;&#x6570;&#x636E;&#x548C;&#x6D4B;&#x8BD5;&#x6570;&#x636E;
13 x\_train,x\_test,y\_train,y\_test=train\_test\_split(feature,target,test\_size=0.2,random\_state=2020)
14
15 # &#x6D4B;&#x8BD5;&#x6837;&#x672C;&#xFF08;&#x7ED8;&#x5236;&#x5206;&#x7C7B;&#x533A;&#x57DF;&#xFF09;,&#x6211;&#x4EEC;&#x6570;&#x636E;&#x9009;&#x4E86;&#x4E24;&#x5217;&#x5373;&#x5C31;&#x662F;&#x4E24;&#x4E2A;&#x7279;&#x5F81;&#xFF0C;&#x6240;&#x4EE5;&#x8FD9;&#x91CC;&#x6709;xlist1&#xFF0C;xlist2
16 xlist1 = np.linspace(x\_train[:, 0].min(), x\_train[:, 0].max(), 200)
17 xlist2 = np.linspace(x\_train[:, 1].min(), x\_train[:, 1].max(), 200)
18 XGrid1, XGrid2 = np.meshgrid(xlist1, xlist2)
19 # &#x5B9E;&#x4F8B;&#x5316;&#x4E00;&#x4E2A;svm&#x6A21;&#x578B;&#xFF0C;&#x975E;&#x7EBF;&#x6027;SVM&#xFF1A;RBF&#x6838;&#xFF0C;&#x8D85;&#x53C2;&#x6570;&#x4E3A;0.5&#xFF0C;&#x6B63;&#x5219;&#x5316;&#x7CFB;&#x6570;&#x4E3A;1&#xFF0C;SMO&#x8FED;&#x4EE3;&#x7CBE;&#x5EA6;1e-5, &#x5185;&#x5B58;&#x5360;&#x7528;1000MB
20 svc = svm.SVC(kernel='rbf', C=1, gamma=0.5, tol=1e-5, cache\_size=1000)
21 drill=svc.fit(x\_train,y\_train)
22
23 #&#x5F97;&#x5230;&#x6D4B;&#x8BD5;&#x5206;&#x6570;&#x548C;&#x6D4B;&#x8BD5;&#x5206;&#x7C7B;
24 print(drill.score(x\_test,y\_test))      #&#x6D4B;&#x8BD5;&#x5206;&#x6570;
25 print(drill.predict(x\_test[3].reshape(1,-1)))   #&#x9884;&#x6D4B;&#x6D4B;&#x8BD5;&#x6570;&#x636E;&#x7B2C;&#x4E09;&#x7EC4;&#x6837;&#x672C;&#x7684;&#x5206;&#x7C7B;&#x6216;&#x9884;&#x6D4B;&#x7ED3;&#x679C;
26
27 # &#x9884;&#x6D4B;&#x5E76;&#x7ED8;&#x5236;&#x7ED3;&#x679C;(&#x4EE5;&#x4E0B;&#x90FD;&#x4E3A;&#x7ED8;&#x56FE;)
28 Z = drill.predict(np.vstack([XGrid1.ravel(), XGrid2.ravel()]).T)
29 Z = Z.reshape(XGrid1.shape)
30 plt.contourf(XGrid1, XGrid2, Z, cmap=plt.cm.hsv)
31 plt.contour(XGrid1, XGrid2, Z, colors=('k',))
32 plt.scatter(x\_train[:, 0], x\_train[:, 1], c=y\_train, edgecolors='k', linewidth=1.5, cmap=plt.cm.hsv)
33 plt.show()

Original: https://blog.csdn.net/qq_43479892/article/details/126811791
Author: qq_43479892
Title: 支持向量机分类算法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/663361/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

深度学习系列45：图像恢复综述

从本期开始，会探索图像恢复领域的论文和代码。本次先阅读一下综述。传统方法一个很大的假设是我们相信我们可以在缺失区域之外找到相似的patch，但是如果缺失区域之外没有任何类似的pat…

人工智能 2023年6月24日
0089
Descriptors cannot not be created directly

在运行诸如深度学习python等程序时，如mmdetection、mmdetection3d中的程序，会出现报错：”Descriptors cannot not be …

人工智能 2023年7月4日
00102
WEB安全之PHP基础（九）：正则表达式

WEB安全之PHP基础（九）：正则表达式正则表达式 * 正则表达式简介正则表达式的基本语法 – 边界限制重复匹配模式选择符模式单元特殊字符模式匹配的顺序 …

人工智能 2023年6月27日
0085
安装PyTorch后引入torchvision报错：Failed to load image Python extension: warn(f“Failed to load image Python

一、问题分析：报错如下： Failed to load image Python extension: warn(f”Failed to load image Pyt…

人工智能 2023年7月20日
0064
【Data Mining】【第六章作业】

文章目录一. 单选题二. 多选题三. 填空题四. 判断题一. 单选题 1.下列几种数据挖掘功能中被广泛的用于购物篮分析的是( )A. 关联分析;B. 分类和预测;C. 聚…

人工智能 2023年6月19日
0097
从Anaconda到TensorFlow到Jupyter一路踩坑一路填平

1.安装anaconda可能遇到的坑下载地址：https://repo.continuum.io/archive/index.html我安装的Anaconda3-5.2.0，为了匹…

人工智能 2023年5月25日
0075
从编译器对指令集的要求看API设计原则

摘要：最近看《计算机体系结构：量化研究方法（第五版）》，发现指令集设计中的一些原则，对API设计也同样适用，给大家分享一下。本文中的所有内容来自工作和学习过程中的心得整理，如需转…

人工智能 2023年6月4日
0077
21句话入门机器学习

这是一篇关于机器学习工具包Scikit-learn的入门级读物。对于程序员来说，机器学习的重要性毋庸赘言。也许你还没有开始，也许曾经失败过，都没有关系，你将在这里找到或者重拾自信。…

人工智能 2023年6月30日
0073
MATLAB-中值滤波原理、实现及应用

写了篇实现medfilt2函数功能的文章，有兴趣的朋友可以看看：medfilt2函数的实现源代码目录中值滤波原理中值滤波窗口重要特性实现方法图像处理程序原图与加噪图…

人工智能 2023年6月20日
00123
A-Level经济真题（13）

A-Level有70多门科目，其中，A-Level经济是最受欢迎考试科目之一。英国大学很多专业都要求学生学习A-Level经济课程。但是，对于A-Level经济究竟偏文还是偏理，考…

人工智能 2023年5月30日
00100
【金猿技术展】维智ST-AI ——全栈时空扩展智能决策技术

维智科技技术本项目由维智科技投递并参与——2021大数据产业创新技术突破榜榜单及奖项”评选。数据智能产业创新服务媒体 ——聚焦数智 · 改变商业维智全栈时空AI（…

人工智能 2023年6月1日
00104
离散数学—判断矩阵：自反性，反自反性，对称性得到矩阵的自反闭包，对称闭包。

目录 1-自反性，反自反性，对称性 2–矩阵的自反闭包，对称闭包 1-自反性，反自反性，对称性题目:从键盘输入集合A的元素值，键盘输入A到A 关系矩阵M。判断该关系…

人工智能 2023年6月27日
0097
C语言期末复习题（上）

1. 输入两个正整数，m和n，求其最大公约数和最小公倍数。 test01() { int m, n; int gy = 0, gb = 0; printf("请输入输入两…

人工智能 2023年6月30日
0085
数字电路基础05（TTL、MOS、CMOS）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月26日
0079
Python操作Redis详解

介绍 Redis是一个开源的基于内存也可持久化的Key-Value数据库，采用ANSI C语言编写。它拥有丰富的数据结构，拥有事务功能，保证命令的原子性。由于是内存数据库，读写非常…

人工智能 2023年7月5日
0062
Python数据分析入门笔记10——简单案例练习（学生信息分析）

系列文章目录 Python数据分析入门笔记1——学习前的准备 Python数据分析入门笔记2——pandas数据读取 Python数据分析入门笔记3——数据预处理之缺失值 Pyth…

人工智能 2023年7月8日
0060

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

支持向量机分类算法

🚀 优质资源分享 🚀

大家都在看