【Sklearn】【API详解】【SVM】- sklearn.svm.SVR参数详解（二）

2023年6月16日下午11:32 • 人工智能 • 阅读 99

SVR为Support Vector Regression的简写，顾名思义，其是基于支持向量的回归器
模型中的 两个自由参数为 C 和 epsilon，自由参数不能通过理论推测，可以通过实验、科研猜测和随机指定来设置， 即自由参数的调节是个玄学，没有理论指导
SVR是基于libsvm实现的
SVR的拟合时间是和样本数量呈二次方指数关系，因此这一分类模型 *适用于样本较小的情况，如果样本量过大（>1W），建议使用其他回归模型，例如 LinearSVR 或者 SGDRegressor

3.1 API形式

形式如下，里面的参数均为默认参数

SVR(*, kernel='rbf', degree=3, gamma='scale', coef0=0.0, tol=0.001, C=1.0, epsilon=0.1, shrinking=True,
 cache_size=200, verbose=False, max_iter=- 1)

3.2 参数说明

参数名称数据作用

核函数1. string类型

{‘linear’, ‘poly’, ‘rbf’, ‘sigmoid’, ‘precomputed’}
默认值为’rbf’

用来选择映射到高维线性可分的核函数

简单、运算效率高；缺点：对线性不可分的数据集没有很好的效果

可以拟合出复杂的分割超平面；缺点：有三个参数，调参困难，且当n过大时，模型拟合时间会很长；

通常定义为样本到数据中心之间径向距离（通常是欧氏距离）的单调函数（由于距离是径向同性的）；

也称为

不用再次拟合核函数对应的Gram 矩阵，直接进行映射就可以了

多项式核函数的维度1. int类型，默认值为3

只有在使用多项式核函数的时候才有用，使用其他核函数自动忽略此参数

用来确定多项式核函数的维度，即n的值

‘rbf’, ‘poly’ 和’sigmoid’ 核函数的系数1. string类型，默认值为’scale’

{‘auto’, ‘scale’}

gamma = 1 / n_features

gamma = 1 / (n_features * X.var())

只作用于 rbf， poly，sigmoid 三个核函数

常数项1. float类型，默认值为0

只作用于poly 和 sigmoid 核函数

作用相当于是对核函数映射的结果进行一个移位操作

停止拟合容忍度1. float类型，默认值为1e-3 即为0.001

定义模型停止拟合的误差值

正则化系数1. float类型，默认值为1.01. 正则化的强度与C的大小成反比，且必须为正。

主要是用来防止模型过拟合
C值越大，对模型的惩罚越高，泛化能力越弱（过拟合）
反之，C值越小，对模型的惩罚越低，泛化能力越强（欠拟合）

希腊字母

float类型，默认值：0.11. 用来定义模型对于错误分类的容忍度，即错误分类而不受到惩罚

的值越大，模型允许错误分类的容忍度越高，反之，容忍度越小

支持向量的个数对

的大小敏感，

也可以理解为

启用启发式收缩1. bool类型，默认为True1. 是否采用启发式收缩，

，然而如果我们对停止迭代容忍度较高时（tol参数来反映），不用启发式收缩可能会更快一些

核缓存大小1. float类型，默认值为200（MB）1. 指定模型在训练时，能占用的最大RAM空间（PS. 经过实验，当大小设置超过2000MB时，训练时长反而会增加，这应该是一个BUG），在2000MB以内，不超过其所需最大内存，则不会降低训练速度，也不会增加。

所以训练多采用的数据集维度越高，条数越高，当所需内存超出了，我们可以通过调整cache_size 的大小来加快模型拟合

启用详细输出1. bool类型，默认值：False1. 该参数表示日志是否启用详细输出，会输出iter次数，nSV等参数的值

如果启用，可能会导致无法进行多线程工作，降低拟合速率

最大迭代次数1. int类型，默认值: -11. 硬性设置最大迭代次数，不管模型是否拟合完成，即不关心误差值(tol参数)

设置-1的话，意味着不限制迭代次数，即按照误差值来停止模型拟合

3.3 属性说明

属性名称数据作用

各类权重1. ndarray，一维数组，(n_classes, )1. 用来获取模型对各个类别设置的权重，与参数中的class_weight相关

特征权重向量1. ndarray，二维数组，(n_classes * (n_classes – 1) / 2, n_features)1. 获取特征权重向量

当核函数为linear时，才可以调用这一属性

对偶系数1. ndarray，二维数组，(n_classes -1, n_SV)1. decision_funciton 中的支持向量的对偶系数

n_SV 为支持向量的个数
所有 ovo 分类器的系数

拟合状态1. int类型1. 拟合成功0，否则为1，进行告警

决策函数常量1. ndarray，一维数组， (n_classes * (n_classes – 1) / 2, )1. decision_funciton 中的常量

特征数量1. int类型1. 拟合过程中使用到的特征数量

特征名称1. ndarray，一维数组，(n_features_in_,)1. 获取拟合时特征的名称

每类的支持向量数1. ndarray，一维数组，(n_classes,), dtype=int321. 获取每种类别的支持向量数

数组维数1.元组，(n_dimensions_of_X,)1.训练向量X的数组维数

支持向量索引1. ndarray，一维数组， (n_SV，)1. 获取模型拟合后获得的所有支持向量的索引

支持向量1. ndarray，二维数组，(n_SV, n_features)1. 获取所有的支持向量

4.1 fit(X, y, sample_weight=None)

1. 描述： 用训练数据拟合模型
2. 参数： X: 训练数据; y: 训练数据标签； sample_weight: 每个样本的权重，(n_samples,)
3. 返回值： 自身，拟合好的模型
4. 注意： 无

4.2 get_params(deep=True)

1. 描述： 获取模型的所有参数
2. 参数： 如果为真，则将返回此模型和作为模型的所包含子对象的参数
3. 返回值： 字典类型，所有的参数
4. 注意： 无

4.3 predict(X)

1. 描述： 用拟合好的模型对所有样本X进行预测
2. 参数： 所有预测样本，二维数组（n_samples, n_features)
3. 返回值： 所有预测 X的预测标签，一维数组，(n_sample, )
4. 注意： 无

4.4 score(X, y, sample_weight=None)

1. 描述： 返回给定测试数据上的平均准确度
2. 参数： X: 训练数据; y: 训练数据标签； sample_weight: 每个样本的权重，(n_samples,)
3. 返回值： R 2 R^2 R 2
4. 注意： R 2 R^2 R 2 被定义为 1 − u / v 1-u/v 1 −u /v, u u u 是 ∑ i = 1 n ( y − y ^ ) 2 \sum_{i=1}^n(y – \hat{y})^2 ∑i =1 n (y −y ^)2 的残差和， v v v 是 ∑ i = 1 n ( y − y . m e a n ( ) ) 2 \sum_{i=1}^n{(y-y.mean())^2}∑i =1 n (y −y .m e a n ())2的平方和，R 2 R^2 R 2 的值越大证明模型性能越好，最大为1，其值也可以为负，意味着模型性能更差，且无最小值

4.5 set_params(**params)

1. 描述： 重置当前模型的参数
2. 参数： 字典类型，内容为当前模型的参数
3. 返回值： 重置参数后的模型
4. 注意： 无

在写这篇文章的过程中发现了前一篇文章的一些错误，已经回头修改了。在查阅文献的过程中，明白了SVM为什么能做回归任务了， 因为其本质上仍是把回归任务当做分类任务来处理，只不过在模型评价的过程中，用了不一样的评价指标，这里是R 2 R^2 R 2 。

有时间再继续更新~

希望这篇文档能对各位看官产生一定的帮助，如有不妥，欢迎评论区指正~

Original: https://blog.csdn.net/weixin_42279212/article/details/121550052
Author: 拾夕er
Title: 【Sklearn】【API详解】【SVM】- sklearn.svm.SVR参数详解（二）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/627299/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

matlab目标跟踪目标检测项目系统源码合集【33套】

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月9日
0075
图像校正-仿射图像的畸变校正

仿射变换仿射变换的变换矩阵为：可以简写为：对偶于圆点（circular point）的圆锥曲线为：如果直线 l 和 m 在原平面上垂直，那么有：对于仿射变换的平面，可以推导出如…

人工智能 2023年6月18日
0065
杰理之Recorder mix 详细接口说明【篇】

// ————————————&#8…

人工智能 2023年5月23日
0071
简单视频分类模型

视频可以简单看作一系列图片的集合有几种方法可以对视频进行分类： [En] There are several ways to classify videos: 本文介绍最简单的 …

人工智能 2023年5月24日
0053
Python实现人脸识别功能，face_recognition的使用 | 机器学习

前言接着上一篇：AI识别照片是谁，人脸识别face_recognition开源项目安装使用 | 机器学习_阿良的博客-CSDN博客根据项目提供的demo代码，调整了一下功能，自…

人工智能 2023年6月4日
0080
【阅读笔记】Towards Personalized Federated Learning个性化联邦综述

文章目录前言 1 背景 * 1.1 机器学习、联邦学习 1.2 促进个性化联邦学习的动机 2 个性化联邦学习的策略 * 2.1 全局模型个性化 – 2.1.1 基于数…

人工智能 2023年6月15日
00113
数据科学与大数据技术与计算机科学与技术哪个好

数据科学与大数据技术，智能科学与技术，这两个专业我该如何选择？哪个好这两门课，一个是大数据，一个是人工智能都是现在炙手可热的学科。相对而言，大数据适用性更广一些。人工智能专业，…

人工智能 2023年7月14日
0075
R语言——数据类型详解

R语言——数据类型详解 R语言支持的数据类型数值型整数型逻辑型字符型复数型原生型 R语言的数据对象类型包括向量：一个向量只能有一种数据类型矩阵：一个矩阵只能有一种数…

人工智能 2023年7月16日
0078
目标检测 YOLOv5 – 损失函数的改进

flyfish 完整代码下载地址该改进源码完全兼容原版的YOLOv5:v5版本，同时backbone支持mobilenetv3,shufflenetv2，原有的backbone全部…

人工智能 2023年7月21日
0076
＜＜从零入门机器学习＞＞通过Anaconda管理工具安装Scikit-Learn机器学习算法库并举例使用（以K近邻算法为例）第四讲

目录 * – 1. 文章主要内容 – 2. Anaconda管理工具安装Scikit-Learn库(图文并茂) – 3. 在JupyterNot…

人工智能 2023年6月16日
0079
Python数据分析教程01：jupyter的使用及numpy要点总结

1 什么是数据分析数据分析是把隐藏在一些看似杂乱无章的数据背后的信息提炼出来，总结出所研究对象的内在规律使得数据的价值最大化分析用产的消费行为制定促销活动的方案。制定促销时…

人工智能 2023年7月17日
0074
怎样P漫画脸？这三个简单方法分享给你

大家在看朋友圈或者一些社交平台时，有没有看到有人分享了一些自己漫画脸的照片，不知道你们是否和我一样看到这些有趣的照片时，也会产生一点好奇心，想知道他们是怎么制作出来的。后来自己研究…

人工智能 2023年6月28日
0087
【数据处理方法】主成分分析（PCA）原理分析

笔者最近在学习的过程需要使用一些数据分析和处理的方法，而PCA就是其中常用的一种手段。但在自学的过程中，由于笔者水平有限，对一些博客中的公式不是能很好理解（数学不好的辛酸Ծ‸Ծ），…

人工智能 2023年7月15日
0057
二、浅层神经网络

文章目录 1、神经网络的表示 2、激活函数 * 2.1 激活函数的导数 3、神经网络的误差反向传播 4、神经网络参数的随机初始化 THE END 1、神经网络的表示 \qquad …

人工智能 2023年7月14日
0055
基于Matlab的双目视觉三维重建技术

首先需要用到双目视觉平行系统原理之后了解到三维重建原理由两张图象的二维图像哥哥像素点的坐标，推导出咱们三维试图重德三维坐标系统中对应的xyz的坐标数值，并显示在Matlab三维图中…

人工智能 2023年6月10日
00201
MAE 论文逐段精读【论文精读】（深度学习论文篇）

源于沐神： MAE 论文逐段精读【论文精读】 (bilibili.com) MAE 2021.11.11提交 arxiv 知乎百万 view; Reddit or Twitter…

人工智能 2023年7月14日
0070

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31