sklearn支持向量机（SVM）多分类问题

2023年7月3日上午9:39 • 人工智能 • 阅读 92

模型

sklearn.svm中的支持向量机：
Classify： SVC、 nuSVC、 LinearSVC
Regression： SVR、 nuSVR、 LinearSVR
OneClassSVM

本文采用 Classify系列，classify三个模型的区别；参数详解

预处理

import pandas as pd
path = "../Data/classify.csv"
rawdata = pd.read_csv(path)
X = rawdata.iloc[:,:13]
Y = rawdata.iloc[:,14]
Y = pd.Categorical(Y).codes

建模

from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, recall_score
import sklearn.svm as svm
x_train, x_test, y_train, y_test = \
    train_test_split(X, Y, test_size=0.3)
model = svm.SVC(kernel="linear", decision_function_shape="ovo")

训练

acu_train = model.score(x_train, y_train)
acu_test = model.score(x_test, y_test)
y_pred = model.predict(x_test)
recall = recall_score(y_test, y_pred, average="macro")

多种SVC、核函数对比

def svc(kernel):
    return svm.SVC(kernel=kernel, decision_function_shape="ovo")

def nusvc():
    return svm.NuSVC(decision_function_shape="ovo")

def linearsvc():
    return svm.LinearSVC(multi_class="ovr")

def modelist():
    modelist = []
    kernalist = {"linear", "poly", "rbf", "sigmoid"}
    for each in kernalist:
        modelist.append(svc(each))
    modelist.append(nusvc())
    modelist.append(linearsvc())
    return modelist

def svc_model(model):
    model.fit(x_train, y_train)
    acu_train = model.score(x_train, y_train)
    acu_test = model.score(x_test, y_test)
    y_pred = model.predict(x_test)
    recall = recall_score(y_test, y_pred, average="macro")
    return acu_train, acu_test, recall

def run_svc_model(modelist):
    result = {"kernel": [],
              "acu_train": [],
              "acu_test": [],
              "recall": []
              }

    for model in modelist:
        acu_train, acu_test, recall = svc_model(model)
        try:
            result["kernel"].append(model.kernel)
        except:
            result["kernel"].append(None)
        result["acu_train"].append(acu_train)
        result["acu_test"].append(acu_test)
        result["recall"].append(recall)

    return pd.DataFrame(result)

run_svc_model(modelist())

对比的结果：

优化linear核函数的SVC的惩罚系数

惩罚系数（C=）越高，对错误分类的惩罚越大，模型训练时的准确率就会提高。但若惩罚系数过高，不仅增加了计算资源的消耗，还可能导致模型过拟合，泛化能力减弱。

def test_c():
    result = {"C": [],
              "acu_train": [],
              "acu_test": [],
              "recall": []
              }
    for c in range(10, 101, 10):
        model = svm.SVC(kernel="linear", C=c, decision_function_shape="ovo")
        acu_train, acu_test, recall = svc_model(model)
        result["C"].append(c)
        result["acu_train"].append(acu_train)
        result["acu_test"].append(acu_test)
        result["recall"].append(recall)
    df = pd.DataFrame(result)
    return df
test_c()

结果

大概60的时候是最优的。

其他模型的优化

其他模型也可以通过调节其他参数优化，比如poly为核函数的SVC模型，可以调节多项式的次数进行优化：

def test_degree():
    result = {"degree": [],
              "acu_train": [],
              "acu_test": [],
              "recall": []
              }
    for d in range(1, 11, 1):
        model = svm.SVC(kernel="poly", degree=d, decision_function_shape="ovo")
        acu_train, acu_test, recall = svc_model(model)
        result["degree"].append(d)
        result["acu_train"].append(acu_train)
        result["acu_test"].append(acu_test)
        result["recall"].append(recall)
    df = pd.DataFrame(result)
    return df

test_degree()

结果（纵轴是测试集上的准确率）

一般是多项式的次数越高，准确率就越高。但是还是没有达到linear的80%。而且消耗计算资源。

Original: https://blog.csdn.net/Yvesx/article/details/111201301
Author: Yvesx
Title: sklearn支持向量机（SVM）多分类问题

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/667327/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

jupyter notebook中出现ValueError: signal only works in main thread 报错即长时间in[*] 解决办法

1 问题描述最近学习 tensorflow 本来已经安装了 jupyter notebook 也运行过好几次程序，但是昨天装了一下 google-colab 之后，今天 jupy…

人工智能 2023年5月25日
0060
（4）绪论三：归纳偏好

通过学习得到的一个模型对应了假设空间的一个假设（这是上节假设空间的内容）归纳偏好或偏好：机器学习算法在学习过程中对某种类型假设的偏好（对于一个新西瓜来说：让一个训练好的模型来判断…

人工智能 2023年7月17日
0058
[论文阅读笔记13]Observation-Centric SORT(OCSORT)论文中的公式推导

这篇文章来自CVPR2022, 是我很喜欢的一篇文章, 尝试用更本质的方法优化Kalman滤波. 论文地址: 论文概述这篇文章解决的主要问题是，现有的方法对运动预测都是基于线性…

人工智能 2023年6月25日
0092
【深度学习】【TensorFlow 】查看Tensorflow和python对应版本、将现有的TensorFlow更新到指定的版本

【深度学习】【TensorFlow 】查看Tensorflow和python对应版本、将现有的TensorFlow更新到指定的版本 1、查看Tensorflow和python对应版…

人工智能 2023年5月25日
0084
自适应迁移学习核极限学习机用于预测

目录 0、前言 1、自适应迁移学习核极限学习机原理 1.1 结构风险最小化 1.2 联合分配 1.3 流行正则化 1.4 核极限学习机模型参数求解公式 1.5 自适应迁移学习核极…

人工智能 2023年6月18日
0076
用DESeq2包来对RNA-seq数据进行差异分析

用DESeq2包来对RNA-seq数据进行差异分析差异分析的套路都是差不多的，大部分设计思想都是继承limma这个包，DESeq2也不例外。 DESeq2是DESeq包的更新版本，…

人工智能 2023年7月16日
0088
自定义注解结合SpringAop实现权限，参数校验，日志等等功能

文章目录 * – Aop(Aspect Orient Programming) – 使用场景实现一些共性需求： – 1.参数校验实现 &#821…

人工智能 2023年6月27日
0076
git下载其他项目到本地

git下载其他项目到本地第一步：新建一个目录（在你想存放项目的特定位置）第二步：进入刚刚建立的文件夹，右键单击，选择”Git Bash Here”第三步：…

人工智能 2023年6月27日
0080
Could not find a version that satisfies the requirement numpy＞=1.20.0 (from imageio) 解决办法

记录一下搞了半天才搞成的imageio安装我在anoconda的tensorflow环境下输入’pip install imageio’ 出现这个错误 C…

人工智能 2023年6月25日
00117
【ROS与语音交互教程】ROS noetic下安装并测试pocketsphinx功能包

ROS noetic下安装并测试pocketsphinx功能包 ROS与语音交互教程-ROS下安装并测试pocketsphinx功能包说明：介绍如何在ROS下安装并测试pock…

人工智能 2023年5月27日
00179
ubuntu在arm平台下编译安装opencv(亲测可用)

X86平台安装很多软件一句话就可以搞定，非常方便，但是在arm平台一个简单的软件安装起来都非常费尽，一个软件安装就要折腾好几天。下面就把安装opencv的过程记录下来一、通过pi…

人工智能 2023年7月18日
00160
使用 Logistic 回归进行鸢尾花品种分类【课堂笔记】

前言感觉如果只是看一遍老师提供的课件的话，对 pandas 库以及 sklearn 库中许多功能还是没有一个全面的认识，我感觉还是得自己多动手实践一下才行。（下文代码中使用的库均…

人工智能 2023年7月1日
0086
【XGBoost】第 1 章：机器学习前景

🔎大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流🔎📝个人主页－Sonhhxg_柒的博客_CSDN博客📃🎁欢迎各位→点赞👍 + 收藏⭐️ +…

人工智能 2023年6月16日
0081
ATK-ESP8266使用说明（STM32-F4）

前期准备（无路由器的情况下）：开一个WiFi热点（后期开发板和电脑都要连接到这同一个热点）（一）修改源代码的WiFiIP地址和密码（使用STA模式） //WIFI STA模式,设…

人工智能 2023年6月30日
0082
Unity打包WebGL平台如何区别移动端和电脑端

Unity打包WebGL平台如何区别移动端和电脑端完整解决方案前情提要最近有一个项目，其中有一个功能来控制角色移动，电脑端是使用WASD（键盘）控制，手机移动端呢使用虚拟摇杆…

人工智能 2023年7月30日
0069
Python编程挑战赛

题1：给小朋友分糖，每人分到糖的数量不同，输入小朋友的数量，计算至少需要多少糖？思路：第1个小朋友1颗糖，第2个小朋友2颗糖，第3个小朋友3颗糖，……第n…

人工智能 2023年6月26日
0069

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

sklearn支持向量机（SVM）多分类问题

预处理

建模

训练

多种SVC、核函数对比

优化linear核函数的SVC的惩罚系数

其他模型的优化

大家都在看