SVM多分类应用——基于支持向量机的两组分混合气体四分类定性识别

2023年7月3日上午9:30 • 人工智能 • 阅读 93

基于支持向量机的两组分混合气体四分类定性识别

支持向量机

支持向量机（SVM）是一种二分类模型，它的特征是找出一种分割超平面做到分类的间隔最大化，其中超平面即为将数据分成两类的边界，支持向量则是距离这个超明面距离最近的点的坐标，间距为支持向量到超平面距离的二倍。这种分类方式使它在线性分类中有别于感知机模型。支持向量机学习算法是求解凸二次规划的最优化算法。

支持向量机学习模型的核心是核函数，选择一个适合模型的核函数，并有效地调整函数的参数，才能训练出适合模型的支持向量机分类超平面。核函数的选择上大致可以分为线性核函数和非线性核函数。

线性核函数任务是找出合适的参数，使得分割超平面间距最大，且能正确对数据进行分类。间距最大是优化目标要正确地对数据分类是约束条件。

对于线性不可分的模型，高斯核函数就是一个很好的选择了。它的主要作用就是把输入特征映射到另外一组特征上。它的优点是可以把特征映射到无限多维，参数也比较好选择。而缺点则是不容易解释，计算速度比较慢，容易过拟合。高斯核函数的表现形式为：

如果输入的特征是一维的标量，那么高斯核函数对应的形状就是一个类似正态分布的反钟形的曲线，其参数σ控制反钟形的宽度。

; MATLAB仿真

该仿真模型是在matlab的环境下，运用支持向量机的原理，采用了高斯核函数对数据集进行训练，最终对训练集进行进行四分类。训练完成后，用测试集进行回归检验，并进行评价。

首先要对数据集进行预处理，该模型作为示例没有用很多训练集去严格的优化支持向量机的性能，在搭建模型完成后，仅通过调整不同的参数去观察参数对于分类结果的影响。

下图为数据集EXCEL表’train.xls’从A1到H64，数据集64组，测试集11组。

该数据集每组数据两个标签，根据两个标签不同状态，将数据集分成四类，分别是（-1，-1），（-1，1），（1，-1），（1，1）之后在整合成一个新的标签分成1，2，3，4贴在数据集上。

接下来就是设置支持向量机的参数，模型最终选用了高斯核函数对数据集进行处理，数据集对于线性分类的表现并不优秀，高斯核函数的表现更好并且优点是参数更容易选择。

设置好支持向量机的参数后，用matlab自带的fitcsvm函数对训练集进行训练。在fitcsvm是matlab中替代了svmtrain函数的官方的函数，在使用这个函数时需要根据支持向量机的目的对多个参数进行设置：

SVMMODEL = fitcsvm(train_data,train_class,'KernelFunction','gaussian','KernelScale', 10,'BoxConstraint',1000);

train_data是训练样本，可以支持的nxm的训练集矩阵，train_class是样本标签，支持nx1的标签矩阵；’KernelFunction’,’gaussian’ 为一对一起使用的参数，有3种 ‘linear’， ‘gaussian’/’rbf’，’polynomial’；其他的参数如’BoxConstraint’,1000 为一对一起使用的参数，是svm的惩罚因子。matlab默认的BoxConstraint为1。参数’KernelScale’,10为键值对参数，表示了高斯核函数的参数取值。

支持向量机是只支持二分类的，对于多分类问题，模型采取了对每一个类都进行一次SVM分类的方法，也就是说对于m个分类需要训练m个二类分类器。对每个类进行一次二分类，当分类到第i个分类器时，把第i类标签置为1，其他类都置为2，这样针对每一个类都需要训练一个二类分类器。测试时对于一个需要分类的测试样本，通常选择最终这个样本在每个SVM二分类器中表现最好的那个类别标记为分类结果。

为了方便观察分类结果，模型对于fitcsvm的分类使用了梯度图进行展示，原理就是，把模型范围规范到训练集二维坐标的最大值最小值之内，在范围内以一定的间隔均匀取点，进行支持向量机的测试，取测试结果最接近0的点连接起来画出分界线，红圈以内的点为支持向量。

第三步，在支持向量机训练好数据之后，对测试集进行回归测试。对四个支持向量机分类模型，均进行测试并把每次分类的结果返回到一个矩阵当中。取出该矩阵每一行的最大值，并返回该值的列数即为最终的测试集标签。

以下为11个测试数据最终权重和分类结果。

最后，测试集预测标签生成之后，将其与测试集真实标签进行对比，对支持向量机的表现进行评价，评价指标采用了confusionmat函数。这是混淆矩阵函数，多用于有监督学习，用于比较分类结果和实际测得值，可以把分类结果的精度显示在一个混淆矩阵里面。

混淆矩阵的主对角线值为预测正确，非主对角线的非零值为预测误差，横向比较为实际值的比较，用于评价预测模型的精确度，纵向比较为预测值得比较，用于评价预测模型的全面程度，以主对角线为中心同时对横向和纵向比较尽心考量，即为预测的精度。

以下为支持向量机的matlab程序：

%&#x8BFB;&#x53D6;&#x8868;&#x683C;&#x8BAD;&#x7EC3;&#x96C6;&#x6570;&#x636E;
 file_name = 'train.xls';
 train_data = xlsread(file_name,'A1:B64');
 train_label = xlsread(file_name,'C1:D64');

 %&#x8BFB;&#x53D6;&#x6D4B;&#x8BD5;&#x96C6;&#x6570;&#x636E;
 test_data = xlsread(file_name,'E1:F11');
 test_label = xlsread(file_name,'G1:H11');

 %&#x8BBE;&#x7F6E;4&#x4E2A;&#x4E8C;&#x5206;&#x7C7B;&#x5668;
 train_class1 = zeros(64,1);
 train_class2 = zeros(64,1);
 train_class3 = zeros(64,1);
 train_class4 = zeros(64,1);
 train_class = zeros(64,1);
 %&#x5C06;&#x8BAD;&#x7EC3;&#x96C6;&#x6807;&#x7B7E;&#x586B;&#x5165;&#x5206;&#x7C7B;&#x5668;
 [m,~] = size(train_data);
 for i = 1:m
     if train_label(i,1) == -1
         if train_label(i,2) == -1
             train_class1(i) = 1;
             train_class(i) = 1;
         end
         if train_label(i,2) == 1
             train_class2(i) = 1;
             train_class(i) = 2;
         end
     end
     if train_label(i,1) == 1
         if train_label(i,2) == -1
             train_class3(i) = 1;
             train_class(i) = 3;
         end
         if train_label(i,2) == 1
             train_class4(i) = 1;
             train_class(i) = 4;
         end
     end
 end

 %&#x5C06;&#x8BAD;&#x7EC3;&#x6A21;&#x578B;&#x8FDB;&#x884C;&#x663E;&#x793A;
 figure;
 gscatter(train_data(:,1),train_data(:,2),train_class);
 title('&#x8BAD;&#x7EC3;&#x6570;&#x636E;&#x6837;&#x672C;&#x5206;&#x5E03;');
 xlabel('&#x6837;&#x672C;&#x7279;&#x5F81;1');
 ylabel('&#x6837;&#x672C;&#x7279;&#x5F81;2');
 grid on;

 %&#x8BBE;&#x7F6E;&#x9AD8;&#x65AF;&#x6838;&#x51FD;&#x6570;&#x7684;&#x652F;&#x6301;&#x5411;&#x91CF;&#x673A;&#x53C2;&#x6570;
 kernel = 'gaussian';
 sigma = 10;
 C = 1000;
 %&#x5BF9;&#x8BAD;&#x7EC3;&#x96C6;&#x6570;&#x636E;&#x5206;&#x522B;&#x652F;&#x6301;&#x5411;&#x91CF;&#x673A;&#x7684;&#x8FDB;&#x884C;&#x8BAD;&#x7EC3;
 model1 = fitcsvm(train_data,train_class1,'KernelFunction',kernel,'KernelScale', sigma,'BoxConstraint',C);
 model2 = fitcsvm(train_data,train_class2,'KernelFunction',kernel,'KernelScale', sigma,'BoxConstraint',C);
 model3 = fitcsvm(train_data,train_class3,'KernelFunction',kernel,'KernelScale', sigma,'BoxConstraint',C);
 model4 = fitcsvm(train_data,train_class4,'KernelFunction',kernel,'KernelScale', sigma,'BoxConstraint',C);

 %&#x7ED8;&#x5236;fitcsvm&#x7684;&#x5206;&#x754C;&#x7EBF;
 svInd1 = model1.IsSupportVector;
 svInd2 = model2.IsSupportVector;
 svInd3 = model3.IsSupportVector;
 svInd4 = model4.IsSupportVector;
 %&#x8BBE;&#x7F6E;&#x53D6;&#x70B9;&#x95F4;&#x9694;&#x548C;&#x8303;&#x56F4;
 h = 0.1;
 max1 = max(train_data(:,1));
 max2 = max(train_data(:,2));
 min1 = min(train_data(:,1));
 min2 = min(train_data(:,2));
 [X1,X2] = meshgrid(min1:h:max1,min2:h:max2);
 %&#x8303;&#x56F4;&#x5185;&#x751F;&#x6210;&#x6A21;&#x578B;&#x7ED3;&#x679C;
 [~,score1] = predict(model1,[X1(:),X2(:)]);
 scoreGrid1 = reshape(score1(:,2),size(X1,1),size(X2,2));
 %&#x753B;&#x56FE;
 figure;
 plot(train_data(:,1),train_data(:,2),'k.');
 hold on;
 plot(train_data(svInd1,1),train_data(svInd1,2),'ro','MarkerSize',10)
 contour(X1,X2,scoreGrid1);
 colorbar;
 title('model1&#x5206;&#x754C;&#x7EBF;');
 %&#x751F;&#x6210;model2&#x56FE;&#x50CF;
 [~,score2] = predict(model2,[X1(:),X2(:)]);
 scoreGrid2 = reshape(score2(:,2),size(X1,1),size(X2,2));
 figure;
 plot(train_data(:,1),train_data(:,2),'k.');
 hold on;
 plot(train_data(svInd2,1),train_data(svInd2,2),'ro','MarkerSize',10)
 contour(X1,X2,scoreGrid2);
 colorbar;
 title('model2&#x5206;&#x754C;&#x7EBF;');
 %&#x751F;&#x6210;model3&#x56FE;&#x50CF;
 [~,score3] = predict(model3,[X1(:),X2(:)]);
 scoreGrid3 = reshape(score3(:,2),size(X1,1),size(X2,2));
 figure;
 plot(train_data(:,1),train_data(:,2),'k.');
 hold on;
 plot(train_data(svInd3,1),train_data(svInd3,2),'ro','MarkerSize',10)
 contour(X1,X2,scoreGrid3);
 colorbar;
 title('model3&#x5206;&#x754C;&#x7EBF;');
 %&#x751F;&#x6210;model4&#x56FE;&#x50CF;
 [~,score4] = predict(model4,[X1(:),X2(:)]);
 scoreGrid4 = reshape(score4(:,2),size(X1,1),size(X2,2));
 figure;
 plot(train_data(:,1),train_data(:,2),'k.');
 hold on;
 plot(train_data(svInd4,1),train_data(svInd4,2),'ro','MarkerSize',10)
 contour(X1,X2,scoreGrid4);
 colorbar;
 title('model4&#x5206;&#x754C;&#x7EBF;');

 %&#x5C06;&#x6D4B;&#x8BD5;&#x96C6;&#x5728;4&#x4E2A;&#x5206;&#x7C7B;&#x5668;&#x4E2D;&#x5206;&#x522B;&#x8BAD;&#x7EC3;&#x8FD4;&#x56DE;&#x5176;&#x5728;&#x5404;&#x4E2A;&#x5206;&#x7C7B;&#x5668;&#x7684;&#x503C;
 [label1,fianl_score1] = predict(model1,test_data);
 [label2,final_score2] = predict(model2,test_data);
 [label3,final_score3] = predict(model3,test_data);
 [label4,final_score4] = predict(model4,test_data);
 %&#x5C06;&#x6D4B;&#x8BD5;&#x540E;&#x7684;&#x6570;&#x636E;&#x878D;&#x5408;
 final_score = [fianl_score1(:,2),final_score2(:,2),final_score3(:,2),final_score4(:,2)];
 final_label = zeros(11,1);
 %&#x8FD4;&#x56DE;&#x878D;&#x5408;&#x540E;&#x7684;&#x6807;&#x7B7E;&#x4E0E;&#x4F4D;&#x7F6E;&#x7684;&#x6700;&#x5927;&#x503C;&#x548C;&#x4F4D;&#x7F6E;&#xFF0C;&#x751F;&#x6210;&#x6700;&#x7EC8;&#x7684;&#x6807;&#x7B7E;&#xFF0C;&#x5B8C;&#x6210;&#x6D4B;&#x8BD5;&#x96C6;&#x9884;&#x6D4B;
 [m,~] = size(final_label);
 for i = 1:m
     [~,n] = max(final_score(i,:));
     final_label(i,:) = n;
 end
 %&#x751F;&#x6210;&#x6D4B;&#x8BD5;&#x96C6;&#x5B9E;&#x9645;&#x503C;
 test_expect = zeros(11,1);
 [m,~] = size(test_expect);
 for i = 1:m
     if test_label(i,1) == -1
         if test_label(i,2) == -1
             test_expect(i) = 1;
         end
         if test_label(i,2) == 1
             test_expect(i) = 2;
         end
     end
     if test_label(i,1) == 1
         if test_label(i,2) == -1
             test_expect(i) = 3;
         end
         if test_label(i,2) == 1
             test_expect(i) = 4;
         end
     end
 end

 %&#x6D4B;&#x8BD5;&#x96C6;&#x663E;&#x793A;
 figure;
 gscatter(test_data(:,1),test_data(:,2),test_expect);
 title('&#x6D4B;&#x8BD5;&#x6570;&#x636E;&#x6837;&#x672C;&#x771F;&#x5B9E;&#x5206;&#x5E03;');
 xlabel('&#x6837;&#x672C;&#x7279;&#x5F81;1');
 ylabel('&#x6837;&#x672C;&#x7279;&#x5F81;2');
 grid on;
 figure;
 gscatter(test_data(:,1),test_data(:,2),final_label);
 title('&#x6D4B;&#x8BD5;&#x6570;&#x636E;&#x6837;&#x672C;&#x9884;&#x6D4B;&#x5206;&#x5E03;');
 xlabel('&#x6837;&#x672C;&#x7279;&#x5F81;1');
 ylabel('&#x6837;&#x672C;&#x7279;&#x5F81;2');
 grid on;

 %&#x6570;&#x636E;&#x8BC4;&#x4EF7;
 A = confusionmat(test_expect,final_label,'Order',[1;2;3;4]);
 [m,~] = size(A);
 for i = 1:m
     c_p = A(i,i) / sum(A(:,i));
     c_r = A(i,i) / sum(A(i,:));
     c_F = 2*c_p*c_r / (c_p + c_r);
     fprintf('&#x7B2C;%d&#x7C7B;&#x7684;&#x67E5;&#x51C6;&#x7387;&#x4E3A;%f,&#x67E5;&#x5168;&#x7387;&#x4E3A;%f,F&#x6D4B;&#x5EA6;&#x4E3A;%f\n\n',i,c_p,c_r,c_F);
 end

仿真结果

对于核函数的参数调整，高斯核函数自身的参数值越小，分类曲线更加的复杂，分类的边界越陡峭，梯度下降的越快，可能会发生分类超平面过于贴合训练集，进而导致过拟合问题，使分类模型对训练数据过分拟合，而对测试数据预测效果不佳。惩罚因子，值越大分类曲线越复杂，也就是说越容易发生过拟合，过小会因为曲线过于圆滑，对于靠近分界线的测试集点的分类，就可能会有误分类的情况。

Original: https://blog.csdn.net/weixin_46288258/article/details/116310639
Author: 土豆哪里去挖？？
Title: SVM多分类应用——基于支持向量机的两组分混合气体四分类定性识别

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/667315/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

利用Python(netCDF4库)读取.nc文件（NetCDF气象数据文件）的基本操作

NetCDF(network Common Data Form)网络通用数据格式是一种面向数组型并适于网络共享的数据的描述和编码标准。目前，NetCDF广泛应用于大气科学、水文、海…

人工智能 2023年7月15日
0085
数据分析与挖掘———SPSS Moderler

数据分析与挖掘———SPSS Moderler 一、Modeler给概述 1、SPSS Modeler基本认识 IBM SPSS Modeler是一组 数&a…

人工智能 2023年7月16日
0068
【树莓派入门】从零开始在树莓派上运行YOLOV5项目实战教程

项目进度《树莓派YOLOV5环境搭建点》击跳转到对应章节（上篇）《基于物联网的智能草莓种植系统》点击跳转到对应章节（下篇）简介：本项目是对上篇环境搭建的一个具体实践项目…

人工智能 2023年5月26日
0066
联邦学习综述（一）——联邦学习的背景、定义及价值

原文地址：https://zhanghan.xyz/posts/54575/ 文章目录第一章：联邦学习背景 * 1.1 现状 1.2 挑战 1.3 联邦学习解决方案 1.4 联邦…

人工智能 2023年7月27日
0063
[深度学习]如何替换YoloV5的主干网络:Flexible-Yolov5

Flexible-Yolov5:可自定义主干网络的YoloV5工程实践本文目录：概述理论学习与环境配置准备自己的数据集修改或调整自定义的主干网络部署训练一、概述 Yo…

人工智能 2023年7月20日
0047
基于51单片机的高精度可调数控稳压电源Proteus仿真

资料编号：131 下面是相关功能视频演示： 131-基于51单片机的高精度可调数控稳压电源Proteus仿真（源码+仿真+全套资料）功能讲解：采用51单片机作为主控，独立按键来…

人工智能 2023年6月26日
0093
周亚军红宝书案例 3 telnet远程管理协议

案例 3 telnet远程管理协议实验要求配置要点实验步骤 * 1、设置IP ，实现设备间通讯 2、开启telnet服务和vty 0 4 设置用户级别 3、验证核心知识…

人工智能 2023年6月29日
0058
论文阅读笔记9-Deformable DETR: Deformable Transformers for end-to-end object detection

2022.4.29补充关于DETR和Deformable DETR算法复杂度的对比，正好今天写论文写到，简单捋了一下，先贴在这里供参考。 DETR复杂度： Deformable D…

人工智能 2023年7月12日
0063
e签宝亮相2022秋季钉峰会，「智能合同」提升企业数字韧性

啊哦~你想找的内容离你而去了哦 [TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:ser…

人工智能 2023年6月2日
0056
前端工程师个人的价值在哪里（换一个人能不能做？）【前端晋升必看】

最近脉脉上这张图片在前端圈子中火了起来。这个故事中”毫无人性”的评委在晋升中对前端同学提出了两个置疑点：业务方向是产品经理决定的，即使前端高质量高效率的完…

人工智能 2023年6月30日
0065
ROC曲线绘制（Python）

首先以支持向量机模型为例先导入需要使用的包，我们将使用roc_curve这个函数绘制ROC曲线！ from sklearn.svm import SVC from sklearn…

人工智能 2023年6月23日
0044
Spark DataFrame写入HBase的常用方式

Spark是目前最流行的分布式计算框架，而HBase则是在HDFS之上的列式分布式存储引擎，基于Spark做离线或者实时计算，数据结果保存在HBase中是目前很流行的做法。例如用户…

人工智能 2023年6月2日
0069
服务器3090训练laneAF–环境配置(DCNv2编译报错、cuda版本不匹配)问题记录

使用的torch=1.7.0 torchvision=0.8.1 cuda=10.1 这里使用torch=1.7.0的原因是因为DCNv2，原作者提供的代码对pytorch1.7以…

人工智能 2023年7月22日
0043
Python代理IP异常：requests.exceptions.ProxyError: HTTPSConnectionPool(host=‘xxxx‘, port=443)

背景这是我在使用Python爬取网页信息的时候出现的异常。由于很多要爬取的网站会把”IP限制”作为反爬虫手段，所以我偶尔会使用”代理IP服务…

人工智能 2023年7月29日
0059
基于keras采用LSTM实现多标签文本分类（一）

多标签和多分类的区别 1.多标签即一条语句可能有多个类别划分。例如，这个酸菜鱼又酸又辣。属于酸和辣两个标签。在采用神经网络学习时，最后一层的激活函数应采用 sigmoid_激活函数…

人工智能 2023年6月30日
0083
支持向量机回归python_在python中SVM回归更快

我正试图加速在python中使用gridsearchcv(用于调整rbf函数的参数)的过程。然而,这需要永远。我有一个适度小的数据集(尺寸600 x 8),所以我不认为尺寸是一个问…

人工智能 2023年6月18日
0071

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

SVM多分类应用——基于支持向量机的两组分混合气体四分类定性识别

支持向量机

; MATLAB仿真

仿真结果

大家都在看