使用SVM分类器进行图像多分类

2023年6月15日上午3:45 • 人工智能 • 阅读 87

ResNet backbone + SVM分类器

对于样本较为均衡小型数据集，SVM作为分类器的效果与MLP的效果相近。
从经验上看，对于样本不均衡的大型数据集，MLP的效果强于SVM。
本博客在自己的小型数据集上进行实验，本来使用MLP已经达到很好的效果，但导师让试一下SVM分类器，可能会对样本量较小的数据集表现稍好。虽然在心里觉得SVM这种方法不太可能有提高，但趁此机会学习一下SVM还是有好处的。

SVM相关知识：

这里仅作简单陈述，详细地可百度或B站，特别多资源
基本理念：最初的SVM是用来作二分类的，目标是在特征空间中找到一个超平面，让任意样本的点到平面的距离大于等于1。
如果样本线性不可分，则需要使用核函数来进行非线性分类，也就是得到非线性超平面。

核函数

SVM可以通过核方法（kernel method）进行非线性分类，是常见的核学习（kernel learning）方法之一。一些线性不可分的问题可能是非线性可分的，即特征空间存在超曲面（hypersurface）将正类和负类分开。使用非线性函数可以将非线性可分问题从原始的特征空间映射至更高维的希尔伯特空间（Hilbert space）H ，从而转化为线性可分问题。

常见的核函数有：多项式核（阶为1时称为线性核）、径向基函数核（又称RBF核、高斯核）、拉普拉斯核、Sigmoid核。
常用线性核和高斯核。
参考自b站：https://www.bilibili.com/video/BV1mP4y137U4?p=2

; 线性核函数

解决问题 从简单的出发，先试一下线性核函数的效果！
公式注意是内积
适用于：特征已经比较丰富了，样本数据量大，即十万、百万这数量级。

多项式核函数（了解即可，不常用）：
给定3个参数，Q控制高次项，越高次对应越复杂的边界，计算量也相应越大，具体视任务情况而定

γ和Q就是要调的超参，得在炼丹过程中调整。

高斯核函数——最常用的

公式如下：

高斯核函数能 把低维特征映射为无穷维的特征，比如有m个数据，每个数据是10维，那么根据公式可得到每个数据Xi和任意数据Xk的”距离”Dx，有m个数据，就计算m次，得到m个Xi与Xk的”距离”，然后将Xi里的第k个元素更换为Xi和Xk的”距离”，也就是变成m维了，因此 可用于扩充特征维度，让模型对数据点有更好的认识和区分。

σ越小，越陡，特征越鲜明，可能对分类效果略好，但是风险越大，可以看第二张图。

; SVM多分类

SVM如何做多分类呢？有直接法和间接法，但直接法不常用，间接法中常用的时一对一（ovo）和一对多（ovr）策略
具体可以来看这篇文章

总结

一对一就是训练 m（m-1）/2 个分类器（m为类别总数），也就是每两个类别之间训练一个分类器，然后用投票法，将预测的变量输入到所有分类器中，预测为label k，则k的得票+1，统计所有的分类器的输出结果，得票最多的类别就是最终预测结果。
优劣：当类别很多时，model的个数是m（m-1）/2，代价很大哦

一对多就是对于第k个类别，将label k的样本设为正类，而其他类别的样本都设为负类，最后训练 m个分类器（m为类别总数）。预测时，将变量输入到所有分类器中，如果只有一个分类器输出正值，则可直接判定结果为该分类器对应的类别，否则选取判别函数值最大的分类器所对应的类别为最终预测结果。
优点：训练m个分类器，个数较少，其分类速度相对较快。
缺点：每个分类器的训练都是讲全部的样本作为训练样本，如果不是线性可分数据，训练速度会随着训练样本的数量增加而急剧减慢；同时由于负类样本的数据要远远大于正类样本的数据，从而出现了样本不对称的情况，且这种情况随着训练数据的增加而趋向严重。解决不对称的问题可以引 入不同的惩罚因子，对样本点来说较少的正类采用较大的惩罚因子。还有就是当有新的类别加进来时，需要对所有的模型进行重新训练。

SVM的优缺点：引用

1、SVM算法对大规模训练样本难以实施

SVM的空间消耗主要是存储训练样本和核矩阵，由于SVM是借助二次规划来求解支持向量，而求解二次规划将涉及m阶矩阵的计算（m为样本的个数），当m数目很大时该矩阵的存储和计算将耗费大量的机器内存和运算时间。针对以上问题的主要改进有有J.Platt的SMO算法、T.Joachims的SVM、C.J.C.Burges等的PCGC、张学工的CSVM以及O.L.Mangasarian等的SOR算法。如果数据量很大，SVM的训练时间就会比较长，如垃圾邮件的分类检测，没有使用SVM分类器，而是使用了简单的naive bayes分类器，或者是使用逻辑回归模型分类。

2、用SVM解决多分类问题存在困难

经典的支持向量机算法只给出了二类分类的算法，而在数据挖掘的实际应用中，一般要解决多类的分类问题。可以通过多个二类支持向量机的组合来解决。主要有一对多组合模式、一对一组合模式和SVM决策树；再就是通过构造多个分类器的组合来解决。主要原理是克服SVM固有的缺点，结合其他算法的优势，解决多类问题的分类精度。如：与粗集理论结合，形成一种优势互补的多类问题的组合分类器。

3、对缺失数据敏感，对参数和核函数的选择敏感

支持向量机性能的优劣主要取决于 核函数的选取,所以对于一个实际问题而言,如何根据实际的数据模型选择合适的核函数从而构造SVM算法。目前比较成熟的核函数及其参数的选择都是人为的,根据经验来选取的,带有一定的随意性.在不同的问题领域,核函数应当具有不同的形式和参数,所以在选取时候应该将领域知识引入进来,但是目前还没有好的方法来解决核函数的选取问题。

实现

用scikit-learn包（sklearn）中的svm即可：官网地址
 SVC
LinearSVC
我的实现是使用ResNet50作为特征提取器（去掉最后一层），先加上MLP预训练35个epoch，然后将特征提取器的输出降维（1024维的特征）输入到SVM中进行训练并得到输出，然后评估结果即可。
在我的小型数据集上实现时， 后续要做添加惩罚因子的实验。

Class Classifer(nn.Module):
    def __init__(self):
        super(Classifier,self).__init__()
        renet50 = torchvision.models.resnet50(pretrained)
        modules = list(resnet.children())[:-1]
        self.resnet = nn.Sequential(*modules)
        self.linear0 = nn.Linear(resnet.fc.in_features, 1024)
    def forward(self,images):
        features = self.resnet(images)
        features = features.reshape(features.size(0), -1)
        self.featuremap2048 = copy.deepcopy(features.detach())
        features = self.linear0(features)
        features = self.relu(features)
        self.featuremap1024 = copy.deepcopy(features.detach())
        ...省略掉MLP的forward

for i, (images, classes, lengths) in enumerate(train_loader):

     images = images.to(device)
     classes = classes.to(device)
     targets = classes

     with torch.no_grad():
         outputs = classifier(images)

     featuremap = classifier.featuremap1024

     featuremap_np = featuremap.cpu().numpy()
     targets_np = targets.cpu().numpy()

     svm_clf.fit(featuremap_np,targets_np)

     np_targets_long = []
     outputs_label_long_list = []
     for m, (images, classes, lengths) in enumerate(test_loader):
         images_test = images.to(device)
         with torch.no_grad():
             outputs_test_tensor = classifier(images_test)
         featuremap_np_test = classifier.featuremap1024.cpu().numpy()

         np_targets = classes.numpy()
         np_outputs = svm_clf.predict(featuremap_np_test)

         np_targets_long.extend(np_targets)
         outputs_label_long_list.extend(np_outputs)

     testset_acc = precision_score(np_targets_long, outputs_label_long_list, average='micro')

Original: https://blog.csdn.net/qq_43679439/article/details/124606380
Author: WWwicky
Title: 使用SVM分类器进行图像多分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/613613/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Pandas数据类型自行变换及数据类型转换失败情况分析与解决方法

最近，在进行数据处理过程中，频繁使用Pandas进行DataFrame关联、合并、数据类型变换操作，当到最后数据入库（MongoDB）时，出现部分整型数据变成浮点型，以及时间转字符…

人工智能 2023年7月15日
0072
如何进行模型评估和性能指标选择

模型评估和性能指标选择模型评估是机器学习任务中非常重要的一个环节，它用于对训练好的模型进行性能评估，以便了解模型的优劣并做出相应的改进。在进行模型评估时，需要选择适当的性能指标来…

人工智能 2024年1月3日
0035
R语言使用attach函数绑定数据、使用detach函数解除数据绑定、以dataframe为例、数据绑定之后可以直接使用数据列的名称访问数据

### 回答1： att ach_和 _detach_是 _R语言_中的两个 _函数，用于将数据_框或其他对象添加到搜索路径中或从搜索路径中删除。 _att ach 函数_可以将…

人工智能 2023年7月17日
0044
验证Python、PyTorch是否安装成功及过程中遇到的问题

win10、anaconda python、PyTorch环境验证Python安装成功 “Win+R”运行小黑窗——输入”cmd”…

人工智能 2023年7月22日
0067
机器学习——线性回归详解

本文使用标准方程，scikit包，以及伪逆对线性回归模型求解进行了详解和代码实现线性回归先生成一个函数进行测试,我们来看看生成随机的点如下图所示。我们再对其进行拟合 impor…

人工智能 2023年6月17日
0069
CDA LEVELⅠ2021最新模拟题一（全网最详细有答案）

1.卡方检验是用途非常广的一种假设检验方法，卡方检验中，将任意两行互换，卡方值（） A.变大 B.变小 C.不变 D.不确定解析：卡方检验的结果与分类变量的顺序无关，将任意两行…

人工智能 2023年6月19日
0098
java 调用python脚本的方法

这几天老师要求我作项目时使用Java调取python脚本得到值，搜索几天，现在记录一下一开始我就是搜索的此方法，但这个方法我自己认为没有什么比较大的意义，但还是贴上来我用的是s…

人工智能 2023年7月6日
0054
git clone拉取GitHub项目失败/太慢的解决方法

问题描述：在Ubuntu中通过git clone从GitHub上拉取项目时，遇到失败/速度慢等情况目录问题描述： — 解决方法 * 1 确定是否安装git工具包 2 拉取失败…

人工智能 2023年5月23日
0099
Python顺序结构程序设计（湖南工业大学）

; 第1关：HUT开学了任务描述本关任务：编写程序，实现如下功能。开学了，你考上了湖南工业大学，校园各个学院的电子屏上显示着以下欢迎界面：‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬…

人工智能 2023年7月6日
0053
《利用Python进行数据分析》数据处理——MovieLens 1M数据集

MovieLens 1M数据集下载地址：https://grouplens.org/datasets/movielens/1m/ 为方便，我已将数据集防止在csdn上，方便下载。 …

人工智能 2023年7月7日
0074
时序分析 40 – 时序预测从ARIMA到SARIMAX(九)超参调优与最佳模型

时序分析 40 从ARIMA到SARIMAX(九)超参调优与最佳模型接上… 超参调优我们是否有方法使模型表现得更好呢？可以使用网格搜索来进行超参数调优，下面我们将针…

人工智能 2023年7月8日
0069
帅爆! 赛博朋克特效实现

资料获取：添加小编 nvshenj125, 备注CVPR2022, 即可获取 CVPR2022 全部论文为了写好这篇文章, 找了很多资料, 如果对你有帮助的话, 帮忙分享一波, …

人工智能 2023年7月19日
0063
微信支付——微信退款实战教程（Java版）

微信支付之微信申请退款实战（Java版）微信支付业务场景一、注意事项二、微信支付退款案例 * 1.微信退款案例二、微信支付官方说明总结微信支付业务场景当交易发生之后一…

人工智能 2023年6月26日
0069
python使用Tensorflow检测GPU运行与使用Pytorch

GPU运行状态检测在先前，博主完成了GPU环境的配置，那么今天博主来实验一下使用GPU来运行我们的项目使用cmd 输入nvidia-smi查看GPU使用情况，下面是Linux里面…

人工智能 2023年5月24日
0075
150935131_2_青少年心理弹性量表_255_255

@150935131_2_青少年心理弹性量表_255_255 描述性统计名称平均值±标准差方差 25分位数 75分位标准误均值95%CI(LL) 均值95%CI(UL) I…

人工智能 2023年6月11日
0061
【小程序从0到1】网络数据请求——request合法域名｜GET｜POST｜跨域？Ajax？

欢迎来到我的博客📔博主是一名大学在读本科生，主要学习方向是前端。 🍭目前已经更新了【Vue】、【React–从基础到实战】、【TypeScript】等等系列专栏 🛠目前正在学习的是…

人工智能 2023年7月1日
0079

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31