四、支持向量机SVM面试题总结

2023年7月16日下午6:54 • 人工智能 • 阅读 60

1. SVM的基本原理？

支持向量机为一个二分类模型，SVM的目标是寻找一个最优的分离超平面，将两类数据在空间中分离开来，并且使得这个超平面到最近的点的间隔最大，这些点称为支持向量。

2. 引入对偶算法的优点？

一是对偶问题往往 更容易求解。当我们寻找约束存在时的最优点的时候，约束的存在虽然减小了需要搜寻的范围，但是却使问题变得更加复杂。为了使问题变得易于处理，我们的方法是 把目标函数和约束全部融入一个新的函数，即拉格朗日函数，再通过这个函数来寻找最优点；
二是 方便引入核函数，（因为对偶问题涉及的是数据的内积计算）进而推广到非线性分类问题。

3. SVM与LR的区别？

LR是参数模型，SVM是非参数模型。非参数模型对目标函数不作过多的假设，如KNN、决策树等；
LR的损失函数的负对数损失函数，SVM的损失函数是合页损失函数；
LR通过sigmoid函数进行非线性映射，从而削弱远离分类决策面的数据的作用。而SVM是只考虑里分类决策面最近的支持向量的作用。

4. SVM硬间隔、软间隔的表达式？

不同在于松弛变量的引入。
松弛变量的作用：软间隔，使得原来线性不可分问题变为线性可分，部分函数间隔y *（w x + b ）无法满足大于1的条件的样本点加上松弛变量之后，函数间隔可以大于1。因此可以使用线性可分的解法求解。

; 5. 如果给你一些数据集，你会如何分类？

一种回答：
根据数据类型选择不同的模型，如Lr或者SVM，决策树。假如特征维数较多，可以选择SVM模型，如果样本数量较大可以选择LR模型，但是LR模型需要进行数据预处理；假如缺失值较多可以选择决策树。

6. SVM核函数的区别？

线性核：主要用于线性可分的情形，参数少，速度快，对于一般数据，分类效果已经很理想了；
高斯核：主要用于线性不可分的情形，参数多，分类结果非常依赖于参数。

特征数数量较多，和样本数量差不多，用线性核；
特征数少用高斯核。

7. 为什么SVM要引入核函数？

当样本在原始空间 线性不可分时，可 将样本从原始空间映射到一个更高维的特征空间，使得样本在这个特征空间内线性可分。而引入这样的映射后，通过对偶问题来求解，无需求解真正的映射函数，而只需要知道其核函数。
核函数就是特征映射后的内积，在学习和预测中只需要定义核函数而不显式地定义映射函数，从而降低计算的难度。

8.为什么SVM对缺失值敏感？

SVM没有处理缺失值的策略；
SVM的效果和支持向量点有关，缺失值可能影响支持向量点的分布。

9. SVM如何处理多分类问题？

一对多：每次将一个类型作为正例，其他的作为反例，训练出k个分类器，当有一个新的样本来的时候，用这k个分类器来测试，哪个分类器的概率高，那么这个样本就属于哪一类。；
一对一：任意两个类训练出一个分类器，如果有k类，一共训练出C ( 2 , k ) C(2,k)C (2 ,k ) 个分类器，这样当有一个新的样本要来的时候，用这$C(2,k) $个分类器来测试，每当被判定属于某一类的时候，该类就加一，最后票数最多的类别被认定为该样本的类。

Original: https://blog.csdn.net/Anthony_hit/article/details/123255132
Author: 高桥凉瓜
Title: 四、支持向量机SVM面试题总结

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/697017/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

C++ 文件操作

程序运行时产生的数据都属于临时数据，程序一旦运行结束，数据都会被释放，通过文件可以将数据持久化 C++ 中对文件操作需要包含头文件 < fstream > 文件类型分…

人工智能 2023年5月30日
0085
MATLAB | 使用FasterRcnn实现目标检测（自己创建数据集）

最终实现对物体的目标检测：前期准备：MATLAB2018aMatlab 2018a安装教程和破解方法（附Crack文件） | 我爱分享网你要训练的图片（本文就举例实现people…

人工智能 2023年7月9日
00128
12.聚类算法

和分类算法一样，都是用于样本的类别划分的区别：分类算法是有监督的算法，也就是算法找到是特征属性x和类别属性y之间的关系，基于这样的关系，对样本数据x做类别的划分预测聚类算法…

人工智能 2023年6月2日
0066
数据归一化和三种常用的归一化方法

数据标准化（归一化）处理是数据挖掘的一项基础工作，不同评价指标往往具有不同的量纲和量纲单位，这样的情况会影响到数据分析的结果，为了消除指标之间的量纲影响，需要进行数据标准化处理，以…

人工智能 2023年6月19日
0059
基于PyTorch实现图片去模糊、降噪，超详细，有代码，数据，可直接运行。

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

人工智能 2023年7月23日
0054
关于图像处理分析的一些理解

1.图像处理较为底层的操作，可以看成数据预处理（图像本身也是由像素数据组成的），常见的处理有：图像降噪，压缩，提升分辨率，边缘检测等彩色图像灰度化边缘检测：检测出图像中亮度变化显…

人工智能 2023年7月10日
0061
边缘计算 | 在移动设备上部署深度学习模型的思路与注意点

💡 作者：韩信子@ShowMeAI📘 深度学习◉技能提升系列：https://www.showmeai.tech/tutorials/35📘 深度学习实战系列：https://ww…

人工智能 2023年6月16日
0088
AISHELL-2019A-EVAL 家居环境近远讲同步语音测试数据集

家庭环境中的同步语音测试数据集 [En] Synchronous speech test data set in home environment 50 speakers in t…

人工智能 2023年5月25日
0076
我的Go gRPC之旅、01 初识gRPC，感受gRPC的强大魅力

微服务架构微服务是一种开发软件的架构和组织方法，其中软件由通过明确定义的API 进行通信的小型独立服务组成。这些服务由各个小型独立团队负责。微服务架构使应用程序更易于扩展和…

人工智能 2023年6月4日
00108
代码实现stable-diffusion模型，你也用AI生成获得一等奖的艺术图

Midjourney工具获奖图片好吗，人工智能虽然已经涉及到人类的方方面面，但没有想到，AI 还能抢艺术家的饭碗，这不，一位小哥使用AI工具生成的艺术照片竟然获奖了，而且还是一等…

人工智能 2023年6月24日
0066
可分离卷积(Separable convolution)详解

可分离卷积可分离卷积包括空间可分离卷积(Spatially Separable Convolutions)和深度可分离卷积(depthwise separable convo…

人工智能 2023年7月21日
0063
Linux应用层例程4 串口应用编程

本小节我们来学习 Linux 下串口应用编程，串口（ UART ）是一种非常常见的外设，串口在嵌入式开发领域当中一般作为一种调试手段，通过串口输出调试打印信息，或者通过串口发送指令…

人工智能 2023年6月29日
0064
spm12预处理步骤及知识点总结

spm12预处理步骤及知&…

人工智能 2023年7月12日
0062
吴恩达–机器学习笔记（2022年课程第三周）

*分类–逻辑回归模型：当y只有两种结果时，称为二元分类问题，使用逻辑回归模型。计算逻辑回归模型的公式：f(x)=g(z)相结合特点，二者概率和为1 ：该公式的含义表示：当y=1，输…

人工智能 2023年6月17日
0092
什么样的人适合学习网络安全？

有很多想要转行网络安全或者选择网络安全专业的人在进行决定之前一定会有的问题：什么样的人适合学习网络安全？我适不适合学习网络安全？会产生这样的疑惑并不奇怪，毕竟网络安全这个专业在2…

人工智能 2023年6月26日
0062
修改pip默认安装位置

修改pip默认安装位置默认安装位置是C:\Users\用户名\AppData\Roaming\Python\Python38\Scripts。浅浅建议不把这些东西放到系统盘，而是…

人工智能 2023年7月6日
0084

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30