机器学习之支持向量机（SVM）的求解方法

2023年6月15日上午5:33 • 人工智能 • 阅读 168

文章目录

前言
梯度下降法
SMO算法
参考

前言

支持向量机就是寻找一个超平面，将不同的样本分分隔开来，其中间隔分为硬间隔和软间隔，硬间隔就是不允许样本分错，而软间隔就是允许一定程度上样本存在偏差，后者更符合实际。

支持向量机思路简单但是求解过程还是比较复杂，需要将原函数通过拉格朗日乘子法并附上KKT条件是的问题有强对偶性，再使用SMO等算法进行高效的求解。
推导过程可以参考：
机器学习之支持向量机之线性可分型原理介绍及代码实现（SVM）
下面主要实现模型的求解方法。

梯度下降法

梯度下降法是一种比较普适的方法，当模型无法得出解析解，或者解析解求解困难的时候，都可以使用梯度下降法来近似求解。因为梯度下降法需要一轮轮迭代，也需要定义损失函数，因此一般而言，梯度下降法只能获得近似最优解。
SVM可以使用梯度下降法求解，不过得出的解大概率只是近似解，并且不一定满足SVM的公式里的约束条件。


import sys;
import random;
import numpy as np
import math

EPS = 0.000000001
def load_data(filename, dim):
    '''
    输入数据格式: label\tindex1:value1\tindex2:value2\tindex3:value3..., 其中index是特征的编号, 从1开始
    data的数据格式: [[label, sample],[label, sample], ...],  其中sample: [v0, v1, v2, v3, ..., v[dim]]
    '''
    label_ = []
    data_ = []
    for line in open(filename, 'rt'):
        sample = [0.0 for v in range(0, dim + 1)];
        line = line.rstrip("\r\n\t ");
        fields = line.split("\t");
        label = int(fields[0]);
        sample[0] = 1.0;
        for field in fields[1:]:
            kv = field.split(":");
            idx = int(kv[0]);
            val = float(kv[1]);
            sample[idx] = val;
        label_.append(label)
        data_.append(sample)

    label_ = np.array(label_)
    data_ = np.array(data_)
    return label_, data_

def svm_train(train_x, train_y, dim, iterations, lm, lr):
    '''
    data4train:数据集
    dim:样本特征维度
    W:SVM模型的权重
    iterations:迭代次数
    目标函数: obj(, W) = (对所有SUM{max{0, 1 - W*X*y}}) + lm / 2 * ||W||^2, 即：hinge+L2
    '''
    X = np.zeros(dim + 1)
    grad = np.zeros(dim + 1)
    num_train = len(train_x);
    global W
    for i in range(0, iterations):

        index = random.randint(0, num_train - 1);
        y = train_y[index]
        X = train_x[index]

        WX = 0.0
        WX += (W * X).sum()

        if 1 - WX * y > 0:
            grad = lm * W - X * y
        else:
            grad = lm * W - 0;

        W = W - lr * grad

def svm_predict(x, y, dim, W):
    num_test = len(x);
    num_correct = 0;
    for i in range(0, num_test):
        target = y[i]
        X = x[i]
        sum = 0.0;
        sum += (X * W).sum()
        predict = -1;

        if sum > 0:
            predict = 1;
        if predict * target > 0:
            num_correct += 1;

    return num_correct * 1.0 / num_test;

if __name__ == "__main__":

    epochs = 10;
    iterations = 10;
    lm = 0.0001;
    lr = 0.01;
    dim = 1000;
    W = np.zeros(dim + 1)

    train_y, train_x = load_data("train.txt", dim)
    test_y, test_x = load_data("test.txt", dim)

    for i in range(0, epochs):
        svm_train(train_x, train_y, dim, iterations, lm, lr);
        accuracy = svm_predict(test_x, test_y, dim, W);

        print("epoch:%d\taccuracy:%f" % (i, accuracy));

    for i in range(0, dim + 1):
        if math.fabs(W[i]) > EPS:
            print("权值W%d\t%f" % (i, W[i]));
    print(W)

这个是参考支持向量机SVM-手写笔记&手动实现这篇博客的，代码改成numpy进行运算了，进行改动的过程也是读懂代码的过程。

这个例子使用的梯度下降法，损失函数应该大概也许相当于用了max(0, x)。整体思路就是，每次就选一个样本点进行参数更新，如果这个样本点对于当前的参数能够正确分类，那么就不更新，如果不能正确分类，就更新。

运行结果如下：

因为每次随机选择样本，那么其实找到的那个超平面大概率不会将样本集完全分开的，但是事实证明梯度下降法还是有效果的，所有，应该可以勉强认为训练出来的是软间隔的SVM吧？

; SMO算法

贴上b站视频，以便日后再去看，实话说目前也没有完全走通这个算法的流程。
快速理解SMO算法
SMO算法思路很简单，因为存在约束条件

所以每次更新两个α，剩余看成常量，α能够通过看成的常量导出，然后满足约束条件的情况下求出极值，更新α。每次都更新两个，当固定其他的α时，能够求出选取α的更新的解析解，所以就算起来非常快。
那么该如何选择呢？
第一个αi应该选择违反KKT条件最大的。
第二个αj应该选择于第一个αi差值最大的。
这样能够保证每次更新都是向最快的方向进行更新。
思路是很简单，但是实践起来还是很困难的，因为里面涉及到许多的约束条件，不同情况下需要分类讨论等等。
直接贴上别人的代码吧


from numpy import *
import matplotlib.pyplot as plt
import random
def loadDataSet(filename):
    dataMat=[]
    labelMat=[]
    fr=open(filename)
    for line in fr.readlines():
        lineArr=line.strip().split('\t')
        dataMat.append([float(lineArr[0]),float(lineArr[1])])
        labelMat.append(float(lineArr[2]))
    return dataMat,labelMat
class optStruct:
    def __init__(self,dataMatIn, classLabels, C, toler):
        self.X = dataMatIn
        self.labelMat = classLabels
        self.C = C
        self.tol = toler
        self.m = shape(dataMatIn)[0]
        self.alphas = mat(zeros((self.m,1)))
        self.b = 0
        self.eCache = mat(zeros((self.m,2)))
    def print_m(self):
        print("self.X", self.X)
        print("self.labelMat", self.labelMat)
        print("self.C", self.C)
        print("self.tol", self.tol)
        print("self.m", self.m)
        print("self.alphas", self.alphas)
        print("self.b", self.b)
        print("self.eCache", self.eCache)

def selectJrand(i,m):
    j=i
    while (j==i):
        j=int(random.uniform(0,m))
    return j

def clipAlpha(aj,H,L):
    if aj>H:
        aj=H
    if L>aj:
        aj=L
    return aj

def calcEk(oS, k):
    fXk = float(multiply(oS.alphas,oS.labelMat).T*(oS.X*oS.X[k,:].T) + oS.b)
    Ek = fXk - float(oS.labelMat[k])
    return Ek

def selectJ(i, oS, Ei):

    maxK = -1
    maxDeltaE = 0
    Ej = 0
    oS.eCache[i] = [1,Ei]

    validEcacheList = nonzero(oS.eCache[:,0].A)[0]
    if (len(validEcacheList)) > 1:
        for k in validEcacheList:
            if k == i:
                continue
            Ek = calcEk(oS, k)
            deltaE = abs(Ei - Ek)
            if (deltaE > maxDeltaE):
                maxK = k
                maxDeltaE = deltaE
                Ej = Ek
        return maxK, Ej
    else:
        j = selectJrand(i, oS.m)
        Ej = calcEk(oS, j)
    return j, Ej

def updateEk(oS, k):
    Ek = calcEk(oS, k)
    oS.eCache[k] = [1,Ek]

def innerL(i, oS):

    Ei = calcEk(oS, i)

    if ((oS.labelMat[i]*Ei < -oS.tol) and (oS.alphas[i] < oS.C)) or ((oS.labelMat[i]*Ei > oS.tol) and (oS.alphas[i] > 0)):

        j,Ej = selectJ(i, oS, Ei)

        alphaIold = oS.alphas[i].copy()
        alphaJold = oS.alphas[j].copy()

        if (oS.labelMat[i] != oS.labelMat[j]):
            L = max(0, oS.alphas[j] - oS.alphas[i])
            H = min(oS.C, oS.C + oS.alphas[j] - oS.alphas[i])
        else:
            L = max(0, oS.alphas[j] + oS.alphas[i] - oS.C)
            H = min(oS.C, oS.alphas[j] + oS.alphas[i])
        if L==H:
            print("L==H")
            return 0

        eta = 2.0 * oS.X[i,:]*oS.X[j,:].T-oS.X[i,:]*oS.X[i,:].T-oS.X[j,:]*oS.X[j,:].T
        if eta >= 0:
            print("eta>=0")
            return 0

        oS.alphas[j] -= oS.labelMat[j]*(Ei - Ej)/eta
        oS.alphas[j] = clipAlpha(oS.alphas[j],H,L)

        updateEk(oS, j)

        if (abs(oS.alphas[j] - alphaJold) < oS.tol):
            print("j not moving enough")
            return 0

        oS.alphas[i] += oS.labelMat[j]*oS.labelMat[i]*(alphaJold - oS.alphas[j])

        updateEk(oS, i)

        b1 = oS.b - Ei- oS.labelMat[i]*(oS.alphas[i]-alphaIold)*oS.X[i,:]*oS.X[i,:].T - oS.labelMat[j]*(oS.alphas[j]-alphaJold)*oS.X[i,:]*oS.X[j,:].T
        b2 = oS.b - Ej- oS.labelMat[i]*(oS.alphas[i]-alphaIold)*oS.X[i,:]*oS.X[j,:].T - oS.labelMat[j]*(oS.alphas[j]-alphaJold)*oS.X[j,:]*oS.X[j,:].T

        if (0 < oS.alphas[i]<oS.C):
            oS.b = b1
        elif (0 < oS.alphas[j]<oS.C):
            oS.b = b2
        else:
            oS.b = (b1 + b2)/2.0

        return 1
    else:
        return 0

def calcWs(dataMat, labelMat, alphas):
    alphas, dataMat, labelMat = array(alphas), array(dataMat), array(labelMat)
    w = dot((tile(labelMat.reshape(1, -1).T, (1, 2)) * dataMat).T, alphas)
    return w.tolist()

def smoP(dataMatIn, classLabels, C, toler, maxIter):

    oS = optStruct(mat(dataMatIn),mat(classLabels).transpose(),C,toler)

    iter = 0
    entireSet = True
    alphaPairsChanged = 0

    while (iter < maxIter) and ((alphaPairsChanged > 0) or (entireSet)):
        alphaPairsChanged = 0
        if entireSet:
            for i in range(oS.m):
                alphaPairsChanged += innerL(i,oS)
                print("fullSet, iter: %d i:%d, pairs changed %d" % (iter,i,alphaPairsChanged))
            iter += 1
        else:

            nonBoundIs = nonzero((oS.alphas.A > 0) * (oS.alphas.A < C))[0]
            for i in nonBoundIs:
                alphaPairsChanged += innerL(i,oS)
                print("non-bound, iter: %d i:%d, pairs changed %d" % (iter,i,alphaPairsChanged))
            iter += 1

        if entireSet:
            entireSet = False
        elif (alphaPairsChanged == 0):
            entireSet = True
        print("iteration number: %d" % iter)

    return oS.b,oS.alphas,oS

def showClassifer(dataMat,labelMat,alphas, w, b):
    data_plus = []
    data_minus = []
    for i in range(len(dataMat)):
        if labelMat[i] > 0:
            data_plus.append(dataMat[i])
        else:
            data_minus.append(dataMat[i])
    data_plus_np = array(data_plus)
    data_minus_np = array(data_minus)
    plt.scatter(transpose(data_plus_np)[0], transpose(data_plus_np)[1], s=30, alpha=0.7)
    plt.scatter(transpose(data_minus_np)[0], transpose(data_minus_np)[1], s=30, alpha=0.7)
    x1 = max(dataMat)[0]
    x2 = min(dataMat)[0]
    a1, a2 = w
    b = float(b)
    a1 = float(a1[0])
    a2 = float(a2[0])
    y1, y2 = (-b- a1*x1)/a2, (-b - a1*x2)/a2
    plt.plot([x1, x2], [y1, y2])
    for i, alpha in enumerate(alphas):
        if 0.6>abs(alpha) > 0:
            x, y = dataMat[i]
            plt.scatter([x], [y], s=150, c='none', alpha=0.7, linewidth=1.5, edgecolor='red')
        if 50==abs(alpha) :
            x, y = dataMat[i]
            plt.scatter([x], [y], s=150, c='none', alpha=0.7, linewidth=1.5, edgecolor='yellow')
    plt.show()

if __name__ == "__main__":
    x = [[1,8],[3,20],[1,15],[3,35],[5,35],[4,40],[7,80],[6,49],[1.5,25],[3.5,45],[4.5,50],[6.5,15],[5.5,20],[5.8,74],[2.5,5]]
    y = [1,1,-1,-1,1,-1,-1,1,-1,-1,-1,1,1,-1,1]
    b, alphas, oS = smoP(dataMatIn=x,classLabels=y,C=50, toler=0.001,maxIter=400)
    w = calcWs(x,y,alphas)
    showClassifer(x,y,alphas, w, b)

运行结果：

其中画圈的就是支持向量机的支持向量，也就是α不为0的样本是对超平面位置有影响的样本点。

SMO算法实现细节可能还是没完全明白，以后懂了再来补吧。

参考

支持向量机SVM-手写笔记&手动实现
 https://www.cnblogs.com/ssyfj/p/13363526.html
SVM SMO算法代码详细剖析

Original: https://blog.csdn.net/qq_52785473/article/details/127262872
Author: Icy Hunter
Title: 机器学习之支持向量机（SVM）的求解方法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/613822/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

MATLAB实现语谱图

一、语谱图含义频谱图用灰度级标记信号强度。如果滤光片的输出信号较强，则相应的颜色会变深。水平方向是时间轴，垂直方向是频率轴。语谱图也被称为视觉语音。 [En] The spect…

人工智能 2023年5月27日
00118
使用pgd和fgsm方法进行攻击并使用map方法评估

本次实验对100张飞机图片组成的数据集，分别使用pgd攻击和fgsm攻击，达到对每张图片飞机区域的攻击，并使用getmap程序对攻击的效果进行评估。文章目录 1、运行1.py程序…

人工智能 2023年7月9日
0067
python pandas 日期格式_python – 使用Pandas将每日数据重新采样为每月(日期格式)

对于create DataFrame可以使用： df = pd.read_excel(‘2016_forex_daily_returns.xlsx’, sh…

人工智能 2023年7月9日
0064
Nvidia Tesla A100 驱动安装方法

Nvidia Tesla A100 驱动安装方法遇到的问题：以前安装tesla系列、geforce系列等gpu 驱动的时候，只需执行nvidiaxxxx.run驱动包或者安装nv…

人工智能 2023年5月23日
0085
软件智能:aaas系统中的数学程序与技术服务之3 序篇之综述1 词汇和符号的标准化及其开发方法

词汇vocabulary在aaas中是和符号notation一起提出来，作为标准化目的的代名词。标准化使数据能共享和被访问，但没有解决数据交换问题。关于词汇表vocabular…

人工智能 2023年5月28日
0065
MATLAB算法实战应用案例精讲-【回归算法】逐步式回归（Stepwise Regression）（附MATLAB、Java、Python和R语言代码）

回归分析是一种预测建模技术的方法，研究因变量（目标）和自变量（预测器）之前的关系。这一技术被用在预测、时间序列模型和寻找变量之间因果关系。例如研究驾驶员鲁莽驾驶与交通事故发生频率之…

人工智能 2023年6月18日
0088
python豆瓣Top250数据分析

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月15日
0045
torch学习笔记之——tensor维度变换

1, （函数API）View ， reshape 本上没有区别，0.3版本之前默认view之后默认使用reshape，现在版本建议使用view。 a = torch.rand(4,…

人工智能 2023年6月24日
00107
MMDetection亲测安装教程

MMDetection是一个基于 PyTorch 的目标检测开源工具箱。接下来就安装看看吧。本人安装环境：系统环境：Ubuntu 20.04.2 LTS cuda版本：11.0…

人工智能 2023年7月20日
0056
Android 调用谷歌原生语音识别

前提： 1.安装谷歌语音搜索APP 2.需要越狱连接外网废话不多说，直接上代码 public void onClick(View v) {//开启语音识别功能Intent int…

人工智能 2023年5月25日
0080
pytorch 中 squeeze 和unsqueeze函数

1. torch.squeeze() 函数 : 作用：移除指定或所有维数为1的维度，从而得到维度减少的张量解释一下： x=torch.zeros(5,1,1,1) print(x…

人工智能 2023年7月23日
0044
BEVFormer 论文笔记

参考代码：BEVFormerpaper：BEVFormer: Learning Bird’s-Eye-View Representation from Multi-Ca…

人工智能 2023年7月13日
0052
HTML+CSS大作业——电影动漫言叶之庭(4页) web前端课程设计_web前端课程设计代码,web课程设计-HTML网页制作代码

HTML5期末大作业：电影网站设计——电影动漫言叶之庭(4页) web前端课程设计_web前端课程设计代码,web课程设计-HTML网页制作代码常见网页设计作业题材有 &…

人工智能 2023年6月29日
0060
Anaconda 修改默认虚拟环境安装位置

项目场景：使用Anaconda Prompt创建虚拟环境问题描述保存虚拟环境的默认地址是C盘，而我想将下载的虚拟环境保存到我自定义的位置。解决方案： 1、使用 conda …

人工智能 2023年7月3日
0084
spass回归分析的基本步骤_动态面板数据的System-GMM回归分析步骤

1.对数据进行平减，去除价格变化的影响，经常用到的方法用居民消费价格指数进行平减，有两种情况：（1）以1978年为基期的，如果就是以1978年为基期可以直接用统计年鉴里相应指标的数…

人工智能 2023年6月18日
00112
STM32F4图像识别

一、硬件介绍（1）主芯片STM32F407VET61.支持单精度浮点运算，芯片硬件资源包括192KB内部RAM，512KB-1MB的FLASH（具体看芯片型号），采用分散内存架构1…

人工智能 2023年6月20日
0069

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

机器学习之支持向量机（SVM）的求解方法

文章目录

大家都在看