吴恩达机器学习课后作业6——使用支持向量机(svm)构建一个垃圾邮件分类器

2023年7月28日下午7:25 • 人工智能 • 阅读 65

1. 问题和数据

在本练习中，您将使用支持向量机(svm)构建一个垃圾邮件分类器。

在本练习的前半部分，您将使用支持向量机(svm)处理各种示例2D数据集。使用这些数据集进行试验将帮助您直观地了解支持向量机的工作方式，以及如何在支持向量机中使用高斯核。
在练习的下一部分中，您将使用支持向量机构建一个垃圾邮件分类器

对于线性可分案例，我们的任务是找到一条最佳的决策边界，使得离这条决策边界最近的点到该决策边界的距离最远，即为要有最大间隔。

损失函数公式如下：

在本节中要用到新的库，scikit-learn,简称sklearn。可以进行数据的预处理以及最后算法的评估。

; 2.线性可分案例

导入包，numpy和pandas是做运算的库，matplotlib是画图的库。
数据集是在MATLAB的格式，所以要加载它在Python，我们需要使用一个SciPy工具。

import numpy as np
import scipy.io as sio
import matplotlib.pyplot as plt

导入数据集

data = sio.loadmat('ex6data1.mat')
print('data.keys():', data.keys())

输出结果：

data.keys(): dict_keys(['__header__', '__version__', '__globals__', 'X', 'y'])

指定X, y, 打印shape来看看

X, y = data['X'], data['y']
print('X.shape, y.shape:', X.shape, y.shape)
print('X:', X)
print('y:', y)

输出shape和X，y

X.shape, y.shape: (51, 2) (51, 1)
X: [[1.9643   4.5957  ]
 [2.2753   3.8589  ]
 [2.9781   4.5651  ]
 [2.932    3.5519  ]
 [3.5772   2.856   ]
 [4.015    3.1937  ]
 [3.3814   3.4291  ]
 [3.9113   4.1761  ]
 [2.7822   4.0431  ]
 [2.5518   4.6162  ]
 [3.3698   3.9101  ]
 [3.1048   3.0709  ]
 [1.9182   4.0534  ]
 [2.2638   4.3706  ]
 [2.6555   3.5008  ]
 [3.1855   4.2888  ]
 [3.6579   3.8692  ]
 [3.9113   3.4291  ]
 [3.6002   3.1221  ]
 [3.0357   3.3165  ]
 [1.5841   3.3575  ]
 [2.0103   3.2039  ]
 [1.9527   2.7843  ]
 [2.2753   2.7127  ]
 [2.3099   2.9584  ]
 [2.8283   2.6309  ]
 [3.0473   2.2931  ]
 [2.4827   2.0373  ]
 [2.5057   2.3853  ]
 [1.8721   2.0577  ]
 [2.0103   2.3546  ]
 [1.2269   2.3239  ]
 [1.8951   2.9174  ]
 [1.561    3.0709  ]
 [1.5495   2.6923  ]
 [1.6878   2.4057  ]
 [1.4919   2.0271  ]
 [0.962    2.682   ]
 [1.1693   2.9276  ]
 [0.8122   2.9992  ]
 [0.9735   3.3881  ]
 [1.25     3.1937  ]
 [1.3191   3.5109  ]
 [2.2292   2.201   ]
 [2.4482   2.6411  ]
 [2.7938   1.9656  ]
 [2.091    1.6177  ]
 [2.5403   2.8867  ]
 [0.9044   3.0198  ]
 [0.76615  2.5899  ]
 [0.086405 4.1045  ]]
y: [[1]
 [1]
 [1]
 [1]
 [1]
 [1]
 [1]
 [1]
 [1]
 [1]
 [1]
 [1]
 [1]
 [1]
 [1]
 [1]
 [1]
 [1]
 [1]
 [1]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [0]
 [1]]

画出数据的散点图来看看分布状况

def plot_data():
    plt.scatter(X[:, 0], X[:, 1], c=y.flatten(), cmap='jet')

    plt.xlabel('x1')
    plt.ylabel('y1')
    plt.show()

plot_data()

导入sklearn.svm，

from sklearn.svm import SVC

SVC的用法如下：

使用sklearn.svm的svc进行求解

svc1 = SVC(C=1, kernel='linear')
svc1.fit(X, y.flatten())
print(svc1)
print(svc1.predict(X))
print(svc1.score(X, y.flatten()))

打印svc1、预测结果和准确率；当前预测的准确率为0.90039

SVC(C=1, kernel='linear')
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0]
0.9803921568627451

绘制决策边界

def plot_boundary(model):
    x_min, x_max = -0.5, 4.5
    y_min, y_max = 1.3, 5
    xx, yy = np.meshgrid(np.linspace(x_min, x_max, 500), np.linspace(y_min, y_max, 500))

    z = model.predict(np.c_[xx.flatten(), yy.flatten()])

    zz = z.reshape(xx.shape)
    plt.contour(xx, yy, zz)

plot_boundary(svc1)
plot_data()
plt.show()

可以看出C=1时有一个样本点是被错分的

接下来我们换一个C的值来看看预测效果

svc100 = SVC(C=100, kernel='linear')
svc100.fit(X, y.flatten())
print(svc100.predict(X))
print(svc100.score(X, y.flatten()))

输出预测结果和准确率：

[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 1]
1.0

调用边界函数画出C=100时的决策边界

plot_boundary(svc100)
plot_data()
plt.show()

这回原本被分错的点也被正确分类了，但是这样其实有点不太好，可能会出现过拟合？只是我们当前的数据点太少，看不出来。

完整代码：


"""
Created on Sat June 23 15:06:11 2022
@author: wzj
python version: python 3.9

Title: 支持向量机（Support Vector Machines）

案例：使用支持向量机(svm)构建一个垃圾邮件分类器。

数据集：数据文件是ex6data1.mat
"""

import numpy as np
import scipy.io as sio
import matplotlib.pyplot as plt

data = sio.loadmat('ex6data1.mat')
print('data.keys():', data.keys())

X, y = data['X'], data['y']
print('X.shape, y.shape:', X.shape, y.shape)
print('X:', X)
print('y:', y)

def plot_data():
    plt.scatter(X[:, 0], X[:, 1], c=y.flatten(), cmap='jet')

    plt.xlabel('x1')
    plt.ylabel('y1')
    plt.show()

from sklearn.svm import SVC
svc1 = SVC(C=1, kernel='linear')
svc1.fit(X, y.flatten())
print(svc1)
print(svc1.predict(X))
print(svc1.score(X, y.flatten()))

def plot_boundary(model):
    x_min, x_max = -0.5, 4.5
    y_min, y_max = 1.3, 5
    xx, yy = np.meshgrid(np.linspace(x_min, x_max, 500), np.linspace(y_min, y_max, 500))

    z = model.predict(np.c_[xx.flatten(), yy.flatten()])

    zz = z.reshape(xx.shape)
    plt.contour(xx, yy, zz)

plot_boundary(svc1)
plot_data()
plt.show()

svc100 = SVC(C=100, kernel='linear')
svc100.fit(X, y.flatten())
print(svc100.predict(X))
print(svc100.score(X, y.flatten()))

plot_boundary(svc100)
plot_data()
plt.show()

3.线性不可分案例

我们在之前面对线性不可分时用的方法都是建立特征多项式，通过把低维的变量映射到高维，就有可能变成可分的。

而在本次中，我们使用核函数，它的原理也和之前差不多的，可以自动将低维空间映射到高维空间，可以在低微空间计算出高维空间的点积结果（后半句不太明白啥意思，先不管）。

常用的核函数有多项式核，高斯核，拉普拉斯核等，如下所示。本次会使用的是高斯核。在高斯核中，会有一个叫σ \sigma σ的参数(可能我看的讲解的视频的作者叫错了，叫它gamma)，gamma对模型复杂度的影响如下，我们之后会通过调整gamma的大小来观察对模型的影响情况。

首先导入库

import numpy as np
import scipy.io as sio
import matplotlib.pyplot as plt

导入数据集，打印表头看看

data = sio.loadmat('ex6data2.mat')
print('data.keys():', data.keys())

输出表头

data.keys(): dict_keys(['__header__', '__version__', '__globals__', 'X', 'y'])

获取X，y，并打印shape来看看

X, y = data['X'], data['y']
print('X.shape, y.shape:', X.shape, y.shape)

输出X，y的shape

X.shape, y.shape: (863, 2) (863, 1)

画出数据的散点图来看看分布状况

def plot_data():
    plt.scatter(X[:, 0], X[:, 1], c=y.flatten(), cmap='jet')

    plt.xlabel('x1')
    plt.ylabel('y1')
    plt.show()

plot_data()

输出散点图：

导入sklearn.svm的库

from sklearn.svm import SVC

调用SVC进行模型预测

svc1 = SVC(C=1, kernel='rbf', gamma=1)

svc1.fit(X, y.flatten())
print(svc1.score(X, y.flatten()))

输出准确率，当前预测的准确率为0.8088064889918888

0.8088064889918888

绘制决策边界

def plot_boundary(model):
    x_min, x_max = 0, 1.0
    y_min, y_max = 0.4, 1.0
    xx, yy = np.meshgrid(np.linspace(x_min, x_max, 500), np.linspace(y_min, y_max, 500))

    z = model.predict(np.c_[xx.flatten(), yy.flatten()])

    zz = z.reshape(xx.shape)
    plt.contour(xx, yy, zz)

plot_boundary(svc1)
plot_data()
plt.show()

绘制出gamma=1时散点图和决策边界图像：

可以看出，当前还不能很好的区分数据点。

我们把上面的gamma=1换成gamma=50：
svc1 = SVC(C=1, kernel=’rbf’, gamma=50)

绘制出gamma=50时的散点图和决策边界图像：

从图中可以看出目前准确率提高了不少，但仍存在一些点不能被区分；并且此时打印出的准确率也达到了0.9895712630359212

0.9895712630359212

我们再把上面的gamma=50换成gamma=1000：
svc1 = SVC(C=1, kernel=’rbf’, gamma=1000)

此时模型复杂了很多，绘制出gamma=1000时的散点图和决策边界图像：

从图中可以看出目前准确率又得到提高了，每一个数据点都得到了正确的分类，并且此时打印出的准确率也达到了1.0

1.0

完整代码：


"""
Created on Sat June 23 18:01:23 2022
@author: wzj
python version: python 3.9

Title: 支持向量机（Support Vector Machines）——线性不可分案例

案例：使用支持向量机(svm)构建一个垃圾邮件分类器。

数据集：数据文件是ex6data2.mat
"""

import numpy as np
import scipy.io as sio
import matplotlib.pyplot as plt

data = sio.loadmat('ex6data2.mat')
print('data.keys():', data.keys())

X, y = data['X'], data['y']
print('X.shape, y.shape:', X.shape, y.shape)

def plot_data():
    plt.scatter(X[:, 0], X[:, 1], c=y.flatten(), cmap='jet')

    plt.xlabel('x1')
    plt.ylabel('y1')
    plt.show()

from sklearn.svm import SVC

svc1 = SVC(C=1, kernel='rbf', gamma=1000)

svc1.fit(X, y.flatten())
print(svc1.score(X, y.flatten()))

def plot_boundary(model):
    x_min, x_max = 0, 1.0
    y_min, y_max = 0.4, 1.0
    xx, yy = np.meshgrid(np.linspace(x_min, x_max, 500), np.linspace(y_min, y_max, 500))

    z = model.predict(np.c_[xx.flatten(), yy.flatten()])

    zz = z.reshape(xx.shape)
    plt.contour(xx, yy, zz)

plot_boundary(svc1)
plot_data()
plt.show()

4.寻找最优参数C和gamma

通过前面两个小练习我们已经知道了误差惩罚系数C和高斯核的参数gamma都会对模型精度产生影响，下面我们就来寻找一下最优参数C和gamma的组合方式。

首先导入库

import numpy as np
import scipy.io as sio
import matplotlib.pyplot as plt
from sklearn.svm import SVC

导入数据集，打印表头看看

data = sio.loadmat('ex6data3.mat')
print('data.keys():', data.keys())

输出表头；可以看出这次X，y除了训练集还有验证集；我们将在训练集上进行模型训练，然后到验证集上对模型进行验证

data.keys(): dict_keys(['__header__', '__version__', '__globals__', 'X', 'y', 'yval', 'Xval'])

获取X，y，Xval, yval；并打印X, y的shape来看看

X, y = data['X'], data['y']
Xval, yval = data['Xval'], data['yval']
print('X.shape, y.shape:', X.shape, y.shape)

输出X，y的shape

X.shape, y.shape: (211, 2) (211, 1)

画出数据的散点图来看看分布状况

def plot_data():
    plt.scatter(X[:, 0], X[:, 1], c=y.flatten(), cmap='jet')

    plt.xlabel('x1')
    plt.ylabel('y1')
    plt.show()

plot_data()

输出散点图：

寻找准确率最高时候的最优参数C和gamma

Cvalues = [0.01, 0.03, 0.1, 0.3, 1, 3, 10, 30, 100]
gammas = [0.01, 0.03, 0.1, 0.3, 1, 3, 10, 30, 100]

best_score = 0
best_params = (0, 0)

for c in Cvalues:
    for gamma in gammas:
        svc = SVC(C=c, kernel='rbf', gamma=gamma)
        svc.fit(X, y.flatten())
        score = svc.score(Xval, yval.flatten())
        if score > best_score:
            best_score = score
            best_params = (c, gamma)
print('best_score, best_params:', best_score, best_params)

输出最优准确率为0.965，最优参数C和gamma分别为0.3和100

best_score, best_params: 0.965 (0.3, 100)

将最优参数代回去，得到最后的最优分类图像

svc2 = SVC(C=best_params[0], kernel='rbf', gamma=best_params[1])
svc2.fit(X, y.flatten())

绘制决策边界

def plot_boundary(model):
    x_min, x_max = -0.6, 0.4
    y_min, y_max = -0.7, 0.7
    xx, yy = np.meshgrid(np.linspace(x_min, x_max, 500), np.linspace(y_min, y_max, 500))

    z = model.predict(np.c_[xx.flatten(), yy.flatten()])

    zz = z.reshape(xx.shape)
    plt.contour(xx, yy, zz)

plot_boundary(svc2)
plot_data()
plt.show()

最高的预测率best_score确实是0.965，但是能达到这个预测率的best_params其实不止有(0.3, 100)这一组，只是按照我们设置的遍历和赋值的特点，他们恰好是最靠后的一组。

完整代码：


"""
Created on Sat June 23 18:01:23 2022
@author: wzj
python version: python 3.9

Title: 支持向量机（Support Vector Machines）——寻找最优参数C和gamma

案例：使用支持向量机(svm)构建一个垃圾邮件分类器。

数据集：数据文件是ex6data3.mat
"""

import numpy as np
import scipy.io as sio
import matplotlib.pyplot as plt
from sklearn.svm import SVC

data = sio.loadmat('ex6data3.mat')
print('data.keys():', data.keys())

X, y = data['X'], data['y']
Xval, yval = data['Xval'], data['yval']
print('X.shape, y.shape:', X.shape, y.shape)

def plot_data():
    plt.scatter(X[:, 0], X[:, 1], c=y.flatten(), cmap='jet')

    plt.xlabel('x1')
    plt.ylabel('y1')
    plt.show()

Cvalues = [0.01, 0.03, 0.1, 0.3, 1, 3, 10, 30, 100]
gammas = [0.01, 0.03, 0.1, 0.3, 1, 3, 10, 30, 100]

best_score = 0
best_params = (0, 0)

for c in Cvalues:
    for gamma in gammas:
        svc = SVC(C=c, kernel='rbf', gamma=gamma)
        svc.fit(X, y.flatten())
        score = svc.score(Xval, yval.flatten())
        if score > best_score:
            best_score = score
            best_params = (c, gamma)
print('best_score, best_params:', best_score, best_params)

svc2 = SVC(C=best_params[0], kernel='rbf', gamma=best_params[1])
svc2.fit(X, y.flatten())

def plot_boundary(model):
    x_min, x_max = -0.6, 0.4
    y_min, y_max = -0.7, 0.7
    xx, yy = np.meshgrid(np.linspace(x_min, x_max, 500), np.linspace(y_min, y_max, 500))

    z = model.predict(np.c_[xx.flatten(), yy.flatten()])

    zz = z.reshape(xx.shape)
    plt.contour(xx, yy, zz)

plot_boundary(svc2)
plot_data()
plt.show()

5.通过SVM判断一封邮件是否是垃圾邮件

首先导入库

import numpy as np
import scipy.io as sio
import matplotlib.pyplot as plt
from sklearn.svm import SVC

导入训练集数据和测试集数据，打印表头看看


data1 = sio.loadmat('spamTrain.mat')
print('data1.keys():', data1.keys())

data2 = sio.loadmat('spamTest.mat')
print('data2.keys():', data2.keys())

输出表头；可以看出这次X，y除了训练集还有验证集；我们将在训练集上进行模型训练，然后到验证集上对模型进行验证

data1.keys(): dict_keys(['__header__', '__version__', '__globals__', 'X', 'y'])
data2.keys(): dict_keys(['__header__', '__version__', '__globals__', 'Xtest', 'ytest'])

获取X，y，Xtest, ytest ；并打印X, y的shape以及X，y来看看

X, y = data1['X'], data1['y']
Xtest, ytest = data2['Xtest'], data2['ytest']
print('X.shape, y.shape:', X.shape, y.shape)
print('X:', X)
print('y:', y)

输出X，y的shape
X由1899种特征来表示，这些特征由0和1组成，0表示语义库不能找到该单词，1表示语义库可以找到该单
y只有0和1两种形式，1表示当前邮件为垃圾邮件，0表示不是垃圾邮件

X.shape, y.shape: (4000, 1899) (4000, 1)
X: [[0 0 0 ... 0 0 0]
 [0 0 0 ... 0 0 0]
 [0 0 0 ... 0 0 0]
 ...

 [0 0 0 ... 0 0 0]
 [0 0 1 ... 0 0 0]
 [0 0 0 ... 0 0 0]]
y: [[1]
 [1]
 [0]
 ...

 [1]
 [0]
 [0]]

调用SVC进行邮件分类, 打印出最好的分数结果best_score与其对应的参数best_param

Cvalues = [3, 10, 30, 100, 0.01, 0.03, 0.1, 0.3, 1]
best_score = 0
best_param = 0

for c in Cvalues:
    svc = SVC(C=c, kernel='linear')
    svc.fit(X, y.flatten())
    score = svc.score(Xtest, ytest.flatten())
    if score > best_score:
        best_score = score
        best_param = c

print('best_score, best_param:', best_score, best_param)

输出最好的分数结果best_score与其对应的参数best_param：

best_score, best_param: 0.99 0.03

将最优的参数best_param分别带入训练集和测试集，得到在各自数据下的最好分数（预测准确率）

svc = SVC(C= best_param, kernel='linear')
svc.fit(X, y.flatten())
score_train = svc.score(X, y.flatten())
score_test = svc.score(Xtest, ytest.flatten())
print('score_train, score_test:', best_score, best_param)

分别输出代入最优参数best_param=0.03时，在测试集和验证集上得到的最优的分数结果，
在训练集上的预测准确率为0.99，在验证集上的预测准确率也为0.99。

best_score, best_param: 0.99 0.03
score_train, score_test: 0.99 0.03

参考文献：
[1] https://www.bilibili.com/video/BV1xJ411U7g9?p=5&spm_id_from=pageDriver&vd_source=72e4369cf6b54497a1e04f2071a47a1e

Original: https://blog.csdn.net/weixin_46915208/article/details/125427559
Author: 学吧学无止境
Title: 吴恩达机器学习课后作业6——使用支持向量机(svm)构建一个垃圾邮件分类器

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/721012/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

用 Python 提取 PDF 文本的简单方法

你好，我是征哥，一般情况下，Ctrl+C 是最简单的方法，当无法 Ctrl+C 时，我们借助于 Python，以下是具体步骤：第一步，安装工具库 1、tika — 用于从各种文件…

人工智能 2023年6月19日
0081
交通流预测爬坑记（三）：使用pytorch实现LSTM预测交通流

很长时间没有更新内容了，上一篇可以看做是刚接触深度学习写的，看法非常狭隘，内容非常粗糙。在最近的学习中接触到了Pytorch，不得不承认，相对于TensorFlow来讲，灵活很多。…

人工智能 2023年7月20日
0099
良/恶性乳腺肿瘤预测(逻辑回归分类器)

乳腺肿瘤预测案例：良/恶性乳腺肿瘤预测 * 1.1 简介 1.2 代码 – 1.2.1 导入数据集 1.2.2 浏览数据的基本信息 1.2.3 查看数据的基本统计信息…

人工智能 2023年7月2日
0083
【深度学习】：《PyTorch入门到项目实战》第九天：Dropout实现（含源码）

专栏介绍 ✨本文收录于【深度学习】：《PyTorch入门到项目实战》专栏，此专栏主要记录如何使用 PyTorch实现深度学习算法及其项目实战，目前正在更新pytorch基础篇，接下…

人工智能 2023年7月23日
00117
RuntimeError:0D or 1D target tensor expected, multi-target not supported&& 神经网络中label出现的错误

在编辑神经网络的时候出现这样的问题，记录自己的一个问题：这个问题一般出现在损失函数上面, torch.nn提供很多损失函数MSELoss,L1Loss,CrossEnropyLo…

人工智能 2023年7月12日
00180
【论文写作】闵帆老师论文写作课程心得体会30篇

我的博客一直记录代码，还是第一次记录心得体会。谢谢我闵帆老师。此次博客记录了我在这学期上闵帆老师《论文写作》后的一些心得体会。在这节课上，我学习了写论文的注意事项、写论文所用的工具…

人工智能 2023年7月29日
0063
YOLOv5网络详解

官方源码仓库：https://github.com/ultralytics/yolov5文章下载地址：没有视频讲解：https://www.bilibili.com/video/…

人工智能 2023年7月26日
0054
python写Bicubic方法，跑数据集Set5和Set14，保存PSNR和SSIM的值

作业描述：python写 Bicubic方法，跑数据集Set5和Set14，两个数据集都把放到倍数×2，×3，×4，×8跑一遍，最后把图像质量评估指标 PSNR 和 SSIM 保存…

人工智能 2023年6月19日
00117
Informer：比Transformer更有效的长时间序列预测

目录 AAAI 2021最佳论文：比Transformer更有效的长时间序列预测 Background Why attention 编辑编辑编辑 Methods:the de…

人工智能 2023年6月16日
0073
机器学习-K近邻(KNN)算法详解

一、KNN算法描述 KNN（K Near Neighbor）：找到k个最近的邻居，即每个样本都可以用它最接近的这k个邻居中所占数量最多的类别来代表。KNN算法属于有监督学习方式的分…

人工智能 2023年6月4日
00122
知识图谱基本概念

一、什么是知识图谱知识图谱就是把很多零散的知识用语义的关系来组成一个有关联的图。知识图谱是一种基于图的数据结构，由节点、边和属性值构成，每个节点表示一个”实体&#82…

人工智能 2023年6月1日
0090
全网最详细的深度学习tensorflow-gpu环境配置

学习深度学习第一步就是环境的配置，相信很多小伙伴已经被什么anaconda，tensorflow，Pytorch，cuda这些东西搞得晕头转向，今天带大家详细配置深度学习的环境，这…

人工智能 2023年5月23日
00110
解决TypeError: SwinTransformer: __init__() got an unexpected keyword argument ‘embed_dim‘

内容部分转自：原文链接Swin transformer复现遇到的问题及解决方法1）问题：TypeError: SwinTransformer: init() got an unex…

人工智能 2023年7月28日
0076
OTSU算法/大津法/最大类间方差法 python实现

1. 介绍 OTSU算法是由日本学者大津于1979年提出的一种对图像进行二值化的高效算法，也称为大津法，最大类间方差法。它根据图像的灰度特性而分为背景和前景两部分，背景和前景之间…

人工智能 2023年5月28日
0083
pytorch的dataset用法详解

torch.utils.data 里面的dataset使用方法当我们继承了一个 Dataset类之后，我们需要重写 len 方法，该方法提供了dataset的大小； getite…

人工智能 2023年7月6日
0077
tensorflow神经网络多维曲线拟合

计算智能作业二题目：自选非线性分类或曲线拟合问题，用BP网络训练、学习。自选题目：下面列表中的数据是某地区20年公路运量数据，其中属性”人口数量”、&#8…

人工智能 2023年5月26日
00110

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

吴恩达机器学习课后作业6——使用支持向量机(svm)构建一个垃圾邮件分类器

1. 问题和数据

; 2.线性可分案例

3.线性不可分案例

4.寻找最优参数C和gamma

5.通过SVM判断一封邮件是否是垃圾邮件

大家都在看