人工智能 | 基于支持向量机SVM模型的鸢尾花分类识别

2023年6月24日上午8:46 • 人工智能 • 阅读 66

一、实验目的

通过鸢尾花萼片长度和宽度特征，采用感知器模型对鸢尾花数据集进行种类的分类识别。

二、算法步骤

1.数据准备
(1)从sklearn库里加载鸢尾花特性数据集；
iris = datasets.load_iris();

[]内数字0、1、2、3分半表示花萼长、宽和花瓣长宽

X = iris.data[:, [2, 3]]; y = iris.target;
打印输出的标签，0、1、2分别表示山鸢尾、变色鸢尾和维吉尼亚鸢尾。
print(‘Class labels:’, np.unique(y));
（2）用train_test_split函数将数据集随机分割成70%训练数据和30%测试数据，并打印出三种花分别对应的所有数量、用于训练的数量和用于测试的数量，将训练数据归一化，转换成一维数据保存在变量X_train_std和X_test_std中。
2.模型训练
对训练数据X_train_std和y_train采用svm进行数据拟合：
svm = SVC(kernel=’linear’, C=1.0, random_state=1);
svm是线性拟合函数，其中，软间隔为1，随机状态为1.

3.数据绘图：用plot_decision_regions函数将150条数据和45条测试数据显示在一张图上，分别用’s'(红),’^'(蓝),’o'(绿)和’O'(黄)表示0类、1类、2类花和测试的数据标注。
4.模型评估：打印出测试集中错误分类的样本的个数Misclassified samples，与测试集整体识别的准确率Accuracy。
print(‘Misclassified samples: %d’ % (y_test != y_pred).sum())
print(‘Accuracy: %.2f’ % svm.score(X_test_std, y_test))

三、直接上代码

from sklearn import __version__ as sklearn_version
from distutils.version import LooseVersion
from sklearn import datasets
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import Perceptron
from sklearn.metrics import accuracy_score
from matplotlib.colors import ListedColormap
import matplotlib.pyplot as plt
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from sklearn.neighbors import KNeighborsClassifier

iris = datasets.load_iris()
X = iris.data[:, [2, 3]]
y = iris.target

print('Class labels:', np.unique(y))

X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=1, stratify=y)

print('Labels counts in y:', np.bincount(y))
print('Labels counts in y_train:', np.bincount(y_train))
print('Labels counts in y_test:', np.bincount(y_test))

sc = StandardScaler()
sc.fit(X_train)
X_train_std = sc.transform(X_train)
X_test_std = sc.transform(X_test)

def plot_decision_regions(X, y, classifier, test_idx=None, resolution=0.02):

    markers = ('s', '^', 'o', 'x', 'v')
    colors = ('red', 'blue', 'lightgreen', 'gray', 'cyan')
    cmap = ListedColormap(colors[:len(np.unique(y))])

    x1_min, x1_max = X[:, 0].min() - 1, X[:, 0].max() + 1
    x2_min, x2_max = X[:, 1].min() - 1, X[:, 1].max() + 1
    xx1, xx2 = np.meshgrid(np.arange(x1_min, x1_max, resolution),
                           np.arange(x2_min, x2_max, resolution))
    Z = classifier.predict(np.array([xx1.ravel(), xx2.ravel()]).T)
    Z = Z.reshape(xx1.shape)
    plt.contourf(xx1, xx2, Z, alpha=0.3, cmap=cmap)
    plt.xlim(xx1.min(), xx1.max())
    plt.ylim(xx2.min(), xx2.max())

    for idx, cl in enumerate(np.unique(y)):
        plt.scatter(x=X[y == cl, 0],
                    y=X[y == cl, 1],
                    alpha=0.8,
                    c=colors[idx],
                    marker=markers[idx],
                    label=cl,
                    edgecolor='black')

X_combined_std = np.vstack((X_train_std, X_test_std))
y_combined = np.hstack((y_train, y_test))

svm = SVC(kernel='linear', C=1.0, random_state=1)
svm.fit(X_train_std, y_train)

plot_decision_regions(X_combined_std,
                      y_combined,
                      classifier=svm,
                      test_idx=range(105, 150))
plt.xlabel('petal length [standardized]')
plt.ylabel('petal width [standardized]')
plt.legend(loc='upper left')
plt.tight_layout()

plt.show()

y_pred = svm.predict(X_test_std)
print('Misclassified samples: %d' % (y_test != y_pred).sum())
print('Accuracy: %.2f' % svm.score(X_test_std, y_test))

四、实验结果

Original: https://blog.csdn.net/kndjg/article/details/122298207
Author: 尘封的CPU
Title: 人工智能 | 基于支持向量机SVM模型的鸢尾花分类识别

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/648745/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

读书笔记：深度学习入门-基于python的理论与实现（俗称鱼书）

文章目录前言三、神经网络 * 3.2 激活函数 – 3.2.1 阶跃函数 3.2.2 sigmoid函数 3.2.3 ReLU函数 3.3 多维数组 –…

人工智能 2023年6月16日
0097
SIFT算法详解(附有完整代码)

说明：本文旨在给出 SIFT 算法的具体实现，而在 SIFT 详解上只是做出简单介绍，在这里可以给大家推荐一篇好文：https://blog.csdn.net/zddblog/ar…

人工智能 2023年7月26日
0075
【深度学习笔记1】-pytorch的dataloader参数shuffle设置true或false

作为一名深度学习的小白，最近在做LSTM预测股票问题，发现训练集的shuffle必须为true而测试集的shuffle必须为false。如果训练集的shuffle不设置为true的…

人工智能 2023年6月16日
00101
2022数维杯数学建模A题

A题是经典的数据问题，那对这类问题我们首先要做的就是数据预处理，至于怎么处理，删除或者填补都是可以的。问题1:请你从这64项数据中整理出适合的投入产出数据，并对各银行的效率展开对…

人工智能 2023年6月13日
00108
TensorFlow 1.15版本安装及PyCharm环境导入

前段时间人工智能的课，发现教材上面的tensorflow1.13.1版本和以前自己用的2.x版本不太一样，大部分api都不兼容。在这里，我想抱怨一下本科教科书。计算机教材不能只看…

人工智能 2023年5月23日
00111
89 logistic回归用户画像用户响应度预测2

logistic回归篇章数据集接应上一节数据集合，本次的分析是从用户是否为高响应用户进行划分，使用logistic回归对用户进行响应度预测，得到响应的概率。线性回归，参考上一篇章…

人工智能 2023年6月11日
0059
多元线性回归算法预测房价

目录一.多元线性回归 1.定义 2.房价问题分析二.使用Excel进行多元先回归预测 1.导入数据 2.完善数据集 1.删除数据偏差 2. 处理非数据数值 3.Excel做线性…

人工智能 2023年6月17日
0084
处理时间序列数据的高端模型Transformer和Pytorch代码实现

目录 Transformer * 1.self-attention 具体原理 2.多头注意力机制 3.Decoder Transformer Transformer 是由 Goog…

人工智能 2023年5月27日
0094
MATLAB图像处理边缘检测

最近正好在做APMCM2019的A题，发现了matlab一些比较好用的函数，做一个学习笔记的作用如果大家有去了解这道题目的话，会发现它其实是需要你通过图像处理等方式，将114张SI…

人工智能 2023年6月17日
00108
2022年，校招计算机视觉算法岗，还要继续all in吗？

本文受众聚焦在本科大四以及硕士研究生的范畴。然后，本文只是提供一些切身的思考，并不一定全对，也会存在考虑不全的地方，希望读者能持开放包容的心态进行阅读😘 so，enjoy：劝退先…

人工智能 2023年7月20日
0030
数据分析师对标签、指标、维度、字段等的思考（指标体系标签体系（转自知乎）

1.前言作为数据分析师工作中经常会接触要标签，指标，字段，维度，属性等，但它们之间有什么区别，怎么定义，相互之间有什么关联呢？这个问题，我无法作出直接的回答，也没想过去整理，…

人工智能 2023年7月16日
0066
R语言ggplot2可视化柱状图添加数值说明并控制文本、数值字体大小、轴标签字体大小实战

### 回答1： ggplot2_是 _R语言_中一个非常流行的绘图包，可用于创建各种类型的图表，包括 _柱状图。在 ggplot2_中，我们可以使用geom_bar()函数创建 …

人工智能 2023年6月20日
00109
python实现定时任务的8种方式详解

在日常工作中，常常会用到需要周期性执行的任务，一种方式是采用 Linux 系统自带的 crond 结合命令行实现。另外一种方式是直接使用Python。当每隔一段时间就要执行一段程…

人工智能 2023年7月29日
0070
【翻译论文】Multiclass Optimal Classification Trees with SVM-splits（2021）

Multiclass Optimal Classification Trees with SVM-splits（2021）支持向量机分裂的多类最优分类树 V Blanco，A Ja…

人工智能 2023年7月2日
00101
【毕业设计】深度学习人体跌倒检测 -yolo 机器视觉 opencv python

文章目录 0 前言 1.前言 2.实现效果 3.相关技术原理 * 3.1卷积神经网络 3.1YOLOV5简介 3.2 YOLOv5s 模型算法流程和原理 4.数据集处理 &#821…

人工智能 2023年7月6日
0052
基础的强化学习(RL)算法及代码详细demo

文章目录 * – + 一、Sarsa (悬崖问题) + * 1.1 CliffWalking-v0环境介绍 * 1.2 Sarsa算法流程 * 1.3 具体代码 * 1…

人工智能 2023年7月26日
0061

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30