笔记篇二：鸢尾花数据集分类

2023年6月16日上午8:51 • 人工智能 • 阅读 108

一、鸢尾花数据集

1、问题

Iris 鸢尾花数据集是一个经典数据集，在统计学习和机器学习领域都经常被用作示例。数据集内包含 3 类共 150 条记录，每类各 50 个数据，每条记录都有 4 项特征：花萼长度、花萼宽度、花瓣长度、花瓣宽度，可以通过这4个特征预测鸢尾花卉属于（iris-setosa, iris-versicolour, iris-virginica）中的哪一品种。

0、1、2分别代表三种鸢尾花种类

二、逻辑回归分析

1、定义：逻辑回归是一个实现分类的算法，可以实现二元分类及多元分类

逻辑回归使用一个函数来归一化y值，使y的取值在区间(0,1)内，这个函数称为 Logistic函数(logistic function)，也称为 Sigmoid函数(sigmoid function)。函数公式如下：

Logistic函数当z趋近于无穷大时，g(z)趋近于1；当z趋近于无穷小时，g(z)趋近于0。Logistic函数的图形如下：

2、计算证明

首先对Sigmoid函数求导：

写出逻辑回归的表达式（这里的x有特殊含义表示函数值取1）：

然后写出取值为0或者1的概率表达式：

合并后便构造出每个单条样本预测正确概率的公式：

若要我们预测的全部样例正确率最高，我们自然要求得概率最大值，有两种常用的方法：

（1）极大似然估计法

（2）梯度下降法（梯度下降是求最小值，而上述需求最大值所以需要加个负号）

三、逻辑回归实现鸢尾花分类

import matplotlib.pyplot as plt
import numpy as np
from sklearn.datasets import load_iris
from sklearn.linear_model import LogisticRegression

#&#x8F7D;&#x5165;&#x6570;&#x636E;&#x96C6;
iris = load_iris()
X = X = iris.data[:, :2]   #&#x83B7;&#x53D6;&#x82B1;&#x5349;&#x4E24;&#x5217;&#x6570;&#x636E;&#x96C6;
Y = iris.target

#&#x903B;&#x8F91;&#x56DE;&#x5F52;&#x6A21;&#x578B;
lr = LogisticRegression(C=1e5)#c=1e5&#x662F;&#x76EE;&#x6807;&#x51FD;&#x6570;
lr.fit(X,Y)

#meshgrid&#x51FD;&#x6570;&#x751F;&#x6210;&#x4E24;&#x4E2A;&#x7F51;&#x683C;&#x77E9;&#x9635;
h = .02
#&#x521D;&#x59CB;&#x5316;&#x903B;&#x8F91;&#x56DE;&#x5F52;&#x6A21;&#x578B;&#x5E76;&#x8FDB;&#x884C;&#x8BAD;&#x7EC3;
x_min, x_max = X[:, 0].min() - .5, X[:, 0].max() + .5
y_min, y_max = X[:, 1].min() - .5, X[:, 1].max() + .5
xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))
print(xx,yy)
#pcolormesh&#x51FD;&#x6570;&#x5C06;xx,yy&#x4E24;&#x4E2A;&#x7F51;&#x683C;&#x77E9;&#x9635;&#x548C;&#x5BF9;&#x5E94;&#x7684;&#x9884;&#x6D4B;&#x7ED3;&#x679C;Z&#x7ED8;&#x5236;&#x5728;&#x56FE;&#x7247;&#x4E0A;
Z = lr.predict(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)
plt.figure(1, figsize=(8,6))
plt.pcolormesh(xx, yy, Z, cmap=plt.cm.Paired)
plt.show()

四、绘制散点图

#&#x7ED8;&#x5236;&#x6563;&#x70B9;&#x56FE;
plt.xlabel('Sepal length')
plt.ylabel('Sepal width')
plt.xlim(xx.min(), xx.max())
plt.ylim(yy.min(), yy.max())
plt.xticks(())
plt.yticks(())
plt.legend(loc=2)
plt.show()

Original: https://blog.csdn.net/m0_62915153/article/details/122623361
Author: 一罐趣多多
Title: 笔记篇二：鸢尾花数据集分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/622809/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

sklearn做文本聚类分析

对文本Kmeans聚类分析前言 * 背景目的与思路数据预处理分词处理 * 采用jieba分词停用词处理 – 获取停用词表去除停用词生成tf-idf矩阵 K…

人工智能 2023年6月2日
0069
决策树中使用网格搜索寻找最优参数

决策树决策树是一个树结构（二叉树或非二叉树），其每个非叶节点表示一个特征上的测试，每个分支代表这个特征在某个值域上的输出，每个叶节点存放一个类别。使用决策树进行决策的过程就是从损…

人工智能 2023年6月19日
0050
Teams app LukcyDraw 的升级之路

我已经有很长一段时间没有更新我的 Teams App：LuckyDraw 了，有很多用户反馈给我，因为快到圣诞，新年和春节了，很多公司都开始要使用LuckyDraw来搞抽奖活动，希…

人工智能 2023年7月31日
0060
数据可视化——词云图

本文目的：将爬取的评论数据进行分词，然后使用词云图进行可视化操作。使用到的工具：结巴中文分词、Wordcloud库首先介绍一下两个工具，其中结巴中文分词是一个专门将中文句子进行…

人工智能 2023年5月28日
0085
随笔记录——不同模态信号、表征与应用

基本概述深度学习模型（主要是感知类模型）接受的输入信号，主要包括图像、文本、语音等信号。不同模态的输入信号，经过模型的逐层抽象、转换之后，转变为不同程度的抽象表示（如语义、表征、…

人工智能 2023年5月25日
0087
【Day1】Python进行excel切片的方法

Excel是一个强大的表格制作工具。然而我们却很难同时修改成百上千个表格，即使是重复单一相同的操作。因此，为了节省企业运营部门处理电子表单的时间成本，本文开辟一些实现excel自动…

人工智能 2023年6月19日
0066
torch.nn.Embedding()详解

一、语法格式 torch.nn.Embedding(num_embeddings, embedding_dim, padding_idx=None, max_norm=None, …

人工智能 2023年6月24日
00108
多算法不调包实现Titanic生还者分类预测

多算法不调包实现Titanic生还者分类预测博主本科的机器学习课程作业，要求不使用机器学习包实现分类算法数据集数据集概况本次选择的数据集是Titanic数据集，来自于Kag…

人工智能 2023年7月2日
0064
【WY】数据分析 — Pandas 阶段一：基础语法六 —— 统计基础

版权声明：本文为博主原创文章，未经博主允许不得转载。文章目录一、数据分组 * 1.1 df.groupby() – 1.1.1 分组：计算 1.1.2 分组：根据列…

人工智能 2023年7月7日
0043
从开发角度看羊了个羊

写在前面：博主是一只经过实战开发历练后投身培训事业的”小山猪”，昵称取自动画片《狮子王》中的”彭彭”，总是以乐观、积极的心态对待周边…

人工智能 2023年6月2日
0062
集成学习——回归

线性回归模型：假设目标值与特征之间线性相关，即满足一个多元一次方程。通过构建损失函数，来求解损失函数最小时的参数w ：假设：数据集D = { ( x 1 , y 1 ) , ….

人工智能 2023年6月18日
0063
tensorflow-gpu版本安装教程（过程详细）

准备工作：在开始安装前，如果你的电脑装过tensorflow，请先把他们卸载干净，包括依赖的包（tensorflow-estimator、tensorboard、tensorflo…

人工智能 2023年6月16日
00151
时间序列预测 | Python实现DeepAR模型时间序列预测

我可以回答这个问题。以下是一个使用Keras 实现_Transformer _时间序列预测模型_的 _Python_代码示例： _python_ import numpy as …

人工智能 2023年6月11日
0098
最新python大数据毕业设计选题推荐（三）

文章目录 0 前言 1 大数据相关题目 2 开题指导 * 2.1 起因 2.2 如何避坑(重中之重) 2.3 为什么这么说呢？ 2.4 难度把控 2.5 题目名称 3 最后 0 前…

人工智能 2023年7月4日
0034
【Java】关于Maven仓库地址

Maven仓库地址仓库如果你没有配置阿里云仓库镜像源，可以到这里来找 https://mvnrepository.com/ 如果你配置了阿里云仓库镜像源，可以来这里找 http…

人工智能 2023年6月4日
0075
【cartogarpher_ros】三：发布和订阅雷达scan信息

上一节介绍和测试了cartographer的官方demo。本节会编写ros系统中，最常用的激光雷达LaserScan传感数据的订阅和发布，方便在cartographer中加入自己…

人工智能 2023年6月4日
0078

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

笔记篇二：鸢尾花数据集分类

目录

一、鸢尾花数据集

二、逻辑回归分析

三、逻辑回归实现鸢尾花分类

四、绘制散点图

大家都在看