（九）逻辑回归多分类应用

2023年7月3日上午3:45 • 人工智能 • 阅读 73

逻辑回归（Logistics Regression）属于分类算法，最适合解决二分类问题，也可以解决多分类问题，下面两个例子都是解决多分类的应用

一、鸢尾花案例

import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression

iris = datasets.load_iris()
X = iris.data
y = iris.target

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=666)

1.1 OvR：（One vs Rest）一对剩余

将所有类别分为两类，某一类和非这一类（其它所有类别），对新样本对于这两类进行概率计算
例如：对要预测的新样本计算为A类的概率、非A类概率；计算为B类的概率、非B类的概率；
计算为C类的概率、非C类的概率……

将这个新样本分到得分最高的那一类，用二分类的思想实现了多分类

"""
可以调用sklearn中封装的OneVsRestClassifier类，调用任意二分类算法进行多分类

例如：
from sklearn.multiclass import OneVsRestClassifier
lgr1 = LogisticRegression()
ovr = OneVsRestClassifier(lgr1)
ovr.fit(X_train, y_train)
"""

lgr1 = LogisticRegression(multi_class='ovr', solver='liblinear')
lgr1.fit(X_train, y_train)
lgr1.score(X_test, y_test)

"""
训练的模型如下：
LogisticRegression(C=1.0, class_weight=None, dual=False, fit_intercept=True,
                   intercept_scaling=1, l1_ratio=None, max_iter=100,
                   multi_class='ovr', n_jobs=None, penalty='l2',
                   random_state=None, solver='liblinear', tol=0.0001, verbose=0,
                   warm_start=False)
"""

 0.9473684210526315

1.2 OvO:（One vs One）一对一

对要预测的新样本进行两两类别求概率，最后投票决定
例如：对某样本求为A类别的概率，为B类别的概率；求为B类别的概率，为C类别的概率；
求为A类别的概率，为C类别的概率，然后根据在哪个类别中数量最大进行投票决定它的类别

"""
可以调用sklearn中封装的OneVsOneClassifier类，调用任意二分类算法进行多分类

例如：
from sklearn.multiclass import OneVsOneClassifier
lgr2 = LogisticRegression()
ovo = OneVsOneClassifier(lgr2)
ovo.fit(X_train, y_train)
"""

lgr2 = LogisticRegression(multi_class='multinomial', solver='newton-cg')
lgr2.fit(X_train, y_train)
lgr2.score(X_test, y_test)

"""
训练的模型如下：
LogisticRegression(C=1.0, class_weight=None, dual=False, fit_intercept=True,
                   intercept_scaling=1, l1_ratio=None, max_iter=100,
                   multi_class='multinomial', n_jobs=None, penalty='l2',
                   random_state=None, solver='newton-cg', tol=0.0001, verbose=0,
                   warm_start=False)
"""
1.0

总结：实际检验中OvO预测准确率高于OvR

二、MNIST手写数据集

import  numpy  as  np
from sklearn.datasets import fetch_openml
mnist = fetch_openml("mnist_784")

x = mnist['data']
y = mnist['target']
print(x.shape)
print(y.shape)

x_train = np.array(x[:60000], dtype=float)
y_train = np.array(y[:60000], dtype=float)
x_test = np.array(x[60000:], dtype=float)
y_test = np.array(y[60000:], dtype=float)

from sklearn.linear_model import LogisticRegression

2.1 OvR

%%time
lgr1 = LogisticRegression(multi_class='ovr', solver='liblinear')
lgr1.fit(x_train, y_train)
lgr1.score(x_test, y_test)
0.9176

2.2 OvO

%%time
lgr2 = LogisticRegression(multi_class='multinomial', solver='newton-cg')
lgr2.fit(x_train, y_train)
lgr2.score(x_test, y_test)
0.9208

Original: https://blog.csdn.net/qq_29644709/article/details/116008125
Author: 文龙z
Title: （九）逻辑回归多分类应用

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/666801/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

[python]LDA模型使用流程及代码

目录数据预处理去除停用词构建LDA模型可视化——pyLDAvis 主题个数确认困惑度计算一致性得分数据预处理该步骤可自行处理，用excel也好，用python也罢，…

人工智能 2023年7月4日
0076
PRGC：一种新的联合关系抽取模型

©NLP论文解读原创•作者 | 小欣论文标题：PRGC: Potential Relation and Global Correspondence Based Joint Re…

人工智能 2023年5月31日
0089
《Python 黑科技》一键分析评论关键词，制作精美词云

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月6日
0053
一起学Pandas系列基础篇—查询

一起学Pandas系列基础篇—查询数据（一）一起学Pandas系列基础篇—查询数据（一）一起学Pandas系列基础篇—查询数据（一）本篇学习内容介绍 …

人工智能 2023年7月8日
0057
实战 lasso特征筛选得到5个基因 cox单因素分析得到很多有意义的基因如何lasso筛选特征基因然后再进行cox多因素分析

二、为什么需要用 Lasso + Cox 生存分析模式一般我们在筛选影响患者预后的变量时，通常先进行单因素Cox分析筛选出关联的变量，然后构建多因素模型进一步确认变量与生存的关联是…

人工智能 2023年7月30日
0059
【机器学习实验四】基于Logistic Regression二分类算法实现手部姿态识别

文章目录 Logistic 回归实现手势识别 * 1. 想法构思 – 一些细节 2. 实现流程 – 2.1 数据采集与预处理 + 2.1.1基于mediap…

人工智能 2023年7月2日
0065
mplayer+科大讯飞离线语音包

文章目录【1】mplayer 【2】科大讯飞离线语音包 ; 【1】mplayer 1.将mplayer放到开发板的bin目录下 system(“mplayer 1.a…

人工智能 2023年5月25日
00137
[收藏]基于Spark Graphframes的社交关系图谱项目实战

大家好，我是老兵。本文是基于 Spark Graphframes的 社交关系&#x…

人工智能 2023年6月1日
0079
强化学习——强化学习概述

文章目录 1. 强化学习 2. 序列决策（Sequential decision making） 3. 动作空间 4. 智能体的组成和类型 * 4.1 策略 – 问题：…

人工智能 2023年7月13日
00110
手眼标定笔记

文章目录 * – 基本介绍： – 坐标系变换运算规则： – + 关系运算说明： + 坐标系运算规则一： + 坐标系运算规则二： + 齐次坐标系：…

人工智能 2023年6月27日
0060
巧用工具！轻轻松松将声音转换成文字

今天给大家介绍，如何在工作中，巧用工具，将我们会议中的录音声音，转换成文字，省了打字的时间，节约我们的工作效率准备工作：一台能够正常联网的电脑安装”录音啦&#82…

人工智能 2023年5月25日
0067
计算机视觉环境配置（pycharm安装)(opencv引入)(anaconda安装)(pytorch安装)(YOLO V5安装和实验)(Harris和SIFT角点检测)

课程作业目录一、Pycharm安装、配置、使用二、Anaconda 安装、配置 * （1）Anaconda 下载安装三、Open CV 安装与使用 * （1）完成Open C…

人工智能 2023年7月23日
0072
遥感影像非监督分类及其精度评估（基于ERDAS实现）

遥感影像非监督分类及其精度评估（基于ERDAS实现）非监督分类法在没有先验类别(训练区) 作为样本的条件下,即事先不知道类别特征的情况下,仅依靠影像上不同类地物光谱信息（或…

人工智能 2023年7月1日
00100
Python Scrapy 多线程爬取网易云音乐热门歌单信息（手把手教学）

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月19日
0069
HanLP-简单使用

目录简介轻量级RESTful API 海量级native API 多任务模型自定义任务删除任务自定义字典单任务模型自定义词典流水线组合 https://github…

人工智能 2023年5月27日
0072
Pytorch:手把手教你搭建简单的全连接网络

代码里的注释一定要看！！！里面包括了一些基本知识和原因可以依次把下面的代码段合在一起运行，也可以通过jupyter notebook分次运行第一步：一些库的导入 import …

人工智能 2023年7月23日
0066

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

（九）逻辑回归多分类应用

一、鸢尾花案例

二、MNIST手写数据集

大家都在看