一个简单的逻辑回归多分类例子与代码（python-sklearn实现）

2023年6月30日下午4:34 • 人工智能 • 阅读 74

sklearn逻辑回归多分类有两种模式： ovr与multinomial。

在multi_class设为auto的时候，如果二分类或者求解器为liblinear时，则为OVR，否则为multinomial,
多分类时ovr与multinomial的区别请参考：《sklearn逻辑回归多分类ovr与multinomial》

本文讲解sklearn逻辑回归以multinomial模式做多分类的一个简单例子，并提取最后的模型表达式

一.问题

现已采集150组鸢尾花数据：鸢尾花类别（山鸢尾,杂色鸢尾,弗吉尼亚鸢尾）与四个特征（花萼长度sepal length (cm) 、花萼宽度sepal width (cm)、花瓣长度petal length (cm)、花瓣宽度petal width (cm)）。
则我们可以通过采集的数据训练一个决策模型，之后就可以用该模型进行预测鸢尾花类别

数据如下（即sk-learn中的iris数据）：

花萼长度花萼宽度花瓣长度花瓣宽度花类别5.13.51.40.204.93.01.40.204.73.21.30.20……………5.03.31.40.207.03.24.71.416.43.24.51.516.93.14.91.51……………5.72.84.11.316.33.36.02.525.82.75.11.927.13.05.92.12……………5.93.05.11.82

二.流程与代码

(一) 流程

1.数据归一化（用sklearn的逻辑回归一般要作数据归一化）
2.用归一化数据训练逻辑回归模型
3.用训练好的逻辑回归模型预测。
4.模型参数提取

(二)代码

-*- coding: utf-8 -*-
"""
sklearn&#x903B;&#x8F91;&#x56DE;&#x5F52;&#x591A;&#x5206;&#x7C7B;&#x4F8B;&#x5B50;(&#x5E26;&#x6A21;&#x578B;&#x516C;&#x5F0F;&#x63D0;&#x53D6;)
"""
from sklearn.linear_model import LogisticRegression
import numpy as np
from sklearn.datasets import load_iris
#----&#x6570;&#x636E;&#x52A0;&#x8F7D;------

iris = load_iris()
X    = iris.data
y    = iris.target
#----&#x6570;&#x636E;&#x5F52;&#x4E00;&#x5316;------
xmin   = X.min(axis=0)
xmax   = X.max(axis=0)
X_norm = (X-xmin)/(xmax-xmin)

#-----&#x8BAD;&#x7EC3;&#x6A21;&#x578B;--------------------
clf = LogisticRegression(random_state=0,multi_class='multinomial')
clf.fit(X_norm,y)

#------&#x6A21;&#x578B;&#x9884;&#x6D4B;-------------------------------
pred_y      = clf.predict(X_norm)
pred_prob_y    = clf.predict_proba(X_norm)

#------------&#x63D0;&#x53D6;&#x7CFB;&#x6570;w&#x4E0E;&#x9608;&#x503C;b-----------------------
w_norm = clf.coef_                             # &#x6A21;&#x578B;&#x7CFB;&#x6570;(&#x5BF9;&#x5E94;&#x5F52;&#x4E00;&#x5316;&#x6570;&#x636E;)
b_norm = clf.intercept_                           # &#x6A21;&#x578B;&#x9608;&#x503C;(&#x5BF9;&#x5E94;&#x5F52;&#x4E00;&#x5316;&#x6570;&#x636E;)
w    = w_norm/(xmax-xmin)                       # &#x6A21;&#x578B;&#x7CFB;&#x6570;(&#x5BF9;&#x5E94;&#x539F;&#x59CB;&#x6570;&#x636E;)
b    = b_norm -  (w_norm/(xmax - xmin)).dot(xmin)      # &#x6A21;&#x578B;&#x9608;&#x503C;(&#x5BF9;&#x5E94;&#x539F;&#x59CB;&#x6570;&#x636E;)
------------&#x7528;&#x516C;&#x5F0F;&#x9884;&#x6D4B;------------------------------
wxb = X.dot(w.T)+ b
wxb = wxb - wxb.sum(axis=1).reshape((-1, 1)) # &#x7531;&#x4E8E;&#x62C5;&#x5FC3;&#x6570;&#x503C;&#x8FC7;&#x5927;&#x4F1A;&#x6EA2;&#x51FA;&#xFF0C;&#x5BF9;wxb&#x4F5C;&#x8C03;&#x6574;
self_prob_y = np.exp(wxb)/np.exp(wxb).sum(axis=1).reshape((-1, 1))
self_pred_y = self_prob_y.argmax(axis=1)

#------------&#x6253;&#x5370;&#x4FE1;&#x606F;--------------------------
print("\n------&#x6A21;&#x578B;&#x53C2;&#x6570;-------")
print( "&#x6A21;&#x578B;&#x7CFB;&#x6570;:",w)
print( "&#x6A21;&#x578B;&#x9608;&#x503C;:",b)
print("\n-----&#x9A8C;&#x8BC1;&#x51C6;&#x786E;&#x6027;-------")
print("&#x63D0;&#x53D6;&#x516C;&#x5F0F;&#x8BA1;&#x7B97;&#x7684;&#x6982;&#x7387;&#x4E0E;sklearn&#x81EA;&#x5E26;&#x9884;&#x6D4B;&#x6982;&#x7387;&#x7684;&#x6700;&#x5927;&#x8BEF;&#x5DEE;", abs(pred_prob_y-self_prob_y).max())

运行结果：

&#x63D0;&#x53D6;&#x516C;&#x5F0F;&#x8BA1;&#x7B97;&#x7684;&#x6982;&#x7387;&#x4E0E;sklearn&#x81EA;&#x5E26;&#x9884;&#x6D4B;&#x6982;&#x7387;&#x7684;&#x6700;&#x5927;&#x8BEF;&#x5DEE; 3.3306690738754696e-16

(三)模型表达式

由模型系数，得到最后的模式表达式为：

类别预测：哪个的值大，就是哪一类。
概率预测：P归一化后即类别。

备注： sklearn担心e的指数部分太大，产生数值溢出，会再做一些处理。详细见代码里的处理。

相关文章

《逻辑回归过拟合分析与解决方案》

《 sklearn:一个简单的逻辑回归例子》

《 sklearn提取逻辑回归模型系数》

《逻辑回归建模完整流程》

Original: https://blog.csdn.net/ywj_1991/article/details/123688120
Author: 老饼讲解机器学习
Title: 一个简单的逻辑回归多分类例子与代码（python-sklearn实现）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/661648/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Attention注意力机制总结

✨ 写在前面：强烈推荐给大家一个优秀的人工智能学习网站，内容包括人工智能基础、机器学习、深度学习神经网络等，详细介绍各部分概念及实战教程，通俗易懂，非常适合人工智能领域初学者及研究…

人工智能 2023年6月16日
0058
【数字图像处理】Python实现图像变换/沃尔什哈达玛变换(WHT，Walsh-Hadamard Transform)

其实已经有人用Python做出来，不过要钱，一点互联网精神都没有，所以这里我就自己想办法捣鼓了一些内容（我才不掏钱买代码呢），代码写的不好，请见谅，后面可能会更新，可能吧。非常感…

人工智能 2023年6月20日
0081
从pandas数据处理到知识图谱构建笔记

从pandas数据处理到知识图谱构建笔记一、数据处理 1.读取文件夹下所有姓名xls文件并整合: import pandas as pd import numpy as np i…

人工智能 2023年7月16日
0056
R：optim()函数——回归优化案例分析

目的使用 optim()函数寻找最优的参数值，使残差平方和最小（最小二乘法）。步骤数据 R自带数据集 Indometh，有66行、3列，分别为 Subject（患者编号）， …

人工智能 2023年6月18日
00106
Python | 英雄联盟游戏数据分析

一、项目背景 EDG夺得2021英雄联盟全球总决赛冠军，这场比赛让所有观赛者热血沸腾，也唤起了我这个沉睡多年老玩家对MOBA游戏的兴趣，兴冲冲地下载了英雄联盟，却发现这并不是一个可…

人工智能 2023年7月16日
0072
机器学习各种小问题

1 机器学习相关安装问题 1.1 pytorch安装慢问题问题描述要安装pytorch包时，因为包源在国外，所以下载很缓慢，甚至出现直接卡死的情况，下面就是快速安装pytorc…

人工智能 2023年5月24日
0062
【目标检测】你想知道的手势识别都在这里【YOLO】网络

基于YOLO+ResNet50的手势识别目录基于YOLO+ResNet50的手势识别 * 写在前面（一）项目背景以及系统环境 – 1.1 项目背景 1.2 硬件环…

人工智能 2023年5月26日
00256
神经网络深度学习（三）优化器

目录一、优化器分类二、优化器详解三、优化器常见面试题一、优化器分类基本梯度下降法：包括标准梯度下降法(GD, Gradient Descent)，随机梯度下降法(SGD,…

人工智能 2023年6月16日
00108
fast-lio2论文阅读《FAST-LIO2: Fast Direct LiDAR-inertial Odometry》

【摘要】本文提出了FAST-LIO2：一个快速、鲁棒和通用的激光雷达惯性里程计框架。FAST-LIO2基于一个高效的紧密耦合迭代卡尔曼滤波器，FAST-LIO2有两个关键的新特性…

人工智能 2023年6月2日
0079
使用tensorflow神经网络预测房价模型

本例使用kaggle的”House Sales in King County, USA”数据集，共有21613笔房屋数据，每一笔数据有21个不同的信息，如图…

人工智能 2023年5月23日
0097
Python面向对象三大特征

🤵‍♂️ 个人主页: @Flyme awei 个主页👨‍💻 作者简介： Python领域新星创作者。📒 系列专栏：《在线编程-Python篇》🌐推荐一款 找&…

人工智能 2023年5月31日
0081
深度学习入门实践1

如果想简单test一下可以用一般来说比较热门的模型会有很多详细介绍的博客 2.读Readme 创建配置虚拟环境有requirements.txt最好（直接创环境，然后pip …

人工智能 2023年7月16日
0065
数据增强是AI算法中常见的细节问题之一。通过对训练数据进行增强，如旋转、裁剪等操作，可以扩大训练集，提升模型的鲁棒性

数据增强在AI算法中的常见细节问题在AI算法中，数据增强是一个常见的细节问题。通过对训练数据进行增强，如旋转、裁剪等操作，可以扩大训练集，提升模型的鲁棒性。本文将详细介绍数据增强…

人工智能 2024年1月6日
0074
Pytorch学习笔记–SEResNet50搭建

目录 1–ResNet50介绍 1-1–Stem Block环节 1-2–Stage环节 1-3–ResNet50核心代码： 2&#…

人工智能 2023年7月21日
0081
【Python】可视化台风路径轨迹图

台风天要带多少钱出门？答案是：四千万。因为台风天没四(事)千万不要出门这不最近又到了台风频发的季节。作为没有四千万的沿海人，多关注一下天气预报还是有必要的。那么今天呢，就给大…

人工智能 2023年7月15日
0080
使用labelme以任意形状标注多个目标后将目标逐一抠图并保存到本地

1.使用labelme进行标注这里使用两张图片进行标注，需要注意以下几点： 1.图片的名称需要时英文字母命名； 2.标注目标的命名为类别. 标注完成直接将对应的json文件保存到…

人工智能 2023年7月19日
0094

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

一个简单的逻辑回归多分类例子与代码（python-sklearn实现）

一.问题

二.流程与代码

(一) 流程

(二)代码

(三)模型表达式

大家都在看