sklearn逻辑回归:参数详解

2023年6月15日上午11:27 • 人工智能 • 阅读 131

本文讲述sklearn逻辑回归参数详解

一.入参说明

完整入参：

clf = LogisticRegression(penalty='l2',dual=False, tol=0.0001, C=1.0, fit_intercept=True, intercept_scaling=1,
                   class_weight=None, random_state=None, solver='lbfgs', max_iter=100, multi_class='auto',
                   verbose=0, warm_start=False, n_jobs=None, l1_ratio=None)

常用入参：
random_state：随机种子。需要每次训练都一样时，就需要设置该参数。
class_weight：各类别样本的权重。样本需要加权时，使用该参数。
fit_intercept：是否需要截距b。一般都需要。
max_iter：最大迭代次数。
tol：停止标准。如果求解不理想，可尝试设置更小的值。

正则化相关参数：
penalty：惩罚项，如果需要正则化，则用默认为L2，不需要则设为None。特殊的，要用L1正则：修改对应的solver。如果L1和L2都用，则改为elasticnet,修改solver和l1_ratio.

C:正则化强度的倒数
solver:求解器,设置正则化时，需要使用支持正则化的求解器。
l1_ratio：Elastic-Net中L1占比。使用Elastic-Net时才需设置。

其它冷参数：
multi_class：多分类模式。一般不需修改，用auto就行
verbose：输出训练过程。一般不打印，不需修改
warm_start：是否热启动。一般不需热启动。不需修改。
n_jobs：使用CPU个数。用默认1个CPU即可。
intercept_scaling：截距特征缩放。一般不需要改。用求解器”liblinear”且要正则化时需要调整。
dual：是否采用对偶方法。求解器liblinear的专用参数（且penalty=L2），一般不需要改。

参数名称参数输入要求变量说明详细说明penaltyl1,l2(默认),elasticnet,none惩罚项l1/l2即在损失函数中加l1/l2正则项。elasticnet即 l1,l2都加。none为不加。（注意：每个求解器支持的参数不同）dualTrue,False(默认)是否采用对偶方法求解器liblinear的专用参数（且penalty=L2）tol数值，默认le-4停止标准迭代中某些过程小于该数，则停止训练C正数，默认1正则化强度的倒数设得越小正则化越强fit_interceptTrue(默认),False是否需要截距b如果为False，则b强设为0，模型中wx+b变成wxintercept_scaling数值，默认1截距特征缩放求解器用”liblinear”才需要。liblinear会把b也添加到正则项，为避免b的取值受正则化影响过大，正则化取的是b/intercept_scaling，可预设intercept_scaling，调整b受正则化的影响。class_weight字典（多输出为字典列表）

，balanced，None（默认）各类别样本的权重None:样本权重全为1

字典:{0:1,1:2}代表0类的样本权重为1，1类的样本权重为2.（多输出时，格式为:[{0:1,1:2},{0:1,1:2}]）

balanced:把总权重n_samples均分给各类，各类再均分给各个样本。例：有3个类别，10个样本，则每个类别平均权重为10/3,平均到某个类别的权重就为 (10/3)/类别样本数。公式：class_weight = n_samples / (n_classes * np.bincount(y))。random_state整数，随机数实例，None(默认)训练过程中的随机种子。如果设定为非None值，则每次训练都会是一样的结果。solvernewton-cg，lbfgs（默认），

liblinear，sag，saga求解器，即求解方法求解器支持的惩罚项：

newton-cg : [‘l2’, ‘none’]

lbfgs:[‘l2’, ‘none’]

liblinear: [‘l1’, ‘l2’]（仅支持OVR分类）

sag: [‘l2’, ‘none’]

saga: [‘elasticnet’, ‘l1’, ‘l2’, ‘none’]max_iter整数，默认100最大迭代次数-multi_classauto(默认),ovr,multinomial多分类模式ovr:one-versus-rest,一对剩余。有K类，则训练K个模型，每个模型把第i类当一类，其余当一类。最后选择预测概率最高的一类作为预测类别。

multinomial：多项模式。此时使用逻辑回归的推广模型softmax回归进行多分类。

auto:如果二分类或者求解器为liblinear时，则为OVR，否则为multinomialverbose整数，默认0输出训练过程数值越大，越详细。0则为不输出。warm_startTrue/False是否热启动为True则沿用之前的解。liblinear不支持。n_jobs整数，默认None使用CPU个数none一般代表1，-1代表使用所有处理器l1_ratio[0,1]的小数，默认NoneElastic-Net中L1占比penalty设为Elastic-Net时专用参数，即Elastic-Net中l1的占比

二.模型训练

clf.fix(X,y) :训练模型

三.模型训练后的方法与属性

clf.predict(X) ：预测X的类别
clf.predict_proba(X) ：预测X属于各类的概率
clf.predict_log_proba(X) ：相当于 np.log(clf.predict_proba())
clf.decision_function(X) :输出wx+b部分
clf.score(X,y) ：返回准确率，即模型预测值与y不同的个数占比(支持样本权重：clf.score(X,y,sample_weight=sample_weight))

clf.coef_ ：模型系数
clf.intercept_：模型截距
clf.classes_ ：类别编号
clf.n_features_in_：特征个数。
clf.feature_names_in_：特征名称。（特征名称为字符串时才会有该属性）

相关文章

Original: https://blog.csdn.net/ywj_1991/article/details/123644785
Author: 老饼讲解机器学习
Title: sklearn逻辑回归:参数详解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/614550/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

从零开始数据分析Kaggle项目—泰坦尼克号（二）

从零开始数据分析Kaggle项目—泰坦尼克号1—1.2 import pandas as pd import numpy as np import os df = pd.read_…

人工智能 2023年7月6日
0084
前端基础之《Bootstrap（13）—JavaScript插件_标签页、工具提示、弹出框、折叠效果和幻灯片》

一、data-开头的是什么是bootstrap封装的js。data-toggledata-targetdata-dismissdata-spy参考资料：https://blog….

人工智能 2023年6月28日
0082
基于旋转高频注入法的永磁同步电机无位置传感器控制

基于旋转高频注入法的永磁同步电机无位置传感器控制一、原理解说 PMSM 无位置传感器控制主要分为两类:一种是在中高速范围内利用反电动势和电角速度的关系，通过计算反电动势获取转子位…

人工智能 2023年6月23日
0078
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.a…

人工智能 2023年6月23日
0060
python数据分析基础008 -利用pandas带你玩转excel表格（中下篇）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月14日
0043
64位系统树莓派部署yolo-fatestv2—超多坑

最近在研究yolo-fastest，开始面对作者大大的一堆部署的指令在pycharm的终端里面一顿操作，然后一路报错，后来才发现原来都是linux的指令…后来在虚拟机上…

人工智能 2023年5月28日
0097
Google colab降级conda、cudnn、安装tensorflow1.x

面向的问题：现在google colab支持tensoflow2.x和1.x，默认使用2.x版本 google提供版本切换方式方法一 %tensorflow_version 1….

人工智能 2023年5月24日
00125
数学建模实战10（时间序列回归）

销量数据预测一.Spss时间序列建模的思路二.销量数据预测 * 1.题目 2. 操作 – 【1】生成时间变量【2】画出时间序列图【3】查看建模结果【4】论文如…

人工智能 2023年6月18日
0092
MMDetection亲测安装教程

MMDetection是一个基于 PyTorch 的目标检测开源工具箱。接下来就安装看看吧。本人安装环境：系统环境：Ubuntu 20.04.2 LTS cuda版本：11.0…

人工智能 2023年7月5日
0075
torchtext 安装，与pytorch版本匹配

没想到安装一个torchtext，查看了好几篇博客！于是梳理总结了一下~ 目录报错：ModuleNotFoundError: No module named ‘tor…

人工智能 2023年5月27日
00134
机器学习的练功方式（十）——岭回归

岭回归是线性回归的改进，有时候迫不得已我们的参数确实不能少，这时候过拟合的现象就可能发生。为了避免过拟合现象的发生，既然不能从减少参数上面下手，那我们转而在线性回归的最后面添加一个…

人工智能 2023年6月18日
00103
LSTM模型

LSTM模型是为了解决RNN神经网络中的梯度爆炸问题。（1）模型思路： RNN是想把所有信息都记住，不管是有用的信息还是没用的信息。LSTM：设计一个记忆细胞（具备选择性记忆的功…

人工智能 2023年7月12日
0041
纯原创，略带点科技艺术气息的目标检测框

如果说作为一名程序员，我要求我自己要不断的求证，那么同时作为一名热爱艺术的人，我则无法忍受主流的那种”丑陋”目标检测框（下图），所以这篇文章也就应用而生了。…

人工智能 2023年7月10日
0053
Redis数据库相关指令大合集

14天学习训练营导师课程：郑为中《Vue和SpringBoot打造假日旅社管理系统》努力是为了不平庸~ 学习有些时候是枯燥的，但收获的快乐是加倍的，欢迎记录下你的那些努力时刻（…

人工智能 2023年7月30日
0061
《Learning from Protein Structure with Geometric Vector Perceptrons》文献阅读

本博文基于《Learning from Protein Structure with Geometric Vector Perceptrons》进行翻译讲解，该文章发表于2021年…

人工智能 2023年7月14日
0060
轮廓检测+外接矩形（opencv+python）

contours, hierarchy = cv2.findContours(image,mode,method) image：输入图像 *mode：轮廓的模式。 cv2.RETR…

人工智能 2023年7月19日
0072

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

sklearn逻辑回归:参数详解

一.入参说明

二.模型训练

三.模型训练后的方法与属性

大家都在看