正则化是一种常见的技术，用于控制Logistic回归模型的复杂度，防止过拟合。常用的正则化方法有L1正则化和L2正则化

2024年1月6日上午4:29 • 人工智能 • 阅读 62

什么是正则化？

正则化是一种常见的技术，用于控制Logistic回归模型的复杂度，防止过拟合。过拟合是指模型在训练集上表现得很好，但在测试集或实际应用中表现很差的情况。正则化通过添加一个正则化项到损失函数中，限制模型权重的大小，从而减小模型的复杂度。

正则化方法有很多种，其中最常用的有L1正则化和L2正则化。下面我们将分别介绍这两种方法及其原理。

L1正则化

L1正则化是指在损失函数中添加L1范数的项。L1范数是指向量中各个元素绝对值的和。对于一个具有n个特征的样本x，L1正则化的损失函数可以表示为：

$$L(w) = L(w_0, w_1, …, w_n) + \lambda\sum_{i=1}^n|w_i|$$

其中，L(w)是带有L1正则化项的损失函数，L(w_0, w_1, …, w_n)是未添加正则化项的损失函数，w_i是第i个特征的权重，λ是正则化参数。L1正则化项采用绝对值的形式，它的作用是使得部分特征的权重变为0，从而实现特征的选择，达到模型的简化和降维。

L2正则化

L2正则化是指在损失函数中添加L2范数的项。L2范数是指向量中各个元素的平方和的开方。对于一个具有n个特征的样本x，L2正则化的损失函数可以表示为：

$$L(w) = L(w_0, w_1, …, w_n) + \lambda\sum_{i=1}^nw_i^2$$

其中，L(w)是带有L2正则化项的损失函数，L(w_0, w_1, …, w_n)是未添加正则化项的损失函数，w_i是第i个特征的权重，λ是正则化参数。L2正则化项采用平方的形式，它的作用是使得所有特征的权重都变得较小，但不为0，从而实现更平滑和稳定的模型。

计算步骤

对于Logistic回归模型，在使用L1或L2正则化方法时，通常需要进行以下步骤：

导入数据集：将数据集导入到Python环境中，可以使用开源数据集或者虚拟数据集。
数据预处理：对数据进行缩放、归一化、填充缺失值等预处理操作，使得数据具备可行性和可用性。
拆分数据集：将数据集划分为训练集和测试集，通常按照70%的比例进行划分。
特征工程：根据实际问题选择合适的特征，可以使用特征选择、特征转换等方法来提取和构建特征。
模型训练：使用Logistic回归模型对训练集进行拟合，得到初始模型参数。
正则化处理：根据选择的正则化方法（L1或L2），对模型的权重进行限制。
模型评估：使用测试集对正则化后的模型进行评估，比较模型在训练集和测试集上的性能。

下面我们将展示一段用Python实现的示例代码，演示如何使用L2正则化。

Python代码示例

import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LogisticRegression
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# 生成虚拟数据集
X, y = make_classification(n_samples=100, n_features=2, n_informative=2, n_redundant=0, 
 n_classes=2, random_state=42)

# 数据预处理
scaler = StandardScaler()
X = scaler.fit_transform(X)

# 拆分数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 定义正则化强度
C = 1.0

# 创建Logistic回归模型
model = LogisticRegression(penalty='l2', C=C, solver='liblinear')

# 训练模型
model.fit(X_train, y_train)

# 模型评估
train_acc = model.score(X_train, y_train)
test_acc = model.score(X_test, y_test)

print("训练集准确率:", train_acc)
print("测试集准确率:", test_acc)

# 绘制决策边界
x1_min, x1_max = X[:, 0].min() - 1, X[:, 0].max() + 1
x2_min, x2_max = X[:, 1].min() - 1, X[:, 1].max() + 1
xx1, xx2 = np.meshgrid(np.arange(x1_min, x1_max, 0.1),
 np.arange(x2_min, x2_max, 0.1))

Z = model.predict(np.c_[xx1.ravel(), xx2.ravel()])
Z = Z.reshape(xx1.shape)

plt.contourf(xx1, xx2, Z, alpha=0.8)
plt.scatter(X[:, 0], X[:, 1], c=y, cmap='RdBu')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.title('Logistic Regression with L2 Regularization')
plt.show()

在这个示例代码中，我们首先生成了一个虚拟的二分类数据集。然后进行了数据预处理，包括对特征进行标准化。接下来，将数据集拆分成训练集和测试集。然后，我们定义了正则化强度C，并使用L2正则化（penalty=’l2’）创建了Logistic回归模型。最后，我们训练了模型，并评估了在训练集和测试集上的准确率。最后，我们绘制了决策边界来可视化模型的分类结果。

通过运行以上代码，我们可以得到Logistic回归模型在L2正则化下的分类效果，并对模型的复杂度进行控制，防止过拟合的问题。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/824187/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

WAVE音频格式及及转换代码

音频信号的读取、写入、回放和记录 [En] Reading, writing, playback and recording of audio signals python已经支持…

人工智能 2023年5月27日
00120
【数字图像处理】OpenCV相机标定计算内参外参

相机标定理论四个坐标轴的变换关系：（1）从 world 到 camera （2）从camera到image（3）从 image 到 pixel（4）从world 到 pixel…

人工智能 2023年5月26日
00102
Halcon常用的画ROI区域的生成保存读取

Halcon常用的画ROI区域的生成与保存读取一.Halcon常用的画ROI区域算子 * 1.画圆（draw_circle，gen_circle） 2.椭圆（draw_ellip…

人工智能 2023年5月26日
0093
lecture 4：Python数据清洗与整理

数据整理的综合案例第一部分按性别/年份统计出生数思路：加载所有txt文件并进行整合，创建数据透视表，运用DataFrame内置绘图请先将所有的TXT文件放在d://myfol…

人工智能 2023年7月8日
0061
数字图像处理-图像分割-复习总结

文章目录数学图像处理 * 图像分割 – 图像分割基础基于边界的图像分割（非连续性分割） + 边缘检测一阶差分算子（掌握）二阶差分算子边缘检测算子的比较（掌握）…

人工智能 2023年7月19日
0075
数据分析 | Pandas 200道练习题，每日10道题，学完必成大神（7）

文章目录 * – 前期准备 – 1. 以df的列名创建一个DataFrame – 2. 打印所有换手率为非数字的行 – 3. 删除所…

人工智能 2023年7月9日
0075
商场可视化与商场停车导航(智能导览、精确车位引导、反向寻车、实景地图)

近年来，随着人均生活水平的提高，各种机动车辆数量的迅猛增长，商场购物中心超大的经营规模能为广大顾客提供购物选择的同时，也面临着许多问题：当顾客走进庞大的商场购物中心，穿梭在纷繁的商…

人工智能 2023年6月4日
0092
[pytorch] MedicalNet 3D Resnet预训练分割网络代码详解

MedicalNet 3D Resnet预训练分割网络代码详解 MedicalNet 参数设置分割模型数据读取预测完整代码 * 依赖 MedicalNet 学习率设置数…

人工智能 2023年7月22日
0077
NLP-基于机器学习的文本分类-垃圾邮件分类

目录 * – 一、文本分类的步骤 – 二、提取特征的经典方法 – 三、分类器方法 – + 1.朴素贝叶斯(Naive Bayesia…

人工智能 2023年7月1日
0096
物理信息驱动的深度学习相比于传统数值方法的潜在优势

物理驱动的神经网络相比于传统数值方法在哪些问题上有潜在优势？刚接触到物理驱动的神经学习方法时，总会有一些疑惑：物理驱动的深度学习方法在求解一些物理系统（由物理方程所描述控制的系统…

人工智能 2023年6月24日
0080
简单讲述几种查找图片中隐藏Flag的方法

目录一、附加字符串二、修改图片的宽高三、jphide图片隐写四、OutGuess隐写五、异或隐写六、盲水印七、二维码画图八、灰度图片LSB隐写一、附加字符串 fl…

人工智能 2023年7月6日
0081
问题解决：OpenCV将捕获的视频保存，却无法播放，报解析错误

首先明确这个问&#…

人工智能 2023年6月22日
00123
MMDetection框架入门教程（完全版）

网上MMDetection的教程看似有很多，但感觉都不成系统，看完一圈下来还是不知道MMDetection要怎么用。这里还是推荐直接跟着官方教程，结合源码学习MMDetection…

人工智能 2023年6月23日
0084
声学多普勒流速剖面仪_深海船载走航式声学多普勒流速剖面仪

一、引言海洋约占地球表面积的71%，是地球上尚未被人类充分认识和利用的最大潜在资源基地。在海底及海洋中，蕴藏着极其丰富的生物资源及矿产资源。海洋中超过2000m水深的深海区占海洋…

人工智能 2023年5月27日
0071
边缘检测原理

什么是边缘？图像的边缘是指图像局部区域亮度变化显著的部分，该区域的灰度剖面一般可以看作是一个阶跃，即从一个灰度值在很小的缓冲区域内急剧变化到另一个灰度相差较大的灰度值。边缘有正…

人工智能 2023年6月17日
0099
计算机视觉图像处理Opencv基础知识（附详解代码）上

计算机视觉图像处理Opencv基础知识 (附详解代码)上此部分内容为在学习唐宇迪老师课程中，自己微调后部分知识以及代码，想更多了解移步唐老师课程。* 计算机视觉图像处理Openc…

人工智能 2023年6月22日
0084

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31