为什么需要使用正则化技术来防止过拟合

2024年1月1日上午5:36 • 人工智能 • 阅读 42

为什么需要使用正则化技术来防止过拟合？

过拟合是指模型在训练集上表现出色，但在新数据上的预测性能较差的情况。这是由于模型过于复杂，以至于每个训练样本的细微变化都会被模型捕捉到，导致模型无法泛化到新数据。为了解决过拟合问题，我们需要采取一些方法，其中之一是正则化技术。

正则化技术通过对模型的权重进行约束，限制其值的范围，从而减小模型的复杂性。这可以防止模型对训练集中的噪声和异常值过于敏感，从而提高模型的泛化能力。

正则化技术的算法原理

正则化技术的一种常见方法是L2正则化（岭回归）算法。

L2正则化通过向损失函数添加一个正则化项，以惩罚较大的权重。这个正则化项由权重的平方和乘以一个正则化参数(lambda)决定。通过调整lambda的值，我们可以控制正则化对模型的影响程度。

公式推导

假设我们的线性模型为：
$$
y = w_1x_1 + w_2x_2 + … + w_nx_n + b
$$

损失函数为平方损失函数：
$$
L = \frac{1}{2}\sum_{i=1}^{m}(y_i – \hat{y_i})^2
$$

在L2正则化中，我们将正则化项添加到损失函数中：
$$
L_{reg} = L + \frac{\lambda}{2}\sum_{i=1}^{n}w_i^2
$$

其中，lambda是正则化参数。

为了减小损失函数，我们需要计算损失函数对权重的偏导数：
$$
\frac{\partial L_{reg}}{\partial w_i} = \frac{\partial L}{\partial w_i} + \lambda w_i
$$

计算步骤

定义线性模型的结构和参数
定义损失函数，包括正则化项
计算损失函数对权重的偏导数
使用梯度下降等优化算法来更新权重
反复迭代直至收敛

复杂Python代码示例

下面是一个使用L2正则化的线性回归的Python示例代码：

import numpy as np

# 生成虚拟数据
np.random.seed(0)
X = np.random.rand(100, 1)
y = 4 + 3 artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls X + np.random.randn(100, 1)

# 添加偏置项
X_b = np.c_[np.ones((100, 1)), X]

# 定义参数和学习率
theta = np.random.randn(2, 1)
lr = 0.1
lambda_ = 0.1

# 梯度下降
for epoch in range(1000):
 gradients = 1/len(X_b) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls X_b.T.dot(X_b.dot(theta) - y) + lambda_/len(X_b) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls np.r_[[[0]], theta[1:]]
 theta = theta - lr artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls gradients

# 打印最终的参数
print(theta)

首先，我们通过numpy.random生成一个虚拟数据集X和y。然后，我们添加一个全为1的偏置项到特征矩阵X中。

接下来，我们定义模型的参数theta和学习率lr，以及正则化参数lambda_。在每个迭代步骤中，我们计算梯度，并根据梯度和学习率更新参数theta。

最后，打印出最终学到的参数theta。

代码细节解释

行1：导入必要的库。
行4-6：生成一个100×1的随机数组X和对应的标签y，并添加随机噪声。
行9：将全为1的列添加到特征矩阵X中。
行12-15：定义模型的参数theta、学习率lr和正则化参数lambda_。
行18-21：使用梯度下降算法更新参数theta。其中，gradients计算了损失函数对权重的偏导数，并添加了正则化项。
行24：打印最终学得的参数theta。

这个示例展示了如何使用L2正则化技术来防止线性回归模型的过拟合。正则化项惩罚权重较大的模型，使其更加平滑，提高了模型泛化能力。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/822393/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

R语言网络图可视化——igraph, forceatlas2的使用

根据连接矩阵，绘制网络图，如下所示：该图中对每个子网络赋予相同的颜色，并且利用forceatlas2来布局。好了，下面直接给出详细的步骤： ; Step1：安装必要的包 rm(…

人工智能 2023年7月17日
0075
Stata常用命令集锦【计量经济系列（一）】

Stata常用命令集锦【计量经济系列（一）】文章目录 1.数据集的打开、关闭与保存 * 1.1 导入Excel数据 1.2 打开dta数据 1.3 关闭数据集 1.4 保存数据 …

人工智能 2023年7月14日
0062
第二章、机器学习之训练轮数（epoch）

第一章批数据训练（batch）第二章训练轮数（epoch）第三章学习率（LR : learning rate）第四章图像区块（patch）第五章滤波器（filte…

人工智能 2023年6月15日
0073
pythonlambda函数替换列表_python——用lambda函数替换for循环

场景如下：现在有一个dataframe，其中一列为score，值从0-100， df： score 现在需要增加一列level，给这些分数分类，90分以上为A，60-90为B，6…

人工智能 2023年7月9日
0057
温故知新：数据科学札记

【引子】春节聊天的时候，家中少年的一个发小刚刚转了个专业——数据科学，自己似乎对所谓的”数据科学”了解很多，但又似乎难以区分其中的一些概念差异，例如，统计学…

人工智能 2023年7月17日
0046
复现lio_sam激光slam算法创建点云地图

实验环境：ubuntu16.04+ROSkinetic+robosense16线+xsense_mti_700惯导+pcl1.9.0+gtsam4.0.2 一、LIO_SAM简介 …

人工智能 2023年6月2日
0063
将爬取数据自动地生成表格

import pickleimport pandas as pdimport datetime 读取爬取下来的数据with open(“/Users/data/all_…

人工智能 2023年7月8日
0065
python方差检验分析（ANOVA）

python方差检验分析（ANOVA）方差分析(Analysis of Variance，简称ANOVA)，又称”变异数分析”，是R.A.Fisher发明…

人工智能 2023年7月17日
0069
使用MobaXterm连接服务器并利用Anaconda进行安装pytoch框架跑深度学习模型（使用学校服务器+显卡进行深度学习）

在开始之前你需要找学校服务器负责人申请服务器账号和密码以及校内外网IP和端口号；另外还需要知道学校服务器显卡cuda版本，以及去pytorch官网查看显卡cuda版本对应的 …

人工智能 2023年6月16日
0073
时间序列模型进行预测及异常值检测

文章目录前言 1. 简介 2. 步骤 3. 代码 4. 结果图展示 5. 参考资料及数据文件获取前言本文主要记录使用时间序列模型进行预测及异常值检测的相关笔记简介在数据分…

人工智能 2023年7月16日
0067
深度学习环境配置——Anaconda+PyTorch+PyCharm （含详细步骤）

目录前言 1.NVIDIA驱动安装 2.Anaconda安装 3.配置PyTorch环境 4.PyCharm安装 5.CUDA和cudnn版本验证前言这篇博客是针对入门的深度…

人工智能 2023年7月20日
0082
Python数据分析入门笔记10——简单案例练习（学生信息分析）

系列文章目录 Python数据分析入门笔记1——学习前的准备 Python数据分析入门笔记2——pandas数据读取 Python数据分析入门笔记3——数据预处理之缺失值 Pyth…

人工智能 2023年7月15日
0068
Python爬取哔哩哔哩（bilibili）视频

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月17日
0043
利用Pyecharts绘制漏斗图的案例【含参数详解】

一、概念介绍漏斗图（Funnel），也称为倒三角图，借助echarts的解释如下： ![利用Pyecharts绘制漏斗图的案例【含参数详解】](https://johngo-pi…

人工智能 2023年7月15日
0060
使用OpenCV中的Structured-Light(结构光)模块做三维重建（流程 + 代码）

导读本文主要介绍如何使用OpenCV中的结构光(Structured-Light)模块完成三维重建。（公众号：OpenCV与AI深度学习）背景介绍从3.0版本开始OpenCV…

人工智能 2023年5月26日
0094
❤️爆肝十二万字《python从零到精通教程》，从零教你变大佬❤️（建议收藏）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月3日
0067

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31