[动手学深度学习(PyTorch)]——权重衰退（Weight decay）

2023年7月23日上午5:27 • 人工智能 • 阅读 84

权重衰退是一种解决过拟合的方式

正则项：在训练参数化机器学习模型时， 权重衰减（weight decay）是最广泛使用的正则化的技术之一，它通常也被称为L2 正则化。这项技术通过函数与零的距离来衡量函数的复杂度
使用L2范数的一个原因是它对权重向量的大分量施加了巨大的惩罚。这使得我们的学习算法偏向于在大量特征上均匀分布权重的模型。在实践中，这可能使它们对单个变量中的观测误差更为稳定。

惩罚项的加入，是得最优值向着原点方向靠近。。原来的最优点会受到罚值的影响。

参数更新法则：

因为λ的引入，使得每次更新权重参数时，先让原来的权重值先乘以一个小于1的正数（1-n-λ），再减去梯度的负方向

*正则项权重是控制模型复杂度的超参数

代码实现：

生成人工数据集：

n_train, n_test, num_inputs, batch_size = 20, 100, 200, 5
true_w, true_b = torch.ones((num_inputs, 1)) * 0.01, 0.05
train_data = d2l.synthetic_data(true_w, true_b, n_train)
train_iter = d2l.load_array(train_data, batch_size)
test_data = d2l.synthetic_data(true_w, true_b, n_test)
test_iter = d2l.load_array(test_data, batch_size, is_train=False)

初始化参数：

def init_params():
    w = torch.normal(0, 1, size=(num_inputs, 1), requires_grad=True)
    b = torch.zeros(1, requires_grad=True)
    return [w, b]

L2范数惩罚项：

#定义 L2范数
def l2_penalty(w):
    return torch.sum(w.pow(2)) / 2

#定义 L1范数惩罚
def l1_penalty(w):
    return torch.sum(torch.sum(w))

定义训练代码：

代码将模型拟合训练数据集，并在测试数据集上进行评估。从之前以来，线性网络和平方损失没有变化，所以我们通过 d2l.linreg和 d2l.squared_loss导入它们。唯一的变化是损失现在包括了惩罚项。

def train(lambd):
    w, b = init_params()
    net, loss = lambda X: d2l.linreg(X, w, b), d2l.squared_loss
    num_epochs, lr = 100, 0.003
    animator = d2l.Animator(xlabel='epochs', ylabel='loss', yscale='log',
                            xlim=[5, num_epochs], legend=['train', 'test'])
    for epoch in range(num_epochs):
        for X, y in train_iter:
            # 增加了L2范数惩罚项，
            # 广播机制使l2_penalty(w)成为一个长度为batch_size的向量
            l = loss(net(X), y) + lambd * l2_penalty(w)
            l.sum().backward()
            d2l.sgd([w, b], lr, batch_size)
        if (epoch + 1) % 5 == 0:
            animator.add(epoch + 1, (d2l.evaluate_loss(net, train_iter, loss),
                                     d2l.evaluate_loss(net, test_iter, loss)))
    print('w的L2范数是：', torch.norm(w).item())

忽略正则项直接训练：

现在用 lambd=0禁用权重衰减后运行这个代码。注意，这里训练误差有了减少，但测试误差没有减少，这意味着出现了严重的过拟合。

train(lambd=0)

使用权重衰减:

train(lambd=3)

Original: https://blog.csdn.net/weixin_42067873/article/details/123517518
Author: Star星屹程序设计
Title: [动手学深度学习(PyTorch)]——权重衰退（Weight decay）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/710145/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

时间序列—相关性和滞后性分析_python

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月4日
0079
利用opencv实现图像马赛克处理的三种方法

前言：本文就图像的马赛克处理，基于opencv提出了三种解决方案，并详细地介绍了三种方法的原理、示例、问题及问题的解决方案。方法一原理介绍：利用resize()将图片先缩小，再…

人工智能 2023年7月18日
0044
【动手学习pytorch笔记】33.Attention实现

Attention实现 import math import torch from torch import nn from d2l import torch as d2l 带掩码…

人工智能 2023年5月27日
0077
【python基础】reverse和reversed函数及使用

一、reverse reverse()是python中列表的一个内置方法(在字典、字符串和元组中没有这个内置方法)，用于列表中数据的反转例子： lista = [1, 2, 3,…

人工智能 2023年7月4日
0047
基于Unity的移动端点云显示及路径规划

基于Unity的移动端点云显示及路径规划 1. 点云显示 * 1.1 点云格式 1.2 手势操作 2. 路径规划 * 2.1 栅格地图系统 2.2 可通行区域提取 2.3 路径规划…

人工智能 2023年6月2日
00171
MySQL密码不要用0开头！！！

我是真的服了……花了大半天连云服务器上的数据库…… 开始时用SQLyog，显示 authentication plugin ‘cac…

人工智能 2023年7月30日
0072
《计算机视觉基础知识蓝皮书》第5篇目标检测基础

本专栏将系统性地讲解计算机视觉基础知识、包含第 1篇机器学习基础、第2篇深度学习基础、第3篇卷积神经网络、第4篇经典热门网络结构、第5篇目标检测基础、第6篇网络搭建及训练…

人工智能 2023年6月17日
0075
最全自动驾驶数据集分享系列一｜目标检测数据集（1/3）

目前关于自动驾驶数据集你想知道的，应该都在这里了，这是「整数智能」自动驾驶数据集八大系列分享之系列一：目录「八大系列概览」 01 「Waymo数据集」 02「PandaSet」…

人工智能 2023年6月17日
0072
Qlib教程——基于源码（二）本地数据保存与加载

文章目录 1. Data Preparation * 1.1 Qlib 数据 1.2 CSV数据 2. Data API * 2.1 数据检索示例 2.2 关于 qlib.init…

人工智能 2023年6月19日
0075
【深度学习】：《PyTorch入门到项目实战》第六天：多层感知机（含代码）

【深度学习】：《PyTorch入门到项目实战》第六天：多层感知机（含代码） ✨本文收录于【深度学习】：《PyTorch入门到项目实战》专栏，此专栏主要记录如何使用 PyTorch实…

人工智能 2023年7月14日
0043
祝福视频生成器（一图一文AI生成）

新年到，祝福来你还在用简单的话祝福你吗？ [En] Are you still using simple words to wish you well? 你还在为拜年视频发愁吗？…

人工智能 2023年5月23日
0086
激光slam课程学习笔记－－第11课：3D激光SLAM介绍

前言：这系列笔记是学习曾书格老师的激光slam课程所得，这里分享只是个人理解，有误之处，望大佬们赐教。这节课主要介绍一些3d slam数学知识，以及典型代表loam。 1. ３d激…

人工智能 2023年6月10日
0087
图文详解牛顿迭代法，牛顿不止力学三定律

目录 1 引例 2 牛顿迭代算法求根 3 牛顿迭代优化 4 代码实战：Logistic回归 1 引例给定如图所示的某个函数，如何计算函数零点x 0 x_0 x 0 ？在数学上…

人工智能 2023年6月1日
0092
改进YOLOv7系列：28.YOLOv7 结合 Swin Transformer V2结构，Swin Transformer V2：通向视觉大模型之路

🔥🔥🔥YOLO系列 + Swin Transformer V2结构结合应用为 CSDN芒果汁&#x6C…

人工智能 2023年6月13日
0076
spss中有关t检验的详细介绍（包含操作过程和结果分析）

SPSS学习记录day1 写在前面：CSDN新人小白，最近在学校学习SPSS，但是学习的知识总是学了就忘，所以打算现在开始尝试记录一下自己的学习过程，希望能坚持下去吧emmm&#8…

人工智能 2023年7月16日
0099
Windows Server 2008 R2 负载平衡入门篇

一、简单介绍负载均衡负载均衡也称负载共享，它是指负载均衡是指通过对系统负载情况进行动态调整，把负荷分摊到多个操作节点上执行，以减少系统中因各个节点负载不均衡所造成的影响，从而提高…

人工智能 2023年6月4日
0073

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

[动手学深度学习(PyTorch)]——权重衰退（Weight decay）

参数更新法则：

代码实现：

生成人工数据集：

初始化参数：

L2范数惩罚项：

定义训练代码：

忽略正则项直接训练：

使用权重衰减:

大家都在看