是什么？它

2024年1月3日上午9:06 • 人工智能 • 阅读 41

优化器（Optimizer）和损失函数（Loss）介绍

优化器（Optimizer）

在深度学习中，优化器用于更新模型参数以最小化损失函数。PyTorch提供了多种优化器，其中常用的有随机梯度下降（SGD）、Adam、Adadelta、Adagrad、AdamW等。

随机梯度下降（SGD）优化器

算法原理

随机梯度下降（SGD）是最基本的优化算法之一。它通过计算每个样本的梯度来更新参数。具体算法原理如下：

初始化模型参数。
对每个样本：
计算模型的输出。
计算损失函数对输出的梯度。
根据梯度更新模型参数。
重复步骤2直到所有样本均处理完毕。

公式推导

SGD的参数更新公式如下所示：
$$
\theta_{t+1}=\theta_t-\alpha\frac{\partial L}{\partial \theta_t}
$$
其中，$\theta_{t}$表示第t个参数的值，$\alpha$为学习率，$L$为损失函数。

计算步骤

遍历训练数据集。
对于每个样本，计算模型的输出和损失函数。
对损失函数进行反向传播，计算梯度。
根据梯度和学习率更新参数。
重复步骤2-4直到所有样本均处理完毕。

Python代码示例

下面是一个简单的使用SGD优化器训练线性回归模型的示例代码，代码中包含了详细的注释解释代码细节。

import torch
import torch.nn as nn
import torch.optim as optim

# 创建模型
class LinearRegression(nn.Module):
 def __init__(self):
 super(LinearRegression, self).__init__()
 self.linear = nn.Linear(1, 1) # 输入和输出的维度都为1

 def forward(self, x):
 return self.linear(x)

# 定义训练数据
x_train = torch.tensor([[1.0], [2.0], [3.0], [4.0]])
y_train = torch.tensor([[2.0], [4.0], [6.0], [8.0]])

# 创建模型实例
model = LinearRegression()

# 定义损失函数和优化器
criterion = nn.MSELoss()
optimizer = optim.SGD(model.parameters(), lr=0.01)

# 进行训练
for epoch in range(100):
 # 前向传播
 y_pred = model(x_train)

 # 计算损失
 loss = criterion(y_pred, y_train)

 # 反向传播和参数更新
 optimizer.zero_grad()
 loss.backward()
 optimizer.step()

 # 打印训练结果
 print('Epoch [{}/{}], Loss: {:.4f}'.format(epoch+1, 100, loss.item()))

# 输出模型参数
print('Learned parameters:')
for name, param in model.named_parameters():
 print(name, param.data)

代码细节解释

nn.Linear(1, 1) 创建了一个线性层，输入维度为1，输出维度为1，即一个线性回归模型。
nn.MSELoss() 创建了一个均方误差（Mean Squared Error）损失函数。
optim.SGD(model.parameters(), lr=0.01) 创建了一个SGD优化器，学习率为0.01。
optimizer.zero_grad() 清除梯度。
loss.backward() 反向传播，计算梯度。
optimizer.step() 根据梯度和学习率更新模型参数。
loss.item()获取当前损失的数值。

总结

本文介绍了PyTorch提供的优化器和损失函数。其中，SGD优化器是最基本的优化算法之一，可以通过计算每个样本的梯度来更新参数。通过使用PyTorch提供的优化器和损失函数，可以方便地进行模型训练，并根据实际需求选择合适的优化器和损失函数。以上示例代码展示了使用SGD优化器训练线性回归模型的完整流程，并解释了代码中的细节。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/823483/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

复现NC图表：相关性分析气泡图（热图）—同时展示正负调控关系和显著性

还是继续复现NC图表，这幅图展示的是相关性分析结果，可以叫做气泡热图，我们之前说过热图也可以这么做（热图5：ggplot2画热图及个性化修饰）。相关性分析这里就不展示了，我们主要…

人工智能 2023年7月17日
00118
深度学习模型DNN部署到安卓（移动）设备上——pytorch-＞onnx-＞ncnn-＞Android

最近，由于实验要求，我需要把在服务器上训练好的pytorch模型预训练.pth文件部署到安卓端测试推理时间，但是一直不知道应该怎么转变模型和部署，查了很多资料，遇到了很多问题，在同…

人工智能 2023年7月22日
0071
三十四.智能驾驶之多传感器融合技术: F-PointNet融合方法

在继PointNet,PointNet++之后,其作者Qi有创新的提出了F-PointNet(Frustum PointNet)多传感器融合算法. 即利用在二维图像非常成熟的物体检…

人工智能 2023年6月2日
0069
[论文][半监督语义分割]Semi-Supervised Semantic Segmentation with Cross Pseudo Supervision

CVPR2021 原文半监督语义分割方法的总结：主要思想： Consistency regularization ：希望不同扰动之下网络的输出结果一致，扰动的加入的位置：（1）…

人工智能 2023年6月6日
00101
使用TF-IDF算法进行数据处理（附代码）

· 什么是TF-IDF？ TF-IDF(term frequency–inverse document frequency)是一种加权技术，用于文本数据的挖掘与清洗。 · 使用情境…

人工智能 2023年6月11日
0089
Python数据分析-Pandas（Series与DataFrame）

Pandas介绍： pandas是一个强大的Python数据分析的工具包，是基于NumPy构建的。 Pandas的主要功能：1)具备对其功能的数据结构DataFrame、Serie…

人工智能 2023年6月2日
0077
AISHELL Speaker Verification Challenge 2019

赛事简介智能语音市场处于大幅增长前期，逐渐成熟的语音技术使得智能语音的商业化落地成为可能。随着智能音箱以及智能语音交互的设备不断落地，声纹识别的技术成为人体物理特征验证的一项重要…

人工智能 2023年5月25日
0076
对抗自编码器（adversarial autoencoder）

目录前言实验 1 导入必要库函数并设置随机数等配置 2 加载并可视化MNIST数据 3 模型定义 4 模型训练 5 随机正态分布数据生成MNIST合成数据参考资料前言自编…

人工智能 2023年6月25日
0071
PaddlePaddle的静态图与动态图

今天想着把自己的网络结构用VisualDL看一下，然后发现了 save函数，然后函数的输入变量是 fluid.default_main_program()，就想着改变一下程序，写…

人工智能 2023年5月26日
0077
基于 Java 机器学习自学笔记（第56-57天：kMeans 聚类）

注意：本篇为50天后的Java自学笔记扩充，内容不再是基础数据结构内容而是机器学习中的各种经典算法。这部分博客更侧重与笔记以方便自己的理解，自我知识的输出明显减少，若有错误欢迎指正…

人工智能 2023年5月31日
0076
opencv圆形网格提取函数findCirclesGrid源码笔记

opencv–findCircle源码笔记函数处理流程源码分析 * findCirclesGrid源码 findCirclesGrid2 函数源码 – …

人工智能 2023年6月18日
0069
疾病负担研究（GBD）-如何优雅的展示发病率数据

文章首发于微信公众号：”小明学习室” 本文是GBD的第三篇推文，今天我们就以已经发表的高分GBD文章来看下如何展示GBD数据，本文案例文章是发表在JOUR…

人工智能 2023年6月17日
0063
基于 SVM 的手写数字识别

本课题要研究或解决的问题和拟采用的研究手段（途径）：本课题研究应用机器学习构建能够识别手写数字的预测模型，并搭建基于SVM的手写数字预测系统，正确识别手写图像数据集中的数字。使用…

人工智能 2023年7月27日
0060
机器学习笔记 – 基于JavaScript的顶级机器学习框架

1、概述虽然 Python 和 C++编程语言已成为机器学习框架的流行选择，但 JavaScript 也并不落后。环顾四周，可能会发现 JavaScript 框架也已在 AI 中…

人工智能 2023年5月24日
0079
人工智能如何改变了我们的日常生活？

在过去，使我们祖先的生活更方便的现象被称为”魔法”和”超自然力量”。现在？这就是所谓的技术。”魔法咒语”现在…

人工智能 2023年5月25日
0054
基于MATLAB的K-means聚类算法

实验数据说明Iris也称鸢尾花卉数据集，是一类多重变量分析的数据集。通过花萼长度，花萼宽度，花瓣长度，花瓣宽度4个属性预测鸢尾花卉属于（Setosa(山鸢尾)，Versicolou…

人工智能 2023年6月30日
0086

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31