李宏毅2021《机器学习/深度学习》——学习笔记（3）

2023年6月15日下午10:52 • 人工智能 • 阅读 88

文章目录

DNN Training Procedure
深度学习简介
*
神经网络是一个函数
神经网络中的矩阵运算
手写体识别例子
Backpropagation（反向传播）
参考资料

DNN Training Procedure

上图所示是 Pytorch 中训练 DNN 的概述，首先是 Define Neural Network、Loss Function、Optimizer，这三步用到了 torch.nn 和 torch.optim 模块。加载数据主要用到 torch.utils.data.Dataset 和 torch.utils.data.DataLoader 模块。反复进行训练和验证，最后得到模型进行测试。

; 深度学习简介

神经网络是一个函数

如果参数已知，那么一个神经网络就是一个 function

如果只是给出了一个网络结构，并没有确定参数，那么就是定义了一个函数的集合。

Layer1 的所有输出都与 Layer2 的所有输入连接，所以叫全连接。
Layer1 的输出给 Layer2，Layer2 的输出给 Layer3，所以叫前馈网络。

; 神经网络中的矩阵运算

神经网络的计算可以用矩阵操作来表示，如下图是一个计算例子。

如上图所示，是深度神经网络用矩阵计算的过程，σ \sigma σ 是激活函数。

一个深度神经网络可以表示成一个函数，它的函数表达式如上图所示。写成矩阵运算的好处是可以用 GPU 加速，普通的 GPU 只是做矩阵运算比较快（相比 CPU）。

手写体识别例子

上图是一个简单的例子，输入是一个手写体数字的图像，对应一个长度为 256 的一维矩阵。输出是一个长度为 10 的一维矩阵，每个位置对应一个数字的概率，认为概率最大的那个数字就是最终的预测结果。

如上图所示，输入是一个长度为 256 的一维矩阵，输出是一个长度为 10 的一维矩阵，把输入转化为输出的函数就是神经网络。

; Backpropagation（反向传播）

backpropagation（反向传播），就是 gradient descent，它能够高效地计算百万维的一维矩阵的梯度。

看了两遍以后，我发现 backpropagation 之所以高效，是利用了动态规划的思想。之所以说是利用了动态规划的思想，而不是动态规划，是因为这个问题是求梯度，是一个确定的值，而动态规划是求最值的，但是思路是一样的。

如上图所示，求 ∂ z ∂ w \frac{\partial z}{\partial w}∂w ∂z 是 Forward pass，求 ∂ C ∂ z \frac{\partial C}{\partial z}∂z ∂C 是 Backward pass。

求 ∂ C ∂ z \frac{\partial C}{\partial z}∂z ∂C 的过程可以画成以下递归树，递归边界是输出层。如果直接计算时间复杂度很高，因为存在大量重复计算，也就是重叠子问题。比如计算到 a 1 a_1 a 1 需要 b 1 , b 2 , b 3 b_1,b_2,b_3 b 1 ,b 2 ,b 3 三个子问题的结果，计算 a 2 , a 3 a_2,a_3 a 2 ,a 3 时也需要用到b 1 , b 2 , b 3 b_1,b_2,b_3 b 1 ,b 2 ,b 3 三个子问题的结果。这时就可以考虑利用动态规划的思想，增加备忘录记忆化搜索或从后往前推。减少了大量重复计算，就是 backpropagation 高效的原因。

上图是对 backpropagation 的总结，求 ∂ z ∂ w \frac{\partial z}{\partial w}∂w ∂z 是 Forward pass，求 ∂ C ∂ z \frac{\partial C}{\partial z}∂z ∂C 是 Backward pass。

参考资料

(强推)李宏毅2021/2022春机器学习课程

Original: https://blog.csdn.net/m0_46283220/article/details/127179427
Author: dotJunz
Title: 李宏毅2021《机器学习/深度学习》——学习笔记（3）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/618042/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

tensorflow实现手写数字识别

从torch入门的我，很排斥tensorflow, 不过最近不得不学了，不然我刚找的工作怕是要换人了。 ok,那让我们愉快的学习吧。我们先来一个AI届的Hello World !…

人工智能 2023年5月23日
00116
机器学习笔记一

吴恩达机器学习视频 1.监督学习与无监督学习 [TencentCloudSDKException] code:FailedOperation.ServiceIsolate mess…

人工智能 2023年6月3日
0071
【机器学习】Few-shot learning（少样本学习）

文章目录少样本学习的诞生元学习少样本学习少样本学习中的相关概念 * 概念1：Support set VS training set 概念2：Supervised learn…

人工智能 2023年6月24日
0087
【每天学习一点新知识】HTTP各个响应状态都是啥意思

提供信息，表示收到了临时请求，会做进一步的处理 100 Continue // 服务器收到了请求的初始部分，并请客户端继续发送。101 Switching Protocols //…

人工智能 2023年6月30日
0088
pd库dataframe基本操作

一、查看数据（查看对象的方法对于Series来说同样适用） 1.查看DataFrame前xx行或后xx行a=DataFrame(data);a.head(6)表示显示前6行数据，若…

人工智能 2023年6月2日
0068
会思考的机器你造嘛——AI技术

目录前言一、人工智能的划分二、人工智能关键技术三、鸢尾花数据集实践人工智能（附代码）总结系列文章目录前言近年来，人工智能（Artificial In…

人工智能 2023年6月4日
00113
【大数据可视化分析】股吧帖子情感倾向及用户参与行为

目录 1. 报告摘要 2. 报告正文 * 2.1 2008-2020年股吧总体分析 – （1） 2008-2020年股吧综合参数（折线图）（2） 2008-2020年…

人工智能 2023年7月16日
0096
极限学习机

注：下有视频讲解，可供参考单层前馈神经网络（SLFN）以其良好的学习能力在许多领域得到了广泛的应用，然而传统的学习算法，如BP等固有的一些缺点，成为制约其发展的主要瓶颈，前馈神经…

人工智能 2023年7月28日
0071
[机器学习、Spark]Spark MLlib分类

👨‍🎓👨‍🎓博主：发量不足 📑📑本期更新内容：Spark MLlib分类 🔥🔥 📑📑下篇文章预告：Hadoop全分布部署🔥🔥🔥 简介：耐心，自信来源于你强大的思想和知识基础！！目…

人工智能 2023年7月3日
00122
【源码开发分享】计算机毕业设计之Python+Spark+Scrapy新闻推荐系统新闻大数据新闻情感分析新闻文本分类新闻数据分析新闻爬虫可视化大数据毕业设计

开发技术 Hadoop、Spark、SparkSQL、Python、Scrapy爬虫框架、MySQL、协同过滤算法(双算法，基于用户、基于物品全实现)、阿里云短信、百度AI人工智能…

人工智能 2023年7月15日
0072
Windows安装Anaconda，创建pytorch环境，pycharm配置环境

目录 1、简介 2、安装Anaconda 3、创建一个独立的环境 4、安装依赖的库 5、安装pytorch 6、pycharm中使用conda环境 7、到这里安装就结束了，希望对您…

人工智能 2023年7月22日
0071
01背包和完全背包

01背包最大约数和题目链接点击这里题目描述选取和不超过 S S S 的若干个不同的正整数，使得所有数的约数（不含它本身）之和最大。输入格式输入一个正整数 S S S。 …

人工智能 2023年7月29日
0080
爬虫_pandas

123.py import pandas as pd df=pd.read_csv(‘./123.csv’) 打印某一列;判断某一列是否有空值 print(df[‘NUM_BEDR…

人工智能 2023年7月6日
0045
Masked Autoencoders Are Scalable Vision Learners (MAE)

目录 Introduction Approach Experiments * ImageNet Experiments – Main Properties Compar…

人工智能 2023年5月28日
0082
树莓派——opencv打开树莓派摄像头调试记录

目录一、安装包：（注意换要源，不要用系统默认源）问题1：磁盘空间不足——把根目录扩展到整个SD卡解决：把根目录扩展到整个SD卡二、下载 1、先创建opencv目录： 2、下…

人工智能 2023年6月19日
0077
automake搭建项目工程

工具介绍需要用到autoscan,aclocal,autoconf,automake这几个工具。在ubuntu中，我们通过apt-get install命令，系统会自动为我们安装…

人工智能 2023年6月28日
0075

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

李宏毅2021《机器学习/深度学习》——学习笔记（3）

文章目录

神经网络是一个函数

; 神经网络中的矩阵运算

手写体识别例子

大家都在看