动手实现深度学习（5）：计算图的实现

2023年6月4日上午4:28 • 人工智能 • 阅读 75

在第二篇中介绍了用数值微分的形式计算神经网络的梯度，数值微分的形式比较简单也容易实现，但是计算上比较耗时。本章会介绍一种能够较为高效的计算出梯度的方法：基于图的误差反向传播。

根据 deep learning from scratch 这本书的介绍，在误差反向传播方法的实现上有两种方法：一种是基于数学式的（第二篇就是利用的这种方法），一种是基于计算图的。这两种方法的本质是一样的，有所不同的是表述方法。计算图的方法可以参考feifei li负责的斯坦福大学公开课CS231n 或者theano的tutorial/Futher readings/graph Structures.

之前我们的误差传播是基于数学式的，可以看出对代码编写者来说很麻烦；

这次我们换成基于计算图的；

上一张我们实现了梯度下降算法，并且能训练出一个简单的神经网络了；本章会基于图计算的方式去实现神经网络。

P.S．：利用计算图的求导数的步骤类似于链式法则，这里先挖个坑，稍后求sigmoid的微分的时候会举例。

Ps: 在前面的几章中，我对代码的重视程度并不大，这是因为前几章的涉及的代码都是作为理论基础。在后面的章节中会注意代码的组织结构。

在实现方面会尽量使用python的类。

为此，创建一个所有类的基类：BaseLayer

forward() 是推理过程中需要调用的函数；其内部的实现是基于公式本身。

backward() 是反向传播过程中需要调用的函数；其内部的实现是基于导数实现的。

以下是BaseLayer的具体实现方式。

为了能够更好的说明如何使用BaseLayer,我们给出乘法和加法的实现。

首先，乘法层的公式是：

反向传播的导数是：

其中，和都是对x,y的微分；

l我们将乘法层命名为 MulLayer, 这个层里面的forward() 是将两个矩阵相乘，x与y均为numpy.Ndarray类型；并且初始化self.x 与self.y
backward() 是传入参数dout, dout是反向传播的梯度差，也是公式中的和，因根据我们之前了解的梯度公式，可以知道反向传播的主要任务是更新权重，因此只需要将成员变量x,y的数值更新即可

首先我们可以看看加法的公式：

其反向传播就是在对加法求导数，分别对x和y求导数后，其公式为：

根据权重更新的公式，可知 x = dout 1 , y = dout1

本节给出了基于计算图的实现方法；并结合反向传播机制，对乘法和加法的backward进行了实现。

Original: https://www.cnblogs.com/greentomlee/p/16686711.html
Author: 修雨轩陈
Title: 动手实现深度学习（5）：计算图的实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/566254/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【Pandas学习】读、存excel数据

一、读数据二、将df存为excel 1、pandas.DataFrame.to_csv() 函数语法 2、利用 import os 获取保存路径 3、产生新的数据，添加至上述cs…

人工智能 2023年7月6日
0073
Python 之嵌套列表

嵌套（nest），顾名思义，我中有你，你在我中之意。嵌套是 Python 语言中常见的现象，有函数嵌套，循环嵌套，可迭代对象嵌套等，具体到标题，即指列表中嵌套有列表，形如：例 1…

人工智能 2023年7月4日
0092
Softmax回归识别验证码（手写数字）

我们首先来学习softmax regression和one-hot encoding。这次本次实验需要学习和机器学习相关的两个重要概念。我们之前学过逻辑回归。由于Logistic …

人工智能 2023年6月17日
0087
[ 注意力机制 ] 经典网络模型1——SENet 详解与复现

🤵 Author ：Horizon Max ✨ 编程技巧篇：各种操作小结 🎇 机器视觉篇：会变魔术 OpenCV 💥 深度学习篇：简单入门 PyTorch 🏆 神经网络篇：经典网络…

人工智能 2023年6月22日
0090
CLion配置opencv环境

工具准备 1.clion官网链接：clion2.cmake官网链接：cmake下载红框标记的压缩包，免安装。3.mingw官网链接：mingw安装红框标记下载免安装版本，解压可用。…

人工智能 2023年7月20日
0082
OpenCV4.4.0 error: (-5:Bad argument) CAP_IMAGES: can’t find starting number (in the name of file)

大家好，我是青空。最近一直在做相机照片传输相关的事情，在传输的过程中使用了好几种方法。 tcp socket 交互 udp 传输 http server mjpeg stream…

人工智能 2023年6月25日
00128
算法效果评估：均方根误差（RMSE）/ 标准误差

文章目录 1. 评估算法的效果 2. 方差（Variance） * 2.1 总体方差 – 2.1.1 在numpy中计算总体方差 2.1.2 在pandas中计算总体方…

人工智能 2023年6月15日
0073
Spring 项目全局日志最佳实践

需求记录前端的每一个请求的信息，大概就是下面这个样子，以后出现问题的时候，便于定位问题请求方式：GET请求地址：http://localhost:8001/memo/taskL…

人工智能 2023年6月28日
0058
pytorch 33 使用mmdeploy将mmdetection模型转换为onnx，并基于mmdeploy-sdk实现c++部署

可以将格式，让在不同的平台和框架之间进行和迁移。同时， c语言进行，可以将格式的到C/ 环境中。要，首先需要安装 cv-full和。安装完成后，以下命令将： …

人工智能 2023年7月22日
0047
【oracle】解析ORACLE21C新增的4个峰度和偏度函数的计算过程并使用excel及sql进行公式计算

一、前言在oracle21c版本中，添加了4个有关峰度和偏度的聚合函数，分别是 SKEWNESS_POP-总体偏度 SKEWNESS_SAMP-样本偏度 KURTOSIS_POP…

人工智能 2023年7月17日
0051
pandas已知数值怎么找位置_如何在pandas中找到模式

使用pandas和python，我想找到一个模式，其中流的流入量比平常大得多，并且在5天内跟随流量不小于流中流入量的5％。见下面的数据框我希望能够在第4列中标记此运动(让我们称为…

人工智能 2023年7月8日
0052
Gprmax 3.0 使用GPU加速方法

Gprmax 3.0 使用GPU加速方法 Gprmax进行电磁波数值模拟时计算时间往往很长，尤其是当网格单元剖分很密集时。Gprmax 3.0 提供了GPU加速的功能，可以选择使用…

人工智能 2023年5月26日
00199
An End-to-End Model for Question Answering over Knowledge Base with Cross-Attention论文笔记

文章目录 * – 摘要 – Introduce – Overview – 方法 – + 候选生成 + Neural Cr…

人工智能 2023年6月10日
0069
【Python八股文系列】：100个Python的面试/笔试高频考点

Python的100个面试/笔试高频考点本文主要整理了关于Python的面试/笔试的一些考点，可用于查漏补缺。涉及到的一些Python进阶知识，可以查看专栏学习：《Python…

人工智能 2023年7月3日
0047
PyTorch学习笔记（三）：PyTorch主要组成模块

往期学习资料推荐：本系列目录：后续继续更新！！！！ 1 深度学习步骤（1）数据预处理：通过专门的数据加载，通过批训练提高模型表现，每次训练读取固定数量的样本输入到模型中进行训…

人工智能 2023年7月13日
0050
【爬虫系列】Python 爬虫入门（2）

接上篇，继续梳理 Python 爬虫入门的知识点。这里将重点说明，如何识别网站反爬虫机制及应对策略，使用 Selenium 模拟浏览器操作等内容，干货满满，一起学习和成长吧。 1、…

人工智能 2023年6月27日
0077

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

动手实现深度学习（5）：计算图的实现

大家都在看