神经网络整体架构及细节（详细简单）

2023年6月16日下午10:10 • 人工智能 • 阅读 88

前言：

神经网络的来源已经有大部分博主有详细的讲过了，但我发现整体框架中的细节很多博主都是大体讲了讲，所以作者今天想来好好详细的讲讲框架中的细节。

一：神经网络构架大体介绍

如下图所示：

这张图很生动的展现了我们神经网络的基本框架，我们会发现只要理解了这张图，就掌握了神经网络的大部分内容。

我们在图中不难看出 整体架构包括层次结构，神经元，全连接，非线性四个部分，所以我们就依据它们来展开讲解。

二：详细介绍

（1）层次结构

在神经网络中神经网络的我们一般分成三个部分：

1：输入层（input layer）

2：隐藏层（hidden layer）

3：输出层（output layer）

ps：要注意的是，中间的隐藏层可以由多层。

（2）神经元

还是把上图给搬下来如下图：

我们可以看到图中每个层次中都有许多圆圆的球似的东西，这个东西就是在神经网络中的神经元， 每一种层次中的神经元中的含量不太一样。

在输入层中的每一个神经元里面是你输入原始数据（一般称为X）的不同特征，比如x为一张图片，这张图片的像素是32323，其中的每一个像素都是它的特征吧，所以有3072个特征对应的输入层神经元个数就是3072个， 这些特征以矩阵的形式进行输入的。我们举个例子比如我们的输入矩阵为’13072′ （第一维的数字表示一个batch（batch指的是每次训练输入多少个数据）中有多少个输入；第二维数字中的就是每一个输入有多少特征。）*

在隐藏层中的每一层神经元表示对x进行一次更新的数据，而每层有几个神经元（比如图中hidden1层中有四个神经元）表示将你的输入数据的特征扩展到几个（比如图中就是四个），就比如你的输入三个特征分别为年龄，体重，身高，而图中hidden1层中第一个神经元中经过变换可以变成这样’年龄0.1+体重0.4+身高0.5’，而第二个神经元可以表示成’年龄0.2+体重0.5+身高0.3’，每一层中的神经元都可以有不同的表示形式。

在输出层中的的神经元个数 主要取决于你想要让神经网络干什么，比如你想让它做一个10分类问题，输出层的矩阵就可以是’1*10’的矩阵（第一维表示的与输入层表示数字相同，后面10就是10种分类）。

（3）全连接

我们依旧照搬原来的图：

我们看到的每一层和下一层中间都有灰色的线， 这些线就被称为全连接（因为你看上一层中每个神经元都连接着下一层中的所有神经元），而这些线我们也可以用一个矩阵表示， 这个矩阵我们通常称为’权重矩阵’，用大写的W来表示（是后续我们需要更新的参数）。权重矩阵W的维数主要靠的是上一层进来数据的输入数据维数和下一层需要输入的维数，可以简单理解为上有一层有几个神经元和下一层有几个神经元，例如图中input layer中有3个神经元，而hidden1 layer中有4个神经元，中的W的维度就为’3*4’，以此类推。（主要是因为我们全连接层的形式是矩阵运算形式，需要满足矩阵乘法的运算法则）

（4）：非线性

在每层运算做完后，我们得数据不能直接输入到下一层计算中，需要添加一些非线性函数（大部分也可以叫做激活函数），常用的激活函数有relu，sigmoid，tanh（读者可以去查查看），就比如说在input layer 在hidden1 layer计算完后不能将数据直接传如hidden2 layer在这之间需要添加一个激活函数。

三：参考视频

1：其中的p5与p6：

不愧是计算机博士唐宇迪居然半天教会了我大学4年没学会的深度学习经典算法解析入门到实战课程，看不懂你打我！！！_哔哩哔哩_bilibili

Original: https://blog.csdn.net/weixin_57643648/article/details/123836992
Author: 小林学编程
Title: 神经网络整体架构及细节（详细简单）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/626931/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pandas计数函数：value_counts( )和counts( )的使用

介绍一下如何在python里使用value_counts( )和counts( )进行计数。一、counts( )函数 1、count()在字符串里的使用函数体及主要参数： c…

人工智能 2023年7月14日
0063
（超详细)python环境安装

耀风也是python初学者，文章可能会有不严谨的地方，如有发现希望帮我指正 1.python环境的安装（1）为什么要安装python环境？ python是一个解释性语言，所谓解释…

人工智能 2023年7月30日
0064
【论文笔记】A Survey of Visual Transformers（完结）

声明：本人是来自 γ 星球的外星人为了学习地球的深度学习知识的，好回去建设自己的家乡每周不定期更新自己的论文精读笔记，中心思想是两个字 — 易懂没啥事的兄弟姐妹们，…

人工智能 2023年5月28日
0080
遗传算法原理案例及MATLAB代码

文章目录遗传算法的原理 * 交叉变异计算适应度选择操作遗传算法的案例 * 初始化种群计算自适应度选择操作交叉操作变异操作 MATLAB 遗传算法的原理遗传算法的…

人工智能 2023年5月31日
0094
论文阅读：HMER via Attention Aggregation based Bi-directional Mutual Learning

一、简介本文提出了一个新的具有注意聚集和双向相互学习(ABM)的HMER框架，如图所示。模型包括三个模块：特征提取、注意聚合和双向促进学习。（1）在特征提取模块（FEM）中，使…

人工智能 2023年7月14日
0068
[python零基础学习] cv2.imread()方法介绍

def imread(filename: Any, flags: Any = None) -> None filename：图片的绝对路径或者相对路径。 ps:路径中不能出现…

人工智能 2023年6月18日
0063
不调包绘制音频语谱图并批量生成语谱图

什么是语谱图语谱图(Spectrogam)是表示语音频谱随时间变化的图形,其实是一个二维的图像，但却能表示三个维度的信息，横坐标表示时间，纵坐标表示频率，颜色的深浅来映射能量的大…

人工智能 2023年5月25日
0080
【长期更新】日常学习中遇到的知识点

以下是学习中顺便记录的自认为比较重要的知识点: * – 1. 深究交叉熵损失(Cross-entropy)和平方损失(MSE)的区别 – 2. 强化学习中的…

人工智能 2023年6月1日
0087
【动手学习pytorch笔记】2.softmax回归

图像分类数据集 %matplotlib inline import torch import torchvision from torch.utils import data fr…

人工智能 2023年6月17日
0069
图像恢复(加噪与去噪)

人工智能导论实验导航实验一：斑马问题 https://blog.csdn.net/weixin_46291251/article/details/122246347 实验二：图像…

人工智能 2023年6月18日
0087
Remote Sensing Image Super-resolution and Object Detection: Benchmark and State of the Art

标题遥感图像超分和目标检测的benchmark和SOTA。摘要在过去的二十年里，人们一直在研究遥感（RS）图像中的目标检测方法。在大多数情况下，用于遥感图像中小目标检测的数据…

人工智能 2023年7月23日
0087
【爬虫实战项目】Python爬取Top100电影榜单数据并保存csv文件（附源码）

前言今天给大家介绍的是Python爬取Top100电影榜单数据保存csv文件，在这里给需要的小伙伴们代码，并且给出一点小心得。首先是爬取之前应该尽可能伪装成浏览器而不被识别出来…

人工智能 2023年7月29日
0086
（CVPR 2020）3DSSD: Point-based 3D Single Stage Object Detector

目前，基于体素的3D单级检测器已经有很多种，而基于点的单级检测器仍处于探索阶段。在本文中，我们首先提出了一种轻量级且有效的基于点的3D单级目标检测器，名为3DSSD，在精度和效率之…

人工智能 2023年5月28日
0080
图像分割计算机视觉和模式识别

图像分割：提示：计算机视觉五大技术：图像分类、图像检测、目标跟踪、语义分割、实例分割</p> <p>计算机视觉—图像分割：</p> <…

人工智能 2023年6月20日
00105
深度学习(四)：ubuntu系统tensorflow框架搭建与测试

目录一、tensorflow安装与测试 1.1 tensorflow 与cuda版本对应版本 1.2 测试gpu 一、tensorflow安装与测试 1.1 tensorflow…

人工智能 2023年5月26日
0077
论文解读：学习蛋白质的空间结构可以提高蛋白质相互作用的预测

文章目录论文概况 1. 研究背景 2. 研究数据 * 2.1 种内数据集 2.2 种间数据集 2.3 多类别数据集 3. 研究方法 * 3.1数据预处理 3.2局部特征提取 * …

人工智能 2023年7月17日
0090

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

神经网络整体架构及细节（详细简单）

（1）层次结构

（2）神经元

（3）全连接

（4）：非线性

大家都在看