【深度学习21天学习挑战赛】备忘篇：我们的神经网模型到底长啥样?——model.summary()详解

2023年7月26日下午8:48 • 人工智能 • 阅读 87

活动地址：CSDN21天学习挑战赛

学完手写识别和服装分类，想稍微停下来消化一下新学的东西，也总结一下，今天就从keras的 model.summary()输出开始吧！

1、model.summary()是什么

构建深度学习模型，我们会通过 model.summary() 输出模型各层的参数状况，已我们刚刚学过的模型为例：

【深度学习21天学习挑战赛】备忘篇：我们的神经网模型到底长啥样?——model.summary()详解

这里可以看出， model.summary()打印出的内容，是和我们构建模型的层级关系是一样，服装分类模型为例：


model = models.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.Flatten(),
    layers.Dense(64, activation='relu'),
    layers.Dense(10)
])

2、model.summary()输出含义

仍以服装分类模型为例：

Model: "sequential_2"
_________________________________________________________________
Layer (type)                 Output Shape              Param
=================================================================
conv2d_6 (Conv2D)            (None, 26, 26, 32)        320

_________________________________________________________________
max_pooling2d_4 (MaxPooling2 (None, 13, 13, 32)        0

_________________________________________________________________
conv2d_7 (Conv2D)            (None, 11, 11, 64)        18496

_________________________________________________________________
max_pooling2d_5 (MaxPooling2 (None, 5, 5, 64)          0

_________________________________________________________________
conv2d_8 (Conv2D)            (None, 3, 3, 64)          36928

_________________________________________________________________
flatten_2 (Flatten)          (None, 576)               0

_________________________________________________________________
dense_4 (Dense)              (None, 64)                36928

_________________________________________________________________
dense_5 (Dense)              (None, 10)                650

=================================================================
Total params: 93,322
Trainable params: 93,322
Non-trainable params: 0
_________________________________________________________________

Param：该层输入 参数个数，那这个数字是怎么来的呢？
a、 卷积层参数个数的计算公式： （卷积核长度*卷积核宽度*通道数+1）*卷积核个数
例：
第一个卷积层： (3*3*1+1)*32 = 320
第二个卷积层： (3*3*32+1)*64 = 18496
第三个卷积层： (3*3*64+1)*64 = 36928 b、 全连接层参数个数的计算公式： （输入数据维度+1）* 神经元个数
例：
输出层之前的全连接层： （64+1）*10=650
这里之所以 要加1，因为每个神经元都有一个 偏置（Bias）。
Output Shape ：该层输出数据形状
Total params: 模型参数总数， 每层参数累加
Trainable params: 模型可训练参数
Non-trainable params:模型不可训练参数

3、理解模型流程形状

通过model.summary()，我们再看这个图，就清楚多了

Original: https://blog.csdn.net/m0_48300767/article/details/126125355
Author: 不负卿@
Title: 【深度学习21天学习挑战赛】备忘篇：我们的神经网模型到底长啥样?——model.summary()详解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/717381/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

2022年Python最新面试题汇总及答案

总结了一部分，会继续更新一、基础部分 1、什么是Python？为什么它会如此流行？ Python是一种解释的、高级的、通用的编程语言。 Python的设计理念是通过使用必要的空格…

人工智能 2023年7月5日
0070
pandas—pandas.DataFrame.query与pandas.DataFrame.reset_index

文章目录 * – + 1.pandas.DataFrame.query + * 官方案例 + 2.pandas.DataFrame.reset_index + * 官方…

人工智能 2023年7月8日
00107
2021-12-26 K-means

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月31日
0090
YOLOPose：除了目标检测，YOLO还能不花代价地估计人体姿态，对实时性能有要求必看!

导读： YOLO，是一种流行的目标检测框架。如果将YOLO引入姿态检测任务中，将取得什么结果呢？这篇文章实现了单阶段的2D人体姿态检测，与自上而下或自下而上的方法不同，该方法将人体…

人工智能 2023年6月17日
00112
【论文精读】Point-NeRF:Point-based Neural Radiance Fields

CVPR2022 oral的一篇文章，文章还行，代码比较乱，超参非常多且没有注释，代码也有bug原文链接：https://arxiv.org/abs/2201.08845代码链接：…

人工智能 2023年7月12日
0077
使用Mongoose populate实现多表关联存储与查询，内附完整代码

文章目录使用Mongoose populate实现多表关联与查询 * 一、数据模型创建 – 1. 创建一个PersonSchema 2. 创建一个StorySche…

人工智能 2023年7月30日
0062
R语言与临床模型预测——LASSO回归，单因素多因素cox，差异表达分析，Venn图，森林图，列线图，矫正曲线，ROC全套代码及解析——第八部分绘制森林图本专栏可免费答疑

1.下载数据匹配基因基因去重复 4.匹配临床数据 5.批量cox回归分析 6.差异表达基因筛选 7.取交集，选出预后相关的差异表达基因 8.森林图绘制 9.lasso回归进一步…

人工智能 2023年6月17日
0086
详解Transformer模型及相关的数学原理

声明：本文参考了许多相关资料，视频，博客，结合《Attention is All You Need》这篇文章的每一个细节，从一个初学者的角度出发详细解读Transformer模型，…

人工智能 2023年7月27日
0080
LightGCN

1.简介本文提出了一种轻型但是有效的GCN网络用于推荐系统，它舍弃了传统GCN的特征变换和非线性激活，并通过实验验证了这两种操作对协同过滤是无效的，同时提出了一种轻量级的GCN网…

人工智能 2023年7月12日
0093
二维码识别与定位-方法2-利用opencv扩展库aruco

二维码识别作为一种快捷准确的技术已经应用与生活中的购物支付、物体识别及工业AGV导航等领域，典型的二维码识别开源库有arcuo,alvar以及OpenCV中的二维码检测API如QR…

人工智能 2023年7月19日
0075
PyTorch Geometric (PyG) 安装教程

诸神缄默不语-个人CSDN博文目录 PyG官方下载主页：Installation — pytorch_geometric documentation 以下仅考虑Linux系统的情况…

人工智能 2023年7月22日
0061
最新IDEA配置Maven指南（适用于2022及以下版本）

2023年更新——IDEA2022配置Maven一次包过教程前言 Maven是当今Java开发中主流的依赖管理工具，那么小伙伴们在刚开始学习的时候呢，IDEA配置Maven肯定会…

人工智能 2023年7月31日
0055
mysql源码分析——InnoDB的磁盘结构之表空间格式

一、表空间的文件类型表空间的文件类型其实就文件的具体类型，在前面谈到过表空间的上层逻辑分层，最下面一层是通过Page来实现的，也就是说，文件的底层就是通过链表来控制这个页数据。而…

人工智能 2023年6月27日
00111
【PyTorch教程】04-详解torchvision0.13中的预训练模型加载的更新及报错的解决方法(2022年最新)

本期目录加载预训练模型(有重大更新) * 1. 新老版本写法对比 2. 新写法的好处 ; 加载预训练模型(有重大更新) 相信最近 (2022年7月) 安装或者更新了 PyTorc…

人工智能 2023年7月24日
0074
虚拟变量怎么做回归_横截面数据怎么做门槛回归？我教你呀

横截面数据怎么做门槛回归？我教你呀缘起门槛模型是在研究结构突变时，非常常用的模型。它最早由著名的计量经济学家Bruce E. Hansen提出，并随后在经济学界快速推广开来。 …

人工智能 2023年6月18日
0073
卷积神经网络实现CIFAR100数据集分类

文章目录 CIFAR100数据集介绍代码实现 * 读取数据集构建网络模型网络模型编译模型训练模型评估模型运行模型运行结果总结 CIFAR100数据集介绍 CIFAR…

人工智能 2023年7月1日
0068

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【深度学习21天学习挑战赛】备忘篇：我们的神经网模型到底长啥样?——model.summary()详解

大家都在看