经典神经网络论文超详细解读（一）——AlexNet学习笔记（翻译＋精读）

2023年10月9日上午11:39 • Python • 阅读 49

本文将为大家介绍经典神经网络的开山力作——AlexNet（ImageNet Classification with Deep Convolutional Neural Networks）。文章包含论文原文翻译＋精读＋个人学习总结。
研一萌新，第一次发文，不足之处多多包涵啦~

论文原文：http://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf

Abstract-摘要

翻译

我们训练了一个庞大的深层卷积神经网络，将ImageNet LSVRC-2010比赛中的120万张高分辨率图像分为1000个不同的类别。在测试数据上，我们取得了37.5％和17.0％的前1和前5的错误率，这比以前的先进水平要好得多。具有6000万个参数和650,000个神经元的神经网络由五个卷积层组成，其中一些随后是最大池化层，三个全连接层以及最后的1000个softmax输出。为了加快训练速度，我们使用非饱和神经元和能高效进行卷积运算的GPU实现。为了减少全连接层中的过拟合，我们采用了最近开发的称为”dropout”的正则化方法，该方法证明是非常有效的。我们还在ILSVRC-2012比赛中使用了这种模式的一个变种，取得了15.3％的前五名测试失误率，而第二名的成绩是26.2％。

精读

主要内容

（1）表示了用了 一个深度卷积神经网络来进行图片分类，取得了一个非常好的效果。

（2）深度卷积网络由 60million个参数， 65w个神经元，以及 五个卷积层和 三个全连接层， 一个1000路的softmax层组成。

（3）为了加快训练，用到了 非饱和激活函数ReLU和卷积运算的GPU加速实现。

（4）用了 Dropout这个随机失活方法来减少完全联通层的过拟。

相关问题一：过拟合和欠拟合

● 神经网络的过拟合和欠拟合介绍：
过拟合概念：过拟合现象一般都是因为学习的过于精确，就好比让机器学习人脸，取了100个人的脸训练，但是由于你学习的过精确，导致除了这个样本100人外其他的人脸神经网络都认为不是人脸，实际我们只需要学习人脸的基本特征而不是详细到人的皮肤细腻眼睛大小等过于细致的特征，这样可以保证机器还是能识别别的图片中的人脸的。
过拟合的表现：模型在训练集上误差很小，在测试集上误差很大。过拟合主要由两个方面决定：一是数据集，二是模型
欠拟合概念：欠拟合是指模型不能在训练集上获得足够低的误差。而过拟合是指训练误差和测试误差之间的差距太大。

●如何判断深度神经网络是否过拟合：
原则上RSquare值越高（越接近1），拟合性越好，自变量对因变量的解释越充分。但最重要的是看sig值，小于0.05，达到显著水平才有意义。可以看回你spss的结果，对应regression的sig值如果是小于0.05的，就可以了。

● 如何减少过拟合：
减少过拟合需要具体情况具体分析。一般由以下几种方法：
模型角度 :1. 限制模型的复杂度（根据训练集的分布，选择复杂度合适的模型）。 2. L2正则限制特征权重，防止某些特征对结果影响太大。 3. L1正则产生稀疏权重，限制模型的复杂度。 4. 参数共享。 5. bagging 。6. 提前终止。 7. dropout 。8. BN
数据角度：得到质量更高，数据量的数据。如数据增强。

相关问题二：Top-5错误率和Top-1错误率

Top-5错误率：一个图片经过网络，得到预测类别的概率，如果概率前五（top-5）中包含正确答案，即认为正确。top-5错误率就是Top-5 = （正确标记不在模型输出的前5个最佳标记中的样本数）/ 总样本数。

Top-1错误率：如果概率最大的是正确答案，才认为正确。Top-1 = （正确标记不是模型输出的最佳标记的样本数）/ 总样本数。

1. Introduction—前言

翻译

当前目标识别的方法基本都使用了机器学习的方法。为了提高这些方法的性能，我们可以收集更大的数据集，学习得到更加强大的模型，然后使用更好的方法防止过拟合。直到现在，相比于成千上百的图像，带标签的图像数据集相对较小（如NORB[16]，Caltech-101/256[8,9]，以及CIFAR-10/100[12]）。这种规模的数据集能使得简单的识别任务得到很好地解决，特别是如果他们进行带标签的转换来增广数据集。例如，当前MINIST数字识别任务最小的错误率（

Original: https://blog.csdn.net/weixin_43334693/article/details/128127653
Author: 路人贾’ω’
Title: 经典神经网络论文超详细解读（一）——AlexNet学习笔记（翻译＋精读）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/794741/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Matlab 与 Python 基于窗函数的滤波器设计对比之凯瑟窗

目录凯瑟窗的参数估计 * Matlab 中的 kaiserord Python 中的 kaiserord 区别基于窗函数的滤波器设计函数 * Matlab 中的 fir1 Py…

Python 2023年8月2日
0061
Spring Boot框架下实现Excel服务端导入导出

Spring Boot是由Pivotal团队提供的全新框架，其设计目的是用来简化新Spring应用的初始搭建以及开发过程。该框架使用了特定的方式来进行配置，从而使开发人员不再需要定…

Python 2023年10月15日
0037
智能流程机器人助你“聚划算”

摘要：RPA可以模拟人工进行操作，比如平时的登录，操作文件，抓取数据，调用api，与数据库进行交互等操作，从而实现一系列自动化的实现。相信大家都知道最近的数字员工非常火，比如我们…

Python 2023年10月29日
0035
Python绘制多种风玫瑰图

Original: https://www.cnblogs.com/123456feng/p/16135257.htmlAuthor: 蚂蚁ailingTitle: Python绘…

Python 2023年5月24日
0062
Django博文数据可视化、simple-ui优化、导入导出插件

Django博文数据可视化、simple-ui优化、导入导出插件今日任务 django博客admin优化导入导出插件 DRF的action装饰器博文数据可视化昨日未解决问题…

Python 2023年8月6日
0059
[设计模式] 装饰器模式

一、装饰器模式在软件开发过程中，由于需求的改动，可能面临对某个或某些对象新增一些新的功能的需求。根据开闭原则，新增功能我们也不能直接去修改原有的类，而如果使用继承的方式去实现，…

Python 2023年10月13日
0032
Python-matplotlib制图04-添加图名称和坐标轴名称

人的一生只有自己可以为自己设限，所以放开手脚尽管去做吧！ Python-matplotlib制图04-添加图名称和坐标轴名称前言 * 1. 概述 2. 版本 – 2….

Python 2023年8月31日
0043
Flask（5）- 动态路由

前言前面几篇文章讲的路由路径(rule)都是固定的，就是一个路径和一个视图函数绑定，当访问这条路径时会触发相应的处理函数这样无法处理复杂的情况，比如常见的一个课程分类下有很多个…

Python 2023年8月15日
0046
【flask入门系列】flask处理请求和处理响应

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

Python 2023年8月12日
0041
scrapy中间件—-下载器中间件

下载器中间件，实现请求的包装发少量的请求时：settings.py:USER_AGENT = ” XXX”DEFAULT_REQUEST_HEADERS …

Python 2023年10月6日
0026
dotnet core 也能协调分布式事务啦！

2022 年 5 月 24 日，我们发布了 DBPack v0.1.0 版本，该版本主要 release 了分布式事务功能。在我们的规划里，DBPack 是要支持所有微服务开发语言…

Python 2023年6月12日
0064
chatgpt+mirai实现QQ机器人

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

Python 2023年11月4日
0027
windows下django开发环境配置

本文的系统基于windows 10版本，介绍如何搭建一个django的开发环境, 并且可以对django进行源码调试。 1 安装Conda软件去Anaconda网站下载软件，然后…

Python 2023年8月4日
0040
scrapy中如何实现翻页抓取数据

翻页请求的思路回顾requests模块是如何实现翻页请求的：（1）找到下一页的URL地址，并找出翻页以后的url中的那个参数变动了（2）调用requests.get(url)…

Python 2023年10月2日
0050
【Carsim Simulink自动驾驶仿真】基于MPC的速度控制

本人也是刚开始探索，大家一起讨论一起进步！项目介绍：教程为北理工的无人驾驶车辆模型预测控制第2版，代码为开源代码。所用的仿真软件为Carsim2020.0和MatlabR2021a…

Python 2023年8月2日
0043
Python游戏开发实战：飞机大战（含代码）

《经典飞机大战》是腾讯交流软件微信5.0 版本在2013 年8 月推出的软件内置经典小游戏,一经推出就在当时火爆整个朋友圈,成为一个现象级的国民小游戏.那么今天我们就一起使用pyg…

Python 2023年9月17日
0039

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

经典神经网络论文超详细解读（一）——AlexNet学习笔记（翻译＋精读）

目录

Abstract-摘要

翻译

精读

主要内容

1. Introduction—前言

翻译

大家都在看