经典神经网络论文超详细解读(一)——AlexNet学习笔记(翻译+精读)

经典神经网络论文超详细解读(一)——AlexNet学习笔记(翻译+精读)

本文将为大家介绍经典神经网络的开山力作——AlexNet(ImageNet Classification with Deep Convolutional Neural Networks)。文章包含论文原文翻译+精读+个人学习总结。
研一萌新,第一次发文,不足之处多多包涵啦~

论文原文:http://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf

目录

目录

Abstract-摘要

1.Introduce—介绍

2.The Dataset-数据集

3.The Architecture—网络结构

3.1ReLU Nonlinearity—非线性激活函数ReLU

3.2Training on Multiple GPUs—用多个GPU训练

3.3Local Response Normalization—局部归一化

3.4Overlapping Pooling—重叠池化

3.5Overall Architecture—整体网络架构

4.Reducing Overfitting—减少过拟合

4.1Data Augmentation—数据增强

4.2Dropout—随机失活法

5.Details of learning—学习的细节

5.1SGD随机梯度下降法

5.2初始化参数

5.3学习速率

6.Results—实验结果

6.1Qualitative Evaluations—定性评估

7.Discussion—讨论

论文十问

Abstract-摘要

翻译

我们训练了一个庞大的深层卷积神经网络,将ImageNet LSVRC-2010比赛中的120万张高分辨率图像分为1000个不同的类别。在测试数据上,我们取得了37.5%和17.0%的前1和前5的错误率,这比以前的先进水平要好得多。具有6000万个参数和650,000个神经元的神经网络由五个卷积层组成,其中一些随后是最大池化层,三个全连接层以及最后的1000个softmax输出。为了加快训练速度,我们使用非饱和神经元和能高效进行卷积运算的GPU实现。为了减少全连接层中的过拟合,我们采用了最近开发的称为”dropout”的正则化方法,该方法证明是非常有效的。我们还在ILSVRC-2012比赛中使用了这种模式的一个变种,取得了15.3%的前五名测试失误率,而第二名的成绩是26.2%。

精读

主要内容

(1)表示了用了 一个深度卷积神经网络来进行图片分类,取得了一个非常好的效果。

(2)深度卷积网络由 60million个参数65w个神经元,以及 五个卷积层三个全连接层一个1000路的softmax层组成。

(3)为了加快训练,用到了 非饱和激活函数ReLU和卷积运算的GPU加速实现。

(4)用了 Dropout这个随机失活方法来减少完全联通层的过拟。

相关问题一:过拟合和欠拟合

● 神经网络的过拟合和欠拟合介绍:
过拟合概念:过拟合现象一般都是因为学习的过于精确,就好比让机器学习人脸,取了100个人的脸训练,但是由于你学习的过精确,导致除了这个样本100人外其他的人脸神经网络都认为不是人脸,实际我们只需要学习人脸的基本特征而不是详细到人的皮肤细腻眼睛大小等过于细致的特征,这样可以保证机器还是能识别别的图片中的人脸的。
过拟合的表现:模型在训练集上误差很小,在测试集上误差很大。 过拟合主要由两个方面决定:一是数据集,二是模型
欠拟合概念:欠拟合是指模型不能在训练集上获得足够低的误差。而过拟合是指训练误差和测试误差之间的差距太大。

●如何判断深度神经网络是否过拟合:
原则上RSquare值越高(越接近1),拟合性越好,自变量对因变量的解释越充分。但最重要的是看sig值,小于0.05,达到显著水平才有意义。 可以看回你spss的结果,对应regression的sig值如果是小于0.05的,就可以了。

● 如何减少过拟合:
减少过拟合需要具体情况具体分析。 一般由以下几种方法:
模型角度 :1. 限制模型的复杂度(根据训练集的分布,选择复杂度合适的模型)。 2. L2正则限制特征权重,防止某些特征对结果影响太大。 3. L1正则产生稀疏权重,限制模型的复杂度。 4. 参数共享。 5. bagging 。6. 提前终止。 7. dropout 。8. BN
数据角度:得到质量更高,数据量的数据。如数据增强。

相关问题二:Top-5错误率和Top-1错误率

Top-5错误率:一个图片经过网络,得到预测类别的概率,如果概率前五(top-5)中包含正确答案,即认为正确。top-5错误率就是Top-5 = (正确标记 不在 模型输出的前5个最佳标记中的样本数)/ 总样本数。

Top-1错误率:如果概率最大的是正确答案,才认为正确。Top-1 = (正确标记 不是 模型输出的最佳标记的样本数)/ 总样本数。

1. Introduction—前言

翻译

当前目标识别的方法基本都使用了机器学习的方法。为了提高这些方法的性能,我们可以收集更大的数据集,学习得到更加强大的模型,然后使用更好的方法防止过拟合。直到现在,相比于成千上百的图像,带标签的图像数据集相对较小(如NORB[16],Caltech-101/256[8,9],以及CIFAR-10/100[12])。这种规模的数据集能使得简单的识别任务得到很好地解决,特别是如果他们进行带标签的转换来增广数据集。例如,当前MINIST数字识别任务最小的错误率(

Original: https://blog.csdn.net/weixin_43334693/article/details/128127653
Author: 路人贾’ω’
Title: 经典神经网络论文超详细解读(一)——AlexNet学习笔记(翻译+精读)

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/794741/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • Matlab 与 Python 基于窗函数的滤波器设计对比 之 凯瑟窗

    目录 凯瑟窗的参数估计 * Matlab 中的 kaiserord Python 中的 kaiserord 区别 基于窗函数的滤波器设计函数 * Matlab 中的 fir1 Py…

    Python 2023年8月2日
    061
  • Spring Boot框架下实现Excel服务端导入导出

    Spring Boot是由Pivotal团队提供的全新框架,其设计目的是用来简化新Spring应用的初始搭建以及开发过程。该框架使用了特定的方式来进行配置,从而使开发人员不再需要定…

    Python 2023年10月15日
    037
  • 智能流程机器人助你“聚划算”

    摘要:RPA可以模拟人工进行操作,比如平时的登录,操作文件,抓取数据,调用api,与数据库进行交互等操作,从而实现一系列自动化的实现。 相信大家都知道最近的数字员工非常火,比如我们…

    Python 2023年10月29日
    035
  • Python绘制多种风玫瑰图

    Original: https://www.cnblogs.com/123456feng/p/16135257.htmlAuthor: 蚂蚁ailingTitle: Python绘…

    Python 2023年5月24日
    062
  • Django博文数据可视化、simple-ui优化、导入导出插件

    Django博文数据可视化、simple-ui优化、导入导出插件 今日任务 django博客admin优化 导入导出插件 DRF的action装饰器 博文数据可视化 昨日未解决问题…

    Python 2023年8月6日
    059
  • [设计模式] 装饰器模式

    一、装饰器模式 在软件开发过程中,由于需求的改动,可能面临对某个或某些对象新增一些新的功能的需求。根据开闭原则,新增功能我们也不能直接去修改 原有的类,而如果使用继承的方式去实现,…

    Python 2023年10月13日
    032
  • Python-matplotlib制图04-添加图名称和坐标轴名称

    人的一生只有自己可以为自己设限,所以放开手脚尽管去做吧! Python-matplotlib制图04-添加图名称和坐标轴名称 前言 * 1. 概述 2. 版本 – 2….

    Python 2023年8月31日
    043
  • Flask(5)- 动态路由

    前言 前面几篇文章讲的路由路径(rule)都是固定的,就是一个路径和一个视图函数绑定,当访问这条路径时会触发相应的处理函数 这样无法处理复杂的情况,比如常见的一个课程分类下有很多个…

    Python 2023年8月15日
    046
  • 【flask入门系列】flask处理请求和处理响应

    抵扣说明: 1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。 Original: https://blo…

    Python 2023年8月12日
    041
  • scrapy中间件—-下载器中间件

    下载器中间件,实现请求的包装 发少量的请求时:settings.py:USER_AGENT = ” XXX”DEFAULT_REQUEST_HEADERS …

    Python 2023年10月6日
    026
  • dotnet core 也能协调分布式事务啦!

    2022 年 5 月 24 日,我们发布了 DBPack v0.1.0 版本,该版本主要 release 了分布式事务功能。在我们的规划里,DBPack 是要支持所有微服务开发语言…

    Python 2023年6月12日
    064
  • chatgpt+mirai实现QQ机器人

    啊哦~你想找的内容离你而去了哦 内容不存在,可能为如下原因导致: ① 内容还在审核中 ② 内容以前存在,但是由于不符合新 的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。 可…

    Python 2023年11月4日
    027
  • windows下django开发环境配置

    本文的系统基于windows 10版本,介绍如何搭建一个django的开发环境, 并且可以对django进行源码调试。 1 安装Conda软件 去Anaconda网站下载软件,然后…

    Python 2023年8月4日
    040
  • scrapy中如何实现翻页抓取数据

    翻页请求的思路 回顾requests模块是如何实现翻页请求的: (1)找到下一页的URL地址,并找出翻页以后的url中的那个参数变动了 (2)调用requests.get(url)…

    Python 2023年10月2日
    050
  • 【Carsim Simulink自动驾驶仿真】基于MPC的速度控制

    本人也是刚开始探索,大家一起讨论一起进步!项目介绍:教程为北理工的无人驾驶车辆模型预测控制第2版,代码为开源代码。所用的仿真软件为Carsim2020.0和MatlabR2021a…

    Python 2023年8月2日
    043
  • Python游戏开发实战:飞机大战(含代码)

    《经典飞机大战》是腾讯交流软件微信5.0 版本在2013 年8 月推出的软件内置经典小游戏,一经推出就在当时火爆整个朋友圈,成为一个现象级的国民小游戏.那么今天我们就一起使用pyg…

    Python 2023年9月17日
    039
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球