深度学习面试题-3

2023年7月13日下午10:49 • 人工智能 • 阅读 48

梯度爆炸问题是指在训练深度神经网络的时候，梯度变得过大而损失函数变为无穷。在RNN中，下面哪种方法可以较好地处理梯度爆炸问题？

A 用改良的网络结构比如LSTM和GRUs
B 梯度裁剪
C Dropout
D 所有方法都不行

正确答案是：B，您的选择是：A
解析：为了处理梯度爆炸问题，最好让权重的梯度更新限制在一个合适的范围。

LSTM在反向传播的时候，会有梯度累加，所以会减轻 梯度消失的问题，但是由于有加法，所以如果 存在梯度爆炸的可能，反而会加剧爆炸， 一般用强制截断来避免梯度爆炸

有许多种梯度下降算法，其中两种最出名的方法是l-BFGS和SGD。l-BFGS根据二阶梯度下降而SGD是根据一阶梯度下降的。在下述哪些场景中，会更加偏向于使用l-BFGS而不是SGD？场景1：数据很稀疏场景2：神经网络的参数数量较少

A 场景1
B 场景2
C 两种情况都是
D 都不会选择l-BFGS

正确答案是：C，您的选择是：D
解析：在这两种情况下，l-BFGS的效果都是最好的

下面哪种方法没办法直接应用于自然语言处理的任务？

A 去语法模型
B 循环神经网络
C 卷积神经网络
D 主成分分析(PCA)

正确答案是：D，您的选择是：A
解析：主成分分析(PCA)主要用于特征降维，后续还需要接其他算法进行自然语言处理。

PCA只是一种数据维度调整方法

对于非连续目标在深度神经网络的优化过程中，下面哪种梯度下降方法是最好的？

A SGD
B AdaGrad
C l-BFGS
D 拉格朗日松弛Subgradient method

正确答案是：D，您的选择是：A
解析：优化算法无法作用于非连续目标。

下面哪个叙述是对的？ Dropout对一个神经元随机屏蔽输入权重 Dropconnect对一个神经元随机屏蔽输入和输出权重

A 1是对的，2是错的
B 都是对的
C 1是错的，2是对的
D 都是错的

正确答案是：D，您的选择是：B
解析：在dropout的过程中，神经元被失活， 在dropconnect的过程中，失活的是神经元之间的连接。所以dropout会使输入和输出权重都变为无效，而在dropconnect中，只有其中一种会被失活。

区别在于失活的是神经元还是连接，神经元失活时，相当于训练时暂时将该神经元排除在外，输入和输出权重无效。

当训练一个神经网络来作图像识别任务时，通常会绘制一张训练集误差和交叉训练集误差图来进行调试。在图中，最好在哪个时间停止训练？

A. D
B. A
C. C
D. B

正确答案是：C，您的选择是：C
解析：你最好在模型最完善之前「提前终止」，所以C点是正确的。

; 7. 反向传播算法一开始计算什么内容的梯度，之后将其反向传播？

A 预测结果与样本标签之间的误差
B 各个输入样本的平方差之和
C 各个网络权重的平方差之和
D 都不对

正确答案是：A，您的选择是：A
解析：BP算法是一个迭代算法，它的基本思想如下：将训练集数据输入到神经网络的输入层，经过隐藏层，最后达到输出层并输出结果，这就是前向传播过程。由于神经网络的输出结果与实际结果有误差，则计算估计值与实际值之间的误差，并将该误差从输出层向隐藏层反向传播，直至传播到输入层；在反向传播的过程中，根据误差调整各种参数的值（相连神经元的权重），使得总损失函数减小。迭代上述三个步骤（即对数据进行反复训练），直到满足停止准则。

在构建一个神经网络时，batch size通常会选择2的次方，比如256和512。这是为什么呢？

A 当内存使用最优时这可以方便神经网络并行化
B 当用偶数是梯度下降优化效果最好
C 这些原因都不对
D 当不用偶数时，损失值会很奇怪

正确答案是：A，您的选择是：A
解析：计算机中 CPU 和 GPU 的 memory 都是 2进制方式存储，将 batch size 设置成2的幂次就顺理成章了。

Xavier初始化是最为常用的神经网络权重初始化方法， V a r ( W ) = 2 n i n + n o u t \mathrm{Var}(W)=\frac{2}{n_{in}+n_{out}}V a r (W )=n i n +n o u t 2 是初始化的公式。Xavier初始化是用来帮助信号能够在神经网络中传递得更深，下面哪些叙述是对的？
如果权重一开始很小，信号到达最后也会很小
如果权重一开始很大，信号到达最后也会很大
Xavier初始化是均匀分布中采样得到的
Xavier初始化可以帮助减少梯度弥散问题

A. 234
B. 1234
C. 124
D. 134

正确答案是：B，您的选择是：D
解析：所有项目都是正确的

一个循环神经网络可以被展开成为一个完全连接的、具有无限长度的普通神经网络，这种说法是

A 正确的
B 错误的

正确答案是：A，您的选择是：B
解析：循环神经元可以被认为是一个具有无限时间长度的神经元序列。

Dropout是一种在深度学习环境中应用的正规化手段。它是这样运作的：在一次循环中我们先随机选择神经层中的一些单元并将其临时隐藏，然后再进行该次循环中神经网络的训练和优化过程。在下一次循环中，我们又将隐藏另外一些神经元，如此直至训练结束。根据以上描述，Dropout技术在下列哪种神经层中将无法发挥

A 仿射层
B 卷积层
C RNN层
D 均不对

正确答案是：C，您的选择是：B
解析： Dropout对于循环层效果并不理想，你可能需要稍微修改一下dropout技术来得到良好的结果。

; 12. 假设你的任务是使用一首曲子的前半部分来预测乐谱的未来几个小节，比如输入的内容如下的是包含音符的一张乐谱图片：而你需要输出描绘了接下来若干个音符的图片：关于这类问题，哪种架构的神经网络最好？

A 神经图灵机
B 附加有循环单元的卷积神经网络
C 端到端完全连接的神经网络
D 都不可用

正确答案是：B，您的选择是：D
解析：RNN的序列和CNN的空间，是有区分的序列问题，强调的是先后顺序，这也引申出上下文的概念，一个翻译问题，这个词的含义可能和前后的单词形成的这个组合有联系（Skip-gram）,也可能是它之前的所有单词都有联系（Attention），并且，借助RNN的state这样的记忆单元，使得一个序列位置的输出在数学上和之前的所有序列的输入都是有关系的。当然原始的RNN由于梯度的乘性问题，前面的序列的影响近乎为0，这个后面又用LSTM来修正为加性问题。RNN的数学基础可以认为是马尔科夫链，认为后续的值是有前者和一些参数的概率决定的。 CNN的卷积核，强调的是空间中的窗口，这个窗口和序列问题相同之处在于同样考虑前后，但RNN没有也不会考虑到空间上下问题。类似股票的价格，也不会在同一个x上出现多个y（价格），整个空间只有一条线，这样的数据密度本身也是不适合用CNN的

当在内存网络中获得某个内存空间时，通常选择读取矢量形式数据而不是标量，这里需要的哪种类型的寻址来完成？

A 基于内容的寻址
B 基于位置的寻址
C 都不行
D 都可以

正确答案是：A，您的选择是：A

一般我们建议将卷积生成对抗网络（convolutional generative adversarial nets）中生成部分的池化层替换成什么？

A 跨距卷积层(Strided convolutional layer)
B ReLU层
C 局部跨距卷积层(Fractional strided convolutional layer)
D 仿射层(Affine layer)

正确答案是：C，您的选择是：A

以下哪些是通用逼近器？

A Kernel SVM
B Neural Networks
C Boosted Decision Trees
D 以上所有

正确答案是：D，您的选择是：D

在CNN中使用1×1卷积时，下列哪一项是正确的？

A 它可以帮助降低维数
B 可以用于特征池
C 由于小的内核大小，它会减少过拟合
D 所有上述

正确答案是：D，您的选择是：D
解析：1×1卷积在CNN中被称为bottleneck structure。

Original: https://blog.csdn.net/weixin_44878336/article/details/124530836
Author: Le0v1n
Title: 深度学习面试题-3

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/690774/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

data mining 聚类思维导图

一、划分聚类1.K-means经典算法，指定k为最后分裂保留的簇的个数。①n个样本，随机选择k个样本作为初始簇的中心。②计算每个样本距离k个簇中心的距离，把它加入到距离自己最近的簇…

人工智能 2023年6月2日
0074
[2021ICLR]Improve Object Detection with Feature-based Knowledge Distillation 论文笔记

动机认为目标检测知识蒸馏效果不好的问题出在两个地方。 1.前背景像素比例不平衡问题。提出了基于注意力引导的提取方法，利用== 注意机制(而非gt)找到前景物体的关键像素点==，使…

人工智能 2023年7月10日
0062
JSP+Servlet+MySql超市管理系统项目源码

一、开发背景软件名称：超市管理系统(servlet+jsp) 使用对象：学习或了解过 java 基础课程，开始接触 javaWeb 的学生和软件爱好者源码链接:超市管理系统:…

人工智能 2023年7月29日
0054
知识图谱neo4j入门之魔兽世界人物可视化

前言系统环境：windows10这篇文章主要记录自己学习neo4j环境部署及初步入门使用。主要参考的链接如下：魔兽世界简易知识图谱 neosemantics环境配置：tps:…

人工智能 2023年6月1日
0077
L1损失（MAE）、L2损失（MSE）

目录均绝对误差(L1 Loss) 均方误差MSE (L2 Loss) MSE和MAE的选择总结均绝对误差(L1 Loss) 均绝对误差（Mean Absolute Error…

人工智能 2023年6月25日
00170
DL 模型组件之残差模块

文章目录 * – 常规残差模块 – Bottleneck（瓶颈残差模块） – 参考阅读 ResNet 的论文Deep Residual Lea…

人工智能 2023年7月14日
0073
查全率与查准率的计算方法

查全率和查准率的概念和计算方法查全率概念：查全率（R）是测量检索系统检出相关文献能力的一种尺度，指系统检出的相关文献数（ w）与系统信息库中存储相关文献数（ x）之比，用公式…

人工智能 2023年7月3日
00251
Python—基于diabetes的最小二乘回归、岭回归和lasso

本次diabete数据来源于R中lars包不同于python库sklearn.datasets中的diabetes数据集语言为python 序号x.agex.sex&#8230…

人工智能 2023年6月18日
0061
AI&BlockChain：“知名博主独家讲授”人工智能创新应用竞赛【精选实战作品】之《基于计算机视觉、自然语言处理和区块链技术的乘客智能报警系统》案例的界面简介、功能介绍分享之总篇

AI&BlockChain：”知名博主独家讲授”人工智能创新应用竞赛【精选实战作品】之《基于计算机视觉、自然语言处理和区块链技术的乘客智能报警系统》…

人工智能 2023年6月23日
0068
【YOLO3D】:端到端3D点云输入的实时检测

YOLO3D:端到端3D点云输入的实时检测前言算法分析 * 模型输入网络结构回归损失 – 3D box 回归偏航角回归边界框损失函数数据集处理 &#821…

人工智能 2023年5月28日
0066
【HSI】高光谱的数据集分类深度学习实战及代码理解

【HSI】高光谱的数据集分类深度学习实战及代码理解文章目录【HSI】高光谱的数据集分类深度学习实战及代码理解 * 一、配置文件编写二、高光谱图像的处理 – 2.1…

人工智能 2023年7月3日
0063
车道线检测传统方法&深度学习方法概览+两篇论文领读LaneATT+LaneNet

车道线检测是自动驾驶中的一个基础模块，车道保持，自适应巡航，自动变道；对于全自动驾驶汽车后续的车道偏离或轨迹规划决策也很重要。目前车道线检测主要有两种方案：传统方法与深度学习…

人工智能 2023年6月16日
00153
如何在PyTorch中创建神经网络模型

介绍在PyTorch中创建神经网络模型是一个重要的任务，它允许我们使用神经网络来解决图像分类、目标检测、自然语言处理等各种机器学习问题。本节将详细介绍如何在PyTorch中创建一…

人工智能 2024年1月3日
0042
海康工业相机SDK+OpenCV实例(2)：RawDataFormatConvert详解

海康工业相机SDK+OpenCV实例(2)： RawDataFormatConvert详解文章目录海康工业相机SDK+OpenCV实例(2)： RawDataFormatCon…

人工智能 2023年5月28日
00106
基于FPGA的图像处理4–线性滤波-均值滤波

Github:https://github.com/zgw598243565/AverageFliter 在图像预处理中，最基础也最重要的处理方法是图像滤波与增强。图像滤波可以很好…

人工智能 2023年6月22日
0084
deeplab-v3+原理详解

入门小菜鸟，希望像做笔记记录自己学的东西，也希望能帮助到同样入门的人，更希望大佬们帮忙纠错啦~侵权立删。目录一、deeplab-v3+提出原因与简单介绍二、deeplab-v…

人工智能 2023年5月26日
0070

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

深度学习面试题-3

大家都在看