深度学习算法工程师面试知识点总结（一）

2023年5月25日上午2:16 • 人工智能 • 阅读 77

深度学习算法工程师职位所需的技术堆栈摘要如下：

[En]

The technical stack required for the position of deep learning algorithm engineer is summarized as follows:

这个总结不是很完整，这个方向需要的知识体系很大，比如高等数学、线性代数、概率论的基础，这对很多学生来说是一个很大的挑战。我们还需要为不同的任务学习一些知识，比如目标检测和目标分割。

[En]

This summary is not very complete, and the knowledge system needed in this direction is very large, such as the foundation of higher mathematics, linear algebra and probability theory, which is a great challenge for many students. We also need to learn some knowledge for different tasks, such as target detection and target segmentation.

本文分享的内容来自采访中常见知识点的总结，读者可以通过以下方式获取整篇文档：

[En]

The content shared in this article comes from a summary of frequently asked knowledge points in the interview, and readers can obtain the entire document in the following ways:

  &#x6DFB;&#x52A0;&#x5FAE;&#x4FE1;study428&#xFF0C;&#x8FDB;&#x5165;&#x5FAE;&#x4FE1;&#x7FA4;&#xFF0C;&#x6709;&#x95EE;&#x9898;&#x53EF;&#x4EE5;&#x53CA;&#x65F6;&#x4EA4;&#x6D41;&#x6C9F;&#x901A;&#xFF1B;
  &#x5173;&#x6CE8;&#x516C;&#x4F17;&#x53F7;&#x201D;&#x8BA1;&#x7B97;&#x673A;&#x89C6;&#x89C9;&#x4E0E;OpenCV&#x201C;&#xFF0C;&#x786C;&#x8D27;&#x77E5;&#x8BC6;&#x5E38;&#x5206;&#x4EAB;&#xFF1B;
  &#x52A0;&#x5165;QQ&#x7FA4;&#x201D;187042448&#x201C;&#x83B7;&#x53D6;&#x6DF1;&#x5EA6;&#x5B66;&#x4E60;&#x76F8;&#x5173;&#x7684;&#x8D44;&#x6599;&#x3002;

本文分享的内容来源于《深度学习计算机视觉实战》一书，该书由刘东研究员和肖铃合作完成，由电子工业出版社出版。

该书从算法入门到模型培训，再到模型部署一站式，书中详细的案例说明，都经过了操作验证。这本书由四部分组成：

[En]

The book from algorithm introduction to model training, to model deployment one-stop, detailed case notes in the book, have been verified by operation. The book consists of four parts:

第一部分（1~2章）深度学习和计算机视觉的基础和算法讲解；
第二部分（3~6章）传统图像处理算法的案例讲解；
第三部分（7-11章）计算机视觉方向的案例讲解；
第四部分（12~13章）Tensorflow Lite讲解（源码分析、模型优化、模型转换等）以及使用Tensorflow Lite在PC端和移动端的部署案例讲解。

本书可以为计算机视觉入门的读者和想要对模型进行工程部署的读者提供参考与帮助。京东链接：https://u.jd.com/rwk3HPT

笔记内容如下（篇幅所限，这是第一部分）：

1、dropout设置：隐含节点 dropout 率等于 0.5 的时候效果最好，原因是 0.5 的时候 dropout 随机生成的网络结构最多。

使用dropout很难检查梯度下降的性能，此时可以关闭dropout，将keep-prob的值设为1，以确保代价函数单调递减，然后打开dropout，确保dropout不会带来问题。

dropout属于深度学习中的算法开发的技巧（tricks），对模型训练性能提升具有帮助，还有一些其他的技巧，在书中有介绍，在案例中有应用。

2、one-hot编码的作用：

编码的功能是相互排斥的，一次只有一个激活。结果，数据变得稀疏。

[En]

The encoded features are mutually exclusive, with only one activation at a time. As a result, the data becomes sparse.

这样做的好处主要有：

（1）解决了分类器不好处理属性数据的问题；

（2）在一定程度上也起到了扩充特征的作用。

如下是在验证码识别的案例中使用到的独热码（即one-hot）

3、将权重初始化为很小的数字是一个普遍的打破网络对称性的解决办法，都初始化为0或者相同的数字会形成对称网络。

偏差一般都初始化为 0。

4、在CNN中，BN应作用在非线性映射前（激活函数）。在神经网络训练时遇到收敛速度很慢，或梯度爆炸等无法训练的状况时可以尝试BN来解决。另外，在一般使用情况下也可以加入BN来加快训练速度，提高模型精度。

BN比较适用的场景是：每个mini-batch比较大，数据分布比较接近。在进行训练之前，要做好充分的shuffle，否则效果会差很多。

5、数据增强方法：

彩色数据增强：图像亮度、饱和度、对比度；比例变换；使用随机图像差分方法对图像进行裁剪和缩放；比例和纵横比增强变换；水平/垂直翻转；平移变换；旋转/仿射变换；高斯噪声、模糊处理。

[En]

Color data enhancement: image brightness, saturation, contrast; scale transformation; using random image difference method to crop and scale the image; scale and aspect ratio enhancement transformation; horizontal / vertical flip; translation transformation; rotation / affine transformation; Gaussian noise, blur processing.

6、经典网络

CNN局部感知、权重共享

LeNet-5：提出卷积神经网络模型

AlexNet：使用ReLU作为非线性，使用dropout技术，使用GPU训练

ZFNet：最大的贡献在于通过使用可视化技术揭示了神经网络各层到底在干什么，起到了什么作用。可视化的实现应该是转置卷积（也称反卷积），反池化是记录了最大池化的位置，其他位置设为0。

VGG：整个网络都使用了同样大小的卷积核尺寸（3 * 3）和最大池化尺寸（2 * 2）；使用两个3 * 3的卷积层串联相当于1个5 * 5的卷积层，3个3 * 3的卷积层串联的效果则相当于1个7 * 7的卷积层。

NIN：提出了抽象能力更高的Mlpconv层，利用多层mlp的微型网络，对每个局部感受野的神经元进行更加复杂的运算，而以前的卷积层，局部感受野的运算仅仅只是一个单层的神经网络；提出了Global Average Pooling（全局平均池化）层，传统的CNN最后一层都是全连接层，参数个数非常多，容易引起过拟合，全连接层参数占整个CNN模型的一大部分，NIN提出采用全局平均池化替代全连接层。

GoogLeNet：引入Inception 结构

采用不同大小的卷积核（如1、3、5）意味着不同大小的感受野，最后拼接意味着不同尺度特征的融合；卷积核大小采用1、3和5，主要是为了方便对齐，可以设置padding使输出featuremap大小相同，以便拼接；使用5×5的卷积核仍然会带来巨大的计算量，为此，文章借鉴NIN2，在5×5卷积之前采用1×1卷积核来进行降维。

Inception结构的改进就是一些技巧的使用，例如使用两个3×3代替一个5×5，使用1xn接nx1代替nxn，引入stem模块获得更深的网络，引入残差模块设计出了Inception-ResNet网络。

ResNet：解决网络退化问题

7、输入层主要包含对原始图像进行预处理，包括归一化、去均值等等。

卷积运算层主要使用滤波器，通过设置步长和深度等参数，从输入中提取不同层次的特征。

[En]

The convolution operation layer mainly uses filters to extract different levels of features from the input by setting parameters such as step size and depth.

激活函数层的主要目的是对卷积层的输出进行非线性映射。

[En]

The main purpose of the activation function layer is to make a non-linear mapping of the output of the convolution layer.

池层主要用来压缩参数的个数，可以减少过拟合的情况。

[En]

The pool layer is mainly used to compress the number of parameters, which can reduce the over-fitting situation.

全连接层中的所有神经元之间有一个加权连接，这经常用于网络的最后一层来计算类别分数。

[En]

There is a weighted connection between all neurons in the full connection layer, which is often used in the last layer of the network to calculate category scores.

8、扩张卷积，又称为带孔（atrous）卷积或者空洞（dilated）卷积。在使用扩张卷积时，会引入一个称作扩张率（dilation rate）的参数。该参数定义了卷积核内参数间的行（列）间隔数。一个3×3的卷积核，扩张率为2，它的感受野与5×5卷积核相同，而仅使用9个参数。这样做的好处是，在参数量不变的情况下，可以获得更大的感受野。扩张卷积在实时分割领域应用非常广泛。

在深度网络中，为了增加感受野，减少运算量，通常会进行下采样池，这可以增加感受野，但会降低空间分辨率。为了在不损失分辨率的情况下仍然扩大接收范围，可以使用孔卷积。在检测方面，一方面感知场较大，可以对较大的目标进行检测和分割，另一方面可以对目标进行高分辨率的精确定位。此外，还可以通过调整扩展速率来获得多尺度信息。

[En]

In order to increase the receptive field and reduce the amount of computation in the deep network, downsampling pool is always carried out, which can increase the receptive field, but the spatial resolution is reduced. In order not to lose the resolution and still expand the receptive field, hole convolution can be used. In the detection, on the one hand, the perception field is larger, it can detect and segment the large target, on the other hand, it can accurately locate the target with high resolution. In addition, multi-scale information can be obtained by adjusting the expansion rate.

因此，一般而言，孔洞褶积的主要作用是在不损失分辨率的情况下扩展接收范围，并调整扩展速率以获得多尺度信息。

[En]

Therefore, generally speaking, the main role of hole convolution is to expand the receptive field without losing resolution, and to adjust the expansion rate to obtain multi-scale information.

Original: https://blog.csdn.net/lxiao428/article/details/121487639
Author: 计算机视觉与OpenCV
Title: 深度学习算法工程师面试知识点总结（一）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/511498/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python学习（4）证件照底色变换

Python学习（4）证件照底色变换前言一. Python准备二. Python仿真三. 仿真结果四. 小结前言随着人工智能研究的不断兴起，Python的应用也在不断…

人工智能 2023年6月20日
00111
论文阅读：HMER via Attention Aggregation based Bi-directional Mutual Learning

一、简介本文提出了一个新的具有注意聚集和双向相互学习(ABM)的HMER框架，如图所示。模型包括三个模块：特征提取、注意聚合和双向促进学习。（1）在特征提取模块（FEM）中，使…

人工智能 2023年7月14日
0060
Pytorch环境配置——从零开始（不需要anaconda）

Pytorch环境配置——从零开始（不需要anaconda） Pytorch环境配置 * 查看显卡信息安装CUDA Toolkit 下载pytorch的whl文件，pip本地安装…

人工智能 2023年7月21日
0059
图像评价指标（python）

代码： import cv2 import numpy as np import math tmp = [] for i in range(256): tmp.append(0) …

人工智能 2023年6月18日
0091
Zero-DCE 论文阅读笔记

C. Guo et al., “Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement…

人工智能 2023年6月20日
0050
基于深度学习的短时交通流预测与优化

TOC 第二章数据预处理与短时交通流量特性分析 2.1 数据来源数据记录了明尼苏达州双子城19条高速环城公路一整年的交通流量，交通流量数据采样间隔为30秒(采用2018年6月1…

人工智能 2023年6月15日
0061
使用阈值调优改进分类模型性能

阈值调优是数据科学中一个重要且必要的步骤。它与应用程序领域密切相关，并且需要一些领域内的知识作为参考。在本文中将演示如何通过阈值调优来提高模型的性能。 ; 用于分类的常用指标一般…

人工智能 2023年7月1日
00115
计算机图形学-颜色科学基础

1.物体的颜色： 2.颜色视觉机理：三原色（不解释色盲）对立颜色（四色学说；不解释红绿蓝产生所有颜色） 3.颜色空间：与图形处理相关的颜色空间： RGB、CMY 与设备无关：…

人工智能 2023年6月22日
0076
Speech在AI算法中的常见细节问题包括什么

1. 问题介绍在AI算法中，Speech是一个常见的研究领域。它涵盖了语音识别、语音合成、语音转换等多个方面。本文将着重介绍Speech中的一个常见细节问题：如何将语音信号转换为…

人工智能 2024年1月3日
0030
Pandas处理JSON文件read_json()一文详解+代码展示

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月9日
0046
使用pytorch搭建AlexNet并训练花分类数据集

深度学习学习笔记导师博客：https://blog.csdn.net/qq_37541097/article/details/103482003导师github:https://…

人工智能 2023年7月2日
0060
论文解读：AdderSR Towards Energy Efficient Image Super-Reso

本文主要介绍的是加法神经网络的超分应用 (CVPR 2021 Oral），这篇是华为诺亚AdderNet的衍生版本，在超分辨率上的应用。 AdderNet显著降低了分类网络的能耗，…

人工智能 2023年7月13日
0059
聚类分析——经典方法梳理笔记

定义：聚类分析或聚类是对一组对象进行分组的任务，使得同一组（称为集群）中的对象（在某种意义上）彼此之间比其他组（集群）中的对象更相似（在某种意义上）。 [TencentClo…

人工智能 2023年6月2日
0060
【BOOST C++ 11 时钟数据】（3）时间（11-14）

Boost.Timer 提供时钟来测量代码性能。起初，这个库似乎与 Boost.Chrono 竞争。然而，虽然 Boost.Chrono 提供时钟来测量任意周期，但 Boost.T…

人工智能 2023年6月29日
0089
＜人生重开模拟器＞——《Python项目实战》

目录 1.模拟实现 “人生重开模拟器” 1.1 问题导引： 1.2 问题分析： 2. 模拟实现分析及步骤： 3.完整源码： 4.写在最后的话：后记：●由于…

人工智能 2023年7月18日
0046
VIO视觉无人机室内定点自主飞行（T265+PX4+Mavros+NX）

利用雷迅V5+、Ubuntu 18.04、ROS Melodic、T265、Jetson Xavier NX机载电脑实现无人机在室内无GPS情况下的定点稳定飞行。文章目录一、环…

人工智能 2023年6月1日
00272

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

深度学习算法工程师面试知识点总结（一）

笔记内容如下（篇幅所限，这是第一部分）：

大家都在看