【学习笔记】深度神经网络基础

2023年6月2日下午12:52 • 人工智能 • 阅读 82

1. 监督学习和无监督学习

监督学习简单定义：提供一组输入数据和其对应的标签数据，然后搭建一个模型，让模型在通过训练后准确地找到输入数据和标签数据之间的最优映射关系，在输入新的数据后，模型能够通过之前学到的最优映射关系，快速地预测出这组新数据的标签。这就是一个监督学习过程。主要应用的是 分类问题和回归问题。
[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:75a06c2a-9e53-4a8c-b60d-ce714baa66a2

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:aadad3fa-cac7-4dd2-afe7-500ba2b38720

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:f222462e-d8a9-41ce-9c21-8da133b6630b

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:3d167dd5-f56a-4288-a075-7a49bd79b010

无监督学习简单定义：提供一组没有任何标签的输入数据，在我们搭建好的模型中进行训练，对整个训练过程不作任何干涉，最后得到一个能够发现数据间隐藏特征的映射模型，使用这个模型实现对新数据的分类。使用无监督学习实现分类的算法又称为聚类。
举例：浏览器搜索”深度学习”，得到的网页大致被分为理论、算法、硬件、新闻几个类别，这就是聚类后的效果。

2.欠拟合和过拟合
2.1 欠拟合：拥有欠拟合的模型对已有数据的匹配性很差，不过对数据中的噪声不敏感。
解决方法：
（1）增加特征项：大部分欠拟合是因为没有准确把握数据的主要特征，所以可以尝试在模型中加入更多的和原数据有重要相关性的特征来训练搭建的模型，这样得到的模型会有更好的泛化能力。
（2）构造复杂多项式：函数的特性决定了函数的泛化能力，可以通过增加函数中的次项来增强模型的变化能力，提升其泛化性能。
（3）减少正则化参数：正则化参数出现的目的是为了防止过拟合情形的出现，若已经出现欠拟合，则可以通过减少正则化参数来消除欠拟合。
2.2 过拟合：拥有过拟合特性的模型对数据的匹配性太好，所以对数据中的噪声非常敏感。
解决方法：
（1）增大训练的数据量：大多数情况下发生过拟合是因为用于模型训练的数据量太小，搭建的模型过度捕获了数据的有限特征，这时就会出现过拟合。因此增加参与模型训练的数据量以后，模型自然能捕获数据的更多特征，模型就不会过于依赖数据的个别特征。
（ 2）增加正则化参数：正则化一般指在目标函数之后加上范数，用来防止模型过拟合发生，在实践中最常用到的正则化方法有L0正则、L1正则和L2正则。
（3）Dropout方法：：Dropout方法在神经网络模型中使用的频率较高，简单来说就是神经网络模型在进行前向传播的过程中，随机选取和丢弃指定层次之间的部分神经连接，因为整个过程是随机的，所以能够有效防止过拟合的发生。

3.后向传播
[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:bc9f6865-f536-4389-93fc-aa15cfe39288

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:dae010f1-94ee-4fc8-91e4-fb12144b324a

4.损失和优化
[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:8a111446-fda0-43e3-89d3-509f3e2db2ae

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:1439d766-c054-4c69-bee5-47db73ac8f7c

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:be37ad74-d1e6-4459-a4b3-b90d306c579f

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:40555cb4-2b6b-4f7f-8dc7-202972ef4bcb

4.1 损失函数
（1）均方误差函数（Mean Square Error, MSE）计算预测值与真实值之差的平方的期望值。计算公式：
M S E = 1 N ∑ i = 1 N ( y t r u e i − y p r e d i ) 2 MSE = \frac{1}{N}\begin{matrix} \sum_{i=1}^N \end{matrix}(y_{true}^{i}-y_{pred}^{i})^2 M S E =N 1 ∑i =1 N (y t r u e i −y p r e d i )2

（2）均方根误差函数（Root Mean Square Error, RMSE）在均方误差基础上进行了改良，计算的是均方误差的算术平方根。计算公式：
R M S E = 1 N ∑ i = 1 N ( y t r u e i − y p r e d i ) 2 RMSE = \sqrt{\frac{1}{N}\begin{matrix} \sum_{i=1}^N \end{matrix}(y_{true}^{i}-y_{pred}^{i})^2}R M S E =N 1 ∑i =1 N (y t r u e i −y p r e d i )2

（3）平均绝对误差函数（Mean Absolute Error, MAE）计算的是绝对误差的平均值，绝对误差即模型预测值和真实值之间的差的绝对值，能更好地反映预测值误差的实际情况。计算公式：
M A E = 1 N ∑ i = 1 N ∣ ( y t r u e i − y p r e d i ) ∣ MAE = \frac{1}{N}\begin{matrix} \sum_{i=1}^N \end{matrix}|(y_{true}^{i}-y_{pred}^{i})|M A E =N 1 ∑i =1 N ∣(y t r u e i −y p r e d i )∣

4.2 优化函数
[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:722798c3-c85e-4707-ad4b-1a3ec404bc9d

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:e41771f9-4f51-4cdb-bccc-8d7fd07e68cb

在实践操作中最常用到的是一阶优化函数，典型的一阶优化函数包括GD、SGD、Momentum、Adagrad、Adam等。一阶优化函数在优化过程中求解的是参数的一阶导数，这些一阶导数的值就是模型中参数的微调值。
此处引入新概念：梯度。梯度是将多元函数的各个参数求得的偏导数以向量的形式展现出来，也叫多元函数的梯度。例如二元函数f(x,y)分别对x和y求偏导，然后把求得的偏导数写成向量的形式，即( δ f δ x , δ f δ y ) (\frac{\delta f}{\delta x},\frac{\delta f}{\delta y})(δx δf ,δy δf ),也可以记做 gradf(x,y)。
[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:8addfc2d-6a8e-4a1c-b30f-1270175cdb6f

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:3c91e857-725b-4d05-9b0c-4440dc25986f

（1）梯度下降（Gradient Descent，GD）是参数优化的基础方法。全局梯度下降的参数更新公式为：
θ j = θ j − η × δ J ( θ j ) δ θ j \theta_j = \theta_j – \eta \times \frac{\delta J(\theta_j)}{\delta\theta_j}θj =θj −η×δθj δJ (θj )
其中，训练样本总数为n，j = 0…n。θ \theta θ是优化的参数对象，η \eta η是学习速率，J ( θ ) J(\theta)J (θ)是损失函数，δ J ( θ j ) δ θ j \frac{\delta J(\theta_j)}{\delta\theta_j}δθj δJ (θj )是根据损失函数计算出来的梯度。学习速率用于控制梯度更新的快慢，如果学习速率过快，参数的更新跨步就会变大，极易出现局部最优和抖动；如果学习速率过慢，梯度更新的迭代次数就会增加，参数更新、优化的时间也会变长。
[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:8485250c-442c-45ee-a713-58a9e79ef9de

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:3461a80d-93a3-42d1-8843-dbc31c0d2e34

（2）批量梯度下降（Batch Gradient Descent, BGD）。
[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:2fafd371-feb2-49cf-82d0-3c5e7f780572

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:9d5b6561-2146-4c07-a8a0-b9c0b4568eb9

假设划分出批量个数为m，其中的一个批量包含batch个数据样本，则一个批量的梯度下降参数更新公式为：
θ j = θ j − η × δ J b a t c h ( θ j ) δ θ j \theta_j = \theta_j – \eta \times \frac{\delta J_{batch}(\theta_j)}{\delta\theta_j}θj =θj −η×δθj δJ b a t c h (θj )
[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:c3a99051-c3d2-4d0e-8804-755373696c0f

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:0c994706-417b-45ab-a866-5c9a86cd9f71

（3）随机梯度下降（Stochastic Gradient Descent,SGD）
随机梯度下降是通过随机的方式从整个参与训练的数据集中选取一部分来参与模型的训练，所以只要随机选取的数据集大小合适，就不用担心计算损失函数的时间成本和模型训练的复杂度，而且与整个参与训练的数据集大小没有关系。假设随机选取的一部分数据集包含stochastic个数据样本，则sgd的更新公式为：θ j = θ j − η × δ J s t o c h a s t i c ( θ j ) δ θ j \theta_j = \theta_j – \eta \times \frac{\delta J_{stochastic}(\theta_j)}{\delta\theta_j}θj =θj −η×δθj δJ s t o c h a s t i c (θj )
[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:f98ad8e4-7371-4865-9c9e-dbadb72155e8

[En]

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped due to arrears, please recharge your account in Tencent Cloud requestId:2636779a-0a79-4a75-aa9f-5ff5c007c023

（4）自适应时刻估计方法（Adaptive Moment Estimation, Adam）
Adam在模型训练优化的过程中让每个参数获得自适应的学习率，来达到优化质量和速度的双重提升。在实际应用中Adam效果较好。

5.激活函数
如果不引入激活函数，无论增加多少层，模型都是线性模型，在应对非线性问题时会存在很大的局限性。激活函数的引入给模型带来非线性因素，非线性模型能够处理更复杂的问题。常见的三种激活函数为：Sigmoid、tanh和ReLU。

Original: https://blog.csdn.net/weixin_45131923/article/details/121745715
Author: 云烟成雨_sky
Title: 【学习笔记】深度神经网络基础

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/560998/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

手把手带你玩转Spark机器学习-使用Spark构建分类模型

系列文章目录手把手带你玩转Spark机器学习-专栏介绍手把手带你玩转Spark机器学习-问题汇总手把手带你玩转Spark机器学习-Spark的安装及使用手把手带你玩转Spa…

人工智能 2023年7月1日
00101
无人驾驶学习笔记-LeGO-LOAM 算法源码学习总结

目录 1、概述 2、lego-loam的贡献 3、系统框图 4、ros graph中的节点关系表 5、lego-loam 的文件系统架构 6、各部分方法原理及代码注释 6.1、点云…

人工智能 2023年6月24日
00124
【自动驾驶】PID实现轨迹跟踪

文章目录参考资料 1. PID控制原理 * 1.1 基本概念 1.2 数字 PID 控制算法 – 1. 位置式PID + python代码实现 2. 增量式PID +…

人工智能 2023年6月2日
0091
【MADDPG（MPE）——环境配置与用法详细介绍（多智能体强化学习）)】

MADDPG（MPE）——环境配置与用法详细介绍（多智能体强化学习） MADDPG（MPE）介绍 MPE环境安装教程 * 前期准备 MPE 安装包介绍 MPE 安装环境要求开始…

人工智能 2023年7月5日
00591
数据分析案例-停车场数据可视化分析

数据集介绍数据为某停车场信息表，具体字段信息如下表：字段含义字段含义 cn 车牌号 price 停车所交费用 timein 车辆进场时间 state 是否已经离…

人工智能 2023年7月16日
00108
单目图像深度估计 – 入门篇

由于公司网站设置，基于git的Blog越来越难打开，所以把部分内容搬运到这里。一转眼都是两年前的内容了，且大部分都是我的个人理解，现在看来也难免有些Bug。虽然后来由于项目安排的关…

人工智能 2023年6月16日
0071
JQuery AJAX 通过一般处理程序取列表

也就是把反回了字符串显示到table中 $("#btnSearch").click(function () { $.post("CurrentSto…

人工智能 2023年6月27日
0060
YOLOv5Face YOLO5Face人脸检测论文及代码简析

YOLO5face人脸检测模型论文和代码简析 YOLO5Face模型分析 * 论文及源码下载论文创新点实验结果下载代码跑起来调整数据集训练完成之后检验结果一点点代码简析…

人工智能 2023年7月27日
0092
NLP-文本摘要提取

摘要提取思路深度学习在NLP的研究方向和应用 1.词向量化把词进行量化，得到向量空间的值，得到具体的数值，长度，计算距离，拓展到文本向量和文章向量2.分词中文：基本语义单元分割…

人工智能 2023年5月27日
0058
Python 数据合并及查询方法——Pandas merge()

本文目录 merge() 官方地址 merge() 主体部分及其参数说明不同的连接示意图 * 内连接 inner join 全连接 Outer Join 左连接 left joi…

人工智能 2023年7月9日
0078
R语言利用openxlsx包输出EXCEL报告

1.openxlsx包的简介openxlsx包是建立R语言与excel交互关系的工具。借助openxlsx包，使用者可以将R语言分析结果直接输出到excel文件中，并可以设置exc…

人工智能 2023年7月18日
00114
基于pytorch语音识别_说话人分割聚类错误率从15.8%到2.2%的蜕变：基于序列传导的语音识别和说话人分割聚类模型联合…

在interspeech2019会议上，一篇名为《Joint Speech Recognition and Speaker Diarization via Sequence Tra…

人工智能 2023年5月27日
00105
Transformer框架时间序列模型Informer内容与代码解读

Transformer框架时间序列模型Informer内容与代码解读注：大家觉得博客好的话，别忘了点赞收藏呀，本人每周都会更新关于人工智能和大数据相关的内容，内容多为原创，Pyt…

人工智能 2023年6月23日
0056
基于机器视觉的水果检测算法实现

一、摘要这是一款基于卷积神经网络和数字图像处理的智能水果检测和分类系统，由检测，分类两个部分组成。通过互联网下载和使用多媒体处理工具对水果拍摄视频剪辑处理得到大量水果图片，对图片…

人工智能 2023年6月20日
0073
维度和指标（metrics and dimensions）

维度和指标是什么？维度和指标大家或多或少都有接触过。属于数据分析领域的基础知识，在分析报告或者分析工具中时有出现，因此大家对此要有所了解。维度和指标的英文分别是metrics …

人工智能 2023年7月17日
0090
PHP短信通知+语音播报自动双呼解决方案

在一些重要信息通知的场景，需要用户能收到且关注到信息，采用短信+语音通知同步推送的方式，能很好的解决这个问题。场景一：相同内容的短信通知+语音通知同步发送在推送短信的同时，同步…

人工智能 2023年5月25日
0095

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【学习笔记】深度神经网络基础

大家都在看