回归任务详解（李宏毅深度学习 task2）

2023年6月17日上午11:31 • 人工智能 • 阅读 90

回归任务详解

1. 回归任务的定义
2. 回归任务的举例
3. 模型建立的步骤
*
3.1 模型假设，选择模型框架（以线性模型为例）
–
3.2 模型评估，如何判断众多模型的好坏（损失函数的确定）
–
3.3 模型优化，如何筛选最优的模型（梯度下降）
–
- 3.3.1 如何筛选最优的模型w , b w,b w ,b (梯度下降法的一般步骤)
- 3.3.2 梯度下降法面对的一些问题
4.如何验证训练好的模型的好坏
5. 更强大复杂的模型：1元N次线性模型
6. 过拟合
7.步骤优化
*
7.1 将多个线性模型合并成一个线性模型
7.2 加入更多的参数，收集更多的数据
7.3 进行正则化
总结
回归任务的定义

找到一个函数function，通过输入的特征值X，输出一个连续的数值Scalar

回归任务的举例

回归任务名称输入数据输出数据股市预测过去十年股票的变动、新闻预测、并购等预测股市明天的平均值自动驾驶无人车上的各个sensor数据（路况等）方向盘的角度商品推荐商品的特性购买商品的几率宝可梦精灵攻击力预测进化前CP值，物种等进化后的CP值

模型建立的步骤

3.1 模型假设，选择模型框架（以线性模型为例）

3.1.1 线性模型的定义

&#x901A;&#x8FC7;&#x5BF9;&#x7279;&#x5F81;&#x503C;&#x7684;&#x7EBF;&#x6027;&#x7EC4;&#x5408;&#x6765;&#x6784;&#x5EFA;&#x6A21;&#x578B;

3.1.2 一元线性模型（单特征）

构建目标函数：y = w x + b y = wx + b y =w x +b
参数构成：w , b w, b w ,b

3.1.3 多元线性模型（多特征）

构建目标函数：y = w T x + b y = w^Tx + b y =w T x +b（将累加和公式转化为矩阵运算）
参数构成：w T , b w^T, b w T ,b(此时的w w w为一个向量，维度等于特征个数)

3.2 模型评估，如何判断众多模型的好坏（损失函数的确定）

3.2.1 收集和查看训练数据

获取到训练所需的数据集，并可以尝试着将这些数据进行一些简单的可视化（为了更方便的看出数据之间的关系以及趋势）

3.2.2 如何判断众多模型的好坏（Loss Function）

在这里，我们使用y i ^ \hat{y_i}y i ^来表示真实值，使用f ( x i ) f(x_i)f (x i )表示预测值
通过距离来衡量模型的好坏
构建损失函数（Loss Function），通过计算( y i ^ − f ( x i ) ) 2 (\hat{y_i} – f(x_i))^2 (y i ^−f (x i ))2的和的大小来衡量模型的好坏。

值越小，证明预测值与真实值之间的差距越小，模型越好
值越大，证明预测值与真实值之间的差距越大，模型越差

; 3.2.3 公式推导

假设为一元线性模型
此时目标函数为y = w x + b y = wx + b y =w x +b
Loss Function = ∑ y → 0 x → n ( y i ^ − f ( x i ) ) 2 \displaystyle \sum^{x \to n}{y \to 0}(\hat{y_i} – f(x_i))^2 y →0 ∑x →n (y i ^−f (x i ))2
= ∑ y → 0 x → n ( y i ^ − ( w x + b ) ) 2 \displaystyle \sum^{x \to n}{y \to 0}(\hat{y_i} – (wx + b))^2 y →0 ∑x →n (y i ^−(w x +b ))2

3.3 模型优化，如何筛选最优的模型（梯度下降）

3.3.1 如何筛选最优的模型 w , b w,b w ,b (梯度下降法的一般步骤)

首先，要设定一个学习率η \eta η（用来决定参数更新的”步长”）
一般步骤：
随机选取一个起始点w 0 w^0 w 0
计算当前的梯度方向，根据梯度的方向来判定移动的方向
1. 大于0，向右移动（增加w w w）
2. 小于0，向左移动（减小w w w）
根据学习率η \eta η进行移动
重复2和3，直至找到最低点

3.3.2 梯度下降法面对的一些问题

无法收敛到全局最优解，只能收敛到局部最优解
当梯度等于0的情况
当梯度约等于0的情况

4.如何验证训练好的模型的好坏

使用训练集和测试集的平均误差

; 5. 更强大复杂的模型：1元N次线性模型

使用更高维的的线性模型通常能够更好的拟合曲线，但也会导致计算量的增加，若维度过高，便可能导致过拟合现象的产生

过拟合
产生原因：模型在学习过程中，模型把数据独有的一些特征当成实例的一般特征学习，导致模型的泛化性能下降
根本原因：模型的学习能力太强
举例说明：
随着线性模型次数的增加，模型拟合训练数据的效果越来越好，可是测试集测试的效果却大幅下降

; 7.步骤优化

7.1 将多个线性模型合并成一个线性模型

7.2 加入更多的参数，收集更多的数据

7.3 进行正则化

目的：避免权重w w w可能会使某些特征权重过高，仍旧导致过拟合
注：
w 越小，表示f u n c t i o n function f u n c t i o n较平滑的，f u n c t i o n function f u n c t i o n输出值与输入值相差不大
在很多应用场景中，并不是w w w越小模型越平滑越好，但是经验值告诉我们w w w越小大部分情况下都是好的。
b b b 的值接近于0 ，对曲线平滑是没有影响

总结

本篇文章只是对回归任务的一个概述，重点描述了线性模型这个基础模型，涉及到梯度下降、正则化等公式推导部分留到以后完成
希望对你们有所帮助。
有问题的话希望指正。
谢谢！

Original: https://blog.csdn.net/Yzy_fulture/article/details/118727785
Author: Y_fulture
Title: 回归任务详解（李宏毅深度学习 task2）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/629939/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【工具】Jupyter切换kernel（虚拟环境）

文章目录前言方法 * 1 打开Anaconda Prompt 2 在Anaconda Prompt里面切换到你需要的虚拟环境中 3 安装jupyter 4 安装完成之后重启ju…

人工智能 2023年7月22日
0093
angular项目启动报错

1、angular项目yarn install报错 angular项目安装依赖的时候虽然没有看到红灿灿的报错，但是末尾有这个ERR:其实这是个无关紧要的报错，只不过强迫症的我看了就…

人工智能 2023年6月28日
0068
深度学习学习笔记-论文研读4-基于深度强化学习的多用户边缘计算任务卸载调度与资源分配算法

本人学识浅薄，如有理解不到位的地方还请大佬们指出，相互学习，共同进步概念引入强化学习 DQN算法边缘计算边缘计算，是指在靠近物或数据源头的一侧，采用网络、计算、存储、应用核心…

人工智能 2023年7月28日
0090
【K210】人脸识别 KPU-kpu.run_yolo2()函数说明

零、摄像头采集图像 img = sensor.snapshot() 这里 img 就可以直接作为输入，这里需要注意： snapshot() 函数采集到图片后，会将图片数据放到两…

人工智能 2023年5月26日
0090
InfoGAN详细介绍及特征解耦图像生成

InfoGAN详细介绍及特征解耦图像生成一.InfoGAN框架理解 * 特征耦合 InfoGAN InfoGAN论文实验结果二.VAE-GAN框架理解 * VAE-GAN算法步…

人工智能 2023年7月13日
0091
如何用人工智能自动玩游戏

如何用人工智能自动玩游戏一、前言让AI玩游戏的思想早在上世纪就已经有了，那个时候更偏向棋类游戏。像是五子棋、象棋等。在上世纪”深蓝”就击败了国际象棋冠军…

人工智能 2023年6月26日
00102
基于JAVA仁爱公益网站计算机毕业设计源码+系统+mysql数据库+lw文档+部署

本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：idea eclipse 前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAV…

人工智能 2023年7月20日
0057
python NSGA-II 算法

NSGA-II 算法 NSGA-II 提出的 NSGA的缺点算法计算量大。NSGA算法的计算复杂度与种群数量N、目标函数个数m的关系为T = O(mN3)，当种群规模较大、目标函…

人工智能 2023年7月6日
0064
pycharm终端提示无法加载文件 E:softwarepython_pycharmvenvScriptsactivate.ps1，因为在此系统上禁止运行脚本。解决方案

解决步骤如下： 2、然后找到windows上的Windows Powershall以管理员的身份运行，并在命令窗口输入 set-executionpolicy remotesig…

人工智能 2023年7月30日
0087
tensorflow之tensor

tensorflow,从名字上看由tensor+flow组成。本文来看看Tensor是什么，是怎么实现的。 tensorflow里的tensor可以抽象的认为由 struct Te…

人工智能 2023年5月24日
00110
基于粒子群优化的BP神经网络（预测应用） – 附代码

基于粒子群优化的BP神经网络（预测应用） – 附代码文章目录基于粒子群优化的BP神经网络（预测应用） – 附代码 * 1.数据介绍 3.PSO优化BP神…

人工智能 2023年6月13日
0073
智能停车场（可检测车牌通过oled屏幕显示车牌号）语音+LED灯提示该车辆所停车位

今天通过自己的学习，我做了一个智能停车场，首先先来介绍一下他的功能，通过识别车辆的车牌号并在OLED屏幕上显示车牌号，然后升降杆升起，并通过语音播报提示车辆所去的车位，同时会有绿色…

人工智能 2023年5月23日
0076
在VSCode中使用Pytorch遇到的问题

PowerShell无法使用conda虚拟环境按教程在VSCode中输入代码，提示缺少模块，于是在终端中安装缺少的模块，发现在VSCode的终端中激活不了conda的虚拟环境。 …

人工智能 2023年7月23日
0072
Python-灰度图像增强(持续更新)

依据作用域的不同，图像增强分为空域内处理和频域内处理；空域内处理是直接对图像进行处理，主要有灰度变换方法和直方图方法等。通过调节灰度图像的明暗对比度，使得图像变得更加清晰。直方图…

人工智能 2023年6月18日
0081
Python实现导弹自动追踪

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月31日
0072
机器学习期末复习题题库-单项选择题

1.属于监督学习的机器学习算法是：贝叶斯分类器 2.属于无监督学习的机器学习算法是：层次聚类二项式分布的共轭分布是： Beta分布多项式分布的共轭分布是： Dirich…

人工智能 2023年6月16日
00118

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31