深度学习（2）回归问题

2023年6月18日上午11:59 • 人工智能 • 阅读 91

深度学习（2）回归问题

一. 问题提出与解析
*
1. Machine Learning
2. Continuous Prediction
3. Linear Equation
4. With Noise?
5. Find w ′ w’w ′，b ′ b’b ′
6. Gradient Descent
二. 回归问题实战
*
1. 步骤
2. Step1: Compute Loss
3. Step2: Compute Gradient and update
4. Step3: Set w = w ′ w=w’w =w ′and loop
5. 代码

一. 问题提出与解析

1. Machine Learning

make decisions
going left/right → \to → discrete
increase/decrease → \to → continuous

2. Continuous Prediction

f θ : x → y f_θ:x→y f θ:x →y
x : i n p u t d a t a x:input data x :i n p u t d a t a
f ( x ) : p r e d i c t i o n f(x):prediction f (x ):p r e d i c t i o n
y : r e a l d a t a , g r o u n d − t r u t h y:real data,ground-truth y :r e a l d a t a ,g r o u n d −t r u t h

; 3. Linear Equation

y=w*x+b
1.567=w*1+b
3.043=w*2+b

→ \to → Closed Form Solution

w=1.477
b=0.089

4. With Noise?

y=w*x+b+ϵ
ϵ ~ N(0,1)
1.567=w*1+b+eps
3.043=w*2+b+eps
4.519=w*2+b+eps
…

→ \to →
* Y=(WX+b)

For Example

; 5. Find w ′ w’w ′ ， b ′ b’b ′

[ ( W X + b − Y ) ] 2 [(WX+b-Y)]^2 [(W X +b −Y )]2
l o s s = ∑ i ( w ∗ x i + b − y i ) 2 loss=\sum_i{(w*x_i+b-y_i)^2}l o s s =∑i (w ∗x i +b −y i )2
M i n i m i z e l o s s Minimize\ loss M i n i m i z e l o s s
w ′ ∗ x + b ′ → y w’*x+b’→y w ′∗x +b ′→y

6. Gradient Descent

(1) 1-D
w ′ = w ′ − l r ∗ d y d w w’=w’-lr*\frac{dy}{dw}w ′=w ′−l r ∗d w d y

x ′ = x − 0.005 ∗ d y d w x’=x-0.005\frac{dy}{dw}x ′=x −0 .0 0 5 ∗d w d y
可以看到，函数的导数始终指向函数值变大的方向，因此，如果要求l o s s loss l o s s函数的极小值的话，就需要沿导数的反方向前进，即− l r ∗ d y d w -lr\frac{dy}{dw}−l r ∗d w d y ，衰减因子l r lr l r的引入是为了防止步长变大，跨度太大。
(2) 2-D

Find w ′ , b ′ w’,b’w ′,b ′

l o s s = ∑ i ( w ∗ x i + b − y i ) 2 loss=\sum_i{(w*x_i+b-y_i)^2}l o s s =∑i (w ∗x i +b −y i )2
分别对w和b求偏导数，然后沿着偏导数的反向前进，即:
w ′ = w − l r ∗ ∂ l o s s ∂ w w’=w-lr*\frac{∂loss}{∂w}w ′=w −l r ∗∂w ∂l o s s
b ′ = b − l r ∗ ∂ l o s s ∂ b b’=b-lr*\frac{∂loss}{∂b}b ′=b −l r ∗∂b ∂l o s s
w ′ ∗ x + b ′ → y w’*x+b’→y w ′∗x +b ′→y

Learning Process

Loss surface

; 二. 回归问题实战

1. 步骤

(1) 根据随机初始化的w , x , b , y w,x,b,y w ,x ,b ,y的数值来计算L o s s F u n c t i o n Loss\ Function L o s s F u n c t i o n;
(2) 根据当前的w , x , b , y w,x,b,y w ,x ,b ,y的值来计算梯度;
(3) 更新梯度，将w ′ w’w ′赋值给w w w，如此往复循环;
(4) 最后面的w ′ w’w ′和b ′ b’b ′就会作为模型的参数。

2. Step1: Compute Loss

共有100个点，每个点有两个维度，所以数据集维度为[ 100 , 2 ] [100,2][1 0 0 ,2 ]，按照[ ( x 0 , y 0 ) , ( x 1 , y 1 ) , … , ( x 99 , y 99 ) ] [(x_0,y_0 ),(x_1,y_1 ),…,(x_{99},y_{99} )][(x 0 ,y 0 ),(x 1 ,y 1 ),…,(x 9 9 ,y 9 9 )]排列，则损失函数为:
l o s s = [ ( w 0 x 0 + b 0 − y 0 ) ] 2 + [ ( w 0 x 1 + b 0 − y 1 ) ] 2 + ⋯ + [ ( w 0 x 99 + b 0 − y 99 ) ] 2 loss=[(w_0 x_0+b_0-y_0)]^2+[(w_0 x_1+b_0-y_1)]^2+⋯+[(w_0 x_{99}+b_0-y_{99})]^2 l o s s =[(w 0 x 0 +b 0 −y 0 )]2 +[(w 0 x 1 +b 0 −y 1 )]2 +⋯+[(w 0 x 9 9 +b 0 −y 9 9 )]2
即:
l o s s = ∑ i ( w ∗ x i + b − y i ) 2 loss=\sum_i(w*x_i+b-y_i)^2 l o s s =i ∑(w ∗x i +b −y i )2
初始值设w 0 = b 0 = 0 w_0=b_0=0 w 0 =b 0 =0。

(1) b和w的初始值都为0，points是传入的100个点，是data.csv里的数据;
(2) len(points)就是传入数据点的个数，即100; range(0, len(points))就代表从0循环到100;
(3) x=points[i, 0]表示取第i个点中的第0个值，即第一个元素，相当于 p[i][0]; 同理， y=points[i, 1]表示取第i个点中的第1个值，即第二个元素，相当于 p[i][1];
(4) totalError为总损失值，除以是 len(points)是平均损失值。

; 3. Step2: Compute Gradient and update

l o s s 0 = ( w x 0 + b − y 0 ) 2 loss_0=(wx_0+b-y_0)^2 l o s s 0 =(w x 0 +b −y 0 )2
∂ l o s s 0 ∂ w = 2 ( w x 0 + b − y 0 ) x 0 \frac{∂loss_0}{∂w}=2(wx_0+b-y_0)x_0 ∂w ∂l o s s 0 =2 (w x 0 +b −y 0 )x 0
∂ l o s s ∂ w = 2 ∑ ( w x i + b − y i ) x i \frac{∂loss}{∂w}=2\sum(wx_i+b-y_i)x_i ∂w ∂l o s s =2 ∑(w x i +b −y i )x i
∂ l o s s ∂ b = 2 ∑ ( w x i + b − y i ) \frac{∂loss}{∂b}=2\sum(wx_i+b-y_i)∂b ∂l o s s =2 ∑(w x i +b −y i )
w ′ = w − l r ∗ ∂ l o s s ∂ w w’=w-lr\frac{∂loss}{∂w}w ′=w −l r ∗∂w ∂l o s s
b ′ = b − l r ∗ ∂ l o s s ∂ b b’=b-lr\frac{∂loss}{∂b}b ′=b −l r ∗∂b ∂l o s s

4. Step3: Set w = w ′ w=w’w =w ′ and loop

w ← w ′ w←w’w ←w ′
b ← b ′ b←b’b ←b ′

计算出最终的w和b的值就可以带入模型进行预测了:
w ′ x + b ′ → p r e d i c t w’ x+b’→predict w ′x +b ′→p r e d i c t

; 5. 代码

import numpy as np

y = wx + b
def compute_error_for_line_given_points(b, w, points):
    totalError = 0
    for i in range(0, len(points)):
        x = points[i, 0]
        y = points[i, 1]
        # computer mean-squared-error
        totalError += (y - (w * x + b)) ** 2
    # average loss for each point
    return totalError / float(len(points))

def step_gradient(b_current, w_current, points, learningRate):
    b_gradient = 0
    w_gradient = 0
    N = float(len(points))
    for i in range(0, len(points)):
        x = points[i, 0]
        y = points[i, 1]
        # grad_b = 2(wx+b-y)
        b_gradient += (2 / N) * ((w_current * x + b_current) - y)
        # grad_w = 2(wx+b-y)*x
        w_gradient += (2 / N) * x * ((w_current * x + b_current) - y)
    # update w'
    new_b = b_current - (learningRate * b_gradient)
    new_w = w_current - (learningRate * w_gradient)
    return [new_b, new_w]

def gradient_descent_runner(points, starting_b, starting_w, learning_rate, num_iterations):
    b = starting_b
    w = starting_w
    # update for several times
    for i in range(num_iterations):
        b, w = step_gradient(b, w, np.array(points), learning_rate)
    return [b, w]

def run():
    points = np.genfromtxt("data.csv", delimiter=",")
    learning_rate = 0.0001
    initial_b = 0  # initial y-intercept guess
    initial_w = 0  # initial slope guess
    num_iterations = 1000
    print("Starting gradient descent at b = {0}, w = {1}, error = {2}"
          .format(initial_b, initial_w,
                  compute_error_for_line_given_points(initial_b, initial_w, points))
          )
    print("Running...")
    [b, w] = gradient_descent_runner(points, initial_b, initial_w, learning_rate, num_iterations)
    print("After {0} iterations b = {1}, w = {2}, error = {3}".

          format(num_iterations, b, w,
                 compute_error_for_line_given_points(b, w, points))
          )

if __name__ == '__main__':
    run()

运行结果如下:

可以看到，在w = 0 , b = 0 w=0,b=0 w =0 ,b =0的时候，损失值e r r o r ≈ 5565.11 error≈5565.11 e r r o r ≈5 5 6 5 .1 1;
在1000轮迭代后，w ≈ 1.48 , b ≈ 0.09 w≈1.48,b≈0.09 w ≈1 .4 8 ,b ≈0 .0 9，损失值e r r o r ≈ 112.61 error≈112.61 e r r o r ≈1 1 2 .6 1，要大大小于原来的损失值。

参考文献:
[1] 龙良曲:《深度学习与TensorFlow2入门实战》

Original: https://blog.csdn.net/weixin_43360025/article/details/119464457
Author: 炎武丶航
Title: 深度学习（2）回归问题

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/634928/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

「微服务网关实战三」详细理解 SCG 路由、断言与过滤器

又来给大家更文了。本篇带给大家的是 SpringCloudGateway （下文简称 SCG）的各种断言与过滤器的讲解，由于在上一篇文章中我们已经使用过了断言与过滤器，但是一直没…

人工智能 2023年6月28日
0086
【理论知识】实际部署中tensorrt的简单理解

搭建tensorrt的基本流程 ➢ 基本流程 ➢ 构建期 ➢ 建立 Builder（引擎构建器） ➢ 创建 Network（计算图内容） ➢ 生成 SerializedNetwor…

人工智能 2023年7月22日
0055
人脸识别：史上最详细人脸识别adaface讲解-资源下载与数据制作–第一节

这章节我会讲解的是我在工作上的项目，人脸识别adaface，以下的讲解为个人的看法，若有地方说错的我会第一时间纠正，如果觉得博主讲解的还可以的话点个赞，就是对我最大的鼓励~ git…

人工智能 2023年6月24日
0086
毕设系列-检测专题-基于YOLOV5的手势识别系统

毕设系列-基于YOLOV5的手势识别系统我们之前做过一期基于Yolov5的口罩检测系统（手把手教你使用YOLOV5训练自己的目标检测模型-口罩检测-视频教程_dejahu的博客-…

人工智能 2023年7月28日
0070
笔记本GTX1050（计算能力6.1）安装cuda11.0+cudnn8.2（for cuda 11.x）+pycharm tensorflow-gpu2.4.0错误排除

我最先下载的是最新的cuda11.4.1以及tf-gpu2.5.0，后来因为觉得版本太高才降低了版本，这三者的版本对应很重要，比如tf2.5.0就不能用cuda11，我才降的级。 …

人工智能 2023年5月25日
0077
汽车悬挂系统的现代控制分析（现代控制理论课程小论文）

目录 0.摘要 4 建立模型 5 1.1. 物理系统分析 5 1.2. 数学模型 5 1.3. 计算机仿真 8 能控能观性判别 10 2.1. 能控能观性定义 10 2.2. 判别…

人工智能 2023年7月25日
0052
下载对应版本的torch-geometric

本篇主要针对使用torch-geometric读取数据时出现错误： The ‘data’ object was created by an older ve…

人工智能 2023年7月21日
0087
ChatGPT技术解构

ChatGPT的训练主要分为三个步骤，如图所示： Step1：使用有监督学习方式，基于GPT3.5微调训练一个初始模型；训练数据约为2w~3w量级（根据InstructGPT的训…

人工智能 2023年7月31日
0064
【使用Pytorch实现ResNet网络模型：ResNet50、ResNet101和ResNet152】

使用Pytorch实现Resnet网络模型：ResNet50、ResNet101和ResNet152 介绍什么是 ResNet？ ResNet 的架构使用Pytorch构建 R…

人工智能 2023年7月21日
0070
垃圾分类系统

毕业论文题目垃圾分类系统目录摘要 1前言 3第1章概述 41.1 研究背景 41.2 研究目的 41.3 研究内容 4第二章开发技术介绍 52.1Java技术 62…

人工智能 2023年6月30日
0055
TDEER: An Efficient Translating Decoding Schema for Joint Extraction of Entities and Relations 论文笔记

TDEER: An Efficient Translating Decoding Schema for Joint Extraction of Entities and Relat…

人工智能 2023年5月28日
0090
[课程][原创]yolox检测封装成类调用几句代码完成目标检测任务

你将收获 1、学会Yolox封装基本技巧和大体思路 2、学会Yolox封装类的API调用技巧和自由扩展 3、学会使用Pycharm调试技巧和运行脚本技巧 4、学会目标检测代码识别基…

人工智能 2023年7月12日
0057
【初学者入门】零基础入门NLP – 新闻文本分类

序言从今天开始入门学习NLP，虽然有点晚，但是我觉得任何时候都值得开始，尤其是面对你去感兴趣的事情。今天的任务是【零基础入门NLP – 新闻文本分类】，这是天池大…

人工智能 2023年5月27日
00100
YOLO-Darknet目标检测最强实战教程

文章目录 * – 一、Darknet 简介 – 二、专栏介绍 – 三、性能比较 – 四、检测效果 – 五、推荐学习资料 …

人工智能 2023年7月9日
0074
基于Python实现五大常用分类算法(原理+代码)

读：在机器学习和统计中，分类算法通过对已知类别训练集的计算和分析，从中发现类别规则并预测新数据的类别。分类被认为是监督学习的一个实例，即学习可以获得正确识别的观察的训练集的情况。…

人工智能 2023年6月24日
0078
jdk线程池ThreadPoolExecutor工作原理解析（自己动手实现线程池）

线程池介绍在日常开发中经常会遇到需要使用其它线程将大量任务异步处理的场景（异步化以及提升系统的吞吐量），而在使用线程的过程中却存在着两个痛点。而线程池正是为解决上述痛点而生的，…

人工智能 2023年6月28日
0071

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

深度学习（2）回归问题

深度学习（2）回归问题

1. Machine Learning

2. Continuous Prediction

; 3. Linear Equation

4. With Noise?

; 5. Find w ′ w’w ′ ， b ′ b’b ′

6. Gradient Descent

1. 步骤

2. Step1: Compute Loss

; 3. Step2: Compute Gradient and update

4. Step3: Set w = w ′ w=w’w =w ′ and loop

; 5. 代码

大家都在看