线性回归1

2023年6月17日下午4:28 • 人工智能 • 阅读 69

回归和预测的区别：
输入变量与输出变量均为连续变量的预测问题是回归问题；
输出变量为有限个离散变量的预测问题成为分类问题；

数据获取

为了便于分析，我们使用y = 5x+6模拟生成一些数据

import torch as tt
from IPython import display
from matplotlib import pyplot as plt
import numpy as np
import random
num_inputs = 1
num_examples = 2000
true_w = 5
true_b = 6
x = tt.from_numpy(np.random.normal(0,1,(num_examples, num_inputs)))
y_true = true_w*x[:,0]+true_b

增加一些噪声数据表示干扰数据

y_true +=tt.from_numpy(np.random.normal(0,1, size = y_true.size()))

plt.plot([-3, 3],[true_w*-3 + true_b,true_w*3 + true_b])
plt.scatter(x[:,0].numpy(), y_true.numpy(),1, c='#ff0000')

损失函数

怎么才能使得推断出的y = wx+b是我们理想中的模型呢，或者是最符合原样本数据的模型呢？我们需要保证样本中的真实的y（true）值和通过模型求解出来的y(pred)值，两者之差越小越好。为了量化两者之间的差值，我们通常会使用均方误差(MSE)来进行衡量，具体公式如下:

N是样本的数量2000；
ytrue是变量的真实值，ypred是变量的预测值
w和x就是我们要通过训练需要迭代出的样本数据特征值

顾名思义，均方误差就是所有数据方差的平均值，我们不妨就把它定义为损失函数。预测结果越好，损失就越低，训练模型就是将损失最小化。也就是在不断的迭代中，我们要通过改变初始值的w和b，使得损失函数的值越来越小，直到达到最优或者局部最优

; 梯度下降

损失值是根据输入值，然后由权重和偏置计算出来的：

L(w,b)

损失函数中，变量只有w和b，如果要想改变L的值，那我们需要调整w或者b。如果调整一下w，损失函数是会变大还是变小？我们需要知道偏导数∂L/∂w是正是负才能回答这个问题，因为在一个曲线的增函数区间，我们需要增大w，曲线才会增大；在一个函数的减函数区间，我们需要减少w，曲线才会减小。因此，如果想要知道变量对曲线的影响是增大还是减小，需要先求出变量的导数。因此，我们需要先求出∂L/∂w和∂L/∂b的值：

根据链式求导法则：

其中：

带入以上公示后，得到线性模型分别对w和b的求导公式：

现在我们来求解下，怎么改变变量值，才能使得损失函数的值不断下降

假设上图是损失函数L和w的函数图，ε表示w调整的步长(导数的意义，单位时间曲线的变化程度)
为了使得问题简单化，我们假设ε>0：

当在左方区域，也就是L成下降趋势的局域(根据偏导数的意义，我们知道(∂L/∂w

w = w + ε

当在右方区域，也就是L成上升趋势的局域(∂L/∂w>0), 我们需要减少w的值，使得L的值下降：

w = w – ε

我们将步长与∂L/∂w的值关联起来
则当∂L/∂w < 0，且ε > 0时：

w < w + ε = w+(-η ∂L/∂w) = w-η∂L/∂w，其中η为正，表示学习率

当∂L/∂w>0>时：

w < w – ε = w-(η ∂L/∂w) = w-η∂L/∂w，其中η为正，表示学习率

当 ε

Original: https://blog.csdn.net/jiadongfengyahoo/article/details/121913555
Author: 古风子
Title: 线性回归1

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/630939/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【python机器学习：朴素贝叶斯分类算法】

python机器学习：朴素贝叶斯分类算法朴素贝叶斯介绍 * 贝叶斯公式基本思想示例分析 * 数据展示先验概率和条件概率算法步骤：代码 – 计算先验概率和条件…

人工智能 2023年7月1日
0043
半监督学习算法如何利用未标记的数据

问题概述半监督学习算法是一种可以利用未标记数据来提升机器学习模型性能的方法。本文将详细介绍半监督学习算法如何利用未标记数据。我们将围绕算法原理、公式推导、计算步骤以及复杂Pyth…

人工智能 2024年1月1日
0035
can通道采样频率_中频采样和IQ采样的比较和转换

RF测试笔记是业界一线工程师们通过理论和实践相结合的方式介绍射频微波测试技术的专栏，主要涵盖噪声系数、数字调制、矢网、频谱分析、脉冲信号等内容。如有想看到的内容或技术问题，可以在…

人工智能 2023年5月27日
0085
特征选择 | MATLAB实现RF(随机森林)特征选择

[ 随机森林特征选择_在 _MATLAB_中的 _实现_需要通过以下几个步骤： 1. 准备数据集：将数据集分为训练集和测试集，并进行特征工程（包括数据清理、 _特征选择_等）； …

人工智能 2023年6月16日
0098
AI带你省钱旅游！精准预测民宿房源价格！ ⛵

💡 作者：韩信子@ShowMeAI📘 数据分析实战系列：https://www.showmeai.tech/tutorials/40📘 机器学习实战系列：https://www.s…

人工智能 2023年6月19日
0079
使用 Amazon SageMaker Clarify 解释德甲赛况 xGoals

最激动人心的 Amazon re:Invent 2020 公告 https://www.youtube.com/watch?v=PjDysgCvRqY 之一是新增一项 Amazon…

人工智能 2023年7月17日
0052
【论文笔记】道路检测 SNE-RoadSeg

论文标题：SNE-RoadSeg: Incorporating Surface Normal Information into Semantic Segmentation for …

人工智能 2023年7月10日
0057
两轮差速小车循线控制原理分析

硬件资料设定：小车驱动来自于两个相同的电机，转向依靠两轮差速实现，小车前后左右安装超声波传感器，前后各一个，左右各两个；功能目标：假设小车左侧有墙壁，通过超声波测距实现按指定距离…

人工智能 2023年6月2日
0065
L1-norm (L1范数) L2-norm(L2范数)

同样存在L0、L3等，L1、L2范数应用比较多。一个向量的 norm 就是将该向量投影到 [0, ∞) 范围内的值，其中 0 值只有零向量的 norm 取到。不难想象，将其与现…

人工智能 2023年6月15日
0081
机器学习 | MATLAB实现支持向量机分类ClassificationSVM参数设定

首先， LSTM（长短期记忆）神经网络_是一种递归 _神经网络，它能够对序列数据进行建模和预测。在多变量时间序列预测_中， _LSTM_可以对多个时间序列进行联合建模和 …

人工智能 2023年7月2日
00104
【数据挖掘算法与应用】——数据挖掘导论

数据挖掘导论 * – 导入 – 一、为什么要进行数据挖掘 – + 1.数据爆炸但知识贫乏 + 2.数据在爆炸式增长 + 3.数据安全 + 4.从…

人工智能 2023年6月15日
0075
【目标检测】YOLOX ，YOLO系列的集大成者

文章目录 * – 一、YOLOX简介 – 二、YOLOX模型结构（Decouple head） – 三、YOLOX的改进之处 – +…

人工智能 2023年7月12日
0066
麦咭早教机器人_麦咭MJ001智能早教机器人怎么样？使用评测

如今，随着社会的进步和科学技术的发展，电子产品变得越来越流行。父母忙于工作，没有足够的时间陪伴孩子和教育。智能机器人逐渐普及到每个家庭，成为宝宝学习、陪伴、教育的小专家。 [En]…

人工智能 2023年5月27日
0088
论文浅尝 | Wordly Wise(WoW) – 用于语音视觉知识问答的跨语言知识融合模型

笔记整理: 谭亦鸣，东南大学博士生来源：NAACL’21链接：https://aclanthology.org/2021.naacl-main.153.pdf 论文提出…

人工智能 2023年5月27日
0086
语言模型(NNLM)

本文主要学习神经网络语言模型，并在文末给出简单的代码demo,便于学习，整体上主要是从表示学习的发展方面展开; 一 .表示学习数据表示面对复杂的概念，可以找到一个表达，化繁从简…

人工智能 2023年5月30日
0078
Pandas操作题

Pandas操作题 1.学生数据分析 1.数据导入并展示, 文件位置位于../data/下请将文件student-info.csv中的内容读入pandas DataFrame &…

人工智能 2023年7月8日
0094

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

线性回归1

数据获取

损失函数

; 梯度下降

大家都在看