单变量线性回归模型（上）

2023年6月17日下午2:53 • 人工智能 • 阅读 72

单变量线性回归即 简单线性回归 ，是一种 回归分析 方法。 回归分析 在统计学上用来分析两个或者多个变量之间的相关关系及其程度。比如预测股票，预测产品销量等等。 单变量 即使用单一变量预测，线性即自变量与因变量之间的关系为线性的。回归即根据之前的数据预测一个准确的输出值。

要想预测就必须有数据，这些数据在机器学习中称为 训练集 ，训练集中的每条完整的数据称为样本。预测的目标被称为标签或者目标，预测依据的自变量称为特征或者 协变量 。比如：

area *

age *

这里的

area 和

age 被称作

，b为

为预测目标，其中的

为协变量。

看到这里，突然想起来高中关注的up主，YJango，初听不知言中意，再听已是建模人。我们的学习过程确实和他讲得十分相似。

根据初中的知识，一个n元一次的方程只需要n + 1个点即可确定一条直线，但是未必存在一条直线通过所有这些点，我们需要找出一条直线尽可能的囊括所有的点并可以预测未来数据的出现。这个过程叫做拟合。拟合程度的好坏需要 代价（损失）函数 来衡量。

损失函数

损失函数 是将随机事件或其有关 随机变量的取值 映射为非负实数以表示该随机事件的”风险”或”损失”的函数。在应用中，损失函数通常作为学习准则与优化问题相联系，即通过最小化损失函数求解和评估模型。 损失函数 能够量化目标的实际值与预测值之间的差距。通常我们会选择非负数作为损失，且数值越小表示损失越小，完美预测时的损失为 0 。
摘自繁凡

数据集 :（ x i , y i ） i = 1 … m
实际值： y i
估计值 : h θ \theta θ ( x i ) = θ \theta θ 0 +θ \theta θ 1x i
估计误差 : h θ \theta θ ( x i ) – y i
代价函数定义:
J ( θ 0 , θ 1 ) = 1 2 m ∑ i = 1 m ( h θ ( x i ) − y i ) 2 J (\theta_0, \theta_1) = \frac {1}{2m} \sum_{i=1}^m{(h_\theta(x^i)-y^i)^2}J (θ0 ,θ1 )=2 m 1 i =1 ∑m (h θ(x i )−y i )2
这里的系数1 2 m \frac {1}{2m}2 m 1 是为了后面的 计算方便人为定义的。应该方便使用梯度下降算法计算

优化方法 (梯度下降算法)

梯度下降是一个用来求函数最小值的算法，这里用来求 J ( θ 0 , θ 1 ) J(\theta_0, \theta_1)J (θ0 ,θ1 ) 的最小值。

Δ θ j = ∂ J ( θ 0 , θ 1 ) ∂ θ j \Delta\theta_j = \frac{\partial J(\theta_0, \theta_1)}{\partial \theta_j}Δθj =∂θj ∂J (θ0 ,θ1 )

θ j : = θ j − α Δ θ j \theta_j := \theta_j – \alpha\Delta\theta_j θj :=θj −αΔθj
(这里的:=指的是赋值)

h θ \theta θ ( x i ) = θ \theta θ 0 +θ \theta θ 1x i

α \alpha α指的是 学习率,值大于0来表示让代价函数下降的程度有多大。每次更新时让所有参数减去学习乘以代价函数的导数。比如这里更新θ 0 \theta_0 θ0 和θ 1 \theta1 θ1:Δ θ 0 = ∂ J ( θ 0 , θ 1 ) ∂ θ 0 = 1 m ∑ i = 1 m ( h θ ( x i ) − y i ) \Delta\theta_0 = \frac{\partial J(\theta_0,\theta_1)}{\partial\theta_0} = \frac {1}{m}\sum_{i = 1}^m{(h_\theta(x^i)-y^i)}Δθ0 =∂θ0 ∂J (θ0 ,θ1 )=m 1 i =1 ∑m (h θ(x i )−y i )Δ θ 1 = ∂ J ( θ 0 , θ 1 ) ∂ θ 1 = 1 m ∑ i = 1 m ( h θ ( x i ) − y i ) ∗ x i \Delta\theta_1 = \frac{\partial J(\theta_0,\theta_1)}{\partial\theta_1} = \frac {1}{m}\sum_{i = 1}^m{(h_\theta(x^i)-y^i)}*x^i Δθ1 =∂θ1 ∂J (θ0 ,θ1 )=m 1 i =1 ∑m (h θ(x i )−y i )∗x i

比如一个二次函数y = x 2 y = x ^ 2 y =x 2,当θ j \theta_j θj 在函数右侧时，导数大于0，更新往极值点处挪动，同理在左侧时，导数小于0，更新亦往极值点处挪动，即这里的函数最小值。当然极小值点未必是最小值点，这并不是最优的优化方法。

再来看一遍代价函数：
J ( θ 0 , θ 1 ) = 1 2 m ∑ i = 1 m ( h θ ( x i ) − y i ) 2 J (\theta_0, \theta_1) = \frac {1}{2m} \sum_{i=1}^m{(h_\theta(x^i)-y^i)^2}J (θ0 ,θ1 )=2 m 1 i =1 ∑m (h θ(x i )−y i )2

Δ θ = 1 m X T e \Delta\theta = \frac {1}{m}X^Te Δθ=m 1 X T e
θ : = θ − α Δ θ \theta := \theta – \alpha\Delta\theta θ:=θ−αΔθ
有时间的话写下推导过程
这里的X T X^T X T指的是： [ 1 1 . . . 1 x 1 x 2 . . . x n ] \left[ \begin{matrix} 1 & 1 & …&1 \ x^1 & x^2 & … & x^n \end{matrix} \right][1 x 1 1 x 2 ……1 x n ]
这里的e指的是估计误差:[ e 1 e 2 . . . e n ] \left[ \begin{matrix} e^1 \ e^2 \ … \ e^n \ \end{matrix} \right]⎣⎢⎢⎡e 1 e 2 …e n ⎦⎥⎥⎤

比赛时间紧迫，代码实现部分以后有时间学习整理在（下）

Original: https://blog.csdn.net/weixin_51709063/article/details/122724799
Author: vFairyo
Title: 单变量线性回归模型（上）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/630543/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

MySQL数据库 — 表的约束

关于数据库约束的话题，今天来进一步讲解，之前说过，数据类型本身就是一种约束。数据库是和数据打交道的，所以要对数据的管理有非常完整的约束体系。今天我们来谈一谈表结构的约束，下一篇再来…

人工智能 2023年6月26日
0083
论文-Knowledge-aware Graph Neural Networks with LabelSmoothness Regularization for Recommender System

Wang H , Zhang F , Zhang M , et al. Knowledge-aware Graph Neural Networks with Label Smoot…

人工智能 2023年6月10日
0053
目标检测学习笔记——mmdet的mmcv安装

目录一、windows下安装mmcv * 1、环境准备 – 安装git 安装visual studio community 2019 安装conda 安装对应版本的c…

人工智能 2023年7月21日
0068
【DL】第 9 章：新兴的神经网络设计

🔎大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流🔎📝个人主页－Sonhhxg_柒的博客_CSDN博客📃🎁欢迎各位→点赞👍 + 收藏⭐️ +…

人工智能 2023年7月13日
0071
【工具】MATLAB一键转为python

使用的是matlab2python,参考大佬博文【Matlab】一键Matlab代码转python代码详细教程 Github：https://github.com/ebranlar…

人工智能 2023年7月5日
0088
PyTorch 环境的配置及安装

一、安装 Anaconda 及 PyCharm 二、安装 Pytorch 在开始窗格中，打开 Anaconda Prompt，如下图：可以看到，左侧显示一个（base），说明An…

人工智能 2023年7月21日
0079
详细解释：Epoch、batch_size批处理大小、迭代次数之间的关系

Epoch、batch_size批处理大小、迭代次数之间的关系问题：当遇到参数Epoch时，我们应该将其具体设置多少呢？或者应该迭代多少次呢？举例说明问题：当遇到参数Epoc…

人工智能 2023年7月23日
0099
Anaconda+PyCharm创建环境及配置环境

回答1：在下配置pytorch可以按照如下步骤进行： 1. 打开一个新的虚拟，例如命名为”pytorch_env”。 2. 在命令行中使用conda…

人工智能 2023年7月4日
0073
基于注意力机制的 CNN-BiGRU 短期电力负荷预测方法

1、原理 CNN原理，自查。采用的是1维CNN BiGRU原理，自查注意力机制原理： 2，基于CNN-BiGRU-Attention的预测模型 3.实验结果采用如图所示的负荷预…

人工智能 2023年7月13日
0062
ROS从入门到精通9-1：项目实战之智能跟随机器人原理与实现

目录 0 专栏介绍 1 智能跟随机器人的应用 2 构造机器人对象 3 机器人初始化 4 实现跟随 5 效果展示 ; 0 专栏介绍本专栏旨在通过对ROS的系统学习，掌握ROS底层基…

人工智能 2023年6月13日
0088
哈工大提出ISTDU-Net:红外小目标检测U型网络

ISTDU-Net：Infrared Small-Target Detection U-Net(代码已开源) 作者单位：哈尔滨工业大学空间光学工程研究中心论文下载链接：https:…

人工智能 2023年7月9日
00128
【java养成】：I/O（输入/输出操作）——＞File类、字节流、字符流

学习背景：在Java中，将这种通过不同输入输出设备(键盘，内存，显示器，网络等)之间的数据传输抽象表述为”流”，程序允许通过流的方式与输入输出设备进行数据…

人工智能 2023年6月26日
0090
实体识别(1) -实体识别任务简介

命名实体识别概念命名实体识别(Named Entity Recognition,简称NER) , 是指识别文本中具有特定意义的词（实体），主要包括人名、地名、机构名、专有名词等等…

人工智能 2023年6月30日
0078
【实战】基于TFlite实现TensorFlowTTS语音合成

【实战】基于TFlite实现TensorFlowTTS语音合成源码地址：https://github.com/TensorSpeech/TensorFlowTTS 一、配置环境 …

人工智能 2023年5月25日
0066
Python+OpenCv实现图像边缘检测（滑动调节阈值）

Python+OpenCv实现图像边缘检测（滑动调节阈值）前言一、导入模块二、核心代码 * 1.图像预处理 2.滑动调参 3.边缘检测 4.图像保存 5.主函数三、运行结果…

人工智能 2023年7月19日
0061
springboot 技术图谱_springboot2.0+Neo4j+d3.js构建知识图谱

Welcome to the Neo4j wiki! 这是一个知识图谱构建工具,最开始是对产品和领导为了做ppt临时要求配合做图谱展示的不厌其烦,做着做着就抽出一个目前看着还算通用…

人工智能 2023年6月5日
0072

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

单变量线性回归模型（上）

损失函数

优化方法 (梯度下降算法)

大家都在看