机器学习入门（二）—— 单变量线性回归

2023年6月17日下午6:27 • 人工智能 • 阅读 105

入门小菜鸟，希望像做笔记记录自己学的东西，也希望能帮助到同样入门的人，更希望大佬们帮忙纠错啦~侵权立删。

一、符号规定

m: 表示训练集的样本的数量；
x: 表示输入变量（特征量），表示输入的特征；
y: 表示输出变量（目标变量），也就是我们的预测结果；
（x,y）：表示一个训练样本；
（x（i），y（i））：为了表示每个训练样本，我们使用x上标（i）和y上标（i）来表示，表示第i个训练样本，i只是一个索引，表示训练集里面的第i行，并不是x和y的i次方；
h：（hypothesis）假设函数，输入x，输出y，h是一个从x到y的函数映射。

二、线性回归模型（h(x)）

单变量线性回归的模型公式：

三、代价函数

在线性回归中，我们有一个训练集。我们要做的是得出Ɵ0和Ɵ1，使我们得到的假设函数表示的直线尽量的与这些数据点相拟合。但是我们要如何选择Ɵ0和Ɵ1呢？我们的想法是选择能够使h(x)，也就是输入x是我们的预测的值，最接近该样本对应的y值的参数Ɵ0和Ɵ1。

抽象的说：在线性回归问题中，我们要解决的是一个最小化的问题，写出关于Ɵ0和Ɵ1的最小化式子，让h(x)和y之间的差异最小。

代价函数（平方误差函数）公式：

如果没有那个1/2，其实就是方差公式，加上了1/2是为了方便计算

就此，我们的目标转化为

如何求得Ɵ0和Ɵ1是为关键

四、梯度下降

我们来看下面这张图方便待会理解

如果我们想要从A点开始找到最快的J值减少方向（梯度下降方向），就像是想最快速度下山，那可以走图中黑色路径（注：起点不同路径不同）

具体公式

其中:=是赋值，α是学习率（即下山时走一步有多远）

α太小的话步伐太小需要很长的时间才能走下山，α太大的话梯度下降可能会越过最低点，甚至可能无法收敛

梯度下降算法不仅可以最小化线性回归函数J，还可以最小化其他函数。

最小化代价函数不一定要使用梯度下降算法，还有另一种算法——正规方程法（normal equation method），但梯度下降算法更加适用于大的数据集。

对于单变量线性回归，这里应用的思想是最小二乘法。

Original: https://blog.csdn.net/weixin_55073640/article/details/122891996
Author: tt丫
Title: 机器学习入门（二）—— 单变量线性回归

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/631372/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【Python数据分析】数据挖掘建模——分类与预测——回归分析

根据挖掘目标和数据形式可以建立分类与预测、聚类分析、关联规则、时序模型、离群点检测等模型。首先介绍一下分类与预测模型。一、分类预测模型实现过程分类模型主要是预测分类编号，预测模…

人工智能 2023年7月2日
0093
SAS因子分析(proc factor过程和因子旋转以及回归法求因子得分函数)

下表给出的数据是在洛杉矶十二个标准大都市居民统计地区中进行人口调查获得的。它有五个社会经济变量，分别是人口总数(pop) 、居民的教育程度或中等教育的年数(school)、雇佣人总…

人工智能 2023年6月18日
0085
机器学习——二分类、多分类的精确率和召回率

机器学习有很多评估的指标。有了这些指标我们就横向的比较哪些模型的表现更好。我们先从整体上来看看主流的评估指标都有哪些：分类问题评估指标：准确率 – Accuracy 精确率(差…

人工智能 2023年7月3日
00570
TransH 论文笔记

Knowledge Graph Embedding by Translating on Hyperplanes – Abstract – Backgroun…

人工智能 2023年6月1日
0085
Python对CSV文件的一些处理方法(读取数据与数据预处理)

Python对CSV文件的一些处理方法该文将在jupyter notebook平台对已给csv数据进行处理。使用python3.8。用到的库有numpy,pandas,seabo…

人工智能 2023年7月15日
00159
知物由学 | 弱监督语义分割：从图像级标注快进到像素级预测

语义分割，旨在将图像中的所有像素进行分类，一直是计算机视觉图像领域的主要任务之一。在实际应用中，由于能准确地定位到物体所在区域并以像素级的精度排除掉背景的影响，一直是精细化识别、图…

人工智能 2023年6月17日
0056
在keras中使用gpu加速训练模型；安装cuda；cudnn；cudnn_cnn_infer64_8.dll 不在path中；device_lib.list_local_devices无gpu；挂掉

在keras中使用gpu加速训练模型，如何安装cuda，cudnn，解决cudnn_cnn_infer64_8.dll 不在path中，解决device_lib.list_loca…

人工智能 2023年5月25日
0056
最近邻算法（KNN算法）

最近邻算法（K-NearestNeighbor），简称 KNN 算法。一个例子有一句老话叫作 “物以类聚、人以群分”。想象我们在一个特别的社区里，一条清…

人工智能 2023年6月15日
0095
一份热力图可视化代码使用教程

前言特征图可视化与热力图可视化是论文中比较常用的两种可视化方法。上一篇文章《一份可视化特征图的代码》介绍了特征图可视化的代码，本篇将对如何进行热力图可视化做一个使用说明。本文介绍了…

人工智能 2023年5月26日
0084
统计学习导论（ISLR）第四章分类算法课后习题

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月1日
00122
python笔记

知识点：python与：中括号；选取行、选取列；loc与iloc的区别 pd.read_excel()[选取列]pd.read_excel().loc[按索引选取行]pd.read…

人工智能 2023年7月8日
0079
opencv、mediapipe==0.8.9人脸检测项目复现过程中遇到的bug（1）

场景： pycharm+win10+mediapipemediapipe第三方库相关资料学习: https://github.com/google/mediapipe 报错一： T…

人工智能 2023年7月20日
0065
stata基础–回归，画散点图，异质性分析

利用stata的内部数据来进行回归代码： sysuse auto sysuse dir /可以看到所有的数据/ su price mpg foreign reg price mp…

人工智能 2023年6月19日
0085
Python 千猫图，简单技术满足你的收集控

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月15日
0069
基于SPSS的聚类分析原理概述

文章目录 1. 聚类分析的基本概念 * 1.1 方法概述 1.2 聚类方法 2. 系统聚类 * 2.1系统聚类的类型 2.2 两个距离概念 2.3亲疏程度的度量 – 2…

人工智能 2023年7月15日
0058
ubuntu18.04安装ros Melodic吐血整理，有视频有截图 (一个小时安装完成)

我真的是吐了,已经记不清楚这是第几次安装ros melodic了,又浪费一天时间,这次完整整理一遍! 服了b站的必剪了,录到一半直接崩了,只有前半部分的视频,后半部分大家看这个博客…

人工智能 2023年6月1日
0094

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

机器学习入门（二）—— 单变量线性回归

大家都在看