机器学习（七）线性回归

2023年6月17日下午2:09 • 人工智能 • 阅读 71

线性回归

原理
*
回归原理
第一类回归
加权线性回归
岭回归和逐步线形回归

原理

大概就是如图所示，画线的方法有很多种，我们期待这条线具有非常好的泛化，显然绿色的线就有一点过拟合的情况，不符合我们的期待。我们期待的是像黑色的线，能够变现出数据的趋势。

这里作出回归主要有三个种回归

线性回归（基础版
局部加权线形回归
岭回归和逐步线形回归（这种两种比较少用归为一类）

回归原理

常见的基本函数y = k x + b y = kx+b y =k x +b我们会需要计算的参数有k , b k,b k ,b,计算的方法有很多，但是最终化简的结构都差不多的。
这里我们换一个为了书写方便的字母：
h ( x ) = θ 0 + θ 1 x h ( x ) = ∑ i = 0 n θ i x i = θ T x h(x) = \theta_0+\theta_1x \ h(x) = \sum_{i=0}^n\theta_ix_i=\theta^Tx h (x )=θ0 +θ1 x h (x )=i =0 ∑n θi x i =θT x
在现实世界里，我们没有办法保证每个等式都是成立的，就必然会产生一定的误差ε \varepsilon ε，每个等式都会有一定的误差，我们希望整体的误差是最小的。
h ( x ) = ∑ i = 0 n ( θ i x i + ε i ) h(x) = \sum_{i=0}^n(\theta_ix_i+\varepsilon_i)h (x )=i =0 ∑n (θi x i +εi )
在大自然中，事物的发生的概率会趋近于符合均值为0和一个标准的高斯分布。事件与事件都是独立。我们对待一类事件往往是认为他们是独立同分布的（iid），有这样的性质将会大幅度推进计算。
预测值与误差： y i = θ T x i + ε i 由于误差服从高斯分布 ( 均值为 0 ) ： p ( ϵ i ) = 1 2 π σ e x p ( − ϵ i 2 2 σ 2 ) 即 p ( y i ∣ x i , θ ) = 1 2 π σ e x p ( − ( y i − θ T x i ) 2 2 σ 2 ) 预测值与误差： y_i = \theta^Tx_i+\varepsilon_i\ 由于误差服从高斯分布(均值为0)： p(\epsilon_i)=\frac{1}{\sqrt{2\pi}\sigma}exp(-\frac{\epsilon_i^2}{2\sigma^2}) \ 即p(y_i|x_i,\theta) = \frac{1}{\sqrt{2\pi}\sigma}exp(-\frac{(y_i-\theta^Tx_i)^2}{2\sigma^2})预测值与误差：y i =θT x i +εi 由于误差服从高斯分布(均值为0 )：p (ϵi )=2 πσ1 e x p (−2 σ2 ϵi 2 )即p (y i ∣x i ,θ)=2 πσ1 e x p (−2 σ2 (y i −θT x i )2 )
我们希望每一个样本都能够符合这样子的条件，由于样本与样本之间是复合假设：独立同分布。构建似然函数
L ( θ ) = ∏ i = 1 m p ( y i ∣ x i , θ ) = ∏ i = 1 m 1 2 π σ e x p ( − ( y i − θ T x i ) 2 2 σ 2 ) l o g L ( θ ) = m l o g 1 2 π σ − 1 2 σ 2 ∑ i = 1 m l o g ( y i − θ T x i ) 2 即求 : max ⁡ ( J ( θ ) ) = ∑ i = 1 m l o g ( y i − θ T x i ) 2 L(\theta)=\prod_{i=1}^mp(y_i|x_i,\theta)=\prod_{i=1}^m\frac{1}{\sqrt{2\pi}\sigma}exp(-\frac{(y_i-\theta^Tx_i)^2}{2\sigma^2}) \ logL(\theta) =mlog\frac1{\sqrt{2\pi}\sigma}-\frac1{2\sigma^2} \sum_{i=1}^mlog(y_i-\theta^Tx_i)^2\ 即求:\max(J(\theta))= \sum_{i=1}^mlog(y_i-\theta^Tx_i)^2 L (θ)=i =1 ∏m p (y i ∣x i ,θ)=i =1 ∏m 2 πσ1 e x p (−2 σ2 (y i −θT x i )2 )l o g L (θ)=m l o g 2 πσ1 −2 σ2 1 i =1 ∑m l o g (y i −θT x i )2 即求:max (J (θ))=i =1 ∑m l o g (y i −θT x i )2
在求最大最小值可以通过对θ \theta θ进行求导，令导数值为0
▽ L ( θ ) = ▽ ( 1 2 ( X θ − y ) T ( X θ − y ) ) = ▽ ( 1 2 ( θ T X T X θ − θ T X T y − y T X θ + y T y ) ) = 1 2 ( 2 X T X θ − X T y − ( y T X ) T ) = X T X θ − X T y = 0 θ = ( X T X ) − 1 X T y \bigtriangledown L(\theta)=\bigtriangledown(\frac12(X\theta-y)^T(X\theta-y)) \ = \bigtriangledown(\frac12(\theta^TX^TX\theta-\theta^TX^Ty-y^TX\theta+y^Ty)) \ =\frac12(2X^TX\theta-X^Ty-(y^TX)^T)=X^TX\theta-X^Ty=0 \ \theta = (X^TX)^{-1}X^Ty ▽L (θ)=▽(2 1 (X θ−y )T (X θ−y ))=▽(2 1 (θT X T X θ−θT X T y −y T X θ+y T y ))=2 1 (2 X T X θ−X T y −(y T X )T )=X T X θ−X T y =0 θ=(X T X )−1 X T y
这边可以直接用这个结果就求得结果，也可以通过梯度下降的方法进行求解。他们有各自的优势，直接求解有一个前提是X本身是一个满秩的矩阵否则无法进行求逆的操作。梯度下降有一个学习的过程但可以避免进行求逆。

第一类回归

用上面求解的结果直接进行回归，就是最基本的回归，

def standRegression(x,y):
    xTx = x.T@x
    if np.linalg.det(xTx) == 0:
        print('this matrix can not do inverse')
        return
    else:
        return np.array(np.mat(xTx).I@(x.T@y))
w = standRegression(x,y)[0]
x_ = np.linspace(0,1,50)
y_ = w[0] + w[1]*x_
plt.xlabel('x')
plt.ylabel('y')
plt.plot(x_,y_,'r-')
sns.scatterplot(data[1],data[2])

我们通过一元的回归可以很明显的看出回归的趋势，但没有办法拟合出细节的内容，有时候我们需要关注局部的细节。为了解决这样的问题可以对需要关注的数据进行加权回归。

加权线性回归

θ = ( X T X ) − 1 X T W y \theta = (X^TX)^{-1}X^TWy θ=(X T X )−1 X T W y
可以通过跟这个点的附近点权重高一些，就会更关注附近点点。权重是人为规定，一种比较好用的方法是高斯加权法。
w ( i , i ) = e x p ( ∣ x i − x ∣ − 2 k 2 ) w(i,i)=exp(\frac{|x_i-x|}{-2k^2})w (i ,i )=e x p (−2 k 2 ∣x i −x ∣)
k是来修改辐射范围，

k值越大给离越远的数据权重越高。k越小就越关注局部的点。

def lwlr(testPoint, x, y, k=0.1):
    m = x.shape[0]
    weight = np.eye(m)
    for j in range(m):
        diff = testPoint - x[j,:]
        weight[j,j] = np.exp(diff@diff.T/(-2.0*k**2))
    xTx = x.T@(weight@x)
    if np.linalg.det(xTx) == 0:
        print('matrax can not be inverse')
        return
    else:
        ws = np.mat(xTx).I@(x.T@(weight@y))
        #print(weight)
        return testPoint@ws[0].T
def lwlrTest(test,x,y,k=0.1):
    m = test.shape[0]
    yhat = np.zeros(m)
    for i in range(m):
        yhat[i] = np.array(lwlr(test[i],x,y,k)).reshape(-1)
    return yhat
x_ = np.linspace(0,1,50)
x_ = np.concatenate((np.ones(50).reshape(-1,1),x_.reshape(-1,1)),axis=1)
y_ = lwlrTest(x_,x,y,0.03)
plt.plot(x_[:,1],y_,'r')
sns.scatterplot(x[:,1],y)

当k=1时，

岭回归和逐步线形回归

其中逐步线形回归的方法和梯度下降类似。
岭回归主要是解决数据特征的个数高于数据本身，导致数据无法求逆，可以通过加入对角矩阵来解决无法求逆的问题
( X T X + λ ) − 1 X T y (X^TX+\lambda)^{-1}X^Ty (X T X +λ)−1 X T y
实际应用中还是可以通过降维的方法来解决。

Original: https://blog.csdn.net/qq_41752952/article/details/123810240
Author: Tensor_Boy
Title: 机器学习（七）线性回归

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/630347/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

NLP中P,R,F1,acc含义以及怎么求

TP: Ture Positive 把正的判断为正的数目。FN: False Negative 把正的错判为负的数目。FP: False Positive 把负的错判为正的数目。T…

人工智能 2023年7月2日
0078
np.random.seed()随机数种子学习笔记

文章目录 np.random.seed()随机数种子 * 为什么使用np.random.seed() 什么是np.random.seed() 代码理解 np.random.seed…

人工智能 2023年6月3日
00116
Python实现带GUI界面的手写数字识别

更多python教程请到友情连接：菜鸟教程https://www.piaodoo.com 初中毕业读什么技校 http://cntkd.net 茂名一技http://www.en…

人工智能 2023年7月1日
0089
中成药数据图谱可视化与知识问答平台研究

摘要中成药数据具有数量庞大、关系复杂等特点，如何对种类繁多的中成药临床、流通与标准规范数据进行有效存储、管理、跟踪与使用成为药品监管部门关注的重点。为实现中成药知识整合、提高数据…

人工智能 2023年6月10日
0083
TensorFlow1.13.1安装指南

TensorFlow1.13.1安装指南现在TensorFlow已经更新到2.8版本了，心血来潮想安装个旧版本的TensorFlow发现会出现各种bug，开篇博客集中记录一下。问…

人工智能 2023年5月23日
0086
MATLAB实验四：MATLAB数据分析

导入指定文件，并对学生成绩进行分析（记录你的指令和结果）说明：本题请先将实验素材提供的成绩单文件s coresheet.xlsx 的数据导入到matlab中，再完成后面的问题。…

人工智能 2023年7月15日
0075
机器学习（六）logistic 回归算法

文章目录 * – Log* 一、分类问题（Classification problems）* – 1. 分类问题的例子 – 2. 正类和负类 &…

人工智能 2023年6月18日
0078
语法纠错数据生成方法

语法纠错属于句子级的校对，需要检测并纠正句子中的错误，其中语法纠错目前已经公开的数据量不多，而现在解决语法纠错的问题主要是采用深度学习的模型，这些深度学习的模型需要大量的训练数据，…

人工智能 2023年5月30日
0083
Kmeans 聚类算法

KMeans 典型的划分聚类划分聚类划分聚类使用场景 KMeans算法属于无监督学习，解决聚类的问题对于数据集D，不需提供数据标记，大大减少工作量数据集D必须是凸集…

人工智能 2023年6月2日
0072
【数据挖掘大作业】基于决策树的评教指标筛选（weka+数据+报告+操作步骤）

数据挖掘大作业下载链接：【数据挖掘大作业】基于决策树的评教指标筛选（weka使用手册+数据+实验报告）一、考核内容现有某高校评教数据(pjsj.xls)，共计842门课程，属…

人工智能 2023年7月17日
0057
目标检测笔记——基于win10实现用darknet-yolov4结合opencv用C++实现实时检测

所需环境：环境 win10 VS2017 opencv4.5.4 算法darkmet-yolov4 https://github.com/AlexeyAB/darknet 进入目录…

人工智能 2023年7月9日
0059
手把手教你用pytorch实现k折交叉验证，解决类别不平衡

在用深度学习做分类的时候，常常需要进行交叉验证，目前pytorch没有通用的一套代码来实现这个功能。可以借助 sklearn中的 StratifiedKFold，KFold来实现，…

人工智能 2023年6月16日
0089
YOLOv5网络结构完全解读【源码+手绘网络结构+模块结构】

🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀YOLOv5网络结构详解 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 🚀 …

人工智能 2023年6月16日
0081
tensorflow的安装

首先提供一个CPU的版本对应图：其他的可以参考网址https://www.icode9.com/content-4-841102.html 这里我选择安装1.12版本的。打开An…

人工智能 2023年5月25日
0080
【强化学习】深入浅出强化学习–机器人找金币

定义和初始化首先自定义环境，自定义的环境将继承 gym.env环境。在初始化的时候，可以指定环境支持的渲染模式（例如 human, rgb_array, ansi)以及渲染环境的…

人工智能 2023年6月30日
0080
《Java》private、protected、public区别及解析

我们今天来给大家解析一下Java中四种修饰类型的区别。那么有的老铁就疑惑了，文章名称不是说三种吗？其实还有一种隐藏的修饰类型（默认类型）英文翻译过来的话是defult，这就是我们什…

人工智能 2023年6月27日
0085

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

机器学习（七） 线性回归