岭回归与Lasso回归

2023年6月18日上午9:49 • 人工智能 • 阅读 92

岭回归与Lasso回归

为什么引入岭回归

传统的多元线性回归可能存在多重共线性，岭回归可以看作是传统多元线性回归的升级版，可以打破多重共线性的限制。

和多元线性回归相似，岭回归的参数估计也是采用OLS（极大似然估计）原理

多元线性回归的参数估计：
β ^ = a r g min ⁡ β ^ ∑ i = 1 n ( y i − x i ′ β ^ ) 2 \hat{\beta}=\mathrm{arg}\min_{\hat{\beta}}\sum_{i=1}^n(y_i-x_i^{\prime}\hat{\beta})^2 β^=arg β^min i =1 ∑n (y i −x i ′β^)2
其中，
β ^ = ( β 1 ^ , β 2 ^ , ⋯ , β k ^ ) ′ \hat{\beta}=(\hat{\beta_1},\hat{\beta_2},\cdots,\hat{\beta_k})^{\prime}β^=(β1 ^,β2 ^,⋯,βk ^)′
岭回归的参数估计：
β ^ = a r g min ⁡ β ^ ∑ i = 1 n ( y i − x i ′ β ^ ) 2 + λ ∑ i = 1 n β i 2 ^ = a r g min ⁡ β ^ ∑ i = 1 n ( Y − X ′ β ^ ) ′ ( Y − X ′ β ^ ) + λ ∑ i = 1 n β ′ ^ β ^ \hat{\beta}=\mathrm{arg}\min_{\hat{\beta}}\sum_{i=1}^n(y_i-x_i^{\prime}\hat{\beta})^2+\lambda\sum_{i=1}^n\hat{\beta_i^2}\\qquad\qquad\qquad=\mathrm{arg}\min_{\hat{\beta}}\sum_{i=1}^n(Y-X^{\prime}\hat{\beta})^{\prime}(Y-X^{\prime}\hat{\beta})+\lambda\sum_{i=1}^n\hat{\beta^{\prime}}\hat{\beta}β^=arg β^min i =1 ∑n (y i −x i ′β^)2 +λi =1 ∑n βi 2 ^=arg β^min i =1 ∑n (Y −X ′β^)′(Y −X ′β^)+λi =1 ∑n β′^β^
可以得出，λ → 0 \lambda\to0 λ→0时，岭回归趋近于多元线性回归，λ → ∞ \lambda\to\infty λ→∞时，β ^ → 0 k × 1 \hat{\beta}\to0_{k\times 1}β^→0 k ×1

后面，有了理论推导，我们就知道，岭回归可以破除多重共线性的限制。

岭回归的理论推导

这里需要几个对向量求导的法则，这不需要大家掌握，只是为了方便推导

向量x的求导公式：
{ ∂ A X ∂ X = A T ∂ X T A X ∂ X = ( A + A T ) X \begin{cases}\frac{\partial AX}{\partial X}=A^T\\frac{\partial X^TAX}{\partial X}=(A+A^T)X\end{cases}{∂X ∂A X =A T ∂X ∂X T A X =(A +A T )X

令L = a r g min ⁡ β ^ ∑ i = 1 n ( Y − X ′ β ^ ) ′ ( Y − X ′ β ^ ) + λ ∑ i = 1 n β ′ ^ β ^ L=\mathrm{arg}\min_{\hat{\beta}}\sum_{i=1}^n(Y-X^{\prime}\hat{\beta})^{\prime}(Y-X^{\prime}\hat{\beta})+\lambda\sum_{i=1}^n\hat{\beta^{\prime}}\hat{\beta}L =arg min β^∑i =1 n (Y −X ′β^)′(Y −X ′β^)+λ∑i =1 n β′^β^

则∂ L ∂ β ^ = − 2 X ′ Y + 2 X ′ X β ^ + 2 λ β ^ = 0 \frac{\partial L}{\partial \hat{\beta}}=-2X^{\prime}Y+2X^{\prime}X\hat{\beta}+2\lambda\hat{\beta}=0 ∂β^∂L =−2 X ′Y +2 X ′X β^+2 λβ^=0得出( X ′ X + λ I ) β ^ = X ′ Y (X^{\prime}X+\lambda I)\hat{\beta}=X^{\prime}Y (X ′X +λI )β^=X ′Y

由于X ′ X X^{\prime}X X ′X半正定，则X ′ X X^{\prime}X X ′X的特征值均为非负数，加上λ I \lambda I λI后，X ′ X + λ I X^{\prime}X+\lambda I X ′X +λI的特征值均为正数，所以
β ^ = ( X ′ X + λ I ) − 1 X ′ Y ( λ > 0 ) \hat{\beta}=(X^{\prime}X+\lambda I)^{-1}X^{\prime}Y\quad(\lambda>0)β^=(X ′X +λI )−1 X ′Y (λ>0 )

我们可以通过下面几种方法选择λ \lambda λ

岭迹分析

岭迹：λ \lambda λ从0到+ ∞ +\infty +∞变化，得到的β ^ = ( β 1 ^ , β 2 ^ , ⋯ , β k ^ ) ′ \hat{\beta}=(\hat{\beta_1},\hat{\beta_2},\cdots,\hat{\beta_k})^{\prime}β^=(β1 ^,β2 ^,⋯,βk ^)′中每个分量的变化曲线

这是我用Matlab跑出来的一个岭迹

岭迹法选择λ \lambda λ的一般原则是：
(1)各回归系数的岭估计基本稳定
(2)用最小二乘估计时符号不合理的回归系数，其岭估计的符号变得合理
(3)回归系数没有不合乎经济意义的绝对值
(4)残差平方和增大不太多

可以选择λ = 50 \lambda=50 λ=50

; VIF法（方差膨胀因子）

VIF是方差膨胀因子，定义如下

假设现在有k k k个自变量，那么第m m m个自变量的V I F m VIF_m V I F m 定义为
V I F m = 1 1 − R 1 ∼ k \ m VIF_m=\frac{1}{1-R_{1\sim k\backslash m}}V I F m =1 −R 1 ∼k \m 1
其中，R 1 s i m k \ m R_{1\sim k\backslash m}R 1 s imk \m 是将第m m m个自变量作为因变量，对剩下的k − 1 k-1 k −1个自变量回归得到的拟合优度，V I F m VIF_m V I F m 越大。说明第m m m个变量和其他k − 1 k-1 k −1个自变量相关性越强

回归模型的V I F VIF V I F定义为
V I F = max ⁡ { V I F 1 , V I F 2 , ⋯ , V I F k } VIF=\max {VIF_1,VIF_2,\cdots,VIF_k}V I F =max {V I F 1 ,V I F 2 ,⋯,V I F k }
如果V I F > 10 VIF>10 V I F >10，可以认为存在多重共线性

可以不断增加λ \lambda λ，直到所有的β ^ < 0 \hat{\beta}

可以使用stata计算VIF

例1：对下列数据进行多元回归，检验多重共线性

年份单产种子费化肥费农药费机械费灌溉费19901017106.05495.15305.145.956.119911036.5113.55561.45343.868.5593.31992792104.55584.8541473.2104.551993861132.75658.35453.7582.95107.551994901.5174.3904.05625.05114152.11995922.5230.41248.75834.45143.85176.41996916.5238.21361.55720.75165.15194.251997976.5260.11337.4727.65201.9291.7519981024.5270.61195.8775.5220.5271.3519991003.5286.21171.8610.95195284.5520001069.5282.91151.55599.85190.65277.3520011168.5317.851105.8553.8211.05290.120021228.5319.651213.05513.75231.6324.1520031023368.41274.1567.45239.85331.820041144.5466.21527.9487.35408336.1520051122449.851703.25555.15402.3358.820061276.55371888.5637.2480.75428.420071233565.52009.85715.65562.05456.9

先导入数据

需要勾选”将第一行作为变量名”

进行多元线性回归可以输入语句

reg &#x5355;&#x4EA7; &#x79CD;&#x5B50;&#x8D39; &#x5316;&#x80A5;&#x8D39; &#x519C;&#x836F;&#x8D39; &#x673A;&#x68B0;&#x8D39; &#x704C;&#x6E89;&#x8D39;

在回归完成后输入下列语句

estat vif

结果如下

VIF=68.23，说明多重共线性比较严重，需要剔除变量种子费，再继续回归。直到无多重共线性为止。

岭回归的Matlab实现

例2：对下列数据进行分析

序号需求量本品价格竞品价格平均收入水平广告投入1128906569.224343.17117021285065.970.674347.591162.2631318065.474.774356.441164.0641378565.34754369.711193.1351388066754387.41241.556126806977.294409.511254.157132906979.064436.051149.5781349869.2581.374467.011200.0691198074.56844502.41220.410120857891.614542.21082.7

data=[12890 65.00   69.22   4343.17 1170.00
12850   65.90   70.67   4347.59 1162.26
13180   65.40   74.77   4356.44 1164.06
13785   65.34   75.00   4369.71 1193.13
13880   66.00   75.00   4387.40 1241.55
12680   69.00   77.29   4409.51 1254.15
13290   69.00   79.06   4436.05 1149.57
13498   69.25   81.37   4467.01 1200.06
11980   74.56   84.00   4502.40 1220.40
12085   78.00   91.61   4542.20 1082.70];%数据矩阵

Y=data(:,1);%因变量组成的向量
[size_n,~]=size(data);%size_n表示样本容量
X=[ones(size_n,1),data(:,2:5)];%自变量矩阵左侧拼接全是1的向量
corr=corrcoef(data);%计算相关系数矩阵
Xtag={'需求量','本品价格','竞品价格','平均收入水平','广告投入'};
figure
heatmap(Xtag,Xtag,corr)%绘制相关系数热力图
beta=[];
[~,size_x]=size(X);
One_sq=linspace(0,100,1001);
for lambda=0:0.1:100
    betanew=(X'*X+lambda*eye(size_x))^(-1)*X'*Y;
    beta=[beta,betanew];%对每一个lambda，计算其回归系数
end
figure
for j=2:size_x
    plot(One_sq,beta(j,:))%绘制岭迹图
    hold on
end
legend(['\beta_' num2str(1)],['\beta_' num2str(2)],['\beta_' num2str(3)],['\beta_' num2str(4)])
title('岭迹分析')
xlabel('\lambda')
ylabel('\beta')

运行结果

可以发现，竞品价格与本品价格之间相关性较强，竞品价格与平均收入水平之间相关性较强，平均收入水平与本品价格之间相关性较强。存在多重共线性，应该使用岭回归。
岭回归与Lasso回归

λ = 50 \lambda=50 λ=50时，y = 0.1992 − 107.1376 x 1 − 19.3472 x 2 + 4.4527 x 3 + 1.8729 x 4 y=0.1992-107.1376x_1-19.3472x_2+4.4527x_3+1.8729x_4 y =0.1992 −107.1376 x 1 −19.3472 x 2 +4.4527 x 3 +1.8729 x 4

逐步回归的进化——Lasso回归

Lasso回归的参数估计
β ^ = a r g min ⁡ β ^ ∑ i = 1 n ( y i − x i ′ β ^ ) 2 + λ ∑ i = 1 n ∣ β i ∣ ^ \hat{\beta}=\mathrm{arg}\min_{\hat{\beta}}\sum_{i=1}^n(y_i-x_i^{\prime}\hat{\beta})^2+\lambda\sum_{i=1}^n\hat{|\beta_i|}β^=arg β^min i =1 ∑n (y i −x i ′β^)2 +λi =1 ∑n ∣βi ∣^

与岭回归相比，Lasso回归的出现也是为了克服多重共线性，最大的优点是可以把不重要的变量回归系数压缩到0，而岭回归的任何回归系数都不会压缩到0，这比较像升级版的逐步回归。

Lasso回归的stata实现

这里用的数据还是例1的数据

先在stata的命令行内输入命令

findit lassopack

选择蓝色链接 lassopack from……

点击click here to install

第一步导入Excel数据

需要勾选”将第一行作为变量名”

输入下列内容

cvlasso 单产 种子费 化肥费 农药费 机械费 灌溉费,lopt seed(520)

tip:可以在变量窗口双击变量名，快速把变量输入到命令窗口

运行结果如下

这说明，除了种子费，农药费，灌溉费，其他的变量均为引起多重共线性的变量，被剔除

我们的回归得出的模型如下：
y = 956.8974544 + 0.3205122 x 1 − 0.3173749 x 3 + 0.6905996 x 5 y=956.8974544+0.3205122x_1-0.3173749x_3+0.6905996x_5 y =956.8974544 +0.3205122 x 1 −0.3173749 x 3 +0.6905996 x 5

Original: https://blog.csdn.net/C1172440795/article/details/126151963
Author: Logistic..
Title: 岭回归与Lasso回归

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/634447/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

聚类案例分析全流程汇总

一、案例说明 1.案例背景研究调查10名运动员的3项测试数据，其中三项分别是：肩宽/髋宽×100、胸厚/胸围×100、腿长/身长×100。其中编号为4、6、8、9的4名运动员分别…

人工智能 2023年5月31日
0077
Win10+Python3.9+GPU版pytorch环境搭建最简流程

大家好，我是Mr数据杨。今天要谈的是如何指挥Python和Pytorch的”三国”军队，一同开疆辟土。需要最先确定”君主”也就是P…

人工智能 2023年7月22日
0068
【1】使用分类学习APP – Classification Learner App 训练分类模型

什么是有监督学习？你可以使用分类学习器训练模型来对数据进行分类。使用这个APP时，你可以通过使用各种分类模型来探索监督机器学习。你可以浏览数据、选择特征、指定验证方案、训练模型和…

人工智能 2023年7月3日
0086
第24天 | 28天学会PyQt5，高级控件之QTableView

高级组件不是说这个组件有多”高级”的意思，而是表示功能强大的意思。如要实现一个功能完整的表格功能，可能需要花上好几天，编写好多代码才能实现，而直接调用wx….

人工智能 2023年7月16日
00163
深度强化学习主流算法介绍（二）：DPG系列

之前的文章可以看这里深度强化学习主流算法介绍（一）：DQN系列相关论文在这里开始介绍DPG之前，先回顾下DQN系列 DQN直接训练一个Q Network 去估计每个离散动作的…

人工智能 2023年7月13日
0051
js中ECharts的显示相关、动画、交互API、Koa2

文章目录 * – 一、显示相关 – + 1.1主题的使用 + 1.2调色盘和颜色渐变 + 1.3样式 + 1.4图表自适应 – 二、动画的使用 …

人工智能 2023年6月27日
0071
python:matplotlib.pyplot绘制箱线图并检测异常值(基础一)

在数据处理中，箱线图常用来检测异常值。数据文件data01.xls 1.绘制箱线图使用boxplot()函数 import pandas as pd import matplot…

人工智能 2023年6月13日
0064
Informer源码分析

首先是数据准备阶段的入口函数，位于Exp_Informer类的train函数内 train_data, train_loader = self._get_data(flag = ‘…

人工智能 2023年6月15日
0068
Python安装Pandas库

方法一：cmd命令行执行pip install pandas1.Windows+R，输入cmd打开命令行窗口，输入pip install pandas。如下图所示2.若出现下图所示…

人工智能 2023年7月4日
0073
基于Python实现五大常用分类算法(原理+代码)

读：在机器学习和统计中，分类算法通过对已知类别训练集的计算和分析，从中发现类别规则并预测新数据的类别。分类被认为是监督学习的一个实例，即学习可以获得正确识别的观察的训练集的情况。…

人工智能 2023年7月26日
0074
齿轮轴承缺陷检测

缺陷检测系列采用深度学习方法解决齿轮和轴承图像的缺陷检测和分类问题。 [En] The depth learning method is used to solve the pr…

人工智能 2023年5月25日
0085
【OpenCV学习】（九）目标识别之车辆检测与计数

【OpenCV学习】（九）目标识别之车辆检测及计数背景本篇将具体介绍一个实际应用项目——车辆检测及计数，在交通安全中是很重要的一项计数；当然，本次完全采用OpenCV进行实现，…

人工智能 2023年7月19日
00145
tensorflow详细安装教程（Win10, Anaconda，Python3.9）

安装默认版本的tensorflow-cpu或者tensorflow-gpu。没有配置cuda，安装tensorflow-cpu版本的，可以输入命令：pip install &#8…

人工智能 2023年6月16日
0078
【2DWT：2维离散小波变换（附Pytorch代码）】

二维离散小波变换一、相关基础 * 1.小波变换基础函数 2.小波变换二、原理三、基本小波基：哈尔小波四、代码实现参考：图像信号具有非平稳特性，无法使用一种确定的数学模型…

人工智能 2023年7月21日
0063
图像处理：Hough变换原理分析

第1章 Visual C++与数字图像处理 1 1.1 数字图像处理_概述 2 1.1.1 图像与数字图像 2 1.1.2 数字 _图像处理_研究的内容 4 1.1.3 数字 …

人工智能 2023年7月19日
0070
吴恩达机器学习课后作业Python实现(三)：多类分类与前馈神经网络

目录多类分类数据集数据可视化正则化逻辑回归正则化代价函数正则化梯度 One-vs-all分类 One-vs-all预测前馈神经网络模型表示模型搭建前馈传播与预测…

人工智能 2023年7月14日
0069

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

岭回归与Lasso回归

为什么引入岭回归

岭回归的理论推导

岭迹分析

; VIF法（方差膨胀因子）

岭回归的Matlab实现

逐步回归的进化——Lasso回归

Lasso回归的stata实现

大家都在看