机器学习第四章线性回归算法进阶4.5Lasso回归（《大话Python机器学习》学习笔记）

2023年6月18日下午2:30 • 人工智能 • 阅读 194

第四章线性回归算法进阶

4.5Lasso回归

Lasso回归与岭回归类似，差别在于使用了不同的正则化项，由于引入正则项不同，解决了岭回归的一些不足，更好地实现了回顾估计法。

4.5.1Lasso回归原理

Lasso回归是让回归系数不要太大，以免造成过度拟合。
与岭回归不同的是，Lasso是在成本函数J(θ)中增加参数绝对值和的正则项：

机器学习第四章线性回归算法进阶4.5Lasso回归（《大话Python机器学习》学习笔记）

岭回归中加入了参数平方和的约束惩罚项（L2正则化）
Lasso回归中加入了参数绝对值和的约束惩罚项（L1正则化）

等高线图表示残差平方和的等高线。
残差在最小二乘估计出最小。
阴影部分分别是岭回归和Lasso回归的限制区域。
圆形为岭回归的，方形为Lasso回归的。
这两种带有惩罚项的方法都是要找到第一个落到限制区域上的等高线的那个位置的坐标。

; 4.5.2Lasso回归的参数求解

通常采用坐标下降法来求解参数估计值。

4.5.3Lasso回归的Python实现：影厅观影人数的拟合（四）

导入数据、划分数据集

df = pd.read_csv('D:/PythonProject/machine/data/3_film.csv')

X = df.iloc[:,1:4]

y = df.filmnum

X = np.array(X.values)
y = np.array(y.values)

X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.25,random_state=1)

Lasso回归估计

lasso = linear_model.Lasso(alpha=0.1)
lasso.fit(X_train,y_train)
print('截距项为：{}\n系数为：{}'.format(lasso.intercept_,lasso.coef_))

截距项为：4.358584829813829
系数为：[ 0.36999035 -0.03494547 0.22750781]

根据求出的参数对测试集进行预测


y_hat = lasso.predict(X_test)

对测试集响应变量实际值与预测集的比较


plt.figure(figsize=(10,6))

t = np.arange(len(X_test))

plt.plot(t,y_test,'r',linewidth=2,label='y_test')

plt.plot(t,y_hat,'g',linewidth=2,label='y_hat')

plt.legend()
plt.show()

对预测结果进行评价


print('r2_2={}'.format(r2_score(y_test,y_hat)))

print('MAE={}'.format(metrics.mean_absolute_error(y_test,y_hat)))

print('MSE={}'.format(metrics.mean_squared_error(y_test,y_hat)))

print('RMSE={}'.format(np.sqrt(metrics.mean_squared_error(y_test,y_hat))))

r2_2=0.8276541436150417
MAE=4.638494755480021
MSE=46.71582547034623
RMSE=6.834897619595061

Original: https://blog.csdn.net/weixin_45655385/article/details/122438959
Author: BianchiHB
Title: 机器学习第四章线性回归算法进阶4.5Lasso回归（《大话Python机器学习》学习笔记）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/635438/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

用于端到端语音识别的文本数据多任务训练

论文 MULTITASK TRAINING WITH TEXT DATA FOR END-TO-END SPEECH RECOGNITION 摘要论文提出了一种基于注意力的端到端…

人工智能 2023年5月27日
0073
【手把手反内卷】开创全新AI多模态任务一视听分割：代码实践、优化教程（二）

前言理论部分请看上一篇文章：简要概述：我们要知道图像中哪个物体在发声如下视频演示： gif 不能发出声音，大家脑补一下场景中有很多车，只有这辆120在发出声音，所以分割出发出声…

人工智能 2023年7月1日
0083
卷积网络识别猴痘

目录 1.跑通代码 2.代码分析 2.1 2.2 2.3 2.4 2.5 2.6 3.总结 🍨 本文为🔗365天深度学习训练营中的学习记录博客 🍦 参考文章地址： 🔗深度学习10…

人工智能 2023年7月13日
0094
基于pointnet的3D物体分类和分割检测（复现不出来你直接敲我家门）

录前言一.资料下载 1.代码下载 2.数据集下载二.环境配置 1.本文采用设备配置说明 2.虚拟环境配置三.训练部分 1.分类训练部分 2.分割的训练部分四.预测部分 1…

人工智能 2023年5月28日
0084
KNN分类USPS, USI sonar及USI iris

KNN算法简介邻近算法，或者说K近邻(kNN，k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K近邻，就是k k k个最近的邻居的意思，说的…

人工智能 2023年7月2日
0080
智能网联汽车网络安全浅析（下）

本文由李玉峰，陆肖元，曹晨红，李江涛，朱泓艺，孟楠联合创作 1 网络安全威胁与防御技术自动驾驶和联网使汽车变成非常复杂的网络物理系统21,也使攻击者看到了新网络空间的更多攻击面，…

人工智能 2023年6月11日
0098
python 绘制3D图

python 绘制3D图 1.散点图 * 代码输入的数据格式 2.三维表面 surface * 代码输入的数据格式 scatter + surface图形展示 3. 三维瀑布图…

人工智能 2023年7月4日
0069
jupyter notebook安装中文及使用

jupyter notebook 一；下载首先下载jupyter库（pip install jupyter），下载完后，在命令行直接输入jupyter notebook就能进入页…

人工智能 2023年6月26日
0079
Mask RCNN算法详解（总结）

Mask RCNN:目标检测+实例分割作用：可以完成目标分类，目标检测，语义分割，实例分割，人体姿态识别等多种任务。 1.实例分割与语义分割的区别和关系？通常的目标分割是指语义…

人工智能 2023年5月26日
00111
IT-架构师绝对不能错过的-34-技术知识图谱帮你轻松拿下大厂offer

2.3 Java集合图谱 2.4 Java集合类图 2.5 Java List类图 2.6 Java Map类图 2.7 Java Set类图 2.8 Java TCP IP 3 …

人工智能 2023年6月1日
0077
使用折外预测（oof）评估模型的泛化性能和构建集成模型

机器学习算法通常使用例如 kFold等的交叉验证技术来提高模型的准确度。在交叉验证过程中，预测是通过拆分出来的不用于模型训练的测试集进行的。这些预测被称为折外预测（out-of-f…

人工智能 2023年7月17日
0062
多分类loss、softmax loss与交叉熵的关系

0、引子：多分类loss采用的是softmax loss，也可称之为softmax交叉熵loss，这个loss中的q就使用的是模型的softmax输出，它就是用来拟合真正的§编码…

人工智能 2023年7月1日
0078
敏捷.敏捷项目管理第二版.Jim Highsmith

吉姆·海史密斯（Jim HighSmith）是ThoughtWorks的执行顾问。从事IT行业工作的30年间，他先后担任过IT经理人、产品经理、项目经理、咨询顾问和软件开发师。吉…

人工智能 2023年6月26日
0060
2021研电赛获奖作品合集

2021″兆易创新杯”第十六届研究生电子设计竞赛（以下简称”研电赛”）已经结束，在比赛中出现了很多优秀作品，特作为整理获奖情况：全…

人工智能 2023年5月25日
00101
毕业设计大数据全国疫情数据分析与3D可视化 – python 大数据

文章目录 0 前言 1 课题背景 2 实现效果 3 设计原理 4 部分代码 5 最后 0 前言 🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，…

人工智能 2023年7月16日
0071
Ubuntu+CUDA+Pytorch搭建全过程及防踩雷指南

Ubuntu+CUDA+Pytorch搭建全过程及防踩雷指南 Ubuntu + CUDA + Pytorch 搭建全过程及防踩雷指南 * 1. Anaconda环境 2. Nvid…

人工智能 2023年7月23日
0074

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

机器学习第四章线性回归算法进阶4.5Lasso回归（《大话Python机器学习》学习笔记）

4.5Lasso回归

4.5.1Lasso回归原理

; 4.5.2Lasso回归的参数求解

4.5.3Lasso回归的Python实现：影厅观影人数的拟合（四）

大家都在看