5 线性回归

2023年7月17日上午12:08 • 人工智能 • 阅读 43

from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split

&#x5BFC;&#x5165;load_boston&#x6570;&#x636E;&#xFF0C;&#x6CE2;&#x58EB;&#x987F;&#x623F;&#x4EF7;&#x6570;&#x636E;
boston = load_boston()
x = boston['data']
y = boston['target']
names = boston['feature_names']
&#x5C06;&#x6570;&#x636E;&#x5212;&#x5206;&#x4E3A;&#x8BAD;&#x7EC3;&#x96C6;&#x548C;&#x6D4B;&#x8BD5;&#x96C6;
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2,random_state=22)
print('x_train&#x524D;3&#x884C;&#x6570;&#x636E;&#x4E3A;&#xFF1A;', x_train[0: 3], '\n','y_train&#x524D;3&#x4E2A;&#x6570;&#x636E;&#x4E3A;&#xFF1A;', y_train[0: 3])

x_train前3行数据为： [[2.24236e+00 0.00000e+00 1.95800e+01 0.00000e+00 6.05000e-01 5.85400e+00
  9.18000e+01 2.42200e+00 5.00000e+00 4.03000e+02 1.47000e+01 3.95110e+02
  1.16400e+01]
 [2.61690e-01 0.00000e+00 9.90000e+00 0.00000e+00 5.44000e-01 6.02300e+00
  9.04000e+01 2.83400e+00 4.00000e+00 3.04000e+02 1.84000e+01 3.96300e+02
  1.17200e+01]
 [6.89900e-02 0.00000e+00 2.56500e+01 0.00000e+00 5.81000e-01 5.87000e+00
  6.97000e+01 2.25770e+00 2.00000e+00 1.88000e+02 1.91000e+01 3.89150e+02
  1.43700e+01]]
 y_train前3个数据为： [22.7 19.4 22. ]

&#x4F7F;&#x7528;LinearRegression&#x7C7B;&#x6784;&#x5EFA;&#x7EBF;&#x6027;&#x56DE;&#x5F52;&#x6A21;&#x578B;
from sklearn.linear_model import LinearRegression
lr_model = LinearRegression()
&#x8BAD;&#x7EC3;&#x6A21;&#x578B;
lr_model.fit(x_train, y_train)

print('LinearRegression&#x6A21;&#x578B;&#x4E2D;&#x5404;&#x7279;&#x5F81;&#x7CFB;&#x6570;&#x4E3A;&#xFF1A;\n', lr_model.coef_)
print('LinearRegression&#x6A21;&#x578B;&#x4E2D;&#x622A;&#x8DDD;&#x4E3A;&#xFF1A;', lr_model.intercept_)

LinearRegression模型中各特征系数为：
 [-1.01199845e-01  4.67962110e-02 -2.06902678e-02  3.58072311e+00
 -1.71288922e+01  3.92207267e+00 -5.67997339e-03 -1.54862273e+00
  2.97156958e-01 -1.00709587e-02 -7.78761318e-01  9.87125185e-03
 -5.25319199e-01]
LinearRegression模型中截距为： 32.428252866991016

print('&#x9884;&#x6D4B;&#x6D4B;&#x8BD5;&#x96C6;&#x524D;5&#x4E2A;&#x7ED3;&#x679C;&#x4E3A;&#xFF1A;\n', lr_model.predict(x_test)[: 5])
print('&#x6D4B;&#x8BD5;&#x96C6;&#x5F97;&#x5206;&#x4E3A;&#xFF1A;', lr_model.score(x_test, y_test))

预测测试集前5个结果为：
 [27.99617259 31.37458822 21.16274236 32.97684211 19.85350998]
测试集得分为： 0.7657465943591124

#&#x5CAD;&#x56DE;&#x5F52;
from sklearn.linear_model import Ridge
ridge_model = Ridge()
ridge_model.fit(x_train, y_train)

#print('&#x8BAD;&#x7EC3;&#x51FA;&#x6765;&#x7684;ridge&#x6A21;&#x578B;&#x4E3A;&#xFF1A;\n', ridge_model)
#print('&#x8FED;&#x4EE3;&#x6B21;&#x6570;&#x4E3A;&#xFF1A;', ridge_model.n_iter_)

print('Ridge&#x6A21;&#x578B;&#x4E2D;&#x5404;&#x7279;&#x5F81;&#x7CFB;&#x6570;&#x4E3A;&#xFF1A;\n', ridge_model.coef_)
print('Ridge&#x6A21;&#x578B;&#x4E2D;&#x622A;&#x8DDD;&#x4E3A;&#xFF1A;', ridge_model.intercept_)

Ridge模型中各特征系数为：
 [-0.09480494  0.04771602 -0.05491252  3.31822206 -9.58446843  3.96702534
 -0.01214016 -1.44131977  0.27969468 -0.01070112 -0.69650831  0.01024209
 -0.53636964]
Ridge模型中截距为： 27.28471754760631

print('&#x9884;&#x6D4B;&#x6D4B;&#x8BD5;&#x96C6;&#x524D;5&#x4E2A;&#x7ED3;&#x679C;&#x4E3A;&#xFF1A;\n', ridge_model.predict(x_test)[: 5])
print('&#x6D4B;&#x8BD5;&#x96C6;&#x5F97;&#x5206;&#x4E3A;&#xFF1A;', ridge_model.score(x_test, y_test))

预测测试集前5个结果为：
 [28.34867714 31.24127881 21.57471674 32.47910016 20.12179682]
测试集得分为： 0.7630850497410888

#Lasso&#x56DE;&#x5F52;
from sklearn.linear_model import Lasso
lasso_model = Lasso(alpha=5)
lasso_model.fit(x_train, y_train)

#print('&#x8BAD;&#x7EC3;&#x51FA;&#x6765;&#x7684;Lasso&#x6A21;&#x578B;&#x4E3A;&#xFF1A;\n', lasso_model)
#print('scipy.sparse matrix&#x4E3A;&#xFF1A;\n', lasso_model.sparse_coef_)

print('Lasso&#x6A21;&#x578B;&#x4E2D;&#x5404;&#x7279;&#x5F81;&#x7CFB;&#x6570;&#x4E3A;&#xFF1A;\n', lasso_model.coef_)
print('Lasso&#x6A21;&#x578B;&#x4E2D;&#x622A;&#x8DDD;&#x4E3A;&#xFF1A;', lasso_model.intercept_)

Lasso模型中各特征系数为：
 [-0.          0.02579275 -0.          0.          0.          0.

  0.01073689 -0.          0.         -0.00508254 -0.          0.00579759
 -0.74030877]
Lasso模型中截距为： 30.908571385880304

print('&#x9884;&#x6D4B;&#x6D4B;&#x8BD5;&#x96C6;&#x524D;5&#x4E2A;&#x7ED3;&#x679C;&#x4E3A;&#xFF1A;\n', lasso_model.predict(x_test)[: 5])
print('&#x6D4B;&#x8BD5;&#x96C6;&#x5F97;&#x5206;&#x4E3A;&#xFF1A;', lasso_model.score(x_test, y_test))
#print('&#x6D4B;&#x8BD5;&#x96C6;&#x5F39;&#x6027;&#x7F51;&#x7EDC;&#x8DEF;&#x5F84;&#x4E3A;&#xFF1A;\n', lasso_model.path(x_test, y_test))

预测测试集前5个结果为：
 [28.62381554 27.34844922 21.61895603 25.09454176 23.13495752]
测试集得分为： 0.5539853847862071

y_pred1 = lr_model.predict(x_test)
y_pred2 = ridge_model.predict(x_test)
y_pred3 = lasso_model.predict(x_test)

fig = plt.figure(figsize=(10, 8))
ax1 = fig.add_subplot(311)
ax1.set_title("&#x7EBF;&#x6027;&#x56DE;&#x5F52;")
ax1.plot(range(y_test.shape[0]), y_test, label="&#x771F;&#x5B9E;&#x503C;",)
ax1.plot(range(y_test.shape[0]), y_pred1, label="&#x7EBF;&#x6027;&#x56DE;&#x5F52;",)
ax1.legend()

ax2 = fig.add_subplot(312)
ax2.set_title("&#x5CAD;&#x56DE;&#x5F52;")
ax2.plot(range(y_test.shape[0]), y_test, label="&#x771F;&#x5B9E;&#x503C;",)
ax2.plot(range(y_test.shape[0]), y_pred2, label="&#x5CAD;&#x56DE;&#x5F52;",)
ax2.legend()

ax3 = fig.add_subplot(313)
ax3.set_title("Lasso&#x56DE;&#x5F52;")
ax3.plot(range(y_test.shape[0]), y_test, label="&#x771F;&#x5B9E;&#x503C;",)
ax3.plot(range(y_test.shape[0]), y_pred3, label="Lasso&#x56DE;&#x5F52;",)
ax3.legend()

plt.show()

Original: https://blog.csdn.net/lesdiables/article/details/124593814
Author: lesdiables
Title: 5 线性回归

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/697500/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【目标检测】《DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection》论文阅读笔记

计划：这周阅读本论文。 DINO是DETR with Improved deNoising anchOr boxes这几个单词的缩写，意思是提高降噪锚框的DETR。DINO通过使用…

人工智能 2023年7月9日
0085
pytorch中model.parameters()和model.state_dict()使用时的区别

联邦学习模拟实验中涉及模型参数的聚合和广播，需要提取模型参数。这个时候一般有两个选择，model.parameters() 和 model.state.dict()。表面上看这两者…

人工智能 2023年6月25日
0091
NLP项目实践——中文序列标注Flat Lattice代码解读、运行与使用

NLP项目实践——中文序列标注Flat Lattice代码解读与使用 1. 原文与项目地址 * 1.1 原文 1.2 项目 2. 运行环境 3. 项目结构 4. 参数介绍 * 4….

人工智能 2023年5月27日
00142
外设测试 – 音频测试 – LINE IN – MIC IN – LINE OUT – PHONE OUT

本项测试针对音频接口的 LINE IN、LINE OUT、MIC IN、PHONE OUT。内部 IN 到 OUT 的循环，采用先录音然后播放的方式实现。使用到 arecord、a…

人工智能 2023年5月27日
0075
关于使用pytorch机器学习中出现expected scalar type Float but found Byte问题的解决

本人才疏学浅，在使用pytorch尝试解决图像处理问题时，弹出了如下得报错。经过报错地址得提示，最后将问题锁定在 def forward(self,x): 这一函数上，其中值x作…

人工智能 2023年7月23日
0084
Opencv学习笔记（一）

1、cv::cvtColor()用于将图像从一个颜色空间转换到另一个颜色空间的转换（目前常见的颜色空间均支持），并且在转换的过程中能够保证数据的类型不变，即转换后的图像的数据类型和…

人工智能 2023年6月22日
0055
Sarsa算法和Q-learning算法

1、马尔可夫决策过程(MDP)四元组马尔可夫四元组 s：state 状态a：action 动作r：reward 奖励p：policy 状态转移概率 p ( s t + 1 , r…

人工智能 2023年6月25日
0080
CentOS7 硬盘扩容

文章目录 CentOS7 硬盘扩容 * 查看分区信息创建新分区创建物理卷 – 查看物理卷 lsblk命令再次查看创建新的物理卷查看物理卷新分区添加到根目录分区…

人工智能 2023年6月30日
0068
解决pycharm安装深度学习pytorch的d2l包失败问题

解决pycharm安装深度学习pytorch的d2l包失败问题解决pycharm安装深度学习pytorch的d2l包失败问题 * 1、首先查看现在pycharm所在的环境 2、从…

人工智能 2023年6月15日
00252
直立平衡调试总结——十六届智能车双车组

目录 * – 简介 – + * 本文以第十六届双车组（直立）软件调试为主，第十七届部分主要讲通讯与控距 – 一、第十六届双车组： –…

人工智能 2023年6月17日
0083
NLP实战学习（2）：基于Bertopic的新闻主题建模

代码参考：【文本分析实操干货】短文本主题建模利器 – BERTopic 开箱即用的工具：bertopic • https://github.com/MaartenGr/…

人工智能 2023年6月15日
0095
基于Python+Open CV的手势识别算法设计

素材资料下载：目录 1. 课题背景及分析 2. 算法设计 3. 算法实现与调试 4. 实验结果及分析 5. 今后研究及改进计划 6. 设计总结 7. 主要参考书目 8. 附件 1…

人工智能 2023年6月19日
00100
必知必会，这4种 Python 数据透视函数一定要掌握

大家好，今天和大家分享 Pandas中四种有关数据透视的通用函数，在数据处理中遇到这类需求时，能够很好地应对。喜欢记得收藏、关注、点赞。注：完整资料、技术交流文末获取 pand…

人工智能 2023年7月6日
0059
如何在 Python 中创建DataFrame

DataFrame是数据的二维集合。它是一种数据结构，其中数据以表格形式存储。数据集按行和列排列；我们可以在DataFrame中存储多个数据集。我们可以执行各种算术运算，例…

人工智能 2023年6月19日
0092
激光slam学习笔记１－－RTK组合惯导、激光雷达传感器一些经验知识分享

前言：跟组合惯导和激光雷达打交道半年了，过程中查找学习了这两方面的资料，这里来个小结。如果有理解错误的，望大佬们不吝赐教。一、RTK组合惯导个人理解有两部分组成，一个提供gps…

人工智能 2023年6月2日
0066
关于cv2.dnn.readNetFromONNX(path)就报ERROR during processing node with 3 inputs and 1 outputs的解决过程【独家发布】

问题是什么：如图，对vgg16使用opencv的dnn模块进行推理时出现错误。 错误的详&…

人工智能 2023年6月25日
00148

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

5 线性回归

大家都在看