机器学习(线性相关）

2023年8月27日下午1:25 • Python • 阅读 27

一、线性回归

stats.mode()            #众数
numpy.median()          #中位数
numpy.mean()            #平均数
numpy.std()             #标准差
numpy.var()       #方差
numpy.percentile(数组，数字)
x = numpy.random.uniform(0.0,5.0,250)
 #250 个介于 0 到 5 之间的随机浮点数的数组
 x = numpy.random.normal(5.0, 1.0, 100000)
 #正态随机数组 平均值为 5.0，标准差为 1.0

标准差 sigma σ

方差 sigma square σ^2

百分位数：

假设我们有一个数组，包含住在一条街上的人的年龄。

ages = [5,31,43,48,50,41,7,11,15,39,80,82,32,2,8,6,25,36,27,61,31]

什么是 75 百分位数？答案是 43，这意味着 75％的人是 43 岁或以下

import matplotlib.pyplot as plt
from scipy import stats

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

slope, intercept, r, p, std_err = stats.linregress(x, y)
#slope 是线性回归线的 斜率，  intercept 是 线性回归线的截距， r 是衡量拟合性能度量(越高拟合越好（0-1）)

def myfunc(x):
  return slope * x + intercept

mymodel = list(map(myfunc, x))

plt.scatter(x, y)
plt.plot(x, mymodel)
plt.show()

运行结果

二、多项式回归

import numpy
import matplotlib.pyplot as plt

x = [1,2,3,5,6,7,8,9,10,12,13,14,15,16,18,19,21,22]
y = [100,90,80,60,60,55,60,65,70,70,75,76,78,79,90,99,99,100]

mymodel = numpy.poly1d(numpy.polyfit(x, y, 3))

myline = numpy.linspace(1, 22, 100)

plt.scatter(x, y)
plt.plot(myline, mymodel(myline))
plt.show()

运行结果

1、np.poly1d()此函数有两个参数：

参数1：为一个数组，若没有参数2，则生成一个多项式，例如：

p = np.poly1d([2,3,5,7])

print(p) ==>>2×3 + 3×2 + 5x + 7 数组中的数值为coefficient（系数），从后往前 0，1，2.。。为位置书的次数

参数2：若参数2为True，则表示把数组中的值作为根，然后反推多项式，例如：

q = np.poly1d([2,3,5],True)

print(q) ===>>(x – 2)(x – 3)(x – 5) = x3 – 10×2 + 31x -30

参数3：variable=’z’表示改变未知数的字母，例如：

q = np.poly1d([2,3,5],True,varibale = ‘z’)

print(q) ===>>(z – 2)(z – 3)(z – 5) = z3 – 10z2 + 31z -30

三、拟合度输出

import numpy
from sklearn.metrics import r2_score

x = [1,2,3,5,6,7,8,9,10,12,13,14,15,16,18,19,21,22]
y = [100,90,80,60,60,55,60,65,70,70,75,76,78,79,90,99,99,100]

mymodel = numpy.poly1d(numpy.polyfit(x, y, 3))

print(r2_score(y, mymodel(x)))

运行结果

r=0.9432150416451026 拟合度很好

四、线性预测

import numpy
from sklearn.metrics import r2_score

x = [1,2,3,5,6,7,8,9,10,12,13,14,15,16,18,19,21,22]
y = [100,90,80,60,60,55,60,65,70,70,75,76,78,79,90,99,99,100]

mymodel = numpy.poly1d(numpy.polyfit(x, y, 3))

speed = mymodel(17)
print(speed)

可以得到当x=17时，y=88.87331269697978

五、多元回归

多元回归就像线性回归一样，但是具有多个独立值，这意味着我们试图基于两个或多个变量来预测一个值。

可以通过以下数据，经过分析得到线性回归方程从而预测结果。

CarModelVolumeWeightCO2ToyotaAygo100079099MitsubishiSpace Star1200116095SkodaCitigo100092995Fiat50090086590MiniCooper15001140105VWUp!1000929105SkodaFabia1400110990MercedesA-Class1500136592FordFiesta1500111298AudiA11600115099HyundaiI20110098099SuzukiSwift1300990101FordFiesta1000111299HondaCivic1600125294HundaiI301600132697OpelAstra1600133097BMW11600136599Mazda322001280104SkodaRapid16001119104FordFocus20001328105FordMondeo1600158494OpelInsignia2000142899MercedesC-Class2100136599SkodaOctavia1600141599VolvoS602000141599MercedesCLA15001465102AudiA420001490104AudiA620001725114VolvoV7016001523109BMW520001705114MercedesE-Class21001605115VolvoXC7020001746117FordB-Max16001235104BMW216001390108OpelZafira16001405109MercedesSLK25001395120

import pandas
from sklearn import linear_model

df = pandas.read_csv("cars.csv")

X = df[['Weight', 'Volume']]
y = df['CO2']

regr = linear_model.LinearRegression()
regr.fit(X, y)

预测重量为 2300kg、排量为 1300ccm 的汽车的二氧化碳排放量：

predictedCO2 = regr.predict([[2300, 1300]])

print(predictedCO2)

Pandas 模块允许我们读取文件并返回一个 DataFrame 对象。（可以用外部的excel表的数据）

使用LinearRegression()函数创建线性回归对象。

Original: https://blog.csdn.net/m0_62305088/article/details/121894844
Author: 浪漫河
Title: 机器学习(线性相关）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/761117/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

社区版PyCharm安装并创建Django项目

目录 1，下载Django 2，创建Django项目 3，创建应用。 4，启动项目 5，关于报错 1，下载Django 首先点击左上角的file选择setting，然后按照下方操作…

Python 2023年8月5日
0047
四、pytest框架

一. Pytest-基本使用应用场景：pytest 框架可以解决我们多个测试脚本一起执行的问题 1.1 安装和介绍概念：pytest 是 python 的一种单元测试框架，同自…

Python 2023年9月12日
0057
关于pycharm打开时很卡，一直加载中的解决办法~

相信很多刚开始使用pycharm不太熟练的小伙伴，每天一开机打开pycharm总是卡半天，不知道的还以为是电脑卡了或者啥问题的。莫慌，其实并不是… 今天我们就来解决一…

Python 2023年6月9日
0093
Flask日志-werkzeug和flask应用的日志为什么会输出到一个日志文件

logger.py import logging logger = logging.getLogger() logger.setLevel(logging.INFO) log_pa…

Python 2023年6月6日
00139
Pytorch加载数据集的方式总结

在用Pytorch加载数据集时，看GitHub上的代码经常会用到ImageFolder、DataLoader等一系列方法，而这些方法又是来自于torchvision、torch.u…

Python 2023年8月1日
0049
Flask 自建扩展

开源发布准备 * 1. 添加文档字符串与注释后的完整代码 """ Flask-Share # ~~~~~~~~~~~~~~ Create social…

Python 2023年5月24日
0056
MySQL 的 NULL 值是怎么存储的？

大家好，我是小林。之前有位读者在面字节的时候，被问到这么个问题：如果你知道 MySQL 一行记录的存储结构，那么这个问题对你没什么难度。如果你不知道也没关系，这次我跟大家聊聊…

Python 2023年10月13日
0049
Git：使用conda命令切换虚拟环境（win10）

目录 1. 问题：在win10电脑的Git中，无法使用conda list命令，也无法使用conda activate base命令激活虚拟环境。 2. 解决： 1）解决在Git中…

Python 2023年9月7日
0054
深度学习炼丹-数据预处理和增强

一，数据增强概述二，opencv 图像增强-几何变换三，pytorch 图像增强四，imgaug 图像增强参考资料一，数据增强概述数据增强（也叫数据扩增）的目的是为了扩…

Python 2023年10月29日
0048
【脚本项目源码】Python制作桌面宠物，这么可爱的萌宠你不想拥有吗？

前言本文给大家分享的是如何通过利用Python制作桌面宠物，废话不多直接开整~ 开发工具 Python版本： 3.6 相关模块： random模块 os模块 cfg模块 sys模…

Python 2023年10月30日
0049
群集搭建【LNMP+负载均衡+高可用+跳板机】

目录项目需求LNMP部署web1部署mysql部署php部署nfs部署LNMP测试负载均衡与高可用web2部署lb1部署lb2部署验证群集跳板机功能测试跳板机项目需求实验目标：…

Python 2023年11月7日
0037
2-求和（蓝桥杯）

给定n个整数a1,a2,⋅⋅⋅,an，求它们两两相乘再相加的和，即：S=a1⋅a2+a1⋅a3+⋯+a1⋅an+a2⋅a3+⋯+an−2⋅an−1+an−2⋅an+an−1⋅an输…

Python 2023年11月6日
0034
Python自动抢购脚本，学废了双十一双十二帮女票抢购心爱的礼物，隔壁女孩都馋哭了。

Python版本：3.10分享一个秒杀抢购的脚本程序，感兴趣的朋友一起看看吧第一步：需要把想要的商品加进购物车 （ 此&#x8…

Python 2023年8月1日
0058
这几个Matplotlib绘图技巧，真的是太实用了

今天呢，小编来为大家分享几个用 matplotlib模块绘制图表的小技巧，希望看了之后会对大家有不少的帮助！！在图表中插入图片如果我们想要在绘制的图表中插入图片，具体该怎么来实…

Python 2023年8月31日
0048
【Python爬虫】爬取2022软科全国大学排行榜

目录 1.任务要求 2.网络爬虫实现原理 3.系统设计与代码实现 3.1 第一题 3.1.1 最初设计方案：采用request+BeautifulSoup 方式 3.1.2 更改后…

Python 2023年8月16日
0039
Django更换数据库和迁移数据方案

双十一光顾着买东西都没怎么写文章，现在笔记里还有十几篇半成品文章没写完… 今天来分享一下 Django 项目切换数据库和迁移数据的方案，网络上找到的文章方法不一，且使用…

Python 2023年10月15日
0028

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

机器学习(线性相关）

大家都在看