机器学习作业二-线性回归预测销售额

2023年6月17日下午12:15 • 人工智能 • 阅读 124

题目如下：

advertising.csv文件是某商品的广告推广费用（单位为元）和销售额数据（单位为千元），其中每行代表每一周的广告推广费用（包含微信、微博和其他类型三种广告费用）和销售额。若在未来的某两周，将各种广告投放金额按如下分配，请预测对应的商品销售额：

（1）微信：100，微博：100，其他类型：100

（2）微信：200，微博：100，其他类型：50

一、线性回归概念

对于因变量y：

如果它和自变量x呈现y=ax+b关系称为一元线性。

如果y与多个因素有关。即 y=a1x1+a2x2+… 称为多元线性。

回归要做的就是根据已有x和y 找到a和b,拟合出这一条直线，预测新x所对应的y。

二、题目分析

首先得到数据（使用pandas），然后画散点图（使用plt）观察三个因素对销量的影响。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression as lr

adv=pd.read_csv("advertising.csv")
#print(adv)

x=np.array(adv.wechat)
#x1=np.array(adv.weibo)
#x2=np.array(adv.others)
y=np.array(adv.sales)
plt.scatter(x,y)
plt.show()#&#x5F97;&#x5230;wechat&#x548C;sales&#x7684;&#x6563;&#x70B9;&#x56FE;
#&#x53D1;&#x73B0;&#x53EA;&#x6709;wechat&#x548C;sales&#x6709;&#x7EBF;&#x6027;&#x5173;&#x7CFB;&#xFF0C;&#x6240;&#x4EE5;&#x662F;&#x4E00;&#x5143;&#x7EBF;&#x6027;&#x56DE;&#x5F52;

画出三个要素对应的散点图。发现只有微信部分和销售额有明显线性关系。

参考文章机器学习基础线性回归——预测网店的销售额_sjjsaaaa的博客-CSDN博客_线性回归法预测销售额

（上文使用了seaborn库，可以一下子呈现三个坐标轴）

所以本题采用一元线性回归处理（简化了处理）

三、最简单代码

对于预测问题，我们可以直接调用sklearn.linear库，直接使用fit和predict函数。

具体学习如下（其中重点注意fit函数的参数）：【机器学习】（一）线性模型之Linear Regression_walk_power的博客-CSDN博客_linearregression函数

所以写出了非常简答的代码：

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression as lr

adv=pd.read_csv("advertising.csv")#读取文档
#print(adv)

x=np.array(adv.wechat)获得x
#x1=np.array(adv.weibo)
#x2=np.array(adv.others)
y=np.array(adv.sales)获得销量y
plt.scatter(x,y)
plt.show()#得到wechat和sales的散点图
#发现只有wechat和sales有线性关系，所以是一元线性回归

x_train=x.reshape(-1,1)#reshape的作用是改变数据的类型
y_train=y.reshape(-1,1)#fit的参数要求是二维矩阵。
x_test=np.array([100])#测试数据直接使用wechat部分。
x_test=x_test.reshape(-1,1)

model=lr()#直接调用库，创建了model
model.fit(x_train,y_train)
y_pred=model.predict(x_test)
print(y_pred)

运行结果如下：

四、线性回归建模

只是调用库来建模的话意义不大，下面我们自己来创建这个模型，即自己找到适合的a和b。

在机器学习中，y=ax+b可以专业的写成y=w*x+b。体现权重weight和bias偏置这两个概念。

首先了解一些基本知识：

参考：异常检测（3）_吃蜘蛛的少年的博客-CSDN博客

1.误差函数：

在最小二乘法中，均方误差函数的数学表达式，刻画的是每个点的y和拟合出来的直线y撇的差距：

均方误差函数（MSE）代码如下

def loss_function(X,y,weight,bias)
y_hat=weight*X+bias
loss=y_hat-y
cost=np.sum(loss**2)/2*len(X)
return cost

2.梯度下降

对于上面这个loss_function函数，它可以表现成与w,b有关的一个三维图像，如下图：

我们的目的是找到图像的最低点，在该情况下的w和b拟合出的直线最为贴近。

一个朴素的处理思想是:先任意确定w和b得到loss，然后不断移动w,b，根据loss的高低来决定移动方向。

这个思想的具体计算方式是依靠导数。

理解梯度：在单变量的函数中，梯度其实就是函数的微分，代表着函数在某个给定点的切线的斜率。梯度下降算法原理讲解——机器学习_Arrow and Bullet-CSDN博客_梯度下降法

对目前的X求导：

如果求导后梯度为正值，则说明L正在随着w增大而增大，应该减小w，以得到更小的损失。
如果求导后梯度为负值，则说明L正在随着w增大而减小，应该增大w，以得到更小的损失。

具体的求导方式：

y_hat  = w*X + b # &#x8FD9;&#x4E2A;&#x662F;&#x5411;&#x91CF;&#x5316;&#x8FD0;&#x884C;&#x5B9E;&#x73B0;&#x7684;&#x5047;&#x8BBE;&#x51FD;&#x6570;
loss = y_hat-y # &#x8FD9;&#x662F;&#x4E2D;&#x95F4;&#x8FC7;&#x7A0B;,&#x6C42;&#x5F97;&#x7684;&#x662F;&#x5047;&#x8BBE;&#x51FD;&#x6570;&#x9884;&#x6D4B;&#x7684;y&#x548C;&#x771F;&#x6B63;&#x7684;y&#x503C;&#x95F4;&#x7684;&#x5DEE;&#x503C;
derivative_w = X.T.dot(loss)/len(X) # &#x5BF9;&#x6743;&#x91CD;&#x6C42;&#x5BFC;, len(X)&#x662F;&#x6837;&#x672C;&#x603B;&#x6570;
derivative_b = sum(loss)*1/len(X) # &#x5BF9;&#x504F;&#x7F6E;&#x6C42;&#x5BFC;

知道了w该向哪个方向移动，下面就是怎么移动到最低点的问题。引入概念learnrate 学习率。

以w为例分析。已知当前的x导数为正，在w,y面则应当向右移动，每次移动lr的长度，

如果lr较小，则得到x1对应y1为肯定比x对应的y更接近最低点。

如果lr较大，有可能越过了最低点，越过情况下y1有可能大于y，此时lr就太大了。

确定lr是这个程序模型拟合的重要一步。

在迭代多次（移动多次lr）以后，我们得到了最接近的w和b

def gradient(X,y,w,b):
    for i in range(iter):#&#x8FED;&#x4EE3;iter&#x6B21;&#xFF0C;&#x6BCF;&#x6B21;&#x79FB;&#x52A8;lr&#x6B65;&#x8BA9;w&#x548C;b&#x66F4;&#x63A5;&#x8FD1;&#x62DF;&#x5408;&#x76F4;&#x7EBF;&#x3002;
        print(i)
        print("&#x73B0;&#x5728;&#x635F;&#x5931;&#x662F;:",loss_function(X,y,w,b))
        loss_history.append(loss_function(X,y,w,b))
        loss=w*X+b-y
        derivative_w=X.T.dot(loss)/len(X)#&#x5BF9;&#x6743;&#x91CD;&#x6C42;&#x5BFC;
        derivative_b=sum(loss)*1/len(X)#&#x5BF9;&#x504F;&#x7F6E;&#x6C42;&#x5BFC;
        print("&#x6743;&#x91CD;&#x5BFC;&#x6570;:",derivative_w)
        print("&#x504F;&#x7F6E;&#x5BFC;&#x6570;:",derivative_b)
        w=w-lr*derivative_w #&#x6539;&#x53D8;w&#xFF0C;&#x5C06;&#x539F;&#x6765;w-lr*der
        print("&#x73B0;&#x5728;w:",w)
        b=b-lr*derivative_b #&#x6539;&#x53D8;b&#xFF0C;&#x5C06;&#x539F;&#x6765;w-lr*der
        print("&#x73B0;&#x5728;b:",b)
        #plt.plot(X,w*X+b)#&#x53EF;&#x4EE5;&#x6BCF;&#x6B21;&#x7ED8;&#x5236;&#x4E00;&#x4E0B;&#x76F4;&#x7EBF;&#x62DF;&#x5408;&#x72B6;&#x51B5;&#xFF0C;&#x76F4;&#x89C2;&#x4E00;&#x4E9B;&#x3002;
    return w,b

整个程序的运行思路：先任意规定w,b,确定好iter，lr（这个可能有问题）

然后调用梯度下降函数。全部代码如下

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

def loss_function(X,y,w,b):
    loss=w*X+b-y
    cost=np.sum(loss**2)/(2*len(X))
    return cost

def gradient(X,y,w,b):
    for i in range(iter):

        print(i)
        print("&#x73B0;&#x5728;&#x635F;&#x5931;&#x662F;:",loss_function(X,y,w,b))
        loss_history.append(loss_function(X,y,w,b))
        loss=w*X+b-y
        derivative_w=X.T.dot(loss)/len(X)#&#x5BF9;&#x6743;&#x91CD;&#x6C42;&#x5BFC;
        derivative_b=sum(loss)*1/len(X)#&#x5BF9;&#x504F;&#x7F6E;&#x6C42;&#x5BFC;
        print("&#x6743;&#x91CD;&#x5BFC;&#x6570;:",derivative_w)
        print("&#x504F;&#x7F6E;&#x5BFC;&#x6570;:",derivative_b)
        w=w-lr*derivative_w #&#x6539;&#x53D8;w&#xFF0C;&#x5C06;&#x539F;&#x6765;w-lr*der
        print("&#x73B0;&#x5728;w:",w)
        b=b-lr*derivative_b #&#x6539;&#x53D8;b&#xFF0C;&#x5C06;&#x539F;&#x6765;w-lr*der
        print("&#x73B0;&#x5728;b:",b)
        #plt.plot(X,w*X+b)

    return w,b

adv=pd.read_csv("advertising.csv")
X=np.array(adv.wechat)
y=np.array(adv.sales)
X_train=X.reshape(-1,1)
y_train=y.reshape(-1,1)#&#x6709;&#x4E86;&#x8BAD;&#x7EC3;&#x96C6;&#x7684;x&#x548C;y
X_test=100

w=0.1
b=1
iter=100
lr=0.000002
loss_history=[]
plt.scatter(X_train,y_train)#&#x7ED8;&#x5236;&#x6563;&#x70B9;&#x56FE;

w1,b1=gradient(X,y,w,b)#&#x6700;&#x7EC8;&#x5F97;&#x5230;w,b
plt.plot(X,w1*X+b1)
print("&#x6700;&#x540E;w,b &#x662F;&#xFF1A;",w1,b1)
print(w1*X_test+b1)
plt.show()

如果发现在迭代过程中有Loss越来愈大的情况，说明选择的lr有问题，尝试调小步长。

选择的iter和lr不同，则最终的w和b有误差。

可以将迭代过程中的loss_history, weight_history, bias_history记录下来，最后查看一下。

运行结果：

"""&#x4E0B;&#x9762;&#x662F;&#x68C0;&#x9A8C;&#x635F;&#x5931;&#x7684;
plt.plot(loss_history,'g--',label='Loss Curve')
plt.xlabel('Iterations') # x&#x8F74;Label
plt.ylabel('Loss') # y&#x8F74;Label
plt.legend() # &#x663E;&#x793A;&#x56FE;&#x4F8B;
plt.show() # &#x663E;&#x793A;&#x635F;&#x5931;&#x66F2;&#x7EBF;
"""

将迭代中的损失记录下来，以图标形式呈现，体现下降趋势。

3.梯度下降的另一种处理

西瓜书上对于线性回归有向量的表示方法，其中涉及X矩阵和w,b的运算，我们可以将wb看成一个新的变量theta，在拟合的时候变成对theta的处理。

横坐标theta，纵坐标L。更加直观。具体参照上面的提到的博客。

五、其他完善

1.运用多元回归

基本思路是将一元中的乘法变成点乘W的T，修改部分如下

问题1.不知道三元的X怎么样和四元的W[w1,w2,w3,w4]点乘，所以舍去了b

2.由于本例中第三个元素干扰实在太大，导致多元回归无法得到一个恰当的数值。

def loss_function(X, y, W): # &#x624B;&#x5DE5;&#x5B9A;&#x4E49;&#x4E00;&#x4E2A;MSE&#x5747;&#x65B9;&#x8BEF;&#x5DEE;&#x51FD;&#x6570;
    y_hat = X.dot(W.T) # &#x70B9;&#x79EF;&#x8FD0;&#x7B97;
    loss = y_hat.reshape((len(y_hat),1))-y  # &#x4E2D;&#x95F4;&#x8FC7;&#x7A0B;&#xFF0C;&#x6C42;&#x51FA;&#x5F53;&#x524D;W&#x548C;&#x771F;&#x503C;&#x7684;&#x5DEE;&#x503C;
    cost = np.sum(loss**2)/(2*len(X)) # &#x8FD9;&#x662F;&#x5747;&#x65B9;&#x8BEF;&#x5DEE;&#x51FD;&#x6570;&#x7684;&#x4EE3;&#x7801;&#x5B9E;&#x73B0;
    return cost # &#x8FD4;&#x56DE;&#x5F53;&#x524D;&#x6A21;&#x578B;&#x7684;&#x5747;&#x65B9;&#x8BEF;&#x5DEE;&#x503C;

def gradient_descent(X, y, W, lr, iter):  # &#x5B9A;&#x4E49;&#x4E00;&#x4E2A;&#x5B9E;&#x73B0;&#x68AF;&#x5EA6;&#x4E0B;&#x964D;&#x7684;&#x51FD;&#x6570;
    for i in range(iter):  # &#x8FDB;&#x884C;&#x68AF;&#x5EA6;&#x4E0B;&#x964D;&#x7684;&#x8FED;&#x4EE3;&#xFF0C;&#x5C31;&#x662F;&#x4E0B;&#x591A;&#x5C11;&#x7EA7;&#x53F0;&#x9636;
        print(i)
        print("&#x73B0;&#x5728;&#x635F;&#x5931;&#x662F;&#xFF1A;",loss_function(X,y,W))
        y_hat=X.dot(W.T)
        #print("y_hat",y_hat)
        loss=y_hat-y
        #print("loss",loss)
        derivate_W=X.T.dot(loss)/(2*len(W))
        derivate_W=derivate_W.reshape(len(W))
        #print("W&#x5BFC;&#x6570;&#x662F;",derivate_W)
        W=W-lr*derivate_W
        print("&#x73B0;&#x5728;W&#x662F;",W)
    return W

2.数据的归一化。用来突出数据的特征，本次没有使用，这部分将在以后学习。

六、总结和反思

1.上面的三种处理方式，最后得到的预测值还是有较大差异，需要研究学习率和循环次数的一个更适合的数值。可以考虑用while循环将误差值控制到一个范围。

2.思考更简便的建立回归模型，思考后面两个元素是否真的没办法用到。

3.再深入了解一下梯度下降的相关内容。

Original: https://blog.csdn.net/weixin_51657403/article/details/122092953
Author: weixin_51657403
Title: 机器学习作业二-线性回归预测销售额

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/630057/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【CVPR 2021】最新EEG脑电信号分类模型研究：Object classification from randomized EEG trials

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月2日
0072
opencv圆形网格提取函数findCirclesGrid源码笔记

opencv–findCircle源码笔记函数处理流程源码分析 * findCirclesGrid源码 findCirclesGrid2 函数源码 – …

人工智能 2023年6月19日
00132
Vue之安装Vue.js devtools

Vue.js devtools调试工具的安装，这里大概介绍一下。下载地址：（已设永久有效）链接：https://pan.baidu.com/s/1YTeP5Pc2u2Ciqf4…

人工智能 2023年6月28日
00122
python数据分析之数据清洗（以摩托车的销售情况数据为例）

文章目录一、获取数据集并寻找存在的问题 * 1、阅读数据集描述 2、查看数据并发现问题二、清洗步骤 * 1、数据格式转换 2、去重复 3、缺失值处理 4、异常值处理 5、数据离…

人工智能 2023年6月11日
00111
IT冷知识第一期（周更）

第一批个人电脑 1977 年 9 月，世界上第一批大规模生产的个人电脑在美国发布了，售价 600 美元。它的名字是： Tandy 公司的 TRS-80 有搜索引擎核心技术的国家…

人工智能 2023年6月27日
0095
【深度学习笔记】飞桨PP-PicoDet算法训练自己数据（过程超详细）

前言最近在研究目标检测算法– PP-PicoDet算法（百度自研)，2021年11月份新鲜出炉。官方介绍说，性能优于YOLOV5 、YOLOX等算法，主要是轻量化部署贡献很大，比…

人工智能 2023年7月10日
0096
软件智能:aaas系统中的数学程序与技术服务之1 序篇之绪言

上一篇”主体性和主体间性”篇，是aaas系统的关键，也可以称为关键技术。链接：软件智能:aaas系统AI众生世界之24 主体间性和主体性_Chuanfa…

人工智能 2023年6月10日
00115
OpenCV（二）矩阵的掩膜操作

OpenCV3矩阵的掩膜操作一、获取像素指针二、像素范围处理saturate_cast 三、掩膜操作（实现图像对比度调整） * 1、C++实现 2、API实现：filter2D…

人工智能 2023年6月22日
00107
【交通数据（1）——加州高速路网PeMS交通数据】

交通数据（1）——加州高速路网PeMS交通数据一、PeMS数据介绍 * 1. 数据来源 2. 数据特点 3. 数据诊断与处理 4. PeMS数据格式二、相关数据下载 * 1. …

人工智能 2023年6月23日
00133
原子物理名词索引

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月28日
00103
matlab直方图均衡化代码

学习目标： 1.直方图均衡化在matlab的实现学习产出 p=imread(‘liena.jpg’);g=rgb2gray(p);%读取图片灰度化的图像x…

人工智能 2023年6月20日
00100
图像去雾（image dehazing）近期论文简述及模型测试

写在前面：先是初步调研，然后是几篇论文的概要，最后是模型的实际测试，主要是对前一段工作的总结，内容不完善，仅做参考。 keyword：hazy ，dehazing 去雾方法主要可以…

人工智能 2023年6月16日
0087
国内代码托管平台Gitee（码云）的入门使用

网址在这>>>码云官网地址中文代码托管平台，英文不好的话，使用github一定的障碍，所有gitee是很好的选择。文章目录一、新建仓库二、AndroidSt…

人工智能 2023年6月29日
0088
PyTorch中通过torch.save保存模型和torch.load加载模型介绍

PyTorch 中一般约定是使用.pt 或.pth 文件扩展名保存模型，通过torch.save 保存模型，通过torch.load 加载模型。torch.save和torch.l…

人工智能 2023年6月16日
00120
智能车八邻域图像算法

将八邻域算法用在智能车图像处理上文章目录将八邻域算法用在智能车图像处理上 * 前言一.当初选择用八邻域的原因 – 1.令人困扰的光线 2.差比和图像处理 3.难以…

人工智能 2023年6月17日
00109
【Tensorflow 2】使用迁移学习（MobileNet）完成图像分类任务

前言：图像分类是CV领域相对比较成熟的一种技术，一般从基础开始学就是Tensorflow——>CNN——>手撸ResNet等算法——>迁移学习。Tensorflo…

人工智能 2023年5月24日
00120

2024 年 6 月
一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

机器学习作业二-线性回归预测销售额

大家都在看