《机器学习》——实验一（回归）

2023年6月17日下午4:56 • 人工智能 • 阅读 59

问题一：

对于线性回归问题，给定：

w 0 ∗ = ( 1 n ∑ i y i ) − w 1 ∗ ( 1 n ∑ i x i ) (1) \begin{aligned} w^_0&=\left(\frac{1}{n}\sum_iy_i\right)-{w_1^}\left(\frac{1}{n}\sum_ix_i\right) \ \end{aligned}\tag{1}w 0 ∗=(n 1 i ∑y i )−w 1 ∗(n 1 i ∑x i )(1 )
w 1 ∗ = − ∑ i x i ( w 0 ∗ − y i ) / ∑ i x i 2 (2) \begin{aligned} {w_1^}&=-\sum_ix_i({w_0^}-y_i)/ \sum_ix_i^2 \end{aligned}\tag{2}w 1 ∗=−i ∑x i (w 0 ∗−y i )/i ∑x i 2 (2 )

试推导：
w 1 ∗ = ∑ i y i ( x i − 1 n ∑ i x i ) ∑ i x i 2 − 1 n ( ∑ i x i ) 2 \begin{aligned} {w_1^*}=\frac{\sum_iy_i(x_i-\frac{1}{n}\sum_ix_i)}{\sum_ix_i^2-\frac{1}{n}(\sum_ix_i)^2} \end{aligned}w 1 ∗=∑i x i 2 −n 1 (∑i x i )2 ∑i y i (x i −n 1 ∑i x i )

解:
把（1）式代入（2）式为：

w 1 ∗ = − ∑ i x i ( 1 n ∑ i y i − w 1 ∗ 1 n ∑ i x i − y i ) ∑ i x i 2 w 1 ∗ ∑ i x i 2 = − ∑ i x i ( 1 n ∑ i y i − w 1 ∗ 1 n ∑ i x i − y i ) w 1 ∗ ∑ i x i 2 = − ∑ i x i ( 1 n ∑ i y i ) + w 1 ∗ ( ∑ i x i ) 2 + ∑ i x i ( y i ) w 1 ∗ ( ∑ i x i 2 − 1 n ∑ i x i ) = ∑ i y i ( x i − 1 n ∑ i x i ) w 1 ∗ = ∑ i y i ( x i − 1 n ∑ i x i ) ∑ i x i 2 − 1 n ( ∑ i x i ) 2 \begin{aligned} {w_1^}&=\frac{-\sum_ix_i(\frac{1}{n}\sum_iy_i-{w_1^}\frac{1}{n}\sum_ix_i-y_i)}{\sum_ix_i^2}\ {w_1^}\sum_ix_i^2 &=-\sum_ix_i(\frac{1}{n}\sum_iy_i-{w_1^}\frac{1}{n}\sum_ix_i-y_i)\ {w_1^}\sum_ix_i^2 &=-\sum_ix_i(\frac{1}{n}\sum_iy_i)+{w_1^}(\sum_ix_i)^2+\sum_ix_i(y_i)\ {w_1^}(\sum_ix_i^2-\frac{1}{n}\sum_ix_i) &=\sum_iy_i(x_i-\frac{1}{n}\sum_ix_i)\ {w_1^} &=\frac{\sum_iy_i(x_i-\frac{1}{n}\sum_ix_i)}{\sum_ix_i^2-\frac{1}{n}(\sum_ix_i)^2} \end{aligned}w 1 ∗w 1 ∗i ∑x i 2 w 1 ∗i ∑x i 2 w 1 ∗(i ∑x i 2 −n 1 i ∑x i )w 1 ∗=∑i x i 2 −∑i x i (n 1 ∑i y i −w 1 ∗n 1 ∑i x i −y i )=−i ∑x i (n 1 i ∑y i −w 1 ∗n 1 i ∑x i −y i )=−i ∑x i (n 1 i ∑y i )+w 1 ∗(i ∑x i )2 +i ∑x i (y i )=i ∑y i (x i −n 1 i ∑x i )=∑i x i 2 −n 1 (∑i x i )2 ∑i y i (x i −n 1 ∑i x i )

问题二：

对于线性回归问题，给定：
arg min ⁡ w 0 , w 1 L ( w ^ ) = ∥ y − X w ^ ∥ 2 \begin{aligned} \argmin_{\mathbf{w_0,w_1}}\mathcal{L}(\mathbf{\hat{w}})=\|y-X\mathbf{\hat{w}}\|^2 \end{aligned}w 0 ,w 1 a r g m i n L (w ^)=∥y −X w ^∥2

试推导：
w ^ = ( X T X ) − 1 X T y \mathbf{\hat{w}}=(X^TX)^{-1}X^Ty w ^=(X T X )−1 X T y

解：

∥ y − X w ^ ∥ 2 = ( X w ^ − y ) T ( X w ^ − y ) = ( w ^ T X T − y T ) ( X w ^ − y ) = w ^ T X T X w ^ − w ^ T X T y − y T X w ^ + y T y \begin{aligned}\|y-X\mathbf{\hat{w}}\|^2 &=(X\mathbf{\hat{w}}-y)^T(X\mathbf{\hat{w}}-y)\ &=(\mathbf{\hat{w}}^TX^T-y^T)(X\mathbf{\hat{w}}-y)\ &=\mathbf{\hat{w}}^TX^TX\mathbf{\hat{w}}-\mathbf{\hat{w}}^TX^Ty-y^TX\mathbf{\hat{w}}+y^Ty \end{aligned}∥y −X w ^∥2 =(X w ^−y )T (X w ^−y )=(w ^T X T −y T )(X w ^−y )=w ^T X T X w ^−w ^T X T y −y T X w ^+y T y

令：

f ( w ^ ) = w ^ T X T X w ^ − w ^ T X T y − y T X w ^ + y T y \begin{aligned} f(\mathbf{\hat{w}})&=\mathbf{\hat{w}}^TX^TX\mathbf{\hat{w}}-\mathbf{\hat{w}}^TX^Ty-y^TX\mathbf{\hat{w}}+y^Ty \end{aligned}f (w ^)=w ^T X T X w ^−w ^T X T y −y T X w ^+y T y

f ( w ^ ) f(\mathbf{\hat{w}})f (w ^) 对 w ^ \mathbf{\hat{w}}w ^ 求偏导为：
d f d w ^ = X T X w ^ + ( w ^ T X T X ) T − X T y − X T y = X T X w ^ + X T X w ^ − X T y − X T y = 2 X T X w ^ − 2 X T y \begin{aligned} \frac{df}{d\mathbf{\hat{w}}}&=X^TX\mathbf{\hat{w}}+(\mathbf{\hat{w}}^TX^TX)^T-X^Ty-X^Ty\ &=X^TX\mathbf{\hat{w}}+X^TX\mathbf{\hat{w}}-X^Ty-X^Ty\ &=2X^TX\mathbf{\hat{w}}-2X^Ty \end{aligned}d w ^d f =X T X w ^+(w ^T X T X )T −X T y −X T y =X T X w ^+X T X w ^−X T y −X T y =2 X T X w ^−2 X T y

令 d f d w ^ = 0 \frac{df}{d\mathbf{\hat{w}}}=0 d w ^d f =0：
w ^ = ( X T X ) − 1 X T y \mathbf{\hat{w}}=(X^TX)^{-1}X^Ty w ^=(X T X )−1 X T y

问题三：

构造人工数据。提示：（x , y x,y x ,y ）要呈线性分布。
利用公式1和公式2求出直线方程。
评价两种方法的优劣（运行时间、目标函数等）
画图。（画出原始数据点云、直线）

1、构造人工数据：

datMat = np.matrix(
       [[ 1.,],
        [ 2.,],
        [ 3.,],
        [ 3.,],
        [ 5.,],
        [ 6.,],
        ])

classLabels = [3.09, 5.06,.03, 9.12, 10.96,6.4,]

2、公式1函数：


def Linear_Regression1(dataArr,classLabels):

    Denominator = 0.0
    molecular = 0.0
    w=0.0
    b=0.0

    for i in range(len(dataArr)):
        molecular += classLabels[i]* (dataArr[i] - average(dataArr))
        Denominator += (dataArr[i]-average(dataArr))**2

    w=molecular/Denominator
    b=average(classLabels)-w*average(dataArr)
    return w,b

公式2函数：


def Linear_Regression2(dataArr,classLabels):

    a=np.matrix(np.ones((len(classLabels),1)))

    datMat=np.c_[dataArr,a]

    classLabels = np.asmatrix(classLabels).reshape(-1, 1)

    w = (datMat.T * datMat).I * datMat.T * classLabels
    w_0=w[0]
    w_1=w[1]
    return w_0,w_1

损失函数：

def lossFunction(y, y_hat):
    '''
    损失函数模块
    '''
    n = len(y)
    sum = 0
    for i in range(n):
        sum += pow((y[i] - y_hat[i]), 2)

    L = (sum) / (2 * n)
    return L

3、两种方法比较：

方法运行时间目标函数（损失）方法第1种（一维）0.0009744.984367最小二乘法第2种（二维）0.000160因为得到w和，b一样的所以损失也是一样的最小二乘法

4、运行结果：

5、图像：

作业四：

构造二维人工数据
提示：正负样本可用直线分离，标记好类别。并对数据集进行拆分（训练集和测试集）。
利用梯度下降法和牛顿法实现逻辑回归算法。
评价两种方法的优劣（运行时间、收敛次数等）
对测试集中的样本进行分类，并计算错误率
画图（画出训练集、直线、以及测试集）

1、构造人工数据集：
前两列的属性，最后一列是标签：

datMat = np.matrix([
        [ 0.33,-1.8,1],
        [ -0.75,-0.47,0],
        [ -0.94,-3.79,1],
        [ -0.87,1.9,1],
        [ 0.95,-4.34,0],
        [ 0.36,4.27,0],
        [ -0.83,1.32,1],
        [ 0.28,-2.13,0],
        [ -0.9,1.84,1],
        [ -0.76,3.47,0],
        [ -0.01,4.0,1],
        ])

拆分数据集为训练集和测试集：

train_x=datMat[0:5,0:2]
    train_y=datMat[0:5,2]
    test_x=datMat[6:11:,0:2]

    test_y=datMat[6:11,2]

2、梯度下降法实现逻辑回归算法：


def Logistic_Regression(X, y, stepsize, max_iters):
    intercept = np.ones((X.shape[0], 1))
    X = np.concatenate(( X,intercept), axis=1)

    m, n = X.shape
    w = np.zeros((n,1))
    J = pd.Series(np.arange(max_iters, dtype=float))

    count=0

    for i in range(max_iters):

        z = np.dot(X, w)

        h = sigmoid(z)

        g = gradient(X, h, y)

        w -= stepsize * g

        J[i] = -stepsize*np.sum(y.T*np.log(h)+(1-y).T*np.log(1-h))
        count+=1

    return J, w,count

3、牛顿法的实现代码暂时还没有去学习研究

Original: https://blog.csdn.net/Naruto_8/article/details/121169319
Author: Asita_c
Title: 《机器学习》——实验一（回归）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/631070/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

使用Bert预训练模型进行中文文本分类（基于pytorch）

前言最近在做一个关于图书系统的项目，需要先对图书进行分类，想到Bert模型是有中文文本分类功能的，于是打算使用Bert模型进行预训练和实现下游文本分类任务数据预处理 2.1 输…

人工智能 2023年7月22日
0047
数据分析20大基本分析方法技术总结【分析目的、分析案例、分析方法与思路】

文章目录 * – 零、分析方法基础 – 一、5W2H分析法 – 二、逻辑树分析法（类似思维导图） – 三、PEST分析法（行业分析方…

人工智能 2023年7月17日
0049
异常检测之基于聚类的局部异常因子检测算法（CBLOF）详细解释且配上代码运行实例

基于聚类的局部异常因子检测算法（CBLOF）文章目录基于聚类的局部异常因子检测算法（CBLOF）前言一、CBLOF是什么？二、CBLOF详解三、CBLOF代码实例前言…

人工智能 2023年6月19日
00102
自动驾驶_测试场景技术发展与应用_2020

2022.7.8启本文依据机械工业出版社——《2020_自动驾驶_测试场景技术发展与应用》进行整合参考书目：自动驾驶汽车测试技术发展现状与思考——范志翔，孙巍第一章：绪论 …

人工智能 2023年6月2日
0083
高数-极限(一)

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月29日
0061
pandas之Series

import pandas as pd import numpy as np pandas.Series( data, index, dtype, name, copy) 参数说明…

人工智能 2023年7月7日
0068
PowerBI使用折线图分析异常数据

你有没有见过这样的拆线图呢，阴影区域是目标销售额的上下限区间，虚线是目标销售额，实线是实际的销售额，显示开关标记的是销售额相对于目标超额10%以下的。在以前要做这样的一份折线图，…

人工智能 2023年6月11日
0082
Glade To Code 介绍

Glade To Code 简介根据Glade 文件生成指定语言的GTK 代码的工具使用说明 python3 glade-to-code.py -l [语言类型] -i [输入…

人工智能 2023年6月4日
0082
多元线性回归详解

入门小菜鸟，希望像做笔记记录自己学的东西，也希望能帮助到同样入门的人，更希望大佬们帮忙纠错啦~侵权立删。目录一、问题描述二、问题分析三、解决问题 —— 找w和b 1、向量形…

人工智能 2023年6月13日
0073
Raki的读paper小记：ELECTRA: PRE-TRAINING TEXT ENCODERS AS DISCRIMINATORS RATHER THAN GENERATORS

Abstract & Introduction & Related Work 研究任务预训练语言模型已有方法和相关工作面临挑战虽然它们在转移到下游的NLP任…

人工智能 2023年5月28日
0074
opencv-python的安装报错及处理

在我们需要import cv2的时候，我们应该先安装opencv-python 一、安装进入cmd打开命令行，输入 pip install opencv-python，此时可能成…

人工智能 2023年6月24日
0069
Gaussian Embedding

文章目录 1. 前驱知识 * transE 2. 高斯分布 3. 结论性概念 4. KG2E 5. Qualitative Analysis 6. Link Prediction …

人工智能 2023年6月10日
0083
相机畸变＋张正友标定（含源代码）

希望2022能够自主学习。本文狠狠的借鉴了：相机标定之张正友标定法数学原理详解（含python源码） – 知乎和最详细、最完整的相机标定讲解_a083614的专栏-C…

人工智能 2023年7月18日
0047
YOLOX：超越2021年前的YOLO系列

目录摘要 1.Introduction 2.YOLOX * 2.1.YOLOX-DarkNet53 实验结果 ; 摘要在本报告中，我们对YOLO系列进行了一些有经验的改进，形成…

人工智能 2023年7月12日
0039
全局坐标系与车身坐标系转换

在学习资料满天飞的大环境下，知识变得非常零散，体系化的知识并不多，这就导致很多人每天都努力学习到感动自己，最终却收效甚微，甚至放弃学习。我的使命就是过滤掉大量的无效信息，将知识体系…

人工智能 2023年7月27日
0052
京东数据分析工具推荐（京东第三方数据平台）

京东平台的店铺众多，同行数不胜数。作为商家，如果连自己竞争对手的情况都不知道的话,很难在这个平台存活下去。那么，这次鲸参谋就来重点说一下我们的京东数据分析工具里的”竞…

人工智能 2023年7月15日
0094

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

《机器学习》——实验一（回归）

问题一：

问题二：

大家都在看