吴恩达机器学习作业一

2023年6月15日下午11:51 • 人工智能 • 阅读 64

Introduction

In this exercise, you will implement linear regression and get to see it work
on data.

首先,先看看数据是什么样的好进一步分析

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

path = "data/ex1data1.txt"
data = pd.read_csv(path, header=None, names=['Population', 'profit'])
print(data)
data.plot(kind="scatter", x="Population", y="profit", figsize=(8, 5))
plt.show()

采用线性回归,尽可能准确地预测输出。
要拟合出一条直线采用均方误差作为损失函数，

我们预测

函数:

损失函数:

这里均方误差使用1/2m而不是1/m是因为后期梯度下降时,对损失函数求偏导平方求导会出现2,这里乘1/2
会使得后续计算方便
持续更新a于b直到收敛

下面就是如何计算偏导数,


def squared_error(a, b):
    res = 0
    for row in data.iterrows():
        population = row[1][0]
        profit = row[1][1]
        res += pow(population*a+b - profit, 2)
    res = 1/(2*data.size)*res
    return res

使得均方误差足够小的a和b即为解,使用梯度下降.

同时更新a和b直到均方误差足够小(凭自己喜好),这里我规定偏导数
吴恩达机器学习作业一

达到-9数量级时认为收敛,

附上源码

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

def squared_error(a, b):
    res = 0
    d_a = 0
    d_b = 0
    for row in data.iterrows():
        population = row[1][0]
        profit = row[1][1]
        res += pow(population*a + b - profit, 2)
        d_a += (population*a + b - profit) * population
        d_b += (population*a + b - profit)
    res *= 1/(2*len(data))
    d_a *= 1/len(data)
    d_b *= 1/len(data)
    print("欧氏距离:", res, "   d_a:", d_a,  "     a:", a)
    return d_a, d_b

def gradient_descent(a, b, alpha):
    d_a, d_b = squared_error(a, b)
    print(type(d_b))
    while abs(d_a) > 10e-9 and abs(d_b) > 10e-9:
        tamp_a = a - alpha * d_a
        tamp_b = b - alpha * d_b
        a = tamp_a
        b = tamp_b
        d_a, d_b = squared_error(a, b)
    return a, b

path = "data/ex1data1.txt"
data = pd.read_csv(path, header=None, names=['Population', 'profit'])
data.plot(kind="scatter", x="Population", y="profit", figsize=(8, 5))

a, b = gradient_descent(0, 0, 0.02)
x = np.linspace(data.Population.min(), data.Population.max(), 100)
y = a*x + b
plt.plot(x, y)
plt.show()

结果如下

Original: https://blog.csdn.net/qq_20180171/article/details/123972082
Author: Cun kou
Title: 吴恩达机器学习作业一

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/618303/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

可解释机器学习- LIME模型讲解｜interpretable machine learning-LIME

Contents 原理计算流程优势劣势 Reference 原理 LIME生成了一个新的数据集，数据集由扰动的样本（permuted samples）和黑箱模型对应的预…

人工智能 2023年6月25日
0098
用Python做数据分析之数据筛选及分类汇总

1、按条件筛选（与，或，非）为数据筛选，使用与，或，非三个条件配合大于，小于和等于对数据进行筛选，并进行计数和求和。与 excel 中的筛选功能和 countifs 和 sumi…

人工智能 2023年6月11日
0053
Python_OpenCV基本功能实现

### 回答1： Python_的 _OpenCV_库和MediaPipe工具包是可以一起使用的，以 _实现_手势识别的功能。首先，需要在 _Python_中安装 _OpenCV…

人工智能 2023年7月19日
0065
计算机网络(第四弹) — TCP 套接字编程的通信模型及实现流程

TCP 套接字编程 1 流套接字通信流程 2 TCP 流套接字编程 3 注意事项 4 关于长短连接的理解 * 4.1 概念 4.2 区别 1 流套接字通信流程 ; 2 TCP 流套…

人工智能 2023年6月29日
0049
【定量分析、量化金融与统计学】R语言线性回归（2）：一元线性回归实例

目录一、前言二、逐步讲解r语言程序 1.导入数据集并查看数据集的基本情况 2.查看数据分布情况 3.查看自变量因变量的散点图，判断线性关系 4.添加线性模型 5.回归，并查看回…

人工智能 2023年7月16日
0064
机器学习之支持向量机SVM之python实现ROC曲线绘制（二分类和多分类）

一、ROC曲线二、TP、FP、TN、FN 三、 python绘制ROC曲线(二分类) 1、思路 2、关键代码 3、完整代码四、 python绘制ROC曲线(多分类) 五、参考文…

人工智能 2023年7月2日
00153
什么是TensorFlow的会话(Session)

什么是TensorFlow的会话(Session)？ TensorFlow是一个流行的开源深度学习框架，用于构建和训练各种机器学习模型。在TensorFlow中，会话(Sessio…

人工智能 2023年12月31日
0053
python-opencv利用cv2.matchShapes()实现轮廓匹配

之前用过cv2.matchTemplate()去做模板匹配，今天学习下cv2.matchShapes() 具体的使用方法,可以参考博客:https://www.cnblogs.co…

人工智能 2023年6月18日
0075
灰色预测模型

目录一、什么是灰色预测二、灰色预测建模流程图三、建模步骤四、代码实现（python）一、什么是灰色预测灰色系统是指系统数据有一些是未知，有一些是已知。白色系统是全都已知…

人工智能 2023年7月26日
0050
周志华-机器学习.pdf 学习心得附整理材料

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月16日
0077
《软件工程与计算》考试复习笔记

软件工程软件工程是应用系统的、规范的、可量化的方法来开发、运行和维护软件，即将工程应用到软件对以上各种方法的研究抽象与分解分解是横向将系统分割为几个相对简单的子系统以及子…

人工智能 2023年6月27日
0087
【Pytorch】使用Pytorch进行知识蒸馏

使用Pytorch进行知识蒸馏 * – + 一、知识蒸馏原理 + * 1. 使用 softmax 进行蒸馏： * 2. 知识迁移：老师知识 —> 学生知识 + 二…

人工智能 2023年6月17日
00108
PointNet++上采样（Feature Propagation）

PointNet++在处理分割任务的时候需要将下采样的点还原到与输入相同的点数，便于做每个点的预测。但是在论文中只给了一个简单的描述和公式，不是很好理解，因此在这里记录一下我的理解…

人工智能 2023年7月13日
0070
pip install pyqt5时报错：Preparing wheel metadata … error

问题描述背景：在服务器上用conda搭建TensorFlow训练环境在安装pyqt5时遇到了这个问题： ; 解决尝试是不是代码源出问题？ pip install pyqt5 …

人工智能 2023年5月25日
00122
Pytorch：全连接神经网络-MLP回归

Pytorch: 全连接神经网络-解决 Boston 房价回归问题 Copyright: Jingmin Wei, Pattern Recognition and Intellig…

人工智能 2023年7月26日
0046
TensorFlow不重新编译源码使用C/C++ API推理

如果开发C++代码，链接pip安装的Tensorflow安装目录下面的so，会报如下错误：E tensorflow/core/common_runtime/session.cc:6…

人工智能 2023年5月25日
0085

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

吴恩达机器学习作业一

Introduction

我们预测

大家都在看