吴恩达机器学习作业笔记（Logistic 回归）

2023年6月18日下午6:48 • 人工智能 • 阅读 120

数据一共有三列，前两列是学生成绩，最后一列用1.0代表学生是否被录取
使用分类的方法进行学习，得到一个学生被录取的概率值。

零基础知识

pandas读取文件

import pandas as pd
data = pd.read_csv('path',sep = ',', header = 0, names = ['第一列','第二列','第三列'], encoding = 'utf-8')

原文链接：https://blog.csdn.net/O_nice/article/details/119667178

path：要读取的文件绝对路径 sep：指定列与列间的分隔符，默认sep = ‘,’ 若sep = ‘\t’，即列与列间用制表符\t分隔；若sep = ‘,’，即列与列间用逗号,分隔；
header：用作列名的行号，默认为0 若header = None，则表明数据中没有列名行；若header = 0，则表明第一行为列名；
names：列名命名或重命名
encoding：指定用于unicode文本编码格式，若encoding =’utf-8’，则表明用UTF-8编码的文本；若encoding = ‘gbk’，则表明用gbk编码的文本；

dataframe格式使用标签提取数据
dataframe根据某列元素筛选数据
Pandas系列_DataFrame数据筛选

positive = data[data['admission'] == 1]
negative = data[data.admission == 0]

numpy矩阵按行合并
numpy 进行数组的拼接，分别在行和列上合并
np.c_[array1,array2] c_表示colum列 np.r_[array1,array2] r_表示row行

矩阵的点乘与叉乘

import numpy as np
a=np.array([[1,2,3],[1,2,3],[1,2,3]])
b=np.array([[1,2,3],[1,2,3],[1,2,3]])
print(a*b)
print(np.multiply(a,b))

[[1 4 9]
 [1 4 9]
 [1 4 9]]
[[1 4 9]
 [1 4 9]
 [1 4 9]]

 import numpy as np
a=np.array([[1,2,3],[1,2,3],[1,2,3]])
b=np.array([[1,2,3],[1,2,3],[1,2,3]])
print(np.dot(a,b))

[[ 6 12 18]
 [ 6 12 18]
 [ 6 12 18]]

sklearn进行数据评估

sklearn.metrics.classification_report(y_true, y_pred, labels=None, target_names=None, sample_weight=None, digits=2, output_dict=False)

classification_report&精确度/召回率/F1值
 classification_report()函数介绍

计算梯度时用到的方程

; 代码

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import scipy.optimize as opt
from sklearn.metrics import classification_report

data = pd.read_csv('ex2data1.txt', sep=',', names=['score1', 'score2', 'admission'])

X = np.array(data[['score1', 'score2']]).reshape(-1,2)
X = np.c_[np.ones(len(X)),X]
y = np.array(data['admission'],dtype=float).reshape(-1,1)
theta = np.zeros(X.shape[1]).reshape(-1, 1)

def norm(X):
    mean = np.mean(X[:, 1:], axis=0)
    std = np.std(X[:, 1:], axis=0, ddof=1)
    X[:, 1:] = (X[:, 1:] - mean) / std
    return mean,std,X
mean,std,X = norm(X)
'''sigmoid函数'''
def sigmoid(x):
    return 1/(1+np.exp(-x))
'''定义Cost函数，这里也可以使用np.sum，/len(X)'''
def J(theta,X, y):
    return np.mean((-y) * np.log(sigmoid(X.dot(theta))) - (1 - y) * np.log(1 - sigmoid(X.dot(theta))))
'''定义梯度'''
def dJ(theta,X, y):
    return X.T.dot(sigmoid(X.dot(theta)) - y) / len(X)
'''定义传统的梯度下降'''
def grad_descend(X,y,theta_init,learning_rate,iters,error,listJ):
    i=0
    theta = theta_init
    while i < iters:
        grad = dJ(theta,X, y)
        temp=J(theta,X, y)
        listJ.append(temp)
        theta_old = theta
        theta = theta - learning_rate * grad
        if (abs(J(theta,X,y) - J(theta_old, X,y))) < error:
            print("第{}次梯度下降,达到理想误差".format(i+1))
            break
        i+=1
    return theta
'''执行梯度下降，并检查收敛性'''
listJ = []

theta = grad_descend(X,y,theta,0.01,1e5,1e-8,listJ)
print(theta)
'''数据可视化，打印决策边界'''
def visualData(data):
    positive = data[data['admission'] == 1]
    negative = data[data.admission == 0]
    plt.scatter(positive.score1, positive.score2, c='g', marker='o', label='Admitted')
    plt.scatter(negative.score1, negative.score2, c='r', marker='o', label='Not Admitted')
    plt.legend(loc=1)
    plt.xlabel('Exam1 Score')
    plt.ylabel('Exam2 Score')
x1 = np.arange(20,101,0.1).reshape(-1,1)
x2 = mean[1] - std[1] * (theta[0] + theta[1] * (x1 - mean[0]) / std[0]) / theta[2]
plt.plot(x1, x2, c='r', label="decision boundary")
visualData(data)
plt.show()
'''不用手写的梯度下降而采用优化算法利用优化算法，失败'''

'''进行0.1分类，并进行sklearn评估'''
def predict(theta, X):
    return [1 if i > 0.6 else 0 for i in sigmoid(X.dot(theta))]
print(classification_report(y, predict(theta, X)))

Original: https://blog.csdn.net/curseofknowledge/article/details/124738582
Author: Curse of Knowledge
Title: 吴恩达机器学习作业笔记（Logistic 回归）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/636054/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

神经网络算法基本原理及其实现

目录背景知识人工神经元模型激活函数网络结构工作状态学习方式 BP算法原理算法实现（MATLAB）背景知识在我们人体内的神经元的基本结构，相信大家并不陌生，看完下面…

人工智能 2023年7月26日
0063
小爱音箱mini系统故障怎么办_小爱音箱MINI使用1年多了，我来说说使用感受

前言家里的蓝牙音箱入了有几个了，今天来说说小爱音箱MINI，这个音箱用了也有1年多了，因为需要插电，所有主要是在家里用，闲暇的时候可以听听书，听听相声。小爱mini音箱可玩性…

人工智能 2023年5月27日
00179
opencv物体识别-识别水果

前言玩一玩用opencv做一些简单的物体识别 1.思路讲解我们基于简单的opencv的阈值分割，通过这个阈值分割，我们能把我们需要识别的物体在二值图里面变成白色，其余的变成黑色…

人工智能 2023年6月18日
0085
【目标检测】YOLOv5遇上知识蒸馏

前言模型压缩方法主要4种：网络剪枝(Network pruning) 稀疏表示(Sparse representation) 模型量化(Model quantification…

人工智能 2023年7月25日
0065
openCV实战项目–人脸考勤

人脸任务在计算机视觉领域中十分重要，本项目主要使用了两类技术：人脸检测+人脸识别。代码分为两部分内容：人脸注册和人脸识别人脸注册：将人脸特征存储进数据库，这里用featu…

人工智能 2023年6月26日
0074
ONNX的模型优化与量化细节

layout: posttitle: ONNX的模型优化与量化细节date: 2021-09-21 18:18:48.000000000 +09:00categories: [算法…

人工智能 2023年5月24日
0078
大众点评字体反爬解析

文章目录 * – + 0x00字体反爬 + 0x01常见映射方式 + 0x02接口分析 + 0x03解决思路 + * 根据映射的关系我们根据以下步骤构建大字典: + 0…

人工智能 2023年6月27日
00132
opencv面试知识点

文章目录一、opencv基础 * 1、OpenCV中cv::Mat的深拷贝和浅拷贝问题 2、opencv常用数据结构和函数 – 2.1、QImage和Mat之间的转换…

人工智能 2023年7月19日
0097
基于51单片机的数字电压表设计

仿真原理图：部分程序： define LED_GLOBAL 1 include “led.h” void ledDelay(uint ms) { ucha…

人工智能 2023年7月29日
0093
YOLOV5训练自己的数据集（踩坑经验之谈）

导言很惭愧，来csdn已经三年多了，却一直都在”白嫖”各位大神的经验与总结。这几天也一直在csdn里学习YOLOv3与YOLOv5训练数据集的具体步骤，几…

人工智能 2023年7月9日
0087
基于华为云ModelArts（实现垃圾分类识别）

基于华为云ModelArts（实现垃圾分类识别）目录 * – 任务简介 – 任务设计 – 任务实施 – + 任务1 购买对象存储服…

人工智能 2023年7月1日
0065
CVPR 2022 | 图像修复！中科大&微软提出PUT：减少Transformer在图像修复应用中的信息损失…

点击下方卡片，关注” CVer“公众号 AI/CV重磅干货，第一时间送达图1 本文方法和现有方法的一些对比结果本文介绍我们在CVPR 2022发表的用…

人工智能 2023年6月25日
0095
conda安装指定版本TensorFlow

文章目录 * – 一、系统环境 – 二、安装步骤一、系统环境操作系统：Windows7 64位，Python环境：Python3.7；conda 4.1…

人工智能 2023年5月23日
0097
Python计算机视觉——图像处理基础

目录 1.什么是图像 2.图像处理——直方图均衡化 3.图像处理——高斯滤波 4.代码实现 5.实验结果 1.什么是图像图像都是由像素(pixel)构成的，即图像中的小方格，这些…

人工智能 2023年6月21日
00102
torch 中的 stft、torchaudio 中的 Spectrogram、Melscale、MelSpectrogram 的使用

torch.stft output = torch.stft(input, n_fft, hop_length=None, win_length=None, window=None…

人工智能 2023年6月15日
0088
演化博弈及Python实现

目录一、写在前面二、演化博弈三、模型构建 3.1博弈收益矩阵 3.2综合期望 3.3复制动态方程 3.4可能的均衡点 3.5局部稳定分析法四、理论分析 4.1演化相位图 4…

人工智能 2023年7月26日
0091

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

吴恩达机器学习作业笔记（Logistic 回归）

零基础知识

计算梯度时用到的方程

; 代码

大家都在看