import numpy as np
import matplotlib.pyplot as plt
from scipy.io import loadmat  # 读入matlab格式的文件
from scipy.optimize import minimize
from sklearn.metrics import classification_report  # 这个包是评价报告

接着加载数据，其中包含5000个训练示例，每个训练示例为20×20的数字灰度图，每个像素都有一个浮点数表示，其中20×20被转为1×400，每个训练示例为数据矩阵X的一行，每一行都是一个手写数字图像的训练示例。

训练集第二部分为5000维的向量y，它包含训练集的标签，需要注意的是由于这里是mat格式的文件，在Matlab中没有零索引，所以数字0被标记为10，而1到9按照自然顺序被标记为1到9

加载数据集
path = r'E:\Code\ML\ml_learning\ex3-neural network\ex3data1.mat'
data = loadmat(path)
X = data['X'] # (5000,400)
y = data['y'] # (5000,1)

数据可视化

由于数据太多，所以随机选取100张进行显示。

def plot_100_image(X):
"""
    随机画100个数字
"""
    # 抽100个索引
    sample_idx = np.random.choice(np.arange(X.shape[0]), 100)
    sample_images = X[sample_idx, :]
    fig, ax_array = plt.subplots(nrows=10, ncols=10, sharey=True, sharex=True, figsize=(8, 8))
    for row in range(10):
        for column in range(10):
            # 这里需要将数据变成20×20，且转置否则显示的图像是歪的
            ax_array[row, column].matshow(sample_images[10 * row + column].reshape((20, 20)).T,
                                          cmap='gray_r')

    plt.xticks([])# 不显示刻度
    plt.yticks([])
    plt.show()

正则化逻辑回归

在这一部分将使用多个逻辑回归模型从而构成一个多类分类器，由于有10个数字，因此需要训练10个独立的逻辑回归分类器。在这里就不展示非正则化的逻辑回归，而直接写正则化下的公式

正则化代价函数

Sigmoid函数公式就不予展示了，正则化逻辑回归的代价函数定义如下

正则化梯度

需要注意θ0不需要被正则化，注意矩阵运算时的维度问题

def sigmoid(z):
    return 1 / (1 + np.exp(-z))

正则化代价函数
def costReg(theta, X, y, learningRate):
    theta = np.matrix(theta) # (1,401)
    X = np.matrix(X) # (5000,401)
    y = np.matrix(y) # (5000,1)
    part1 = y.T * np.log(sigmoid(X * theta.T))
    part2 = (1 - y.T) * np.log(1 - sigmoid(X * theta.T))
    part3 = (learningRate / (2 * len(X))) * theta * theta.T

    return float(-(part1 + part2) / len(X) + part3)

计算梯度
def gradientReg(theta, X, y, learnRate):
    # 先转成矩阵才运算
    theta = np.matrix(theta) # (1,401)
    X = np.matrix(X) # (5000,401)
    y = np.matrix(y) # (5000,1)
    reg = (learnRate / len(X)) * theta
    # θ0不被正则化
    reg[0, 0] = 0
    gradient = (X.T * (sigmoid(X * theta.T) - y)) / len(X)
    return gradient + reg.T

One-vs-all分类

这一部分实现训练10个正则化逻辑回归分类器来实现手写数字识别，每个分类器对应一个分类。

def one_vs_all(X, y, num_labels, learningRate):
    rows = X.shape[0] # 行5000
    params = X.shape[1] # 列400
    # 用于存放全部分类器的模型参数
    all_theta = np.zeros((num_labels, params + 1)) # (10,401)
    # 添加x0 = 1
    X = np.insert(X, 0, values=np.ones(rows), axis=1)
    # 通过循环训练分类器
    for i in range(1, num_labels + 1):
        theta = np.zeros(params + 1) # (401, )
        # 1代表属于当前该类，0代表不属于该类
        y_i = np.array([1 if label == i else 0 for label in y]) # (1, 400)
        y_i = np.reshape(y_i, (rows, 1))# (400,1)
        # 使用优化算法进行模型参数求解
        fmin = minimize(fun=costReg, x0=theta, args=(X, y_i, learningRate), method='TNC', jac=gradientReg)
        # 保存每一个分类器的模型参数
        all_theta[i - 1, :] = fmin.x
    return all_theta

One-vs-all预测

训练完分类器后，可以使用它来预测给定图像中包含的数字。对于每个输入，应该使用经过训练的逻辑回归分类器计算它属于每个类的”概率”。您的一对所有预测函数将选择相应的逻辑回归分类器输出最高概率的类，并返回类标签(1,2，…，或K)作为输入示例的预测。

def predict_all(X, all_theta):
    rows = X.shape[0] # 5000
    params = X.shape[1] # 400

    num_labels = all_theta.shape[0] # 10

    X = np.insert(X, 0, values=np.ones(rows), axis=1)
    X = np.matrix(X) # (5000,401)
    all_theta = np.matrix(all_theta) # (10,401)

    h = sigmoid(X * all_theta.T) # (5000, 10)
    # 获得最大值的索引
    h_argmax = np.argmax(h, axis=1) # (5000,1)
    h_argmax = h_argmax + 1
    return h_argmax

这里的 h共5000行，10列，每行代表一个样本，每列是预测对应数字的概率。我们取概率最大对应的索引加1就是我们分类器最终预测出来的类别。返回的 h_argmax是一个array，包含5000个样本对应的预测值。

all_theta = one_vs_all(X, y, 10, 1)
y_pred = predict_all(X, all_theta)
print(classification_report(data['y'], y_pred))

然后利用classification_report对预测做评价，可以得知通过多个逻辑回归分类器得出的识别准确率为94%

precision    recall  f1-score   support

           1       0.95      0.99      0.97       500
           2       0.95      0.92      0.93       500
           3       0.95      0.91      0.93       500
           4       0.95      0.95      0.95       500
           5       0.92      0.92      0.92       500
           6       0.97      0.98      0.97       500
           7       0.95      0.95      0.95       500
           8       0.93      0.92      0.92       500
           9       0.92      0.92      0.92       500
          10       0.97      0.99      0.98       500

    accuracy                           0.94      5000
   macro avg       0.94      0.94      0.94      5000
weighted avg       0.94      0.94      0.94      5000

前馈神经网络

在前一部分实现了多类逻辑回归识别手写数字，然后，逻辑回归并不能形成更复杂的假设，在这一部分，将搭建一个前馈神经网络对相同的数据集实现识别手写数字，神经网络可以实现非常复杂的非线性模型，在这部分我们将利用已经训练好的权重进行预测

模型表示

神经网络如图上所示，它包含3层—输入层，隐含层，输出层。

模型搭建

"""加载数据集与模型参数"""
path1 = r'E:\Code\ML\ml_learning\ex3-neural network\ex3weights.mat'
weight = loadmat(path1)
theta1,theta2 = weight['Theta1'],weight["Theta2"]
((25, 401), (10, 26))

"""模型搭建"""
X2 = np.matrix(np.insert(data['X'], 0, values=np.ones(X.shape[0]), axis=1))
y2 = np.matrix(y)
((5000, 401), (5000, 1))

a1 = X2 # (5000,401)
z2 = a1 *theta1.T  # (5000,25)

a2 = sigmoid(z2) # (5000,25)
a2 = np.insert(a2,0,values = np.ones(a2.shape[0]),axis = 1) # (5000,26)
z3 = a2*theta2.T # (5000, 10) theta2(10,26)
a3 = sigmoid(z3)

前馈传播与预测

"""预测"""
y_pred2 = np.argmax(a3,axis=1) + 1
print(classification_report(y2, y_pred))

precision    recall  f1-score   support

           1       0.95      0.99      0.97       500
           2       0.95      0.92      0.93       500
           3       0.95      0.91      0.93       500
           4       0.95      0.95      0.95       500
           5       0.92      0.92      0.92       500
           6       0.97      0.98      0.97       500
           7       0.95      0.95      0.95       500
           8       0.93      0.92      0.92       500
           9       0.92      0.92      0.92       500
          10       0.97      0.99      0.98       500

    accuracy                           0.94      5000
   macro avg       0.94      0.94      0.94      5000
weighted avg       0.94      0.94      0.94      5000

参考文章

https://blog.csdn.net/Cowry5/article/details/80367832

Original: https://blog.csdn.net/weixin_50345615/article/details/126285245
Author: Hyxx.
Title: 吴恩达机器学习课后作业Python实现(三)：多类分类与前馈神经网络

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/692039/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【python pandas groupby】

pandas groupby 数据聚合与分组 GroupBy 四种分组键 * DataFrame列名的值可以将分组轴向上的值和分组名称相匹配的字典或者Series –…

人工智能 2023年7月8日
0053
知识图谱学习笔记七（语义搜索）

语义搜索背景：互联网从仅包含网页和网页之间超链接的文档万维网转变成包含大量描述各种实体与实体之间丰富关系的语义万维网。以谷歌为代表的各大搜索引擎公司通过构建知识图谱来改善搜索质量…

人工智能 2023年6月1日
00113
pkg打包很慢的解决办法

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月29日
0068
Huggingface BERT源码详解：应用模型与训练优化

©PaperWeekly 原创 · 作者｜李泺秋学校｜浙江大学硕士生研究方向｜自然语言处理、知识图谱接上篇，记录一下对 HuggingFace 开源的 Transformer…

人工智能 2023年5月30日
0090
没有二十年功力，写不出 Thread.sleep(0) 这一行“看似无用”的代码

这篇文章要从一个奇怪的注释说起，就是下面这张图：我们可以不用管具体的代码逻辑，只是单单看这个 for 循环。在循环里面，专门有个变量 j，来记录当前循环次数。第一次循环以及往…

人工智能 2023年7月30日
0048
python数据分析学生成绩查询系统_python数据分析-学生成绩分析

python数据分析-学生成绩分析 python数据分析-学生成绩分析目标：分析学生成绩的影响因素 1.导入原始数据，以及需要用到的库 import pandas as pd i…

人工智能 2023年7月7日
0066
Python可视化——matplotlib.pyplot绘图的基本参数详解

plt.legend(loc="lower left") # 设置图例位置 2.13 table()：向子图中添加表格 plt.table(cellText=N…

人工智能 2023年7月3日
0041
基于ResNet50的CIFAR10分类

本次运用了 ResNet50进行了图像分类处理（基于Pytorch) 一、数据集 CIFAR-10数据集共有60000张彩色图像，这些图像是32*32，分为10个类，每类6000张…

人工智能 2023年6月30日
0065
看了几十篇轻量化目标检测论文扫盲做的摘抄笔记

摘要：本文首先介绍了轻量化目标检测及其发展历程，接着又对网络进行概述，在此基础上引出近三年来最新的轻量化目标检测算法，最后对轻量化目标检测的发展和研究做出总结。关键字：目标检测；…

人工智能 2023年6月16日
0096
目标检测—全卷积实现

目标检测—全卷积实现文章目录目标检测—全卷积实现 * 一.相关知识点的学习 – 二分类交叉熵： MSE：多分类交叉熵： FCN网络：二.代码实现目标检测首先照…

人工智能 2023年7月12日
0067
论文笔记：ICLR 2019 RotatE Knowledge Graph Embedding by Relational Rotation in Complex Space

1. 前言论文链接：https://openreview.net/forum?id=HkgEQnRqYQgithub：https://github.com/DeepGraphLe…

人工智能 2023年6月1日
0074
【文献阅读】ChineseBERT: Chinese Pretraining Enhanced by Glyph and Pinyin Information

Abstract 最近的中文预训练模型忽略了中文特有的两个重要方面：字形和拼音，它们携带重要的句法和语义信息，用于语言理解我们提出了 ChineseBERT，它将汉字的字形和拼音…

人工智能 2023年5月30日
0077
【2022】保姆级Anaconda安装与换国内源教程

一、Anaconda的安装由于Anaconda官网在境外，为了提升下载速度，我们选择从北京外国语大学镜像站下载Anaconda的安装包。截止到写作时，Anaconda3最新版本…

人工智能 2023年6月12日
00116
SpringBoot-属性绑定和bean属性校验

目录属性绑定自定义类属性绑定第三方bean属性匹配规则:松散绑定（宽松绑定） Bean属性校验属性绑定属性绑定：我们可以使用配置文件对类的属性进行赋值绑定。自定义类属…

人工智能 2023年6月30日
0047
【推荐收藏】【机器学习实战】分类（以MNIST为例）（挑战全网最全，没有之一，另附完整代码与加速库的使用）

参照《机器学习实战》第二版 1、MNIST 本章使用 MNIST数据集，这是一组由70000张手写的数字图片，每张图片都用其代表的数字标记。因此也被成为机器学习领域的”…

人工智能 2023年7月1日
0057
彻底解决 TypeError: cannot pickle ‘_thread.RLock‘ object ，以 PyTorch DDP 为例

解决问题的思路是，首先找到导致序列化失败的对象，然后将其覆盖为一个正常对象。网上能找到很多相关解答，但是往往都是授人以鱼，没有授人以渔。这个问题的出现场景很多，但是归根结底，都是…

人工智能 2023年7月5日
0079

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

吴恩达机器学习课后作业Python实现(三)：多类分类与前馈神经网络

数据集