深度学习——（7）分类任务

2023年7月2日下午3:44 • 人工智能 • 阅读 88

深度学习——（7）分类任务

文章目录

深度学习——（7）分类任务
*
1. 学习目的
2. 上代码
–
+
3. 注意
–
+
- 3.1 可以计算在验证集上的准确率
- 3.2 optimizer中的SGD和Adam

1. 学习目的

以mnist为例，对构建一个10分类的model
对model的写法做基本认识
（里面涉及一些详细的知识点，在后期建立model的时候可能不需要这种复杂的写法，只是为了更清楚的了解网络的具体内部运算过程）
注：在jupyter中进行

2. 上代码

2.1 下载数据集

%matplotlib inline

from pathlib import Path
import requests

DATA_PATH = Path("data")
PATH = DATA_PATH / "mnist"

PATH.mkdir(parents=True, exist_ok=True)

URL = "http://deeplearning.net/data/mnist/"
FILENAME = "mnist.pkl.gz"

if not (PATH / FILENAME).exists():
        content = requests.get(URL + FILENAME).content
        (PATH / FILENAME).open("wb").write(content)

2.2 加载数据

import pickle
import gzip

with gzip.open((PATH / FILENAME).as_posix(), "rb") as f:
        ((x_train, y_train), (x_valid, y_valid), _) = pickle.load(f, encoding="latin-1")

注：初学者，不要只是运行别人的代码，搞清楚里面的每一步得到的是什么数据，不要ctrl+enter就完事了，如果在ide 可以选择调试，在notebook直接单拎出来打印看看数据类型，数据shape或者直接打印value看看里面到底是什么。

2.3 简单查看数据，熟悉数据

from matplotlib import pyplot
import numpy as np

pyplot.imshow(x_train[0].reshape((28, 28)), cmap="gray")
print(x_train.shape)

2.4 将数据转换为tensor

注：数据需要提前转换为tensor才能参与后续建模训练

import torch

x_train, y_train, x_valid, y_valid = map(
    torch.tensor, (x_train, y_train, x_valid, y_valid)
)
n, c = x_train.shape
x_train, x_train.shape, y_train.min(), y_train.max()
print(x_train, y_train)
print(x_train.shape)
print(y_train.min(), y_train.max())

2.5 torch.nn.functional 很多层和函数

torch.nn.functional中有很多功能，后续会常用的。那什么时候使用nn.Module，什么时候使用nn.functional呢？一般情况下，如果模型有可学习的参数，最好用nn.Module，其他情况nn.functional相对更简单一些

import torch.nn.functional as F

loss_func = F.cross_entropy

def model(xb):
    return xb.mm(weights) + bias
bs = 64
xb = x_train[0:bs]
yb = y_train[0:bs]
weights = torch.randn([784, 10], dtype = torch.float,  requires_grad = True)
bs = 64
bias = torch.zeros(10, requires_grad=True)

print(loss_func(model(xb), yb))

2.6 创建model

必须继承nn.Module且在其构造函数中需调用nn.Module的构造函数
无需写反向传播函数，nn.Module能够利用autograd自动实现反向传播
Module中的可学习参数可以通过named_parameters()或者parameters()返回迭代器

from torch import nn

class Mnist_NN(nn.Module):
    def __init__(self):
        super().__init__()
        self.hidden1 = nn.Linear(784, 128)
        self.hidden2 = nn.Linear(128, 256)
        self.out  = nn.Linear(256, 10)
        self.dropout=nn.Dropout(0.5)

    def forward(self, x):
        x = F.relu(self.hidden1(x))
        x = F.relu(self.hidden2(x))
        x = self.out(x)
        return x
net = Mnist_NN()
print(net)

2.7 打印权重和偏执

此处没有使用迁移学习，使用别人以前训练好的参数作为权重初始化，所以开始的权重都是随机生成的。

for name, parameter in net.named_parameters():
    print(name, parameter,parameter.size())

2.8 使用tensordataset和dataloader对数据进行简化

from torch.utils.data import TensorDataset
from torch.utils.data import DataLoader

train_ds = TensorDataset(x_train, y_train)
train_dl = DataLoader(train_ds, batch_size=bs, shuffle=True)

valid_ds = TensorDataset(x_valid, y_valid)
valid_dl = DataLoader(valid_ds, batch_size=bs * 2)

注：shuffle 将数据打乱，使数据尽量没有规律，一般在训练网络时设置为True,让原来的数据没有规律，在验证的时候设置为FALSE

def get_data(train_ds, valid_ds, bs):
    return (
        DataLoader(train_ds, batch_size=bs, shuffle=True),
        DataLoader(valid_ds, batch_size=bs * 2),
    )

2.9 网络训练前准备工作

定义训练函数 ， 可不定义，直接写进主函数

import numpy as np

def fit(steps, model, loss_func, opt, train_dl, valid_dl):
    for step in range(steps):
        model.train()
        for xb, yb in train_dl:
            loss_batch(model, loss_func, xb, yb, opt)

        model.eval()
        with torch.no_grad():
            losses, nums = zip(
                *[loss_batch(model, loss_func, xb, yb) for xb, yb in valid_dl]
            )
        val_loss = np.sum(np.multiply(losses, nums)) / np.sum(nums)
        print('当前step:'+str(step), '验证集损失：'+str(val_loss))

注：

一般在训练模型时加上model.train()，这样会正常使用Batch Normalization和 Dropout。训练的时候要更新权重
测试的时候一般选择model.eval()，这样就不会使用Batch Normalization和 Dropout。验证的时候不更新参数，所以是torch.no_grad()
zip 两个array进行配对的打包结果，unzip表示解压包。

定义获取model函数

from torch import optim
def get_model():
    model = Mnist_NN()
    return model, optim.SGD(model.parameters(), lr=0.001)

计算batch的loss

def loss_batch(model, loss_func, xb, yb, opt=None):
    loss = loss_func(model(xb), yb)

    if opt is not None:
        loss.backward()
        opt.step()
        opt.zero_grad()

    return loss.item(), len(xb)

注：torch上的每一次迭代都是独立的，opt.zero_grad清空以前的梯度，三个要固定一起出现

2.10 训练

train_dl, valid_dl = get_data(train_ds, valid_ds, bs)
model, opt = get_model()
fit(20, model, loss_func, opt, train_dl, valid_dl)

3. 注意

3.1 可以计算在验证集上的准确率

correct=0
total=0
for xb,yb in valid_dl:
    output=model(xb)
    _,predict=torch.max(output.data,1)
    total += yb.size(0)
    correct += (predict==yb).sum().item()

print('ACC of the network on 10000 test image:%d  %%' %(100* correct / total))

3.2 optimizer中的SGD和Adam

现在多用Adam,他的下降速度要比其他的快。上面有他和SGD的对比。也可以自己训练的时候试试。

Original: https://blog.csdn.net/qq_43368987/article/details/126581326
Author: 柚子味的羊
Title: 深度学习——（7）分类任务

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/665733/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

基于极限学习机的轴承故障分类（西储大学数据）

matlab2018pycharm2020python版本：python3.7（重要） import numpy as np import scipy.io as scio fro…

人工智能 2023年7月2日
0080
微信铃声设置教程，怎么设置微信铃声？

1.在手机中打开微信，在底部找到【我】-【设置】，进入微信的设置界面。 2.点击【新消息提醒】，进入微信通知提醒的设置页面。在”声音与振动”下可以看到【…

人工智能 2023年5月27日
0091
数据分析 Numpy快速入门

导入库 import numpy as np 1-数组的创建 1-1 列表创建数组 a1 = np.array([1,2,3]) a1 array([1, 2, 3]) 1-2 元…

人工智能 2023年7月16日
0094
利用微软接口制作的文字转语音神器Read Aloud

最近，抖音(雏菊点子)一时兴起再次被使用，偶尔会传一些电脑/手机截图，基本上都是一些被分享的有用软件的实际操作。有兴趣的朋友可以关注并帮助提出建议。 [En] Recently, …

人工智能 2023年5月25日
00107
自然语言处理（二）：文本预处理之文本处理的基本方法

文本预处理中包含的主要环节文本处理的基本方法文本张量表示方法文本语料的数据分析文本特征处理数据增强方法文本处理的基本方法分词词性标注命名实体识别文本张量表示方法…

人工智能 2023年5月31日
0099
把数据库里的未付款订单改成已付款，会发生什么

啊哦~你想找的内容离你而去了哦 [TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:ser…

人工智能 2023年6月2日
0095
2022电子设计竞赛自主不成熟设计

基于2022测控题目的方案题目： 2022年TI杯大学生电子设计竞赛声源定位跟踪系统（ E 题）一、任务设计制作一个声源定位跟踪系统，能够实时显示及指示声源的位置，当声源移…

人工智能 2023年6月24日
00128
SPSS异方差检验的实现

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月18日
0066
【Python】（2022.07.03）在Jupyter Notebook中调用Stata17并绘制3D图展示回归结果的边际效应

文章目录背景介绍：实现结果安装过程 * 安装stata_setup包 – 检查是否安装成功常见问题调用stata – 常见问题 + 1. stat…

人工智能 2023年6月17日
0079
云GPU（恒源云）训练的具体操作流程

简介这篇博客主要讲一下怎么使用云服务器上的GPU跑程序，主要是一些设置和操作步骤，具体的训练步骤可以看我的另一篇博客。以下步骤可能会有遗漏，也可能和你们有一些差别，有什么问题可…

人工智能 2023年6月23日
00257
如何进行探索性数据分析

一般数据分析项目第一步都需要探索性数据分析。主要包括三个方面：使用描述性统计汇总数据使用图标可视化数据识别缺失值通过上述三个方面分析，可以在执行假设检验或统计模型之前对数据…

人工智能 2023年7月6日
0075
【自动驾驶】Frenet坐标系与Cartesian坐标系（一）

文章目录参考资料 * 【自动驾驶】Frenet坐标系与Cartesian坐标系（二） 1. Frenet坐标系介绍 * 1.1 Cartesian坐标系 1.2 Frenet坐标…

人工智能 2023年6月10日
0098
c++/opencv 配置、常见的问题：无法打开源文件“opencv2/opencv.hpp“和“opencv2/tracking.hpp“的问题

目录 c++/opencv 配置常见问题1：LNK2019 无法解析的外部符号 “class cv::debug_build_guard::_InputOutputA…

人工智能 2023年6月18日
00103
Pandas学习笔记

Pandas学习笔记导入库 import pandas as pd 读取文件数据 df = pd.read_csv("data/dogName.csv") S…

人工智能 2023年7月8日
00100
Pandas教程（非常详细）

文章目录 * – 教程特点 – 阅读条件* Pandas是什么* – Pandas主要特点 – Pandas主要优势 –…

人工智能 2023年7月16日
0056
【pandas】空数据处理

目录 1、判断空值 .isna() 2、空值删除 .dropna() 3、空值替换 .dropna() 数据清洗是对一些没有用的数据进行处理的过程。很多数据集存在数据缺失、数据格…

人工智能 2023年7月15日
0071

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

深度学习——（7）分类任务

文章目录

1. 学习目的

2. 上代码

2.1 下载数据集

2.2 加载数据

2.3 简单查看数据，熟悉数据

2.4 将数据转换为tensor

2.5 torch.nn.functional 很多层和函数

2.6 创建model

2.7 打印权重和偏执

2.8 使用tensordataset和dataloader对数据进行简化

2.9 网络训练前准备工作

2.10 训练

3. 注意

3.1 可以计算在验证集上的准确率

3.2 optimizer中的SGD和Adam

大家都在看