刘二大人 PyTorch深度学习实践笔记 P9 多分类问题

2023年7月23日上午10:42 • 人工智能 • 阅读 60

刘二大人 PyTorch深度学习实践笔记 P9 多分类问题

P9 多分类问题
*
1、softmax函数
2、作业：CrossEntropyLoss vs NULLoss
–
3、应用在MINIST数据集
–
- I 实现过程
- II 实现代码
5、作业

P9 多分类问题

1、softmax函数

糖尿病数据集分类为0和1，MNIST数据集有10个分类怎么办？输出时输出10个y？

神经网络希望输出之间是带有竞争性的，即所有概率之和为1，且所有概率均大于0，softmax可以实现这两点。

图中绿色框中就是指包括softmax的计算过程：

; 2、作业：CrossEntropyLoss vs NULLoss

I NLLLoss损失函数

代码实现如下：

import numpy as np
y = np.array([1, 0, 0])
z = np.array([0.2, 0.1, -0.1])
y_pred = np.exp(z) / np.exp(z).sum()
loss = (- y * np.log(y_pred)).sum()
print(loss)

输出：

0.9729189131256584

II CrossEntropyLoss损失函数

CrossEntropyLoss损失函数 = Softmax + NLLLoss损失函数
神经网络的最后一层不需要做激活(经过Softmax层的计算)，直接输入到CrossEntropyLoss损失函数中就可以。

代码实现如下：

import torch
y = torch.LongTensor([0])
z = torch.Tensor([[0.2, 0.1, -0.1]])
criterion = torch.nn.CrossEntropyLoss()
loss = criterion(z, y)
print(loss)

输出：

tensor(0.9729)

III 举例

import torch
criterion = torch.nn.CrossEntropyLoss()

Y = torch.LongTensor([2, 0, 1])

Y_pred1 = torch.Tensor([[0.1, 0.2, 0.9],
                        [1.1, 0.1, 0.2],
                        [0.2, 2.1, 0.1]])
Y_pred2 = torch.Tensor([[0.8, 0.2, 0.3],
                        [0.2, 0.3, 0.5],
                        [0.2, 0.2, 0.5]])

l1 = criterion(Y_pred1, Y)
l2 = criterion(Y_pred2, Y)
print("Batch Loss1 = ", l1.data, "\nBatch Loss2 = ", l2.data)

输出：

Batch Loss1 =  tensor(0.4966)
Batch Loss2 =  tensor(1.2389)

3、应用在MINIST数据集

I 实现过程

准备数据集
设计模型
构造损失函数和优化器
训练+测试(前馈、反馈、更新)

II 实现代码

import torch
from torchvision import transforms
from torchvision import datasets
from torch.utils.data import DataLoader
import torch.nn.functional as F
import torch.optim as optim

batch_size = 64

transform = transforms.Compose([
    transforms.ToTensor(),

    transforms.Normalize((0.1307, ), (0.3081, ))
])

train_dataset = datasets.MNIST(root='dataset/mnist/',
                               train=True,
                               download=True,
                               transform=transform)
train_loader = DataLoader(train_dataset,
                          shuffle=True,
                          batch_size=batch_size)
test_dataset = datasets.MNIST(root='dataset/mnist',
                              train=False,
                              download=True,
                              transform=transform)
test_loader = DataLoader(test_dataset,
                         shuffle=False,
                         batch_size=batch_size)

class Net(torch.nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.l1 = torch.nn.Linear(784, 512)
        self.l2 = torch.nn.Linear(512, 256)
        self.l3 = torch.nn.Linear(256, 128)
        self.l4 = torch.nn.Linear(128, 64)
        self.l5 = torch.nn.Linear(64, 10)

    def forward(self, x):
        x = x.view(-1, 784)
        x = F.relu(self.l1(x))
        x = F.relu(self.l2(x))
        x = F.relu(self.l3(x))
        x = F.relu(self.l4(x))
        return self.l5(x)

model = Net()

criterion = torch.nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.5)

def train(epoch):
    running_loss = 0.0
    for batch_idx, data in enumerate(train_loader, 0):
        inputs, target = data
        optimizer.zero_grad()

        outputs = model(inputs)
        loss = criterion(outputs, target)
        loss.backward()
        optimizer.step()

        running_loss += loss.item()

        if batch_idx % 300 == 299:
            print('[%d,%5d] loss:%.3f' % (
            epoch + 1, batch_idx + 1, running_loss / 300))
            running_loss = 0.0

def test():
    correct = 0
    total = 0
    with torch.no_grad():
        for data in test_loader:
            images, labels = data
            outputs = model(images)

            _, predicted = torch.max(outputs.data, dim=1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()
    print('Accuracy on test set:%d %%' % (100 * correct / total))

if __name__ == '__main__':

    for epoch in range(10):
        train(epoch)
        test()

输出：

[1,  300] loss:2.256
[1,  600] loss:1.102
[1,  900] loss:0.432
Accuracy on test set:89 %
[2,  300] loss:0.331
[2,  600] loss:0.279
[2,  900] loss:0.238
Accuracy on test set:93 %
[3,  300] loss:0.198
[3,  600] loss:0.180
[3,  900] loss:0.158
Accuracy on test set:95 %
[4,  300] loss:0.137
[4,  600] loss:0.124
[4,  900] loss:0.119
Accuracy on test set:96 %
[5,  300] loss:0.102
[5,  600] loss:0.101
[5,  900] loss:0.093
Accuracy on test set:96 %
[6,  300] loss:0.083
[6,  600] loss:0.072
[6,  900] loss:0.078
Accuracy on test set:97 %
[7,  300] loss:0.063
[7,  600] loss:0.060
[7,  900] loss:0.064
Accuracy on test set:97 %
[8,  300] loss:0.047
[8,  600] loss:0.052
[8,  900] loss:0.054
Accuracy on test set:97 %
[9,  300] loss:0.040
[9,  600] loss:0.040
[9,  900] loss:0.042
Accuracy on test set:97 %
[10,  300] loss:0.030
[10,  600] loss:0.031
[10,  900] loss:0.035
Accuracy on test set:97 %

损失不断降低，准确率高达97%，但是到最后准确率就上不去了，是因为对图像用全连接神经网络忽略了对局部信息的利用，把所有的元素都全连接了，处理时权重不够高，处理图像时更关心高级别的特征。
如果可以先做特征提取，再做分类训练，效果可能会好些。
人工特征(wavelet )提取方法：FFT傅里叶变换、小波变化
自动特征提取：CNN

5、作业

代码：


import pandas as pd
import numpy as np
import torch
from torch.utils.data import Dataset
from torch.utils.data import DataLoader
import torch.optim as optim

def labels2id(labels):
    target_id = []
    target_labels = ['Class_1','Class_2','Class_3','Class_4','Class_5','Class_6','Class_7','Class_8','Class_9']
    for label in labels:
        target_id.append(target_labels.index(label))
    return target_id

class OttogroupDataset(Dataset):
    def __init__(self, filepath):
        data = pd.read_csv(filepath)
        labels = data['target']
        self.len = data.shape[0]

        self.x_data = torch.tensor(np.array(data)[:, 1:-1].astype(float))
        self.y_data = labels2id(labels)

    def __getitem__(self, index):
        return self.x_data[index], self.y_data[index]

    def __len__(self):
        return self.len

train_dataset = OttogroupDataset('dataset/otto-group/train.csv')

train_loader= DataLoader(dataset=train_dataset, batch_size=64, shuffle=True, num_workers=0)

class Net(torch.nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.l1 = torch.nn.Linear(93, 64)
        self.l2 = torch.nn.Linear(64, 32)
        self.l3 = torch.nn.Linear(32, 16)
        self.l4 = torch.nn.Linear(16, 9)
        self.relu = torch.nn.ReLU()

    def forward(self, x):
        x = self.relu(self.l1(x))
        x = self.relu(self.l2(x))
        x = self.relu(self.l3(x))
        return self.l4(x)

    def predict(self, x):
        with torch.no_grad():
            x = self.relu(self.l1(x))
            x = self.relu(self.l2(x))
            x = self.relu(self.l3(x))
            x = self.relu(self.l4(x))

            _, predicted = torch.max(x, dim=1)

            y = pd.get_dummies(predicted)
            return y

model = Net()

criterion = torch.nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr = 0.01, momentum=0.5)

def train(epoch):
    running_loss = 0.0
    for batch_idx, data in enumerate(train_loader):
        inputs, target = data
        inputs = inputs.float()
        optimizer.zero_grad()

        outputs = model(inputs)
        loss = criterion(outputs, target)
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        if batch_idx % 300 == 299:
            print('[%d,%5d] loss:%.3f' % (epoch + 1, batch_idx + 1, running_loss / 300))
            running_loss = 0.0

if __name__ =='__main__':
    for epoch in range(50):
        train(epoch)

def predict_save():
    test_data = pd.read_csv('dataset/otto-group/test.csv')
    test_inputs = torch.tensor(np.array(test_data)[:, 1:].astype(float))
    out = model.predict(test_inputs.float())

    labels = ['Class_1', 'Class_2', 'Class_3', 'Class_4', 'Class_5', 'Class_6',
              'Class_7', 'Class_8', 'Class_9']

    out.columns = labels

    out.insert(0, 'id', test_data['id'])
    output = pd.DataFrame(out)
    output.to_csv('my_predict.csv', index=False)
    return output
predict_save()

Original: https://blog.csdn.net/qq_44948213/article/details/126480753
Author: 小白*进阶ing
Title: 刘二大人 PyTorch深度学习实践笔记 P9 多分类问题

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/710455/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Recognition算法使用的数据类型是什么

Recognition算法使用的数据类型是什么？ Recognition算法通常使用图像或者语音数据类型进行识别。在图像识别中，一般使用数字形式的像素点数据作为输入。在语音识别中，…

人工智能 2024年1月3日
0043
朴素贝叶斯基本原理和预测过程、先验概率、后验概率、似然概率概念

贝叶斯原理是英国数学家托马斯·贝叶斯提出的。贝叶斯原理建立在主观判断的基础上：在我们不了解所有客观事实的情况下，同样可以先估计一个值，然后根据实际结果不断进行修正。举例： …

人工智能 2023年6月16日
0099
我公司有个统计学的985应届（硕士）从事数据分析岗位

我公司有个统计学的985应届（硕士）从事数据分析岗位，公司给了她15000一个月，万万没有想到，她不能直接胜任工作，耽误公司的进度，经理批评了几句，今天她主动离职了，这就是95后的…

人工智能 2023年6月11日
0077
详细解释：Epoch、batch_size批处理大小、迭代次数之间的关系

Epoch、batch_size批处理大小、迭代次数之间的关系问题：当遇到参数Epoch时，我们应该将其具体设置多少呢？或者应该迭代多少次呢？举例说明问题：当遇到参数Epoc…

人工智能 2023年7月23日
00105
python wave_Python wave模块：处理WAVE音频文件

wave 模块让用户读写、分析及创建 WAVE(.wav)文件。可以使用 wave 模块的 open() 方法打开旧文件或创建新文件。其语法格式如下： open(file [, m…

人工智能 2023年5月27日
00110
L1范数，L2范数，L2,1范数（向量范数、矩阵范数、正则化）

参考文章如下：https://blog.csdn.net/lqzdreamer/article/details/79676305 https://blog.csdn.net/lqz…

人工智能 2023年6月12日
0092
Torch 、torchvision 、Python 版本对应关系以及安装 GPU 或 CPU 版本的 pytorch

文章目录 * – 1. torch – torchvision – python 版本对应关系 – 2. CUDA Toolkit …

人工智能 2023年7月21日
00347
搭建神经网络模型对MNIST手写数字分类并测试模型性能

目录一、MNIST数据集介绍二、搭建神经网络模型对MNIST手写数据集分类 1.读取数据集 2.数据预处理 3.搭建神经网络 4.测试模型性能三、报错解决四、测试运行一、…

人工智能 2023年7月2日
0075
RK3588(自带NPU)的环境搭建和体验（一）

前言：这是本系列文章的第一篇，这里介绍一些必要的环境和工具，后面的文章不再介绍。工具：i7-6700四核八线程、GTX960M显卡的渣渣笔记本（16G内存 + 512G固态 +1…

人工智能 2023年7月25日
0088
PaddleNLP基于ERNIR3.0文本分类以CAIL2018-SMALL数据集罪名预测任务为例【多标签】

NLP专栏简介：数据增强、智能标注、意图识别算法|多分类算法、文本信息抽取、多模态信息抽取、可解释性分析、性能调优、模型压缩算法等专栏详细介绍：NLP专栏简介：数据增强、智能标注…

人工智能 2023年7月1日
0094
异常检测论文阅读（一）——DRÆM：A discriminatively trained reconstruction embedding for surfaceanomaly detection

目录重构子网络判别子网络模拟异常产生表面异常定位与检测近年来的表面异常检测方法依赖于生成模型来精确重构正常区域。这些方法只对无异常的图像进行训练，通常需要手工制作后处理步…

人工智能 2023年7月13日
0059
神经网络——基础思想

神经网络神经网络是一种通过模拟人脑的神经网络，来实现类人工智能的机器学习技术。人脑中的神经网络是一个非常复杂的组织。成人的大脑中估计有1000亿个神经元之多。用一个例子来学习神…

人工智能 2023年7月14日
0067
在家靠python爬虫兼职月入3w+：成年人的世界，钱是底气！

前言在2022年新一轮Y情期间，” 有啥方法，可在家快速赚钱？“冲上了热门话题。（文末送福利） “好想挣钱啊……&#…

人工智能 2023年7月4日
0079
SimpleITK使用——2. 进行crop操作

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月26日
0098
〖Python自动化办公篇㉑〗- python实现邮件自动化 – 定时发送邮件

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月5日
0073
Python数据清洗——Pandas

文章目录一、Series的定义和使用 * 1.1 Series索引标签的添加 – 1.1.1 创建Series对象时添加 1.1.2 建立好Series后用一个新的列…

人工智能 2023年7月6日
0055

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

刘二大人 PyTorch深度学习实践 笔记 P9 多分类问题

刘二大人 PyTorch深度学习实践 笔记 P9 多分类问题

1、softmax函数

; 2、作业：CrossEntropyLoss vs NULLoss

I NLLLoss损失函数

II CrossEntropyLoss损失函数

III 举例

3、应用在MINIST数据集

I 实现过程

II 实现代码

5、作业

大家都在看

刘二大人 PyTorch深度学习实践笔记 P9 多分类问题

刘二大人 PyTorch深度学习实践笔记 P9 多分类问题