神经网络多分类的实现总结

2023年7月1日下午1:45 • 人工智能 • 阅读 87

one-hot

在多分类中，必须知道one-hot编码。独热编码即 One-Hot 编码，又称一位有效编码。其方法是使用 N位状态寄存器来对 N个状态进行编码，每个状态都有它独立的寄存器位，并且在任意时候，其中只有一位有效。

举例
假设我们有四个样本（行），每个样本有三个特征（列），如图：

上述feature_1有两种可能的取值，比如是男/女，这里男用1表示，女用2表示。feature_2 和 feature_3 各有4种取值（状态）。
one-hot 编码就是保证 每个样本中的单个特征只有1位处于状态1，其他的都是0。。
上述状态用 one-hot 编码如下图所示：
神经网络多分类的实现总结

基于torch的one-hot代码

import torch.nn.functional as F
import torch

num_class = 5
label = torch.tensor([0, 2, 1, 4, 1, 3])
one_hot = F.one_hot(label, num_classes=5 )
print(one_hot)
"""
tensor([[1, 0, 0, 0, 0],
        [0, 0, 1, 0, 0],
        [0, 1, 0, 0, 0],
        [0, 0, 0, 0, 1],
        [0, 1, 0, 0, 0],
        [0, 0, 0, 1, 0]])
"""

基于numpy的one-hot代码

import numpy as np
&#x8BBE;&#x7F6E;&#x7C7B;&#x522B;&#x7684;&#x6570;&#x91CF;
num_classes = 10
&#x9700;&#x8981;&#x8F6C;&#x6362;&#x7684;&#x6574;&#x6570;
arr = [1, 3, 4, 5, 9]
&#x5C06;&#x6574;&#x6570;&#x8F6C;&#x4E3A;&#x4E00;&#x4E2A;10&#x4F4D;&#x7684;one hot&#x7F16;&#x7801;
print(np.eye(10)[arr])

多分类的损失函数

多分类问题一般用 softmax作为神经网络的最后一层，然后计算交叉熵损失。

softmax原理

softmax函数的作用是将每个类别所对应的输出分量归一化，使各个分量的和为1。可以理解为将每个输出分量转化为对应的概率。

softmax的计算步骤如下：
1.算出e关于每个输入向量的每个元素的幂
2.将所有的幂相加，得到分母
3.每个幂作为相应位置输出结果的分子
4.输出的概率=分子/分母

计算公式：

看一个简单是例子，比如输入向量为[-1,0,3,5]，softmax的计算结果如下表。
神经网络多分类的实现总结

; 交叉熵损失函数

交叉熵的原理

关于样本集的两个概率分布p和q，设p为真实的分布，比如[1,0,0]表示样本属于第一类，q为预测的概率分布，比如[0.7,0.2,0.1]

按照真实分布p来衡量识别一个样本所需的编码长度的期望，即平均编码长度（信息熵）：

如果使用预测的概率分布q来表示来自真实分布p的编码长度的期望，即平均编码长度（交叉熵）：

恒成立，当q为真实分布时取等，我们将由q得到的平均编码长度比由p得到的平均编码长度多出的bit数称为相对熵，也叫KL散度：
神经网络多分类的实现总结

在机器学习的分类问题中，我们希望缩小模型预测和标签之间的差距，即KL散度越小越好，在这里由于KL散度中的H§项不变（在其他问题中未必），故在优化过程中只需要关注交叉熵就可以了，因此一般使用交叉熵作为损失函数。

; 多分类任务中的交叉熵损失函数

PyTorch中的交叉熵损失函数实现

pytorch提供了两个类来计算交叉熵，分别是CrossEntropyLoss() 和NLLLoss()。
对于torch.nn.CrossEntropyLoss()定义如下:

torch.nn.CrossEntropyLoss(
    weight=None,
    ignore_index=-100,
    reduction="mean",
)

如果weight被指定，

import torch
import torch.nn as nn

model = nn.Linear(10, 3)
criterion = nn.CrossEntropyLoss()

x = torch.randn(16, 10)
y = torch.randint(0, 3, size=(16,))  # (16, )
logits = model(x)  # (16, 3)

loss = criterion(logits, y)

对于torch.nn.NLLLoss()定义如下:

torch.nn.NLLLoss(
    weight=None,
    ignore_index=-100,
    reduction="mean",
)

import torch
import torch.nn as nn

model = nn.Sequential(
    nn.Linear(10, 3),
    nn.LogSoftmax()
)
criterion = nn.NLLLoss()

x = torch.randn(16, 10)
y = torch.randint(0, 3, size=(16,))  # (16, )
out = model(x)  # (16, 3)

loss = criterion(out, y)

心得

1.CrossEntropyLoss() 和NLLLoss()的使用是不一样的,使用CrossEntropyLoss() 的网络架构不需要最后一层加入softmax,而NLLLoss()则需要加入softmax.

2.在使用CrossEntropyLoss() 和NLLLoss()的时候,不需要进行one_hot编码,函数会自动处理
3.由于不需要进行one_hot编码,由于网络预测结果的维度会比label的维度多1. 当预测的维度大于2时,第二维度是label的个数(由损失函数的源码可知).

参考链接：

Original: https://blog.csdn.net/qq_42178122/article/details/121459653
Author: Good@dz
Title: 神经网络多分类的实现总结

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/663459/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python数据分析之道(Pandas)

一、概述 1、pandas是Python张处理大数据集的首选如啊年包，通常处理1GB左右的数据集，大于1GB通常建议使用其他软件库(如Vaex) 2、pandas == panel…

人工智能 2023年7月16日
0050
常用激活函数的优缺点

非线性激活函数是深度学习网络重要的组成部分，随着近几年的快速发展，越来越多的激活函数被提出与改进。选择一个合适的激活函数将决定了模型的最终结果。下文总结了13种常见的激活函数的计算…

人工智能 2023年7月14日
0059
电影推荐系统（数据预处理+模型训练+预测）

博客源地址电影推荐思路利用doc2vec做电影推荐，其实核心就是比较两部电影介绍文本之间的向量相似程度。自然语言处理中的分布式假设提出了”某个单词的含义由它周围的单…

人工智能 2023年5月30日
00128
YOLO v4相比较YOLO v3的改进之处

输入端：这里指的创新主要是训练时对输入端的改进，主要包括 Mosaic数据增强、cmBN、SAT自对抗训练 BackBone主干网络：将各种新的方式结合起来，包括： CSPDark…

人工智能 2023年7月11日
0051
机器学习实战（1）-文本分类

参考链接：14种分类算法进行文本分类实战：https://blog.csdn.net/qq_41731978/article/details/109459234（这个博主写的很详细…

人工智能 2023年7月1日
0055
MySQL的卸载与安装

MySQL的卸载与安装环境：Ubuntu20.04 MySQL版本： 5.7 注：Ubuntu 20.04 版本系统自带的 MySQL 版本是 8.0，本文给出 5.7 版本的安…

人工智能 2023年6月27日
0078
论文翻译解读：Anytime Bottom-Up Rule Learning for Knowledge Graph Completion【AnyBURL】

随时自底向上的知识图谱完成规则学习简要信息序号属性值1模型名称AnyBURL2所属领域知识图谱3研究内容链接预测4核心内容基于规则的链接预测5GitHub源码AnyBURL 6…

人工智能 2023年6月1日
0072
PaddleDetection：FCOS Anchor Free目标检测算法

2021SC@SDUSC本周分析 Anchor Based方法当我们提到当前主流的目标检测算法时，无论是多阶段的各种RCNN和单阶段的SSD、YoloV3等等都是基于Anchor…

人工智能 2023年7月12日
0049
Opencv学习笔记 – 使用opencvsharp和随机森林进行分类和回归问题

随机森林（Random Forest，RF）是一种简单易用的机器学习算法。即使在没有超参数调整的情况下，随机森林在大多数情况下仍可获得还算不错的结果。可用于分类任务和回归任务，是常…

人工智能 2023年7月2日
0054
数据结构专题 | 先序非递归遍历二叉树

一、队列的类型定义二、顺序队列的表示和实现 2.1 初始化队列 2.2 入队 2.3 出队 2.4 判断循环队列是否为空三、链队的表示和实现 3.1 链队的初始化 3.2 判断…

人工智能 2023年6月27日
0071
机器学习初探：（五）逻辑回归之多分类

（五）逻辑回归 – 多分类图片出处文章目录（五）逻辑回归 – 多分类 * 逻辑回归多分类（One-vs-all logistic regressi…

人工智能 2023年6月30日
0095
树莓派最新64位系统部署yolov5

目录一、适用版本二、部署过程 1、下载yolov5 2、安装opencv和pytorch 安装opencv 安装pytorch 3、安装yolov5 4、运行detect.py…

人工智能 2023年7月21日
00114
AAAI论文摘要【知识图谱补全】：A Survey on knowledge Graphs：Representation，Acquisition and Application

A Survey on knowledge Graphs：Representation，Acquisition and Application 主要思路全面回顾知识图谱表示学习…

人工智能 2023年6月10日
0058
python k-means聚类算法物流分配预测实战（超详细，附源码）

数据集和地图可以点赞关注收藏后评论区留下QQ邮箱或者私信博主要聚类是一类机器学习基础算法的总称。聚类的核心计算过程是将数据对象集合按相似程度划分成多个类，划分得到的每个类称为聚…

人工智能 2023年7月6日
0072
网络退化现象和残差网络效果

介绍最近在网上看见了一个用神经网络实现“一个字符串的所有字母用它的后继字母代替（比如，a用b代替，b用c代替）”功能的代码。看见里面加了一个残差网络，就去…

人工智能 2023年7月14日
0066
免费GPU：九天•毕昇平台使用教程

背景深度学习非常依赖设备，训练模型就类似在”炼丹”，没有好的炼丹炉，想要复现顶刊中那些动辄8卡/4卡 Tesla V100显卡训练的模型，只能是&#822…

人工智能 2023年7月25日
00200

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

神经网络多分类的实现总结

softmax原理

交叉熵的原理

; 多分类任务中的交叉熵损失函数

PyTorch中的交叉熵损失函数实现

大家都在看