pytorch：多标签分类的损失函数和准确率计算

2023年7月22日上午1:22 • 人工智能 • 阅读 59

1 损失函数

我们先用sklearn生成一个多标签分类数据集。

from sklearn.datasets import make_multilabel_classification

X, y = make_multilabel_classification(n_samples=1000,
                                          n_features=10,
                                          n_classes=3,
                                          n_labels=2,
                                          random_state=1)
print(X.shape, y.shape)

看一下标签长啥样。

每一行都是0、1标签，1可能有多个，这就是多标签了。
由于仍然是二分类（标签只有0和1），所以激活函数用Sigmoid（对输出的每一个维度用Sigmoid）。这个时候损失函数就是BCELoss。
如果是普通的二分类，Sigmoid的输出是一个值。用N N N表示样本数量，p n p_n p n 表示预测第n n n个样本为正例的概率，y n y_n y n 表示第 n n n个样本的标签，则BCELoss计算公式为：
l o s s = − 1 N ∑ n = 1 N y n × l o g ( p n ) + ( 1 − y n ) × l o g ( 1 − p n ) loss=-\frac{1}{N}\sum_{n=1}^{N}y_n×log(p_n)+(1-y_n)×log(1-p_n)l o s s =−N 1 n =1 ∑N y n ×l o g (p n )+(1 −y n )×l o g (1 −p n )
那么对于多标签分类呢？BCELoss会计算每一个维度上的损失然后求平均。
举个例子，假如模型某个输出是[0.2，0.6，0.8]，真实值是[0，0，1]，那么该样本损失可以计算如下：
a = 0 × l n ( 0.2 ) + 1 × l n ( 1 − 0.2 ) b = 0 × l n ( 0.6 ) + 1 × l n ( 1 − 0.6 ) c = 1 × l n ( 0.8 ) + 0 × l n ( 1 − 08 ) l o s s = ( a + b + c ) / 3 a=0×ln(0.2)+1×ln(1-0.2)\ b=0×ln(0.6)+1×ln(1-0.6)\ c=1×ln(0.8)+0×ln(1-08)\ loss=(a+b+c)/3 a =0 ×l n (0 .2 )+1 ×l n (1 −0 .2 )b =0 ×l n (0 .6 )+1 ×l n (1 −0 .6 )c =1 ×l n (0 .8 )+0 ×l n (1 −0 8 )l o s s =(a +b +c )/3
这只是单个样本的损失，最后还需要求所有样本损失的平均值。但是你就不用管了，只需要知道多标签分类用Sigmoid+BCELoss就可以完成损失计算。还有一个函数叫BCEWithLogitsLoss，是Sigmoid和BCELoss的结合。如果损失函数用这个，Sigmoid就可以不用。

2 准确率计算

依然是上面的例子，模型的输出是[0.2，0.6，0.8]，真实值是[0，0，1]。准确率该怎么计算呢？

pred = torch.tensor([0.2, 0.6, 0.8])
y = torch.tensor([0, 0, 1])
accuracy = (pred.ge(0.5) == y).all().int().item()
accuracy

首先ge函数将pred中大于等于0.5的转化为True，小于0.5的转化成False，再比较pred和y（必须所有维度都相同才算分类准确），最后将逻辑值转化为整数输出即可。
训练时都是按照一个batch计算的，那就写一个循环吧。

pred = torch.tensor([[0.2, 0.5, 0.8], [0.4, 0.7, 0.1]])
y = torch.tensor([[0, 0, 1], [0, 1, 0]])
accuracy = sum(row.all().int().item() for row in (pred.ge(0.5) == y))
accuracy

3 完整代码

from sklearn.datasets import make_multilabel_classification
import torch
from torch.utils.data import DataLoader
from sklearn.model_selection import train_test_split

def get_dataset():
    X, y = make_multilabel_classification(n_samples=1000,
                                          n_features=10,
                                          n_classes=3,
                                          n_labels=2,
                                          random_state=1)
    return X,y

n_inputs, n_outputs = X.shape[1], y.shape[1]
X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.33,random_state=42)
X_train = torch.from_numpy(X_train).float()
X_test = torch.from_numpy(X_test).float()
y_train = torch.from_numpy(y_train).float()
y_test = torch.from_numpy(y_test).float()

train_data=[(X,y) for X,y in zip(X_train,y_train)]
train_loader = DataLoader(train_data, batch_size=64,shuffle=True)

class MLP(nn.Module):
    def __init__(self, n_inputs, n_outputs, num_hiddens):
        super(MLP, self).__init__()
        self.linear_relu_stack = nn.Sequential(
            nn.Linear(n_inputs, num_hiddens),
            nn.ReLU(),
            nn.Linear(num_hiddens, n_outputs),
            nn.Sigmoid())

    def forward(self, x):
        outputs = self.linear_relu_stack(x)
        return outputs

num_hiddens = 30
model = MLP(n_inputs, n_outputs, num_hiddens)
print(model)

loss = nn.BCELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=1e-3)

def evaluate_accuracy(X, y, model):
    pred = model(X)
    correct = sum(row.all().int().item() for row in (pred.ge(0.5) == y))
    n = y.shape[0]
    return correct / n

def train(train_loader, X_test, y_test, model, loss, num_epochs, batch_size,
          optimizer):
    batch_count = 0
    for epoch in range(num_epochs):
        train_l_sum, train_acc_sum, n = 0.0, 0.0, 0
        for X, y in train_loader:
            pred = model(X)
            l = loss(pred, y)
            optimizer.zero_grad()
            l.backward()
            optimizer.step()
            train_l_sum += l.item()
            train_acc_sum += sum(row.all().int().item()
                                 for row in (pred.ge(0.5) == y))
            n += y.shape[0]
            batch_count += 1
        test_acc = evaluate_accuracy(X_test, y_test, model)
        print(
            'epoch %d, loss %.4f, train acc %.3f, test acc %.3f'
            % (epoch + 1, train_l_sum / batch_count, train_acc_sum / n,
               test_acc))

num_epochs, batch_size = 20, 64
train(train_loader, X_test, y_test, model, loss, num_epochs, batch_size,optimizer)

Original: https://blog.csdn.net/qsmx666/article/details/121718548
Author: 明日何其多_
Title: pytorch：多标签分类的损失函数和准确率计算

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/708171/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Ubuntu16.04 安装 OPENCV详细教程避坑

1.首先大家需要下载一个Opencv压缩包，选择source版本。下载官网：Releases – OpenCV 本教程内采用的opencv-4.5.4这个版本 2.如果…

人工智能 2023年5月26日
00100
机器视觉——单目相机模型（坐标标定以及去畸变）

单目相机模型：针孔相机模型的映射关系：化为矩阵形式：其中，中间的矩阵被称为相机的内参矩阵K。通常认为，相机的内参在出厂之后是固定的，不会在使用过程中发生变化。有点相机生产厂商…

人工智能 2023年6月21日
0080
（学习笔记）地理加权回归

1回归 1.1回归回归分析是最常用的社会科学统计方法。回归用于评估两个或更多要素属性之间的关系。通过回归分析，我们可以对空间关系进行建模、检查和探究；回归分析还可以帮助解释所观测…

人工智能 2023年6月16日
0077
手机问题——语音让小爱同学学习用户对手机的操作并复现

文章目录 * – 问题 – 那么我们能否让小爱同学控制手机屏幕，完成我们事先录制的操作呢？ – 日常有语音转文字，实时中英翻译，以及用语音控制屏…

人工智能 2023年5月25日
0085
【实例分割yolact++】从头训练自己的yolact++模型

目录 0.前言 1.整个流程 2.具体过程 * 2.1 下载Github上的项目 2.2 使用labelme打标签 – 2.2.1 安装labelme 2.2.2 如何…

人工智能 2023年7月23日
00100
Python实现替换照片人物背景，精细到头发丝（附上代码） | 机器学习

目录前言项目说明项目结构数据准备替换背景图代码总结前言根据我另一篇文章：如何将照片或者视频中的背景图抠掉，机器学习开源项目使用 | 机器学习_阿良的博客-CSDN博…

人工智能 2023年7月21日
0072
VMware Tools安装步骤（windows10）

VMware Tools是VMware虚拟机中的一个工具，其主要作用是能够使鼠标在虚拟机和主机之前流畅地切换，并且能够共享剪贴板。我们可以通过VMware Tools将主机的文件复…

人工智能 2023年5月30日
0065
89 logistic回归用户画像用户响应度预测2

logistic回归篇章数据集接应上一节数据集合，本次的分析是从用户是否为高响应用户进行划分，使用logistic回归对用户进行响应度预测，得到响应的概率。线性回归，参考上一篇章…

人工智能 2023年7月17日
0080
MUDA：对齐特定域的分布和分类器以实现来自多源域的跨域分类

简介：1、提出了一个具有两个对齐阶段的MUDA新框架。 2、该框架不仅分别对齐多个特定特征空间中每对源域和目标域的分布，而且还利用特定域的决策边界对齐分类器的输出。如下图所示，在…

人工智能 2023年6月20日
0079
【机器学习-分类】决策树预测

我用一些机器学习的算法对数据进行一个分类，下面是一些需要用到的基础代码，以决策树为例，并不包括针对项目的模型处理和修改，留作记忆学习。对于数据划分训练集直接省略 def Tree…

人工智能 2023年7月1日
0089
fine-tune语义相似分类模型实践

首先要准备一些fine tune用的训练样本，这个可以通过tensorflow dataset获得，也可以自己解析文本获得。 glue_train = bert_encode(gl…

人工智能 2023年7月2日
0099
【NLP基础技术】浅谈词法分析之短文本语义相似度

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月2日
0065
AI：ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略

AI：ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略导读：ModelScope旨在打造下一代开源的模型即服务共享平台，汇集了行业领先的预…

人工智能 2023年6月23日
00647
单目视觉SLAM在无人机上的应用

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月10日
0074
深度学习之BP神经网络

前言 bp神经网络是模拟人体中神经元结构而设计出来的: 神经元大致可以分为树突、突触、细胞体和轴突。树突为神经元的输入通道，其功能是将其它神经元的动作电位传递至细胞体。其它神经元的…

人工智能 2023年7月25日
0079
MNIST训练

MNIST训练数据下载&训练代码结果 * 1. CNN结构 2. fc_net_4layer 3. fc_net_2layer 4. 三种网络对比遇到的问题数据下载…

人工智能 2023年7月14日
0062

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pytorch：多标签分类的损失函数和准确率计算

大家都在看