解决pytorch 二分类数据集全部预测到了同一类

2023年7月21日下午6:55 • 人工智能 • 阅读 51

文章目录

*
– 问题描述
–
+ 训练集和验证集训练分布
+ 训练方法
+ 训练结果
– 解决办法
–
+ 1. 修改学习率
+
* 如何寻找最优的初始学习率
+ 2. 查看各类样本的分布，使用采样的方法WeightedRandomSampler
+ 3. 在计算损失时对不同标签的样本赋予不同大小的权重 Focal_Loss()
+ 4. 在训练集进行随机采样

问题描述

二分类 0与1（阴性与阳性）

训练集和验证集训练分布

训练集数据验证集数据阳性（1）2130238阴性（0）894108总计3024346

训练方法

损失函数：BCELoss
优化器：Adam

训练结果

在训练的同时进行验证，发现训练集和验证集的准确率保持不变
训练集准确率=0.704365 验证集准确率=0.687861
训练集和验证集全部被预测为阳性

解决办法

1. 修改学习率

初始采用的优化器是Adam，学习率是0.001
尝试将学习率修改为0.0001，发现训练集的准确率仍然保持不变，而验证集的准确率有所提高，提高至0.731213

启示
将学习率由大到小调试，如果准确率有所变化，则在训练时，如果验证集的损失在几个epoch 内没有下降，可以减少学习率

关键代码


for epoch in tqdm(range(0, 64)):
    ...
    ...

    if (epoch - best_epoch) > 3:
        if val_loss > best_loss:
            print("decay loss from " + str(LR) + " to " + str(LR / 2) + " as not seeing improvement in val loss")
            LR = LR / 2
            print("created new optimizer with LR " + str(LR))

            if (epoch - best_epoch) > 10:
                print("no improvement in 10 epochs, break")
                break

如何寻找最优的初始学习率

理论详解
关键代码

train_data_path = 'train.csv'
cropped_images_floder = 'cropped_images'

train_df = pd.read_csv(train_data_path)
train_size = len(train_df)

train_dataset = ImageData(cropped_images_floder=cropped_images_floder, df=train_df, channel_copy=True,
                          transform=None)
train_loader = DataLoader(dataset=train_dataset, batch_size=4, shuffle=True,
                          num_workers=1)

device = torch.device("cuda:1" if torch.cuda.is_available() else "cpu")
criterion = nn.BCELoss(reduction='mean').to(device)

model = get_model(modelType='resnet50', pretrained=True, num_labels=1, hidden_dropout=0.2)
model = model.to(device)
optimizer = torch.optim.Adam(params=filter(lambda p: p.requires_grad, model.parameters()), lr=1e-5,
                             betas=(0.9, 0.99))

def find_lr(init_value=1e-8, final_value=10., beta=0.98):

    num = len(train_loader) - 1

    mult = (final_value / init_value) ** (1 / num)
    lr = init_value
    optimizer.param_groups[0]['lr'] = lr
    avg_loss = 0.

    best_loss = 0.

    batch_num = 0
    losses = []
    log_lrs = []
    for i, data in enumerate(train_loader, 0):
        batch_num += 1

        imgs, labels, _ = data
        imgs, labels = imgs.to(device), labels.to(device)
        optimizer.zero_grad()
        outputs = model(imgs)
        loss = criterion(outputs, labels)

        avg_loss = beta * avg_loss + (1 - beta) * loss.item()
        smoothed_loss = avg_loss / (1 - beta ** batch_num)

        if batch_num > 1 and smoothed_loss > 4 * best_loss:
            return log_lrs, losses

        if smoothed_loss < best_loss or batch_num == 1:
            best_loss = smoothed_loss

        losses.append(smoothed_loss)
        log_lrs.append(math.log10(lr))

        loss.backward()
        optimizer.step()

        lr *= mult
        optimizer.param_groups[0]['lr'] = lr
    return log_lrs, losses

logs, losses = find_lr()
plt.plot(logs[10:-5],losses[10:-5])
plt.savefig('search_best_lr.png')

2. 查看各类样本的分布，使用采样的方法WeightedRandomSampler

训练模型时，需要保证训练集和验证集中阳性和阴性数据之比尽可能1：1。
阴性样本很少从而导致模型倾向于总体样本全预测为阳性。
pytorch 中 WeightedRandomSampler 用于平衡数据集的样本类别不平衡

参数和返回值介绍

weights = [ ] 是指数据集中每个样本的权重， len(weights) = 数据集的样本总数
计算方式：数据集样本总数 / 单个样本所属类别的数量
num_samples : 需要采样的数量，可以根据自己需要的训练集样本数量设置
replacement: 采样方式 True: 有放回采样；False: 无放回采样
返回值：从[0, len(weights) -1]中取出num_samples个数， list中的每个数可以作为index供DataLoader取用

关键代码


class ImageData(Dataset):
    def __init__(self, cropped_images_floder, df, channel_copy=True, transform=None):
        self.cropped_images_floder = cropped_images_floder
        self.transform = transform
        self.df = df
        self.channel_copy = channel_copy
        self.random_number_generator = np.random.RandomState(0)

    def __getitem__(self, idx):
      ...

    def get_classes_for_all_images(self):
        return self.df['label'].tolist()

    def __len__(self):
        return self.df.shape[0]


cropped_images_floder = '/home/user1/data/cropped_images'
train_data_df = pd.read_csv('/home/user1/data/train.csv')
class_counts = [train_data_df['label'].value_counts()[0], train_data_df['label'].value_counts()[1]]
print(class_counts)

weights = 1. / torch.tensor(class_counts, dtype=torch.float)
print(weights)

train_dataset = ImageData(cropped_images_floder=cropped_images_floder, df=train_data_df, channel_copy=True,
                          transform=None)
train_targets = train_dataset.get_classes_for_all_images()
print(train_targets, len(train_targets))

samples_weights = weights[train_targets] * len(train_data_df)
print(samples_weights, len(samples_weights))

sampler = WeightedRandomSampler(weights=samples_weights, num_samples=len(samples_weights), replacement=True)
print(list(sampler), len(list(sampler)))

train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=4, shuffle=False,
                                           sampler=sampler, num_workers=1)

测试代码

true_labels = []
for i, data in enumerate(train_loader, 0):
    images, labels, path = data
    for item in labels.cpu().data.numpy():
        for j in item:
            true_labels.append(int(j))
print(pd.value_counts(true_labels)

问题
使用这种方法，可能会导致丢失原始数据，即并不是所有的原始数据都有被采样到和被模型训练

3. 在计算损失时对不同标签的样本赋予不同大小的权重 Focal_Loss()

原理参考博文

class Focal_Loss(torch.nn.Module):
"""
    二分类Focal Loss
"""
    def __init__(self, alpha=0.25, gamma=2):
        super(Focal_Loss, self).__init__()
        self.alpha = alpha
        self.gamma = gamma

    def forward(self, preds, labels):
"""
        preds:sigmoid的输出结果
        labels：标签
"""
        eps = 1e-7
        loss_1 = -1 * self.alpha * torch.pow((1 - preds), self.gamma) * torch.log(preds + eps) * labels
        loss_0 = -1 * (1 - self.alpha) * torch.pow(preds, self.gamma) * torch.log(1 - preds + eps) * (1 - labels)
        loss = loss_0 + loss_1
        return torch.mean(loss)

4. 在训练集进行随机采样

将小类别的全部样本送进训练，并且在每个epoch 都从大类别样本中随机采样，采样与小类别样本相同数量的样本送进训练

Original: https://blog.csdn.net/qq_42552025/article/details/126003988
Author: 葛蓓莉亚
Title: 解决pytorch 二分类数据集全部预测到了同一类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/707633/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

机器学习的应用

一、图像识别图像识别是机器学习最常见的应用之一。它用于识别物体、人、地点、数字图像等。具体比如：人脸识别，人脸检测，AI换脸，图像边缘处理，物体跟踪等。二、语音识别在我们使…

人工智能 2023年6月24日
0052
从方法到实践，银行如何搭建用户体验管理体系？

随着金融体验场景逐渐从线下向线上迁移，手机银行 APP、微信银行等线上电子渠道迅速成为金融服务的主要载体，加上用户对线上服务及体验要求也越来越高。因此，科学地建设用户体验体系，持续…

人工智能 2023年7月16日
0055
数据挖掘——序列模式挖掘

《数据挖掘》青岛大学数据挖掘之序列模式挖掘时间序列：将某一指标在不同时间上的不同数值，按照时间先后顺序排列而成的数列。时间序列的建模方法：一元时间序列：通过单变量随机过程的…

人工智能 2023年7月16日
0089
【python】matplotlib 实现双（多）Y轴图

【python】matplotlib 实现双（多）Y轴图先来点简单的两个Y轴三个以及多个Y轴来亿点点美化先来点简单的先来个最简单的画图，比如一个 y = s i n (…

人工智能 2023年7月5日
00150
调用阿里云语音识别接口

1、登录阿里云免费试用网站开通免费试用功能，按提示完成身份认证 https://free.aliyun.com/product/nls/freetrial?spm=5176.120…

人工智能 2023年5月27日
0086
anaconda配置tensorflow-gpu环境并在jupyter notebook使用（两种方法：命令行/anaconda内）

本文是有关anaconda配置tensorflow-gpu环境，将通过命令行和anaconda内两种方式，读者可自行选择，let’s go！以下目录1、2两章内容相同，…

人工智能 2023年5月26日
00169
机器学习（李宏毅）—— Classification

如果简单的将Classification看成一个Regression的问题，会发现Regression的评价标准并不适用于Classification(回归的本质是让损失函数尽可能…

人工智能 2023年7月1日
0068
python中为什么用replace后数据还是没变_为什么dropna（）和replace（）方法不能处理dataframe中丢失的数据？…

我从一门数据科学课程开始，它要求我处理丢失的数据，要么删除”price”子集中包含NaN的行，要么用一些平均值替换NaN。但是dropna()和replac…

人工智能 2023年7月9日
0062
Python顺序结构程序设计（湖南工业大学）

; 第1关：HUT开学了任务描述本关任务：编写程序，实现如下功能。开学了，你考上了湖南工业大学，校园各个学院的电子屏上显示着以下欢迎界面：‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬…

人工智能 2023年7月6日
0052
【Deep-sort多目标跟踪流程及其改进方法的解读】

【Deep-sort多目标跟踪流程及其改进方法的解读】文前白话 * 相关的文章、资源链接流程及其改进方法的梳理 – 一、多目标跟踪的流程二、Sort 与 deep…

人工智能 2023年6月24日
0064
机器学习之掌纹识别（掌纹分类）

机器学习之掌纹识别一、掌纹特征提取 * 1.1 Gabor滤波器二、掌纹信息分类 * 2.1 基于PCA+SVM的掌纹信息分类 2.2 基于PCA+KNN的掌纹信息分类分类结…

人工智能 2023年7月1日
0077
Python学习笔记—pivot_table()数据透视表

Python学习笔记—pivot_table()数据透视表文章目录 Python学习笔记—pivot_table()数据透视表前言一、pivot_table数据透…

人工智能 2023年6月19日
0074
[算法整理]可能是最全的无监督/自监督单目深度估计方法汇总 – Part2:双目图像篇

借着最近开题写开题报告的机会，比较细致地整理了一下之前看过的自监督单目深度估计相关的论文。合计了一下，感觉写篇综述有点太耗时耗力，干脆就在这里分享出来好了。论文列表持续更新中广告…

人工智能 2023年7月21日
0060
(ICCV 19) Deep Closest Point: Learning Representations for Point Cloud Registration

Deeo Closest Point（DCP[1]）可以算是小数据集ModelNet40上使用深度学习做配准的开山之作了，首先呈现整体模型架构图：总体来说，DCP模型主要由4个部分…

人工智能 2023年5月28日
0084
opencv学习笔记及复习（二）读取摄像头以及获取图片类型

一、补充一下：之前的图片是放在和代码一样的目录下，简称根目录，这样就可以直接输入所要读取的图片或者视频，无需指定其他路径，若要指定其他路径，最好别有中文。二、导入包，numpy…

人工智能 2023年7月19日
0074
【OpenCV 例程200篇】13. 图像的加法运算（cv2.add）

专栏地址：『youcans 的 OpenCV 例程 200 篇』文章目录：『youcans 的 OpenCV 例程200篇 – 总目录』【youcans 的 Open…

人工智能 2023年6月18日
0084

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30