[深度学习]-Dataset数据集加载

2023年7月10日下午6:39 • 技术杂谈 • 阅读 97

加载数据集dataloader

from torch.utils.data import DataLoader
form &#x81EA;&#x5DF1;&#x5199;&#x7684;dataset import Dataset

train_set = Dataset(train=True)
val_set = Dataset(train=False)

image_datasets = {
    'train': train_set, 'val': val_set
}

batch_size = 4

dataloaders = {
    'train': DataLoader(train_set, batch_size=batch_size, shuffle=True, num_workers=2),
    'val': DataLoader(val_set, batch_size=batch_size, shuffle=False, num_workers=2)
}

dataset_sizes = {
    x: len(image_datasets[x]) for x in image_datasets.keys()
}
print(dataset_sizes)

for epoch in range(num_epochs):
    for phase in ['train', 'val']:
        if phase == 'train':
            # for param_group in optimizer.param_groups:
                # print("LR", param_group['lr'])
            model.train()
        else:
            model.eval()

以上适用于train一遍test一遍的情况

或者分别加载训练和测试：

train_dataset = Dataset('train')
train_data_loader = torch.utils.data.DataLoader(train_dataset, batch_size=8, shuffle=True,
                                                    num_workers=2, collate_fn=collate_fn)

test_dataset = Dataset('eval')
test_data_loader = torch.utils.data.DataLoader(test_dataset, batch_size=8, shuffle=False,
                                                   num_workers=2, collate_fn=collate_fn)

自己写Dataset

from torch.utils.data import Dataset
import os
import cv2
import torch
import numpy as np

class Dataset(Dataset):
    def __init__(self,train):
        if train:
            self.datapath = {'image': '/home/myy/code/Final_Project/data_train.txt', 'target':'/home/myy/code/Final_Project/gt_train.txt'}
        else:
            self.datapath = {'image': '/home/myy/code/Final_Project/data_test.txt', 'target':'/home/myy/code/Final_Project/gt_test.txt'}
            # self.datapath = {'image': '/home/myy/code/Final_Project/test_small_data.txt', 'target':'/home/myy/code/Final_Project/test_small.txt'}
        self.image_list, self.target_list = self.read_txt(self.datapath)

&#x6B64;&#x5904;&#x53EF;&#x4EE5;&#x4F9D;&#x636E;&#x9700;&#x8981;&#x81EA;&#x5DF1;&#x5B9A;&#x4E49;&#x4E00;&#x4E9B;&#x51FD;&#x6570;
&#x6CE8;&#x610F;&#x8C03;&#x7528;&#x524D;&#x8981;&#x52A0;&#x4E0A;self.
&#x6BD4;&#x5982;&#x4EE5;&#x4E0B;&#x4E24;&#x4E2A;&#x8BFB;&#x53D6;&#x6570;&#x636E;&#x7684;&#x51FD;&#x6570;&#xFF0C;read_txt&#x3001;read_json&#x5C31;&#x662F;&#x81EA;&#x5DF1;&#x5B9A;&#x4E49;&#x7684;
    def read_txt(self,datapath):
        im =[]
        target_image = []
        print(datapath)
        with open(datapath['image'], 'r') as f:
            image_list = f.readlines()
        with open(datapath['target'], 'r') as f:
            target_list = f.readlines()
        return image_list, target_list

    def read_json(save_path, encoding='utf8'):
        jsondata = []
        with open(save_path, 'r', encoding=encoding) as f:
            content = f.read()
            content = json.loads(content)
            for key in content:
                jsondata.append(content[key])
            return jsondata

    def __getitem__(self, item):
        # &#x6700;&#x6838;&#x5FC3;&#x7684;&#x90E8;&#x5206;&#xFF0C;&#x7ECF;&#x8FC7;&#x5904;&#x7406;&#xFF0C;&#x8981;&#x8FD4;&#x56DE;&#x8F93;&#x5165;&#x548C;gt

        return img, target

    def __len__(self):
        # &#x8FD9;&#x53EF;&#x4EE5;&#x6839;&#x636E;&#x5177;&#x4F53;&#x60C5;&#x51B5;&#x4FEE;&#x6539;&#xFF0C;&#x4E0D;&#x5199;&#x4E5F;&#x884C;
        return len(self.data)

Original: https://www.cnblogs.com/camilia/p/16143870.html
Author: CAMILIA
Title: [深度学习]-Dataset数据集加载

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/683371/

转载文章受原作者版权保护。转载请注明原作者出处！

技术杂谈

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【主流技术】Redis 在 Spring 框架中的实践

前言一、Redis 概述 1.1Redis 是什么？ 1.2Redis 能做什么？ 1.3基础知识二、Redis 安装与基本命令 2.1Windows 安装方式一方式二 2…

技术杂谈 2023年7月10日
0077
代码进行抄袭检查

代码抄袭：那些让985学生沉默，211学生流泪的真相 – 知乎 https://zhuanlan.zhihu.com/p/40568346 Original: http…

技术杂谈 2023年5月31日
0090
【软考】信息系统安全等级保护

1.概念《计算机信息系统安全保护等级划分准则》（GB 17859-1999）将计算机信息系统划分为5个等级：等级适用范围用户自主保护级普通内联网用户系统审计保护级通过…

技术杂谈 2023年5月31日
00102
无法删除服务器 ‘repl_distributor’，因为该服务器用作复制过程中的分发服务器

博客园：当前访问的博文已被密码保护请输入阅读密码: Original: https://www.cnblogs.com/kerrycode/p/15760743.htmlAut…

技术杂谈 2023年5月31日
0080
java学习之MybBaits

0x00前言我前面使用的jdbc和jdbc的工具类集成的但是它们在少部分代码的情况下会会简单，但是以后如果项目较大jdbc的固定代码会很难维护，如果使用框架会简单很多，也标志着j…

技术杂谈 2023年6月21日
0099
利用DbgHelp获取线程的栈回溯信息

当线程发生异常时，我们如果可以记录下来异常线程的堆栈信息，那么对于我们后续问题处理将会有极大的帮助。这里记录一个操作方法。 1 #include 2 #include 3 #inc…

技术杂谈 2023年7月11日
0077
解决 Windows Update 更新 WSL 内核出现 0x80070643 错误问题 (Windows Subsystem for Linux Update)

问题原因很简单：之前已经安装的 WSL 内核包因为不明原因损坏了，因为无法在后台卸载，就没有办法安装新的。问题解决：（Win10、Win11、WinServer2019、WinS…

技术杂谈 2023年6月21日
00106
linux全新机器环境搭建流程梳理

软件解压后安装基础指令（复制用）：./configure && make && make install ./configure –pr…

技术杂谈 2023年7月11日
0084
CentOS 7配置成网关服务器

其实在Linux下配置网关服务器很简单，如果配置好之后出现无法访问外网的情况，那么可以排查以下情况： 1、防火墙和iptables的服务关掉（firewalld、iptables）…

技术杂谈 2023年5月30日
00102
NatTypeTester

NatTypeTester https://opensourcelibs.com/ https://github.com/HMBSbige/NatTypeTester/releas…

技术杂谈 2023年5月30日
0068
bilibili动画下载视频批量改名（python）

bilib应用在微软商店中下载哔哩哔哩动画，虽然软件UI古老，但是贵在稳定和支持下载安装以后搜索自己想要的视频，然后缓存下载下载后进入下载的路径视频文件重命名打开自动命令…

技术杂谈 2023年7月24日
0089
记录XorDDos木马清理步骤

1.检查查看定时任务文件发现有两个异常定时任务 [root@manage ~]# cat /etc/crontab user-name command to be execute…

技术杂谈 2023年7月25日
0070
如何将编写的c语言程序打包成exe可执行文件呢？

如何将编写的c语言程序打包成exe可执行文件呢？以前我们写程序很多是在编辑器上，让编辑起来编译运行我们的程序。如果想将其打包成exe可执行文件该如何做？我这里推荐使用codeB…

技术杂谈 2023年6月21日
00144
「游记」CSP-S2021爆零记

今年的线上提交系统很坑，长时间不操作就会退出登录。还好中途学校老师有提醒先提交一部分，让我发现已退出登录，不然等最后提交就要「爆零」了（据说福建有不少选手这样），在此感谢学校老师。…

技术杂谈 2023年7月24日
0065
MySQL的三值逻辑

MySQL 采用三值逻辑 SELECT 1 = 1; SELECT 1 = 2; SELECT 1 = NULL; SELECT 1 != NULL; 上面四条语句的结果分别为：可…

技术杂谈 2023年7月25日
0059
SSM实战(58)在线教育（58）后端(26)课程管理（13）课程信息确认

博客园：当前访问的博文已被密码保护请输入阅读密码: Original: https://www.cnblogs.com/qiu-hua/p/16514879.htmlAutho…

技术杂谈 2023年6月1日
0092

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

[深度学习]-Dataset数据集加载

加载数据集dataloader

自己写Dataset

大家都在看