TransUnet官方代码训练自己数据集（彩色RGB3通道图像的分割）

2023年7月3日下午10:40 • 人工智能 • 阅读 50

码字不易，收藏之余，别忘了给我点个赞吧！

———Start

官方代码：https://github.com/Beckschen/TransUNet

目的：训练5个类别的汽车部件分割任务（测试在另一篇博客中）

实现效果：

; 1. github下载代码，并解压。

项目里的文件可能跟你下载的不一样，不急后面会讲到！

; 2. 配置数据集（尽最大努力还原官方数据集的格式）。

&#x901A;&#x5E38;&#x81EA;&#x5DF1;&#x624B;&#x4E0A;&#x7684;&#x6570;&#x636E;&#x96C6;&#x5206;images&#x548C;labels&#x6587;&#x4EF6;&#x5939;&#xFF0C;&#x5206;&#x522B;&#x5B58;&#x653E;&#x7740;&#x539F;&#x59CB;&#x56FE;&#x50CF;&#x548C;&#x5BF9;&#x5E94;&#x7684;mask&#x56FE;&#x50CF;&#xFF0C;&#x5982;&#x4E0B;&#x56FE;&#x6240;&#x793A;; mask&#x56FE;&#x50CF;&#x4E2D;&#x7684;&#x50CF;&#x7D20;&#x6709;0,1,2,3,4 &#x5206;&#x522B;&#x4EE3;&#x8868;&#x80CC;&#x666F;&#xFF0C;&#x8F66;&#x8EAB;&#xFF0C;&#x8F6E;&#x5B50;&#xFF0C;&#x8F66;&#x706F;&#xFF0C;&#x7A97;&#x6237;&#xFF0C;&#x4E00;&#x5171;&#x4E94;&#x4E2A;&#x7C7B;&#x522B;&#xFF0C;&#x6240;&#x4EE5;&#x8FD9;&#x91CC;&#x663E;&#x793A;&#x5168;&#x9ED1;&#x8272;&#xFF0C;&#x8089;&#x773C;&#x770B;&#x4E0D;&#x51FA;&#x5DEE;&#x522B;&#xFF01;&#x901A;&#x8FC7;&#x9605;&#x8BFB;&#x5B98;&#x65B9;&#x8BFB;&#x53D6;&#x6570;&#x636E;&#x7684;&#x4EE3;&#x7801;&#xFF0C;&#x6211;&#x4EEC;&#x9700;&#x8981;&#x5C06;&#x4E00;&#x5F20;&#x56FE;&#x50CF;&#x548C;&#x5176;&#x5BF9;&#x5E94;&#x7684;&#x6807;&#x7B7E;&#x5408;&#x5E76;&#x8F6C;&#x5316;&#x6210;&#x4E00;&#x4E2A;.npz&#x6587;&#x4EF6;.

官方数据集格式，data文件夹，Synapse文件夹，test_vol_h5文件夹，train_npz文件夹手动创建！

转化数据集的代码如下，会将images中的图像和labels中的标签生成一个.npz文件。

def npz():

    path = r'G:\dataset\car-segmentation\train\images\*.png'

    path2 = r'G:\dataset\Unet\TransUnet-ori\data\Synapse\train_npz\\'
    for i,img_path in enumerate(glob.glob(path)):

        image = cv2.imread(img_path)
        image = cv2.cvtColor(image,cv2.COLOR_BGR2RGB)

        label_path = img_path.replace('images','labels')
        label = cv2.imread(label_path,flags=0)

        np.savez(path2+str(i),image=image,label=label)
        print('------------',i)

    print('ok')

生成的文件在 data\Synapse\train_npz文件夹中，如下图，也可以自己定义生成的路径，然后把文件复制到data\Synapse\train_npz文件中。

data\Synapse\train_npz文件夹中存放的是训练集样本，按照同样的方式生成测试集样本，存放在data\Synapse\test_vol_h5文件夹中。

我的训练集203个样本，测试集3个样本。npz文件生成完成之后，找到train.txt和test_vol.txt，手动将文件里面的内容清空，split_data.py这个文件直接无视。自己写一个函数读取train_npz中所有的文件名称，然后将文件名称写入train.txt文件，一个名称一行，如下图所示。同理可完成test_vol.txt文件制作。

至此，数据集制作完毕！！！代码会先去train.txt文件中读取训练样本的名称，然后根据名称再去train_npz文件夹下读取npz文件。所以每一步都很重要，必须正确！

3. 下载预训练权重

官方下载地址

CSDN下载地址[推荐]

进入网站后，点击imagenet21k文件夹。

下载这个权重文件即可。

手动创建如下多个文件夹，存放刚刚下载完毕的权重，注意名称跟我的保持一致！

至此，预训练权重已下载完毕。

; 4. 修改读取文件的方法

找到datasets/dataset_synapse.py文件中的Synapse_dataset类，修改__getitem__函数。

 def __getitem__(self, idx):
        if self.split == "train":
            slice_name = self.sample_list[idx].strip('\n')
            data_path = self.data_dir+"/"+slice_name+'.npz'
            data = np.load(data_path)
            image, label = data['image'], data['label']
        else:
            slice_name = self.sample_list[idx].strip('\n')
            data_path = self.data_dir+"/"+slice_name+'.npz'
            data = np.load(data_path)
            image, label = data['image'], data['label']
            image = torch.from_numpy(image.astype(np.float32))
            image = image.permute(2,0,1)
            label = torch.from_numpy(label.astype(np.float32))
        sample = {'image': image, 'label': label}
        if self.transform:
            sample = self.transform(sample)
        sample['case_name'] = self.sample_list[idx].strip('\n')
        return sample

找到datasets/dataset_synapse.py文件中的RandomGenerator类，修改__call__函数。

    def __call__(self, sample):
        image, label = sample['image'], sample['label']

        if random.random() > 0.5:
            image, label = random_rot_flip(image, label)
        elif random.random() > 0.5:
            image, label = random_rotate(image, label)
        x, y,_ = image.shape
        if x != self.output_size[0] or y != self.output_size[1]:
            image = zoom(image, (self.output_size[0] / x, self.output_size[1] / y,1), order=3)
            label = zoom(label, (self.output_size[0] / x, self.output_size[1] / y), order=0)
        image = torch.from_numpy(image.astype(np.float32))
        image = image.permute(2,0,1)
        label = torch.from_numpy(label.astype(np.float32))
        sample = {'image': image, 'label': label.long()}
        return sample

至此，数据读取的部分已经修改完毕！

5. 配置训练参数

认真检查各个参数是否正确，这里的路径都是 ‘./'(当前目录下)，不是”…/”，训练时，batch_size通常大于1，我这里设置有误！类别数可根据你的任务定！

图片大小设置，越大越耗显存。

; 6. 修改trainer.py文件

设置trainer.py文件中的DataLoader函数中的num_workers=0

至此，所有代码修改完毕！

总结：以上修改内容针对彩色图像的分割任务，由于仅文字表述某些操作存在局限性，故只能简略应答，有任何问题可下方留言评论。

Original: https://blog.csdn.net/qq_37652891/article/details/123465472
Author: 小小小MaYi
Title: TransUnet官方代码训练自己数据集（彩色RGB3通道图像的分割）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/668470/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

OpenCV-Python实战（3）——OpenCV中绘制图形与文本

[ OpenCV_是一款非常强大的计算机视觉库，其 _中_包含了很多功能强大的 _图像处理_和计算机视觉算法。而在这个系列的第三篇文章 _中，我们将重点介绍如何在 OpenCV 中…

人工智能 2023年6月18日
00101
【pytorch】CGAN编程实现

CGAN介绍由于原始GAN生成的图像是随机的，不可预测的，无法控制网络输出特定的图片，生成目标类别不明确，可控性不强。针对原始GAN不能生成具有特定属性的图片的问题， Mehd…

人工智能 2023年7月23日
0087
微调Faster-R-CNN-InceptionV2完成高准确率安全帽检测任务

个人简介：李响Superb，CSDN百万访问量博主，普普通通男大学生，深度学习算法、医学图像处理专攻，偶尔也搞全栈开发，没事就写文章。本文分析了Faster-R-CNN-Ince…

人工智能 2023年5月25日
00114
Android逆向基础入门

### 回答1：学习 Android 逆向_PDF这个过程需要一定的时间和专业知识。首先，你的兄弟需要了解 _Android_开发和 _Java_编程语言。他可以通过学习相关的教…

人工智能 2023年7月5日
0090
PySide6精简教程

目录一、PySide6概述二、安装PySide6 三、设计界面四、响应UI操作五、打包部署一、PySide6概述近几年，受益于人工智能的崛起，Python语言几乎以压倒…

人工智能 2023年7月30日
0078
NLP入门干货：手把手教你3种中文规则分词方法

导读：本文将讲解中文自然语言处理的第一项核心技术——中文分词技术，它是中文自然语言处理非常关键和核心的部分。作者：杜振东涂铭来源：大数据DT（ID：hzdashuju）在自…

人工智能 2023年6月10日
0060
如何创建像 Quora 这样的问答网站：技术堆栈、用户获取等

尽管问答网站并不是互联网的新手，但 Quora 已经成功地将这一类别提升到了一个全新的水平。当您创建问答网站时，应该解决一些问题。除了一些技术上的困难，您在吸引用户时可能会遇到问题…

人工智能 2023年5月30日
0078
机器学习中的数学——距离定义（二十二）：海林格距离（Hellinger Distance）

我们假设p p p和q q q是两个概率测度，并且它们对于第三个概率测度λ \lambda λ来说是绝对连续的，则p p p和q q q的海林格距离（Hellinger Dista…

人工智能 2023年6月25日
0062
【深度学习】（四）目标检测——上篇

; 目标检测——上篇🍉 文章目录 * – 目标检测——上篇🍉* 前言🎆* 一、目标检测是什么？* 二、目标检测的发展历程* 三、区域卷积神经网络（R-CNN）系列* &…

人工智能 2023年6月17日
0077
python获取音频音量大小_音频响度分析和获取

–– coding: utf-8 –– /usr/local/bin/python3 @Time : 2020/3/7 4:05 P…

人工智能 2023年5月27日
0087
数据库课程设计——实验报告管理系统（超详细）

实验报告管理系统【前言】 1.系统需求分析 * 1.1引言 1.2目标与任务 – 1.2.1需求分析阶段目标 1.2.2 需求分析阶段任务 + * 1.2.2.1实验…

人工智能 2023年7月30日
00109
预测评价指标：MSE,RMSE,MAE，MAPE，SMAPE

目录前言 MSE RMSE MAPE SMAPE Python程序前言分类问题的评价指标是准确率，回归算法的评价指标是MSE,RMSE，MAE.测试数据集中的点，距离模型的平…

人工智能 2023年6月16日
0088
Matlab语音及音乐信号的采集、滤波

电信19-2 翁大弟一、实验目的 1、理解采样率和量化级数对语音信号的影响； 2、设计滤波器解决实际问题。二、实验原理（1）观察使用不同采样率及量化级数所得到的信号的…

人工智能 2023年5月25日
00136
回归任务详解（李宏毅深度学习 task2）

回归任务详解 1. 回归任务的定义 2. 回归任务的举例 3. 模型建立的步骤 * 3.1 模型假设，选择模型框架（以线性模型为例） – 3.1.1 线性模型的定义 3…

人工智能 2023年6月17日
0086
Python数据分析-pandas进阶-2-DataFrame进阶

1.描述性统计 min最小值max最大值mean平均值median中位数std标准差var方差cov协方差sem标准误差mode众数skew偏度kurt峰度quantile四分位数…

人工智能 2023年7月7日
0081
Simhash算法详解及python实现

GoogleMoses Charikar发表的一篇论文”detecting near-duplicates for web crawling”中提出了sim…

人工智能 2023年5月27日
0070

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31