nnUNet在2d数据集上训练测试一体教程（绕过五折交叉验证

2023年7月23日上午5:49 • 人工智能 • 阅读 89

nnUNet在2d数据集上训练测试一体教程（绕过五折交叉验证）

文章目录

nnUNet在2d数据集上训练测试一体教程（绕过五折交叉验证）
前言
一、环境配置
*
1.创建虚拟环境
2.创建目录
3.git nnUNet
4.创建数据目录
–
二、数据准备
*
1.2D图像转为3D
–
三、训练前准备及数据预处理
*
–
- 数据预处理：
三、训练
四、测试
*
–
- 评估

前言

最近在MICCAI的Brats2019的2d数据集上用nnunet做了对比实验，于是就想记录一下整个的流程以及踩的坑（算力不够就想办法绕过了五折交叉验证直接训练），照着做就可以得到预期的结果。

一、环境配置

这里参考
https://blog.csdn.net/weixin_41693877/article/details/121333947
的博客配置环境

1.创建虚拟环境

conda create -n nnUNet python=3.8
source activate nnUnet

2.创建目录

随后创建一个nnUNetFrame文件夹（叫什么都行，之后的nnunet东西都放里边），在终端中cd进入这个文件夹。

3.git nnUNet

git clone https://github.com/MIC-DKFZ/nnUNet.git

通过该命令clone nnUNet的代码文件，随后在nnUNetFrame中就有了一个名为nnUNet的目录，所有的操作都将在其中进行。

随后进入该目录，并安装其所需库

cd nnUNet
pip install -e .
注意加.

4.创建数据目录

请完全按照下图方式创建所有目录

nnUNetFrame:

; DATASET:

nnUNet_raw：

; nnUNet_raw_data:

这里边存放你的任务，请按照Taskxxx_xxxxx的格式命名，其中编号最好以100+命名（为了防止与可能会发生的预训练任务冲突）

Taskxxx_xxxx:

先创建上面5个文件夹，dataset.json后边会讲如何制作
五个文件夹从上至下分别是训练集图片，测试集图片，测试集预测结果（用来测指标），训练集真值，测试集真值。

; 二、数据准备

1.2D图像转为3D

nnUNet的数据要求为三维的.nii.gz文件，对于我们已有的切片，不论是图像格式还是npy格式，读取后通过numpy在0轴增加维度后通过sitk保存为.nii.gz格式即可

对于具有多模态的数据（如脑肿瘤四个模态），将四个模态分别保存，命名为i_000j.nii.gz，其中i为文件名，j为模态，保存至上述五个文件中，对应的数据和真值要拥有相同的文件名。如下图所示

imageTr

; labelTr

json制作，请按照如下格式制作，尤其是训练集和测试集的文件名字典序列要制作正确。

小坑：对于过大的数据集，json文件pycharm等编译器打不开，用txt打开去复制等操作即可。

; json文件制作及数据处理代码示例（原始数据为.npy）

import os
import numpy as np
import SimpleITK as sitk
import tqdm
import json

direct_dir = "../nnUNetFrame/DATASET/nnUNet_raw/nnUNet_raw_data/Task100_MICCAIre/"
source_data = "../unet2d-Brats/val_data/"

dir_list = ["imagesTr", "labelsTr", "imagesTs", "labelsTs"]
class_list = ["Image", "Mask"]

def flaris_split(img):
    imgs = []
    for i in range(img.shape[2]):
        imgs.append(np.expand_dims(img[:, :, i], 0))
    return imgs

def change_and_json():
    all_result = []
    img_files = os.listdir(source_data + class_list[0] + "/")
    for i in tqdm.tqdm(range(len(img_files))):

        img = np.load(source_data + class_list[0] + "/" + img_files[i])
        mask = np.load(source_data + class_list[1] + "/" + img_files[i])
        mask[mask == 4] = 3

        imgs = flaris_split(img)
        mask = np.expand_dims(mask, 0)

        for j in range(len(imgs)):

            img_nii = sitk.GetImageFromArray(imgs[j])

            sitk.WriteImage(img_nii, direct_dir + dir_list[2] + "/" + f"{i}_000{j}.nii.gz")

            img_dir = "./" + dir_list[2] + "/" + f"{i}.nii.gz"

            mask_dir = "./" + dir_list[3] + "/" + f"{i}.nii.gz"

            result = {"image": img_dir, "label": mask_dir}
            all_result.append(result)
        mask_nii = sitk.GetImageFromArray(mask)
        sitk.WriteImage(mask_nii, direct_dir + dir_list[3] + "/" + f"{i}.nii.gz")

    print(all_result)
    b = json.dumps(all_result)
    f2 = open('result.json', 'w')
    f2.write(b)
    f2.close()

if __name__ == '__main__':
    change_and_json()

三、训练前准备及数据预处理

在终端中输入（仍为nnUNet目录下）来配置环境变量

export nnUNet_raw_data_base=”…/DATASET/nnUNet_raw”
export nnUNet_preprocessed=”…/DATASET/nnUNet_preprocessed”
export RESULTS_FOLDER=”…/DATASET/nnUNet_trained_models”

数据预处理：

在处理之前需要对代码文件进行修改，具体为nnunet/preprocessing/sanity_checks.py文件中的verify_dataset_integrity函数，具体位置为：

改动1：如果你的数据含有测试集真值，那么需要将expected_test_identifiers行中的i后边加入[‘image’]，如上图所示，如果数据测试集没有真值则不需要上述改动。
改动2：在改动1下一行加入

expected_train_identifiers = np.unique(expected_train_identifiers)
    expected_test_identifiers = np.unique(expected_test_identifiers)
    print('train num', len(expected_train_identifiers))
    print('test num:', len(expected_test_identifiers))

随后在终端中输入下述命令进行数据预处理
nnUNet_plan_and_preprocess -t 100 –verify_dataset_integrity
100是你的任务编号

三、训练

若要进行五折交叉验证，则可按照https://blog.csdn.net/weixin_41693877/article/details/121333947
中的方式进行训练

这里采用非五折交叉验证的方式，在nnunet的github readme文件中有提及，即

CUDA_VISIBLE_DEVICES=0 nnUNet_train 2d nnUNetTrainerV2 Task101_MICCAIadd all –npz

CUDA是用于指定GPU卡号，默认为0

训练时打开DATASET中的nnUNet_trained_models目录中一系列目录下的当前任务的目录，可以看到

all中即为我们训练的模型，若不含模型则需要检查上述操作是否出错

; 四、测试

因为没有采用五折交叉验证，所以无法通过nnUNet中的选择模型命令得到测试命令，我们可以自行输入，首先需要更改一些文件中的参数，

在nnunet/inference/目录下的predict.py和predict_simple文件中，通过Ctrl f来找到包含model_final_checkpoint参数的函数，两文件中各有一个，把model_final_checkpoint改为model_best即可

随后在终端中输入命令：
nnUNet_predict -i …/DATASET/nnUNet_raw/nnUNet_raw_data/Task100_MICCAIre/imagesTs/ -o …/DATASET/nnUNet_raw/nnUNet_raw_data/Task100_MICCAIre/imagesTsPred/ -m 2d -t Task100_MICCAIre -f all
即可完成测试，输出结果保存在-o所示路径中。

-i为需要预测的数据路径，-o为输出路径，-m为2d（模型类别），-t为任务名，-f为选择的模型，因为这里我们选用的是直接训练所以是all

评估

因为输出为.nii.gz文件，所以若要进行评估则需要转为numpy类型，下面提供了一个示例，可根据需要自行调整。

import os
import numpy as np
import SimpleITK as sitk
import tqdm
import torch.utils.data
from glob import glob
from hausdorff import hausdorff_distance
os.environ["CUDA_VISIBLE_DEVICES"] = "1"
device = "cuda" if torch.cuda.is_available() else "cpu"

def dice_coef(output, target):
    smooth = 1e-5
    if torch.is_tensor(output):
        output = output.data.cpu().numpy()
    if torch.is_tensor(target):
        target = target.data.cpu().numpy()

    intersection = (output * target).sum()

    return (2. * intersection + smooth) / \
        (output.sum() + target.sum() + smooth)

infer_path = "/nnUNetFrame/DATASET/nnUNet_raw/nnUNet_raw_data/Task100_MICCAIre/imagesTsPred/"
label_path = "/nnUNetFrame/DATASET/nnUNet_raw/nnUNet_raw_data/Task100_MICCAIre/labelsTs/"

def wt_tc_et_make(npmask):
    WT_Label = npmask.copy()
    WT_Label[npmask == 1] = 1
    WT_Label[npmask == 2] = 1
    WT_Label[npmask == 3] = 1
    TC_Label = npmask.copy()
    TC_Label[npmask == 1] = 1
    TC_Label[npmask == 2] = 0
    TC_Label[npmask == 3] = 1
    ET_Label = npmask.copy()
    ET_Label[npmask == 1] = 0
    ET_Label[npmask == 2] = 0
    ET_Label[npmask == 3] = 1

    nplabel = np.empty((npmask.shape[0], npmask.shape[1], 3))
    nplabel[:, :, 0] = WT_Label
    nplabel[:, :, 1] = TC_Label
    nplabel[:, :, 2] = ET_Label
    nplabel = nplabel.transpose((2, 0, 1))
    del npmask
    return nplabel

def visit_data():
    wt_dices = []
    tc_dices = []
    et_dices = []
    dices = [wt_dices, tc_dices, et_dices]

    wt_hd = []
    tc_hd = []
    et_hd = []
    hds = [wt_hd, tc_hd, et_hd]
    image_list = os.listdir(label_path)
    for i in tqdm.tqdm(range(len(image_list))):
        pred_nii = sitk.ReadImage(infer_path + image_list[i], sitk.sitkUInt8)
        pred_arr = sitk.GetArrayFromImage(pred_nii)[0, :, :]
        pred_cu = np.array(pred_arr)
        pred = wt_tc_et_make(pred_cu)

        mask_nii = sitk.ReadImage(label_path + image_list[i], sitk.sitkUInt8)
        mask_arr = sitk.GetArrayFromImage(mask_nii)[0, :, :]
        mask_cu = np.array(mask_arr)
        mask = wt_tc_et_make(mask_cu)
        for j in range(3):
            dice = dice_coef(pred[j, :, :], mask[j, :, :])
            hd = hausdorff_distance(pred[j, :, :].get(), mask[j, :, :].get())
            dices[j].append(dice)
            hds[j].append(hd)
        del pred_nii, pred, pred_cu, pred_arr, mask_nii, mask, mask_cu, mask_arr
    dices = np.array(dices)
    hds = np.array(hds)

    print(f"wt dice is {np.mean(dices[0, :])}")
    print(f"tc dice is {np.mean(dices[1, :])}")
    print(f"et dice is {np.mean(dices[2, :])}")
    print(f"wt hd is {np.mean(hds[0, :])}")
    print(f"tc hd is {np.mean(hds[1, :])}")
    print(f"et hd is {np.mean(hds[2, :])}")

if __name__ == '__main__':
    visit_data()

Original: https://blog.csdn.net/only_ctrl/article/details/124775303
Author: DewNose
Title: nnUNet在2d数据集上训练测试一体教程（绕过五折交叉验证

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/710167/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

利用opencv实现图像马赛克处理的三种方法

前言：本文就图像的马赛克处理，基于opencv提出了三种解决方案，并详细地介绍了三种方法的原理、示例、问题及问题的解决方案。方法一原理介绍：利用resize()将图片先缩小，再…

人工智能 2023年7月18日
0058
翻译: 详细图解Transformer多头自注意力机制 Attention Is All You Need

前言 The Transformer——一个使用注意力来提高这些模型的训练速度的模型。Transformer 在特定任务中的表现优于谷歌神经机器翻译模型。然而，最大的好处来自于 T…

人工智能 2023年7月26日
0081
机器人标定总结

1 引言工业机器人虽然重复定位精度很高，但由于绝对定位精度很低限制了工业机器人的应用，因此提高绝对定位精度能扩展工业机器人的应用范围。机器人可以将传感器安装在固定位置，具有固定的…

人工智能 2023年6月25日
0082
k-means聚类算法及其优化

欢迎关注笔者的微信公众号在机器学习中有这样一种场景，需要对已知数据按照一定的关系归到不同的类别中（无监督） k-means是比较流行的聚类方法其基本算法流程如下：随机设置K个…

人工智能 2023年5月31日
0075
鲸鱼WOA优化注意力机制的BiLSTM用于负荷预测

基于Python、tensorflow1.x框架，提出了一种基于 Attention 机制的BiLSTM短期电力负荷预测方法，该方法将历史负荷数据作为输入，建模学习特征内部动态变化…

人工智能 2023年5月25日
0094
R语言使用names函数自定义修改数据列变量的名称、一次性修改dataframe所有数据列的名称

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月16日
00106
Python：opencv画点、圆、线、多边形、矩形

简介：机器学习视觉方向一般都需要在图像中添加标注框，标注框有着很大的用处，特别是对图像中某些需要关注的特征起到圈定的效果，方便对特征选择进行处理。相关攻略：机器学习：基本流程P…

人工智能 2023年5月28日
0089
.NET下如何拦截鼠标、键盘消息？Win32NET来帮你

Win32NET是一个Win32API的.NET下封装的类库，包含： 1: 常用win32的API的net封装 2：鼠标、键盘、热键hook钩子模块， 3：模拟键盘输入文字（支持各…

人工智能 2023年6月4日
00175
GTX960M安装Anaconda+cuda9.0+cudnn v7.6.5+tensorflow-gpu1.8.0

目录 1 安装Anaconda 1.1下载Anaconda安装包 1.2安装 1.3 更改路径 1.4 修改默认浏览器 2 安装cuda9.0 2.1 cuda版本选择 3 安装c…

人工智能 2023年5月23日
00102
设计模式学习（十七）：状态模式

设计模式学习（十七）：状态模式作者：Grey 原文地址：博客园：设计模式学习（十七）：状态模式 CSDN：设计模式学习（十七）：状态模式状态模式状态模式是一种行为型模式。…

人工智能 2023年6月29日
0069
nltk自然语言处理

一些知识点 concordance concordance查找语料库中特定的单词的上下文, 检索词指定窗口大小的上下文。 concordance(word,width,lines)…

人工智能 2023年5月28日
0076
Tensorflow keras中实现语义分割多分类指标：IOU、MIOU

在TF1.x版本中 miou指标可以使用tf.metrics.mean_iou 进行计算： tf.metrics.mean_iou(labels, predictions, num…

人工智能 2023年5月23日
0098
知识图谱从入门到应用——知识图谱的知识表示：符号表示方法

分类目录：《知识图谱从入门到应用》总目录相关文章：· 知识图谱的知识表示：基础知识· 知识图谱的知识表示：符号表示方法· 知识图谱的知识表示：向量表示方法在前面的文章中已经多次提…

人工智能 2023年6月1日
00110
pytorch和tensorflow函数对应关系(持续更新)

方法名称大写一般为类，小写为函数，如A，a，使用方法为A()(),a() 作用Pytorchtensorflow tensor常量troch.tensor()tf.constant…

人工智能 2023年7月22日
0040
Diffusion模型详解

1 引言在上一篇《基于流的深度生成模型》中详解介绍了有关流的生成模型理论和方法。目前为止，基于GAN生成模型，基于VAE的生成模型，以及基于flow的生成模型它们都可以生成较高质…

人工智能 2023年6月23日
0054
MXNe

问题：MXNe问题介绍 MXNe（Maksimized Noise Entropy）是一种用于对信号进行降噪的算法。它基于最大化信号的噪声熵来寻找最佳降噪结果。本文将详细介绍MXN…

人工智能 2023年12月31日
0041

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31