• 【ACDC数据集】:预处理ACDC心脏3D MRI影像数据集到VOC数据集格式,nii转为jpg,label转为png


    【Segment Anything Model】做分割的专栏链接,欢迎来学习。
    【博主微信】cvxiaoyixiao
    本专栏为公开数据集的介绍和预处理,持续更新中。

    2023年11月2日更新补充

    跟我要处理好的数据集的,我都给了。请自行注意检查数据集是否是你想要的,我只处理了原数据集的第一部分
    也就是frame01部分。并且测试集 现在是RGBA图像,可以自行转化为L灰度图像。

    def convert_RGBA2L():
        from PIL import Image
        import os
    
        path = "ACDC_dataset/testing/label"
        for i in os.listdir(path):
            old_path = os.path.join(path, i)
            rgba_image = Image.open(old_path)
            gray_image = rgba_image.convert("L")
            new_name = os.path.splitext(i)[0] + ".png"  # 更改扩展名为.png
            new_path = os.path.join(path, new_name)
            gray_image.save(new_path, "PNG")  # 指定保存格式为PNG
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13

    1️⃣ ACDC数据集介绍

    他是一个多类别的心脏3D MRI影像数据集`,2017年ACDC挑战赛(Automated Cardiac Diagnosis
    Challenge)。

    原数据集获取,网盘永久有效:
    链接:https://pan.baidu.com/s/1F4Xq1crtUSmFcSKxwO4Eaw?pwd=ejfa 提取码:ejfa
    –来自百度网盘超级会员V6的分享

    2️⃣ ACDC数据集样例

    首先夸夸👍 ,ACDC数据集存放格式非常规律👍 ,数据质量非常高👍 清晰了分为3类别。
    在这里插入图片描述
    training里有100例患者,testing里有50例患者。每个nii的切片个数不同根据勾画的肿瘤。
    在这里插入图片描述

    Info是媒体信息
    patient001_4d.nii.gz是全部的切片,我也不知道从医学上怎么描述,就是这个患者的立体影像,包括没有肿瘤的部分
    patient001_frame01.nii.gz是一个时期nii影响的压缩包
    patient001_frame01_gt.nii.gz对应patient001_frame01.nii.gz的肿瘤勾画的label的压缩包。用四种像素对应了四个类别包括背景。
    patient001_frame12.nii.gz是统一患者另一时期的影像
    patient001_frame12_gt.nii.gz是对应的label

    总之每个患者都有一个整体影像,还有两个不同成像和对应label。以下是打开之后的影像图。

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    3️⃣ 预处理ACDC目标

    目标:处理ACDC的nii.gz数据集到VOC格式的2d的png图片
    VOC格式 这篇文章有讲直达
    在这里插入图片描述

    例如:将patient001_frame01.nii.gz处理成几张png作为网络image的输入。将patient001_frame01_gt.nii.gz处理成几张png作为label。只处理了training的100例患者,把training当成了整个集合划分了训练测试。并且只关心了frame01第一阶段,第二个阶段的未关心。只关心了留下的部分。够了。
    在这里插入图片描述

    4️⃣ 处理结果样图

    处理结果样图:
    img转为jpg label转为png 并且像素为0-3. 0代表背景,1-3代表分类。label图像素太小,这里看不出来,可以看第三张数组图
    在这里插入图片描述在这里插入图片描述
    在这里插入图片描述

    5️⃣ 代码

    事先准备好VOC文件夹在这里插入图片描述

    """
    处理官网下载的ACDC到网络要求的VOC格式,按需调用
    author: cvxiayixiao
    Wechat: cvxiayixiao
    """
    import os
    from os.path import join
    import nibabel as nib
    import gzip
    import shutil
    import matplotlib.pyplot as plt
    import numpy as np
    
    ori_ACDC_train_path = './ACDC_challenge_20170617/training'
    
    
    def niigz2nii():
        """
        解压每个患者的01阶段的nii.gz 和 gt.nii.gz 到输入文件夹"ACDC_nii"
        """
    
        input_path = ori_ACDC_train_path
        # 处理image
        # target='frame01.nii'
        # output_path = 'ACDC_nii/images'
    
        # 处理gt
        target = 'frame01_gt.nii'
        output_path = 'ACDC_nii/labels'
    
        for patient in os.listdir(input_path):
            # ACDC_challenge_20170617/training/patient001
            patient_path = join(input_path, patient)
            for niigz in os.listdir(patient_path):
                if target in niigz:
                    niigzpath = join(patient_path, niigz)
                    new_nii_path = join(output_path, niigz)
                    shutil.copy(niigzpath, new_nii_path)
    
    
    # niigz2nii()
    def convert_nii_to_jpg():
        '''
        将ACDC_nii/images中的nii转到VOCjpg中
        :return:
        '''
        image_num = 0
        nii_path = "./ACDC_nii/images"
        output_dir = "./VOCdevkit/VOC2007/JPEGImages"
        for patient in os.listdir(nii_path):
            patient_path = join(nii_path, patient)
            for one in os.listdir(patient_path):
                one_patient_nii_path = join(patient_path, one)
                # 加载 .nii 文件
                nii_img = nib.load(one_patient_nii_path)
                data = nii_img.get_fdata()
                # 遍历数据的每个切片,并保存为 .png 文件
                for i in range(data.shape[2]):
                    image_num += 1
                    # 获取当前切片数据
                    slice_data = data[:, :, i]
                    # 创建输出文件路径
                    num = f"{image_num}".zfill(6)
                    output_path = os.path.join(output_dir, f'{patient}_{num}.jpg')
                    # 以灰度图像格式保存切片数据为 .png 文件
                    plt.imsave(output_path, slice_data, cmap='gray')
    
    
    # convert_nii_to_jpg()
    
    def convert_nii_to_png():
        '''
        将ACDC_nii/labels中的nii转到ACDC_nii/tmp_png_label中
        此时的像素是原label 中的像素,不是网络中的分类像素,还需要一部转换
        :return:
        '''
        image_num = 0
        nii_path = "./ACDC_nii/labels"
        output_dir = "./tmp"
        for patient in os.listdir(nii_path):
            patient_path = join(nii_path, patient)
            for one in os.listdir(patient_path):
                one_patient_nii_path = join(patient_path, one)
                # 加载 .nii 文件
                nii_img = nib.load(one_patient_nii_path)
                data = nii_img.get_fdata()
                # 遍历数据的每个切片,并保存为 .png 文件
                for i in range(data.shape[2]):
                    image_num += 1
                    # 获取当前切片数据
                    slice_data = data[:, :, i]
                    # 创建输出文件路径
                    num = f"{image_num}".zfill(6)
                    output_path = os.path.join(output_dir, f'{patient}_{num}.png')
                    # 以灰度图像格式保存切片数据为 .png 文件
                    plt.imsave(output_path, slice_data, cmap='gray')
    
    from PIL import Image
    
    
    def turnto255():
        from PIL import Image
        from PIL import Image
        for i in os.listdir("tmp"):
            output_path = os.path.join("./tmp1", i)
            png_path = join("tmp", i)
            # 读取图像
            image = plt.imread(png_path)
    
            # 取三个通道的平均值
            im_gray = np.mean(image, axis=2)
            im_gray = Image.fromarray((im_gray * 255).astype(np.uint8)).convert("L")
            # 保存输出图像
            im_gray.save(output_path)
    
    
    def rename():
        """
        处理好的VOC2007 train和test名称不同,名称不对应不能训练
        转为对应的,之前的留作副本可以对应原图
        :return:
        """
        root = "VOCdevkit/VOC2007/SegmentationClass"
        for i in os.listdir(root):
            img_old_path = join(root, i)
            new_png_path = join(root, i[-10:])
            shutil.copy(img_old_path, new_png_path)
    
    
    # rename()0-255转为0-3类代码,加微信cvxiayixiao
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56
    • 57
    • 58
    • 59
    • 60
    • 61
    • 62
    • 63
    • 64
    • 65
    • 66
    • 67
    • 68
    • 69
    • 70
    • 71
    • 72
    • 73
    • 74
    • 75
    • 76
    • 77
    • 78
    • 79
    • 80
    • 81
    • 82
    • 83
    • 84
    • 85
    • 86
    • 87
    • 88
    • 89
    • 90
    • 91
    • 92
    • 93
    • 94
    • 95
    • 96
    • 97
    • 98
    • 99
    • 100
    • 101
    • 102
    • 103
    • 104
    • 105
    • 106
    • 107
    • 108
    • 109
    • 110
    • 111
    • 112
    • 113
    • 114
    • 115
    • 116
    • 117
    • 118
    • 119
    • 120
    • 121
    • 122
    • 123
    • 124
    • 125
    • 126
    • 127
    • 128
    • 129
    • 130
    • 131
    • 132
    • 133

    6️⃣ 划分测试集和训练集

    import os
    import random
    
    import numpy as np
    from PIL import Image
    from tqdm import tqdm
    
    #   修改train_percent用于改变验证集的比例 9:1
    trainval_percent    = 1
    train_percent       = 0.9
    VOCdevkit_path      = 'VOCdevkit'
    
    if __name__ == "__main__":
        random.seed(0)
        print("Generate txt in ImageSets.")
        segfilepath     = os.path.join(VOCdevkit_path, 'VOC2007/SegmentationClass')
        saveBasePath    = os.path.join(VOCdevkit_path, 'VOC2007/ImageSets/Segmentation')
        
        temp_seg = os.listdir(segfilepath)
        total_seg = []
        for seg in temp_seg:
            if seg.endswith(".png"):
                total_seg.append(seg)
    
        num     = len(total_seg)  
        list    = range(num)  
        tv      = int(num*trainval_percent)  
        tr      = int(tv*train_percent)  
        trainval= random.sample(list,tv)  
        train   = random.sample(trainval,tr)  
        
        print("train and val size",tv)
        print("traub suze",tr)
        ftrainval   = open(os.path.join(saveBasePath,'trainval.txt'), 'w')  
        ftest       = open(os.path.join(saveBasePath,'test.txt'), 'w')  
        ftrain      = open(os.path.join(saveBasePath,'train.txt'), 'w')  
        fval        = open(os.path.join(saveBasePath,'val.txt'), 'w')  
        
        for i in list:  
            name = total_seg[i][:-4]+'\n'  
            if i in trainval:  
                ftrainval.write(name)  
                if i in train:  
                    ftrain.write(name)  
                else:  
                    fval.write(name)  
            else:  
                ftest.write(name)  
        
        ftrainval.close()  
        ftrain.close()  
        fval.close()  
        ftest.close()
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53

    成功划分
    在这里插入图片描述

  • 相关阅读:
    NSS [鹤城杯 2021]Middle magic
    第四次作业
    【学习记录】动态数组(vector)的基本操作,包括插入、删除、扩容、输出、释放内存等。用C语言编写
    CTF—Go题目复现
    Oracle故障案例之-19C时区补丁DSTV38更新
    ARM接口编程—RTC(exynos 4412平台)
    AIGC快速入门体验之虚拟对象
    C语言 题目 1760: 字符序列模式识别
    Hive 之拉链表
    多个文件合成一个bin文件(将uboot/kernel/rootfs合成一个bin文件烧录)(UBin工具下载)
  • 原文地址:https://blog.csdn.net/cvxiayixiao/article/details/133232554