• 医学YOLOv8 | 脑肿瘤检测 Accuracy 99%


    b6351a31a8ecfb57ba30eea1e7fd4ffc.png

    在医疗保健领域,准确和高效地识别脑肿瘤是一个重大挑战。本文中,我们将探讨一种使用 YOLOv8,一种先进的目标检测模型,将脑肿瘤进行分类的新方法,其准确率达到了 99%。通过将深度学习与医学图像相结合,我们希望这种方法将提高脑肿瘤识别的速度和准确性。

    首先,我们将从 Kaggle 获取脑肿瘤分类数据集。然后,我们将利用各种数据清理方法来准备数据,以输入到我们的模型中。接下来,我们将从 Ultralytics 下载 YOLOv8,并对其进行调整以适应我们的具体情况。最后,我们将创建一个 FastAPI 应用程序以实现简化的使用。

    1. 探索数据集

    让我们仔细看看刚刚从 Kaggle 下载的数据集。数据集已经被分为训练集和测试集。数据集中有四种不同的肿瘤类别:胶质瘤、脑膜瘤、垂体瘤和无肿瘤。每个类别在训练集中约有 1300 个示例,在测试集中约有 300 个示例。

    2. 数据准备

    在此过程中,我们将利用各种技术来清理数据集图像。这些技术包括识别和删除损坏的图像,以及消除尺寸明显较小的图像。

    2.1 删除损坏的图像

    在这个过程中,我们必须检查每个类别中的所有图像,并验证它们是否可以使用 cv.imread 打开。如果无法打开,就必须从数据集中删除它,因为它可能是损坏的图像或根本不是图像文件。

    2.2 删除尺寸不合格的图像

    另一个数据清理技术涉及检查图像是否低于某个尺寸阈值并将其删除。这很重要,因为冗余数据可能会对我们的模型性能产生负面影响。下面的代码可以一次删除所有损坏的和低于阈值的图像。

    1. import os
    2. import cv2
    3. train_dir = "BrainTumor/train"
    4. categories = ["glioma", "meningioma", "notumor", "pituitary"]
    5. size_threshold = (10,10)
    6. valid_extensions=('.jpg', '.png', '.jpeg')
    7. def is_image_corrupt(image_path):
    8. try:
    9. img = cv2.imread(image_path)
    10. if img is None:
    11. return True
    12. return False
    13. except:
    14. return True
    15. def is_image_below_threshold(img_path):
    16. img = cv2.imread(image_path)
    17. if img.shape <= size_threshold:
    18. print(img.shape)
    19. return True
    20. return False
    21. for each_category in categories:
    22. folder_path = os.path.join(train_dir, each_category)
    23. for each_file in os.listdir(folder_path):
    24. image_path = os.path.join(folder_path, each_file)
    25. if os.path.isfile(image_path) and each_file.lower().endswith(valid_extensions):
    26. if is_image_corrupt(image_path) or is_image_below_threshold(image_path):
    27. os.remove(image_path)
    28. print(f"Removed corrupt image: {each_file}")

    3. 数据分析

    作为分析的一部分,我们将检查数据集以确定总记录数和每个类别的图像数量。我们还将评估类别的分布,并生成图表以增进对数据的理解。

    这种方法允许我们从数据中获得洞察,以防止在将其输入模型时出现过拟合和欠拟合问题。

    1. import matplotlib.pyplot as plt
    2. import os
    3. train_dir = "/BrainTumor/train"
    4. valid_extensions=('.jpg', '.png', '.jpeg')
    5. categories = ["glioma", "meningioma", "notumor", "pituitary"]
    6. category_count = {}
    7. for each_category in categories:
    8. folder_path = os.path.join(train_dir, each_category)
    9. valid_images = [file for file in os.listdir(folder_path) if file.lower().endswith(valid_extensions)]
    10. category_count[each_category] = len(valid_images)
    11. fig, ax = plt.subplots(figsize=(10, 4))
    12. # Bar chart
    13. bar_plot = plt.barh(list(category_count.keys()), list(category_count.values()), 0.5)
    14. plt.title('Tumor Type Distribution')
    15. plt.xlabel('Count')
    16. plt.ylabel('Tumor Type')
    17. for i, bar in enumerate(bar_plot):
    18. plt.text(bar.get_width(), bar.get_y() + bar.get_height() / 2, str(list(category_count.values())[i]), ha='left', va='center')
    19. plt.show()
    20. sample_size = sum(category_count.values())
    21. class_dist = {key : val/sample_size for key, val in category_count.items()}
    22. fig, ax = plt.subplots(figsize=(10, 4))
    23. # Bar chart
    24. bar_plot = plt.barh(list(class_dist.keys()), list(class_dist.values()), 0.6)
    25. plt.title('Class Distribution')
    26. plt.xlabel('Class')
    27. plt.ylabel('Percentage')
    28. for i, bar in enumerate(bar_plot):
    29. plt.text(bar.get_width(), bar.get_y() + bar.get_height() / 2, str(round(list(class_dist.values())[i], 3)), ha='left', va='center')
    30. plt.show()

    所展示的代码将创建两个条形图,表示每个类别的图像数量和类别分布。图表显示我们的数据分布均匀,虽然在“无肿瘤”类中的图像数量稍多,但与其他类别相比仍然相对平衡。

    824715383b88df3fcaeb4d782f38af40.png

    4. 数据可视化

    在将数据输入之前,用肉眼查看它对于更好的理解是很重要的。下面提供的代码显示了每个类别的一张图像。

    1. import matplotlib.pyplot as plt
    2. import os
    3. train_dir = "/BrainTumor/train"
    4. valid_extensions=('.jpg', '.png', '.jpeg')
    5. categories = ["glioma", "meningioma", "notumor", "pituitary"]
    6. plt.figure(figsize=(12, 8))
    7. for i, category in enumerate(categories):
    8. folder_path = os.path.join(train_dir, category)
    9. image_path = os.path.join(folder_path, os.listdir(folder_path)[0])
    10. if not image_path.lower().endswith(valid_extensions):
    11. continue
    12. img = plt.imread(image_path)
    13. plt.subplot(2, 2, i+1)
    14. plt.imshow(img)
    15. plt.title(category)
    16. plt.axis("off")
    17. plt.tight_layout()
    18. plt.show()

    输出:

    7d5133b35b0a53ec46710f5206f9a687.png

    5. 训练模型

    在脑肿瘤分类项目中,我们将使用 YOLOv8 预训练模型。我们的第一步将是将这个模型导入项目中。接下来,我们将用我们的数据集微调预训练模型。最后,我们将在测试数据上评估模型,以确定每个类别的准确性。

    1. from ultralytics import YOLO
    2. model = YOLO('yolov8m-cls.pt') # load a pretrained YOLOv8n classification model
    3. # train/pre-tuned the model on our dataset
    4. model.train(data='BrainTumor', epochs=3)
    5. # run the model on test data
    6. res = model.val()
    7. # Result saved to runs/classify/val

    要获得归一化混淆矩阵,导航到当前目录中的 runs/classify/val 文件夹。一旦进入那里,您将能够以以下图像的形式查看它。

    5cdae64608fe4355af7c21ebbd8d9064.png

    从所提供的数据中,模型在三个类别上达到了 100% 的性能,而在一个类别(脑膜瘤)上达到了 96%。因此,总准确性可以计算如下: (100 x 3 + 96) / 4 = 99%。

    6. 测试自定义图像

    在项目的最后一步,我们将在 FastAPI 中建立一个端点。这个端点将接受图像作为输入,并返回图像的标签预测。有了这个功能,我们可以轻松地在任何选择的图像上测试我们的模型。在微调模型后,它将生成另一个预训练模型文件(.pt),位于/run/classify/train/weights/best.pt 中。我们将将此文件集成到我们的 FastAPI 项目中。

    以下是运行在端口 8000 上的 FastAPI 代码,它有一个 /images 的端点。这个端点将以图像作为输入,并返回由我们的模型(best.pt)预测的图像标签。

    1. import subprocess
    2. from fastapi import FastAPI, UploadFile, File
    3. from ultralytics import YOLO
    4. def model_train():
    5. model = YOLO('./runs/classify/train/weights/best.pt') # load a pretrained YOLOv8n classification model
    6. return model
    7. app = FastAPI()
    8. model_data = None
    9. @app.post("/images/")
    10. def create_upload_file(image: UploadFile = File(...)):
    11. global model_data
    12. if model_data is None:
    13. model_data = model_train()
    14. with open(f"./images/{image.filename}", "wb+") as f:
    15. f.write(image.file.read())
    16. result = model_data(f"./images/{image.filename}")
    17. return {"result": result[0].names[result[0].probs.top1]}
    18. def run_uvicon():
    19. uvicorn_command = [
    20. "uvicorn",
    21. "main:app",
    22. "--host", "127.0.0.1",
    23. "--port", "8000",
    24. "--reload",
    25. ]
    26. subprocess.run(uvicorn_command, check=True)
    27. if __name__ == "__main__":
    28. run_uvicon()

    输出:

    0bdd2448b348f1bd57d05d01dbc598dc.png

    结论

    总之,我们文章中使用的数据是从 Kaggle 平台获取的。在此之后,我们对数据进行了清理处理,然后将其输入到模型中,最终生成了归一化混淆矩阵。作为最后一步,我们使用 FastAPI 建立了一个端点,使我们能够以高度准确和高效的方式进行预测,并随后返回输入系统的任何肿瘤图像的类别。

    ·  END  ·

    HAPPY LIFE

    f911e04d4d0341a3db2c5373bacc4f0f.png

    本文仅供学习交流使用,如有侵权请联系作者删除

  • 相关阅读:
    【LeetCode】Day130-最长有效括号
    详解操作符
    机器学习 | Python实现KNN(K近邻)算法模型
    信息学奥赛一本通:1162:字符串逆序
    互联网应用主流框架整合之构建REST风格的系统
    认真学习MySQL中的角色权限控制
    【RPA技术】前 5 个开源 RPA 框架——以及如何选择
    牛客网:主持人调度
    野生程序员的成长之路(续)--团队需要什么样的管理者?
    Linux Vim 进阶教程
  • 原文地址:https://blog.csdn.net/weixin_38739735/article/details/134046894