前情提要,上一篇文章医学影像 DICOM转NIFTI(.dcm 到 .nii) 介绍了如何读取医学影像文件,及如何进行格式转换,本文将围绕“特征提取”,聊聊如何使用 Python 进行影像特征的提取,为后续预处理、建模做好数据准备。
在开始之前,我们需要明确两点,一个是医学影像序列,另一个就是感兴趣区 ROI。
医学影像序列我们都比较熟悉了,就是通过 CT 或者核磁扫描,得到的一份序列图片。
那 ROI 是什么呢?官方解读是:Region Of Interest,也就是感兴趣区。用来指定某一个区域,去抽取医学影像序列图中的部分数据。这么说可能比较抽象,我们不妨举个例子。
大家或许都用过面膜,没用过也可能见过,当然要是见都没见过,那这理解起来估计也就不那么直白了,这里就假定见过了。
面膜敷到脸上,一般漏出来的是:眼睛,鼻子,嘴巴。这三个区域便可以是 ROI,我们指定好这三个 ROI,透过它们看后面的脸,能看到的就是:眼睛,嘴巴,鼻子。
对应到医学影像和 ROI 上,同样如此。有了 ROI 文件,我们就可以截取医学影像上特定的感兴趣的区域。
通常来说,ROI 文件一般是经验丰富的医生手动勾画出的病灶区域,当然也有半自动,自动的机器抽取。不过目前业界的金标准依旧是人工勾画。