• 2022国际数维杯C题题解:利用大脑结构特征和认知行为特征诊断阿尔茨海默病


    原创:CSDN/知乎:川川菜鸟

    问题描述

    阿尔茨海默病的临床前阶段,也称为轻度认知障碍(MCI),是正常和严重之间的过渡状态。由于患者及家属对疾病的认知有限,67%的患者被诊断为中重度,已错过最佳干预阶段。因此,早期准确诊断阿尔茨海默病和轻度认知障碍具有重要意义

    所附数据包含在不同时间点(一个时间点为一个量)收集的 4850 名认知正常老年人(CN)、1416 名主观记忆主诉患者(SMC)、2968 名早期轻度认知障碍患者(EMCI)、5236 名晚期轻度认知障碍患者(LMCI)和 1738 名阿尔茨海默病患者(AD)的具体信息特征。请利用附录中提供的不同类别人群的大脑结构特征和认知行为特征,构建阿尔茨海默病识别模型,设计智能诊断方法,准确诊断阿尔茨海
    默病。

    说明文档原文:

    https://adni.loni.usc.edu/wp-content/uploads/2013/09/DOD-ADNI-PM-12.7.12-FINAL.pdf

    任务

    1. 对所附数据的特征指标进行预处理,考察数据特征与阿尔茨海默病诊断的相关性。
    2. 利用附带的结构脑特征和认知行为特征,设计阿尔茨海默病的智能诊断。
    3. 首先,将 CN、MCI 和 AD 分成三大类。然后,对于 MCI 中包含的三个子类(SMC、EMCI 和 LMCI ),聚类继续细化为三个子类。
    4. 附件中的相同样本包含在不同时间点收集的特征,请分析它们与时间点的关系,以揭示不同类别疾病随时间演变的模式。
    5. 请参考相关文献来描述 CN、SMC、EMCI、LMCI 和 AD 五种类型的早期干预和诊断标准

    数据说明

    • DX_b:类型。CN表示正常老年人,SMC表示主观记忆主诉患者,EMCI表示早期轻度认知障碍患者,LMCI表示晚期轻度认知障碍患者,AD表示阿尔茨海默病患者。
    • AGE:年龄
    • PTGENDER:性别
      。。。。。

    不用太关心这些变量的含义,只要把目标变量确定出来就行。

    思路

    目标变量:DX_b
    其它变量:相关特征

    第一问:空缺部分可填充为0,缺失多的直接删除;缺失值少的用平均值填充。剔除一些不重要的特征。相关性可以用热力图,估计用处不大;还可以用特征重要性的排名来看,越重要则越相关,从而还能用于筛选特征。

    第二问:五分类问题。建议算法:XGBoost 模型、 支持向量机 (SVM)模型、随机森林(RF)模型。建议至少使用两个算法,从而有对比性。

    第三问:把三个大类分开筛选,其中单独提取H列中SMC、EMCI 和 LMCI 这三个类型的数据,然后使用无监督学习的聚类算法。例如使用:手肘法+Kmeans,这样的做法在高教杯就能国二水平。

    第四问:关键在“时间点”,描述统计一些关于时间的量,可视化能说明出来更好。

    第五问:这方面资料很多,晚点我再发出来。

    思路如果有错误,后续我再更新。

    代码

    点击查看:C题

    视频讲解:C题

  • 相关阅读:
    SpringBoot——常用注解
    【SpringBoot整合MQ】-----SpringBoot整合ActiveMQ
    一次简单的 JVM 调优,学会拿去写到简历里
    【无标题】
    【01】ES6:ECMAScript 介绍
    算符与数据结构 --- 类C语言有关操作和补充
    智能手机马拉松:后半程是耐力赛
    HarmonyOS/OpenHarmony(Stage模型)应用开发单一手势(二)
    Java必须掌握的多态的优势和弊端(含面试大厂题和源码)
    【云原生--Kubernetes】Pod容器与镜像拉取策略
  • 原文地址:https://blog.csdn.net/weixin_46211269/article/details/127897977