原创:CSDN/知乎:川川菜鸟
阿尔茨海默病的临床前阶段,也称为轻度认知障碍(MCI),是正常和严重之间的过渡状态。由于患者及家属对疾病的认知有限,67%的患者被诊断为中重度,已错过最佳干预阶段。因此,早期准确诊断阿尔茨海默病和轻度认知障碍具有重要意义
所附数据包含在不同时间点(一个时间点为一个量)收集的 4850 名认知正常老年人(CN)、1416 名主观记忆主诉患者(SMC)、2968 名早期轻度认知障碍患者(EMCI)、5236 名晚期轻度认知障碍患者(LMCI)和 1738 名阿尔茨海默病患者(AD)的具体信息特征。请利用附录中提供的不同类别人群的大脑结构特征和认知行为特征,构建阿尔茨海默病识别模型,设计智能诊断方法,准确诊断阿尔茨海
默病。
说明文档原文:
https://adni.loni.usc.edu/wp-content/uploads/2013/09/DOD-ADNI-PM-12.7.12-FINAL.pdf
不用太关心这些变量的含义,只要把目标变量确定出来就行。
目标变量:DX_b
其它变量:相关特征
第一问:空缺部分可填充为0,缺失多的直接删除;缺失值少的用平均值填充。剔除一些不重要的特征。相关性可以用热力图,估计用处不大;还可以用特征重要性的排名来看,越重要则越相关,从而还能用于筛选特征。
第二问:五分类问题。建议算法:XGBoost 模型、 支持向量机 (SVM)模型、随机森林(RF)模型。建议至少使用两个算法,从而有对比性。
第三问:把三个大类分开筛选,其中单独提取H列中SMC、EMCI 和 LMCI 这三个类型的数据,然后使用无监督学习的聚类算法。例如使用:手肘法+Kmeans,这样的做法在高教杯就能国二水平。
第四问:关键在“时间点”,描述统计一些关于时间的量,可视化能说明出来更好。
第五问:这方面资料很多,晚点我再发出来。
思路如果有错误,后续我再更新。
点击查看:C题
视频讲解:C题