点击链接: C题
针对第一问:对所附数据的特征指标进行预处理,调查数据特征与阿尔茨海默病诊断之间的相关性。
解析:这里主要分为两部分内容需要解决,首先是数据处理,然后是选择合适的相关性分析方法判断特征和疾病间的相关性;数据预处理这个很简单,主要是判断有无缺失值或异常值,并且剔除这些的数据,属于常规操作。
相关性分析计算方式也就那么几种:Pearson相关系数(适用于定量数据,且数据满足正态分布)、Spearman相关系数(数据不满足正态分布时使用)、Kendall’s tau-b相关系数(有序定类变量)。个人初步认为Pearson相关系数就可以满足,但具体效果如何,可以进行Kappa一致性检验一下。如果我们只是想初步探查变量之间是否存在相关关系,则可以忽略变量连续/离散特性,统一使用相关系数进行计算,这也是pandas中的.corr方法所采用的策略。
针对第二问:利用所附的大脑结构特征和认知行为特征来设计一种阿尔茨海默病的智能诊断。
需要对文献结构脑特征和认知行为特征进行分析,分成两个类别,比如患病阿尔茨海默病的表现和数据怎么样,有哪些特征,比如这两个哪个值高、哪个值低;什么情况下是没有患阿尔茨海默病,哪几种情况是患病的,这一题建议使用决策树算法的树形模型,svm支持向量机也不错,树模型可以用 xgboost 这个模型目前也是比较火的,svm和 xgboost有一定难度,赛友可以选择通过简单的数据分析来做,或者用聚类算法也可以。本题思路比较开阔 。
针对第三问:首先,将 CN、MCI 和 AD 分成三大类。然后,对于 MCI 中包含的三个子类(SMC、EMCI 和 LMCI ),聚类继续细化为三个子类。 这个问题已经在题目中给出明显的要求是进行聚类,聚类后再聚类,如果第二问已经用了聚类可以接着用,如果没有,在这里聚类需要设计3 个类,这里赛友可以尝试使用一些方法降敌噪音,参考见补充6、7,如果是时间紧张和比赛熟练度比较低,可以不做这个部分。
补充1:数据预处理可以参考:https://blog.csdn.net/weixin_46211269/article/details/125092790
补充2:相关性分析及相关系数可以参考:https://blog.csdn.net/SHRtuji/article/details/114107221?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-1-114107221-blog-81867882.pc_relevant_aa&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-1-114107221-blog-81867882.pc_relevant_aa&utm_relevant_index=2
补充3:聚类分析 10 种方法及其代码链考 https://mp.weixin.qq.com/s?__biz=MjM5NzEyMzg4MA==&mid=2649469644&idx=6&sn=3f5992bc76bb4233650933dd704c283b&chksm=bec1d08b89b6599d58ab3e91ad35fe78c2f176f1c78a8e4911cb7436d636f0da44297dd14678&scene=27
补充4:xgboost: https://blog.csdn.net/weixin_52910499/article/details/123987063
补充5:svm:https://blog.csdn.net/weixin_43569478/article/details/113980240?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522166865913216782429766058%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D&request_id=166865913216782429766058&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2alltop_click~default-2-113980240-null-null.142%5ev63%5econtrol,201%5ev3%5eadd_ask,213%5ev2%5et3_control1&utm_term=svm%E5%88%86%E7%B1%BB&spm=1018.2226.3001.4187
补充6:聚类中噪音的处理 https://blog.csdn.net/qq_29258361/article/details/79489573