【全网最全】2023华为杯研赛E题高质量资料获取入口

目录

一定要点击文末的卡片,这是获取资料的入口


更新1种保奖思路+可直接运行的数据预处理代码

【全网最全】2023华为杯研赛E题高质量资料获取入口_第1张图片

E题思路

先说下数据,随访流水号是患者的后续诊断号码,表3有对应的数据,首先需要做下数据整理,需要整理出每次诊断的指标(包括表1中人物信息、表2中的检查指标以及表3中的检查指标,基于流水号进行匹配整合)

这个题目主要涉及到机器学习算法,可以检查下数据是否有异常或缺失情况,采取必要处理

第一问:

第一小问:是标记患者是否发生血肿扩张,看附件2中HM_volume的几次指标数值的变化是否出现体积增加≥6 mL或相对体积增加≥33%的情况,是则标记为1,流水号后四位应该是几点几分钟,以首次流水号上的时间减去发病到首次检测的间隔时间作为0时刻,对时间和HM_volume指标值做插值拟合或者拟合关系式,并算出48小时的HM_volume值,然后判断是否发生血肿扩张,如果48小时内判断发生血肿扩张,则需要计算出刚好满足判断为血肿扩张的时间,注意HM_volume值单位是10^-3ml。

第二小问:基于患者首次检测的指标作为输入,是否48小时内是否发生水肿扩张为输出,用机器学习算法训练,训练集测试集划分见题目说明,模型训练好之后分别带入这几个数据集,算出对应的概率,这个概率别四舍五入了,一些算法最后输出的是整数,但是输出结构中能调出对应的概率。

 第二问:

第一小问:建立时间与HM_volume值的关系模型,并进行拟合检验,需要拿前100个患者的检测时间和HM_volume值数据来做分析,然后分别带入前100个患者的发病时间去计算下残差,最后建议填写平均值。

第二小问:先聚类,类别3-5个,然后分别按照第一小问的方式做就行。

一定要点击文末的卡片,这是获取资料的入口

你可能感兴趣的:(数学建模,数学建模比赛,数学建模,算法)