2023东三省“深圳杯”A题全保姆论文讲解

A题 影响城市居民身体健康的因素分析

以心脑血管疾病、糖尿病、恶性肿瘤以及慢性阻塞性肺病为代表的慢性非传染性疾病(以下简称慢性病)已经成为影响我国居民身体健康的重要问题。随着人们生活方式的改变,慢性病的患病率持续攀升。众所周知,健康状况与年龄、饮食习惯、身体活动情况、职业等都有密切的关系。如何通过合理地安排膳食、适量的身体运动、践行健康的生活方式,从而达到促进身体健康的目的,这是全社会普遍关注的问题。附件A1是某市卫生健康研究部门对部分居民所做的“慢性非传染性疾病及其相关影响因素流行病学”调查问卷表,附件A2是相应的调查数据结果,附件A3是中国营养学会最新修订的《中国居民膳食指南》中为平衡居民膳食提出的八条准则。

总体展示图:

2023东三省“深圳杯”A题全保姆论文讲解_第1张图片

大家可以看我的目录就知道我这道题的一个求解思路非常清晰,不是市面上那些五花八门的水论文,连目录都不逻辑清晰。

2023东三省“深圳杯”A题全保姆论文讲解_第2张图片

以下是论文概览,可以看到,这里五~八这四个章节分别对应题目中四个小题目

问题1 参考附件A3,分析附件A2中居民的饮食习惯的合理性,并说明存在的主要问题。

针对问题一,我们需要参考附件商分析附件二中居民的饮食习惯和理性,并说明主要问题在这里可以通过对附件A3的8项准则进行理解,提取出附件二中可以反映附件三相关指标的数据用于衡量居民的饮食习惯的合理性,然后对每一项指标绘制图表进行描述性分析,说明居民的饮食习惯与《中国居民膳食指南》的差距。如下图所示,我们可以通过对D4~D37的指标进行归类后,依次提取附件A3中涉及的指标进行指标构建,构建后与A3进行差距分析。

2023东三省“深圳杯”A题全保姆论文讲解_第3张图片

下面是构造后的指标分布情况,这里可以结合正太分布图、小提琴图、箱线图进行展示分析

2023东三省“深圳杯”A题全保姆论文讲解_第4张图片

对分析后的结果可以进行归纳总结,指出居民饮食习惯的合理性与指南中存在的差距,然后举出建议

2023东三省“深圳杯”A题全保姆论文讲解_第5张图片


问题1代码运行后产生结果:

2023东三省“深圳杯”A题全保姆论文讲解_第6张图片

问题2 分析居民的生活习惯和饮食习惯是否与年龄、性别、婚姻状况、文化程度、职业等因素相关。

解法1:相关性分析,首先可以整理出生活习惯指标与饮食习惯指标的相关变量,然后逐个对年龄、性别、婚姻状况、文化程度、职业等因素进行关联分析,然后对前面关联分析后的结果进行整合,获取其相关系数的均值,进而确定整体是否与以上因素存在相关关系,以及个体上,哪些变量相关性低,或者不呈现相关性。

解法2:逻辑回归,首先可以整理出生活习惯指标与饮食习惯指标的相关变量,这些变量作为X,然后以此对年龄、性别、婚姻状况、文化程度、职业等人口因素做为Y,例如以性别作为Y举例,先分析其F检验是否呈现显著性,如过存在显著性,那么说明整体上是存在影响关系的,接着查看每一项的标准化回归系数,核对个体上的显著性关系;

解法3:机器学习+模型解释(shap模型),同方法2,先核对指标,然后通过机器学习建模分类或回归模型,把模型输入shap模型之类,这样可以从非线性的角度确定各个指标对人口因素(Y)的影响

2023东三省“深圳杯”A题全保姆论文讲解_第7张图片

这里第二问我采用解法2,因为第三问用了解法3,这么做可以给到大家更多的选择,问题2论文如下所示,与解法2描述有所不同的是,这里我用了PCA做了降维,因为整理后的指标达到了380多个指标,当然降维也并非直接一口气降维,我论文划分了4个部分进行降维,并依次分析其可解释情况。
问题2代码运行后产生结果:

2023东三省“深圳杯”A题全保姆论文讲解_第8张图片

问题3 根据附件A2中的数据,深入分析常见慢性病(如高血压、糖尿病等)与吸烟、饮酒、饮食习惯、生活习惯、工作性质、运动等因素的关系以及相关程度。

2023东三省“深圳杯”A题全保姆论文讲解_第9张图片

这道题同问题2一样,唯一的不同是把Y变了,这里的Y为(0:没有患病,1:有高血压或糖尿病),然后再对这些变量进行整理即可,建议问题2可以采用解法3,然后套入与问题2一样的解法,这样问题3解题难度就降低了,想要炫技的话可以采用不同的机器学习来对比。这里我用的是xgboost+shap模型
问题3代码运行后产生结果:

2023东三省“深圳杯”A题全保姆论文讲解_第10张图片

问题4 依据附件A2中居民的具体情况,对居民进行合理分类,并针对各类人群提出有利于身体健康的膳食、运动等方面的合理建议。

这道题的关键核心是分类的方向,从题意来看很多类型的分类,例如对于有无患病(高血压或糖尿病)、亦或根据人口特征分类,例如少年、青年、中年、老年,或者肥胖群体,再或者饮食习惯等等,所以事实上这道题有很多的做法,但是万变不离其中,再做完分类后,针对各类人群提出有利于身体健康的膳食、运动等方面的合理建议这个做法是都是一样的分析步骤,这个分析可以直接复制第一问的分析,只是这个时候是按人群来划分了

这里我用首先基于k聚类分析对居民的人口属性进行了分类,通过肘部法则确定居民划分为三类客群,类别0主要是老年女性,文化程度一般,主要为已婚或丧偶等,类别1主要是中青年群体,男女比例接近,受教育程度较高,婚姻状况以未婚和已婚为主等,类别2主要是中老年女性,受教育程度一般,主要为已婚等。接着以该分类标签作为筛选条件分三个客群。对其进行了饮食习惯和理性分析分析方法同第五章节,再列举出各个人群存在问题后,结合指南。提出了有利于身体健康的膳食运动建议

2023东三省“深圳杯”A题全保姆论文讲解_第11张图片


问题4代码运行后产生结果:

2023东三省“深圳杯”A题全保姆论文讲解_第12张图片

完整视频及成品获取可看B站:

2023东三省深圳杯A题论文成品全保姆教程 城市居民身体健康分析_哔哩哔哩_bilibili

你可能感兴趣的:(数学建模,2023深圳杯,2023东三省数学建模,算法,人工智能,机器学习)