【已更新】2023mothercup妈妈杯D题数学建模挑战赛思路代码-航空安全风险分析和飞行技术评估问题

我们来看下D题,这道题是一道数据分析类题目,总共有五个小问。

第一题是要求我们针对附件1的数据质量开展可靠性研究,提取与飞行安全相关的部分关键数据项,并对数据项的重要程度进行分析。第一步是对数据的可靠性分析,数据质量的可靠性研究主要包括数据完整性、数据准确性、数据一致性等方面,例如我们可以分析附件1中每个数据项的数据缺失程度,然后检测数据项的异常值,可以使用的方法包括标准差检验、箱线图检验等,也可以采用一些机器学习的方法,如DBSCAN聚类,孤立森林等检测每个数据项中异常值。第二步是提取部分关键数据项进行分析,在题目中说“G 值是飞机飞行过程中过载情况的直接反应,在着陆安全分析中,G 值通常是描述落地瞬间安全性的重要指标”,那么着陆G值(CGBRMACL)肯定是要重点分析的,由于着陆G值1秒记录10次,我们可以先来分析最大G值出现在不同时间点的频率,得到最大G值之后,我们可以认为这个值是预测值,构建一个随机森林模型用附件1中的其他变量来预测这个最大G值,随机森林模型可以计算不同特征的重要程度,我们就可以基于这个模型,提取几个关键数据项,并说明他们的重要程度;也可以根据附件2中超限数据,寻找可以识别超限事件的特征,如“接地速度小”这一超限事件就与QAR数据落地前一段时间的地速数据有关,而特征的重要程度就与超限事件发生的频率相关。

第二题要求我们对飞行操纵过程进行量化描述,我们这里重点关注的指标就是附件1中的CAP WHL 1 POSN指标,有杆量和盘量两个指标,分别影响飞机姿态和坡度,我们可以筛选出飞行过程中这两个指标变化剧烈的时间段并进行可视化分析,还可以单独选取飞机落地前10s的数据进行可视化分析,绘制这两个指标的变化折线图,即可以对飞行操纵过程进行量化;也可以对整个飞行过程的杆位变化进行可视化,然后再进一步分析不同时间段的杆位变化情况。

第三题要求我们基于附件2的数据,分析不同超限的基本特征,附件2提供了飞机的警告级别、机号、目的机场、起飞机场、时间日期、飞行阶段以及超限名称。为了进行数据分析,我们首先需要将字符串类型的数据项(机号、目的机场等)进行编码,可以采用标签编码,one-hot编码等,然后我们可以将数据按照不同超限情况进行分类,再利用可视化技术分析超限的基本特征,如分析“50英尺至接地距离远”这一超限情况下,航线的分布频率、飞行阶段频率以及时间分布情况,我们还可以构造一些特征,如是否为工作日等,值得注意的是,警告级别也可以与超限情况进行联合分析,可以分析不同警告级别不同超限情况的特征。基于可视化图表,我们可以回答飞机在哪些航线或者在哪些机场容易出现何种超限等问题。

第四题要求我们基于附件3,探讨基于飞行参数的飞行技术评估方法,那么这个问题的实质就是一个回归问题,将“落地主操作人员资质”是模型输出,其他变量则是输入值。我们首先对字符串等类型的数据进行编码,然后对利用PCA等降维技术降低数据维度,也可以根据附件3的字段说明筛选或者构造一些关键特征作为输入,然后使用回归模型进行预测,可以选择线性回归、随机森林等模型进行回归预测。

第五题要求我们建立一个自动化预警机制预防可能发生的安全事故,实质上是要求我们基于QAR数据检测异常事故。我们可以根据附件2中的超限名称来分析附件1中是否有超限事件发生,如通过海拔可以计算得到飞机的爬行速度,然后判断该飞机的爬行速度是否超限,给出飞机在整个阶段的超限情况。

你可能感兴趣的:(机器学习,人工智能,数据挖掘,数学建模)