如何分析2023第二十届华为杯研究生数学建模竞赛F题?

2023第二十届华为杯研究生数学建模竞赛F题

      建议尽快抽出一两个小时整合一下常用的网站、工具资料等,尽快熟悉一些上手比较快的软件,比如近两年上常听到SPSSPRO这个软件,其他各种软件等详见下文。

———————————————

老粉可能知道,我是为爱发电,一般分享完思路偶尔会做对应的建模(一般都是帮助同门师兄妹情况下),杜绝各位被骗,由于个人工作问题,我尽可能在比赛期间更新思路,建议收藏或者关注。

注:2023.9.22 更新,有许多同学私信我说希望发一些论文模板等资料和进度分享,有时间的话会在里边上传一些资料、回答问题737.388.193,去掉符号,或点击此处

———————————————

---------------------------------------

选题建议及分析简述:

比赛开始后尽快更新~陪你们一起奋战!

A\B是华为专项:建议对自己实力有信心的同学去挑战。后续给出思路和对应代码等资料。

C题大规模创新类评审研究:大数据分析类题目,整体难度和思路适中,数学类专业同学应该很擅长。对于指标的定义是关键,可以参考文献或者用模糊评价、相关性分析和降维之类的。推荐最小二乘法、多项式拟合、线性回归、曲线拟合、插值法等。

D题双碳目标与路径规划研究:政策类题目,比较常见,各个专业都可以选。可以在往年研赛和美赛优秀论文里找参考。思路大致类似。

E题出血性脑卒中临床智能诊疗:大数据分析,各个专业都可以尝试。门槛低都可以选,参考网上的各种思路形成格式干净完整的论文就能混到奖,但是需要比较新奇的一些思路方式和优秀的可视化才能拿到比较高的奖项。

常见评价类算法:灰色评价之类的。数值型分析就是常规的归一化、去除异常值预处理然后选择比较擅长的算法;非数值型需要标签编码、独热码等方式量化后评价。可视化可以尝试做的新一些、仔细一些,抓住老师眼球好拿奖。

F题强对流降水临近预报:需要仔细看文献,自己也需要再找一些文献和资料,把物理过程转成建模过程,这一类有一些文字建模的往届优秀论文,大家可以先在群里资料找找。题目明示建议使用卷积神经网络和循环神经网络,对深度学习算法有了解的同学可以尝试。数据库则需要从常见的一些网站上、文献里找,找到的数据本身对论文质量影响就比较大,但是能形成完整论文基本就能拿三等了。相关的数据和思路我也会尽快找到并且放到下边的链接。

比赛思路更新地址:

!!!!!!!!!点击我!!!!!!!!!!

-------------------------------------------------------------------------------

正在全速更新,下边内容是为了占个坑

正在全速更新,下边内容是为了占个坑

E题 遭受旱灾的植物群落

 建议: C题是数据挖掘题,通过分析wordle的游戏机制,挖掘不同单词所对应的得分情况对其难度的影响,这道题的难度主要是如何提取不同单词难度的特征,相对来说反而是最好实现的。

        猜字谜游戏,数独游戏,绿色表示字母填对,黄色表示答案中有但位置不对,灰色表示不包含该字母,为游戏规则,有简易模式。 开发数学模型来解释变化,需要开发模型来解释规律,关键在于要构建单词与其他指标之间的关系,只是在描述数字和字母间的逻辑关系,属于比较直观的自然语言处理问题,采用深度学习的思想的话,数据不够,只有三百个数据。

需要剖析单词组词原理与构成,可以采用简单思想来简化问题。首先可以用分类、聚类思想来思考,单词内没有重复字母,可以分为一类,出现两个相同字母分为一类,三个相同字母分类一类,先把word分类成变量,再把它与普通数据建立逻辑关系。需要进行正态性分析和方差齐检验。 另外也可以采用神经网络模型,利用隶属度函数进行分类,用聚类模型转换为不同的类,再用神经网络作为输出,但容易陷入过拟合现象,不建议用BP神经网络模型,建议使用复杂一点的模型,例如基于遗传算法的神经网络模型。 

        

已更新A题数据、B题参考论文、C题多种思路及第一问代码请大家按需自取;E题基本更新完毕包括预处理数据、参考代码、做题思路等;往年优秀论文或美赛建模常用资料等,自取;

进度更新2023 年美赛整体思路分析-【HeartOfDog】 https://kdocs.cn/l/cqq5TPhg9DJ0icon-default.png?t=N7T8https://kdocs.cn/l/cqq5TPhg9DJ0

        具体思路分析:

第一题.ipynb,参考着文件代码分析:

        首先,分析每天都在变化的原因,需要预测的变量为:不同尝试次数的百分比分布、分数区间、困难的分数

        然后读取数据,并讲数据预处理分为以下五步,并得到处理后的数据集:

  1. 百分比之和可能不等于1,所以对其进行归一化
  2. 按照'Contest Number'对整个表进行升序排列
  3. 判断当前日期是否为周末,为周几
  4. 统计单词中字母个数,重复出现的字母算一次。
  5. 对单词进行词性标注

分析整体的星期几对得分均值的影响,并得到周一到周日每天得分均值与总均值图。判断整体得分与星期几之间的相关性,最终得到一周每天得分均值与总均值图。分析图像得出结论:从图和相关系数可以看出,星期几与得分存在较大的负相关关系,且周末的得分明显小于工作日的得分情况。

详细请跳转:

更新C题多种思路及第一问代码、A题数据,E即将更新完毕,具体请参考:

2023 年美赛整体思路分析-【HeartOfDog】 https://kdocs.cn/l/cqq5TPhg9DJ0icon-default.png?t=N7T8https://kdocs.cn/l/cqq5TPhg9DJ0

注:助力内容包括原创中文版参考论文+代码程序,免费赠送其他博主的思路或者参考论文。 预计每个链接更新两次,第一次为赠品:其他团队的进阶思路参考等;第二次更新直接上传对应原创参考论文、程序及数据等,精力有限一次只能针对一个题做;

你可能感兴趣的:(华为,数学建模)