2023年美赛数学建模C题思路模型分析(预测单词结果)

背景

Wordle是《纽约时报》目前每日提供的一个热门谜题。玩家尝试在六次或更少的尝试中猜出一个五个字母的单词来解决谜题,每次猜都会收到反馈。对于这个版本,每个猜测必须是一个实际的英语单词。不允许比赛中未识别为单词的猜测。Wordle继续受到欢迎,目前已有超过60种语言的游戏版本。

《纽约时报》网站对Wordle的说明指出,提交单词后,瓷砖的颜色会发生变化。黄色平铺表示该平铺中的字母在单词中,但它位于错误的位置。绿色平铺表示该平铺中的字母在单词中,并且位于正确的位置。灰色平铺表示该平铺中的字母根本不包含在单词中(见附件2)[2]。图1是一个示例解决方案,在三次尝试中找到了正确的结果。

2023年美赛数学建模C题思路模型分析(预测单词结果)_第1张图片

玩家可以在常规模式或“硬模式”下进行游戏。Wordle的硬模式要求玩家一旦在单词中找到正确的字母(瓷砖为黄色或绿色),就必须在随后的猜测中使用这些字母,从而使游戏更加困难。图1中的示例是在硬模式下播放的。

许多(但不是所有)用户在Twitter上报告自己的分数。针对该问题,MCM已生成2022年1月7日至2022年12月31日的每日结果文件(见附件1)。该文件包括日期、比赛编号、当天的单词、当天报告分数的人数、硬模式下的玩家人数,以及在一次尝试、两次尝试、三次尝试、四次尝试、五次尝试、六次尝试中猜到单词或无法解开谜题的百分比(用X表示)。例如,在图2中,2022年7月20日的单词是“TRITE”,结果是通过挖掘Twitter获得的。尽管图2中的百分比总和为100%,但在某些情况下,由于四舍五入,这可能不正确。

2023年美赛数学建模C题思路模型分析(预测单词结果)_第2张图片

要求

《纽约时报》要求您对本文件中的结果进行分析,以回答几个问题。

  • 报告结果的数量每天都在变化。开发一个模型来解释这种变化,并使用您的模型为2023年3月1日报告的结果数量创建一个预测区间。单词的任何属性是否会影响在硬模式下播放的报告分数百分比?如果是,怎么办?如果没有,为什么不呢?

  • 对于给定的未来解决方案单词,在未来的日期,开发一个模型,使您能够预测报告结果的分布。换句话说,预测未来日期(1,2,3,4,5,6,X)的相关百分比。你的模型和预测有哪些不确定性?举一个具体的例子,说明你对2023年3月1日EERIE一词的预测。你对模型的预测有多自信?

  • 开发并总结一个模型,根据难度对解决方案单词进行分类。识别与每个分类相关的给定单词的属性。使用你的模型,EERIE这个词有多难?讨论分类模型的准确性。

  • 列出并描述此数据集的一些其他有趣的功能。

  • 最后,在给《纽约时报》拼图编辑的一到两页信中总结你的结果。

思路分析

C题是数据挖掘题,通过分析wordle的游戏机制,挖掘不同单词所对应的得分情况对其难度的影响,这道题的难度主要是如何提取不同单词难度的特征,相对来说反而是最好实现的。

更多思路:永久更新,全网最新最全,持续更新中,查看最下方QQ群获取。

你可能感兴趣的:(美赛,2023美赛,python,matlab,算法)