问题C:网球的动量
在2023年温布尔登绅士队的决赛中,20岁的西班牙新星卡洛斯·阿尔卡拉兹击败了36岁的诺瓦克·德约科维奇。这是德约科维奇自2013年以来首次在温布尔登公开赛失利,并结束了他在大满贯赛事中历史上最伟大的球员之一的非凡表现。
这场比赛本身就是一场非凡的战斗。[1]德约科维奇似乎注定要轻松获胜,他以6-1控制了第一盘(7场比赛赢6场)。然而,第二盘比赛很紧张,最终阿尔卡雷兹以7-6的比分获胜。第三盘与第一盘相反,阿尔卡拉兹以6-1轻松获胜。在第四盘开始时,年轻的西班牙人似乎完全控制了局面,但不知怎么的,比赛又改变了方向,德约科维奇完全控制了局面,以6-3赢得了这一盘。第五盘也是最后一盘开始时,德约科维奇从第四盘领先,但方向又发生了变化,阿尔卡拉兹控制了局面,以6-4获胜。这场比赛的数据在所提供的“2023-温布尔登1701”的数据集“match_id”中。当德约科维奇使用“set_no”列等于1时,你可以看到第一回合的所有分数。令人难以置信的波动,有时是很多分数,甚至是比赛,发生在那些似乎有优势的球员,通常被归因于“势头”。
字典中对动量的一种定义是“通过运动或一系列事件获得的力量或力”。[2]在体育运动中,一个团队或球员可能会觉得他们在比赛/比赛中有动力,或“力量/力量”,但很难衡量这种现象。此外,如果比赛中各种事件如何创造或改变势头,这并不明显。
提供2023年温布尔登男子比赛前两轮后的每一分数据。您可以自行选择包含额外的玩家信息或其他数据,但您必须完全记录这些来源。将数据用于:
开发一个模型,捕捉得分发生时的比赛流程,并将其应用于一个或多个比赛。你的模型应该确定哪个球员在比赛的特定时间表现更好,以及他们的表现有多好。提供一个基于模型的可视化功能来描述匹配流程。注:在网球比赛中,发球者赢得得分的可能性要高得多。您可能希望以某种方式将其考虑到您的模型中。
网球教练怀疑“势头”是否在比赛中起着任何作用。相反,他假设一个球员的波动和成功的跑动是随机的。使用您的模型/度量来评估此索赔。
教练们很想知道是否有指标可以帮助决定何时比赛的流程将从偏爱一个球员转向另一个球员。
o利用至少一场比赛提供的数据,建立一个模型来预测比赛中的这些波动。哪
些因素似乎是最相关的(如果有的话)?
o考虑到过去比赛“势头”波动的差异,你如何建议一名球员与另一名球员进
行新的比赛?
在一个或多个其他匹配项上测试您开发的模型。你对比赛中的波动的预测效果如何?
如果模型有时表现不佳,您能否确定可能需要包含在未来模型中的任何因素?
你的模式对其他比赛(如女子比赛)、锦标赛、球场表面和乒乓球等其他运动项目有多普遍。
制作一份不超过25页的报告,包括你的发现,包括一份两页的备忘录,总结你的结果
,建议教练们了解“势头”的作用,以及如何准备球员对影响网球比赛流程的事件
做出反应。
最新思路更新(看最新发布的文章即可):
https://blog.csdn.net/dc_sinor?type=blog
A题是自由度比较大的场景限定下的模型构建,相对比较容易,核心是找到现有的成熟的数学模型,然后找到合适的数据进行证明得到结论,估计大部分是目标优化问题。(不限制专业)
B题属于较为经典的物理建模(对海洋专业的学生具有优势)
C题今年非常难,不同往年的数据分析,不过核心还是特征提取和主成分分析(本质是在数据中找到或者构建影响比赛的有效向量),并且需要在其他数据上证明推广(这点就比较恶心了) (不限制专业)
D 本质上是资源分配和调度问题,其中保持最佳水位需要一个控制算法(估计要融合PID或者模糊PID),其中也会涉及到目标优化模型(毕竟多方需要争抢湖泊的水位),需要做灵敏度分析。难度不小!
E 核心是做相关性分析,并涉及到评价模型,就是数据会比较难找!
F 本次建模最简单的一道题,给定一个范围甚至目标都需要自己定,并且动物保护相关数据比较好找,最后结合语文建模就能搞定!
难度排名(由易到难):F < A < E < D < B < C
最新思路更新(看最新发布的文章即可):
https://blog.csdn.net/dc_sinor?type=blog