【多思路附源码持续更新】2023年华为杯(中国研究生数学建模)竞赛C题

赛题

相关实现代码以及思路过程可移步到文末添加卡片

若官网拥挤,数据集和赛题下载地址如下:

https://download.csdn.net/download/weixin_47723732/88364777

论文万能模板下载地址

https://download.csdn.net/download/weixin_47723732/85090067

【多思路附源码持续更新】2023年华为杯(中国研究生数学建模)竞赛C题_第1张图片

大规模创新类竞赛评审方案研究

现在创新类竞赛很多,其中规模较大的竞赛,一般采用两阶段(网评、现场评审)或三阶段(网评、现场评审和答辩)评审。创新类竞赛的特点是没有标准答案,需要评审专家根据命题人(组)提出的评审框架(建议)独立评审。所以,对同一份作品,不同评委的评分可能存在较大差异。事实上,当竞赛规模大,评委的人数众多时,极差(定义见附件1)大的问题更为突出。显然,简单地依据多位评委评分的总和进行排序并不是创新类竞赛评审的好方案。因此,探讨大规模创新类竞赛评审方案的公正性、公平性和科学性具有深远意义。

目前,各项创新类竞赛都在摸索、调整自己的评审方案。现有方案包括:(1)对每位评审专家的评分进行标准化(公式见附件1),按作品将标准分相加得每件作品总分,然后依总分排序;(2)去掉同一份作品得分中的最高分、最低分,再将剩余评分相加,最后依总分排序;(3)同一份作品如果专家的评分差异(极差)较大,组织相关专家协商调整,将调整后得分相加,再依总分排序;(4)当竞赛规模很大时,首先利用上述方案(1)或(2)或(3)对作品进行初选,再对初选入围的作品组织专家评审(第二阶段评审)或经过答辩等环节确定获奖名单。这些方案都有一定的合理性,但也有局限性。特别是针对大规模创新类竞赛评审,现有方案偏简单,研究不多。

在大规模创新类竞赛中,增加评审每份作品的专家人数,显然有利于评审工作的公正、公平。然而,由于种种原因,参与评审工作的专家数目是受限的。评审专家少了,评审工作的误差会变大。不过,考虑到大规模创新类竞赛获奖比例通常小于50%,有些误差并不影响是否获奖。因此,在不影响获奖等级的前提下,为了适应评审专家人数较少的现状,不少竞赛采用两阶段评审办法。

为探索大规模创新类竞赛评审的好方法,附件给出模拟大规模创新类竞赛的数据。其包含两阶段评审,第一阶段由五位专家对作品评审,取标准分后,将五位专家的标准分取均值后排序,按事先约定的比例取排名在前的作品,进入第二阶段评审。第二阶段由三位专家对作品评审,分别取标准分,并对少数极差大作品的标准分进行必要的调整后,再将第一阶段五位专家评审标准分的均值、第二阶段三位专家的评审标准分共4份成绩求和,依最终总成绩再排序。请利用这批数据建立数学模型,探讨建立更为合理、公平的评审方案。

问题

问题一 在每个评审阶段,作品通常都是随机分发的,每份作品需要多位评委独立评审。为了增加不同评审专家所给成绩之间的可比性,不同专家评审的作品集合之间应有一些交集。但有的交集大了,则必然有交集小了,则可比性变弱。请针对3000支参赛队和125位评审专家,每份作品由5位专家评审的情况,建立数学模型确定最优的“交叉分发”方案,并讨论该方案的有关指标(自己定义)和实施细节。

问题二 在评审中采用标准分(附件1)为基础的排序方法,其假设是不同评审专家评审的作品集合的学术水平分布相同。但在大规模创新类竞赛评审中,通常任意两位专家评审的作品只有小部分是共同的,绝大多数作品是不同的(见问题一),而且每位专家只看到作品集合的很小部分,因此标准分评审方案的假设可能不成立,需要探索新的评审方案。请选择两种或两种以上现有或自己设计的评审方案和题目附件数据,分析每位专家、每份作品原始成绩、调整之后(如取标准分)成绩的分布特点,按不同方案进行排序,并设法比较这些方案的优劣。进而针对大规模创新类竞赛的评审,设计新的标准分(公式)计算模型。另外,一般认为经多位专家协商一致的获奖论文具有最大的可信度,附件2提供的数据1,其第二评审阶段评选出的一等奖作品排序是经专家协商取得一致的,请利用这批数据,改进你们的标准分计算模型。

问题三 “创新类”大赛的特点是“创新性”,即没有标准答案。由于这类竞赛的问题难度较大,一般需要通过创新才能在竞赛期间部分解决。而作品的创新到了什么程度,后续研究的前景如何,很难有一致看法,即使专家面对面的交流,都可能由于各持己见而无法统一。加上研究生的论文表达不到位,评审专家的视角不同,同一份作品的几位专家给出的成绩会有较大的差异(极差)。极差大是大规模创新类竞赛的特点,极差比较大的作品一般处于高分段或低分段。低分段属于淘汰范围,低分段极差大的原因是有专家对违规作品或有重大失误的作品给了很低的分数,或评审专家都认同该作品质量不高,只是其中某位(些)专家更不认同该作品。故这里极差虽大,但属于不获奖范畴,一般不需要调整极差。而高分段作品还要参加权威性较高的第二阶段评审(附件数据表格同一行代表同一个作品在两个阶段的成绩,没有第二阶段评审成绩的作品只参加了第一阶段的评审)。第二阶段评审仍然存在部分极差大的作品,因为是终审,误差可能影响获奖等级,因此对部分极差大的作品,需要复议调整极差(附件的数据中有记录,复议分就是该专家最后给的标准分,用来替换原来的标准分)。第二阶段(注意两个阶段每份作品评审专家人数不同)专家调整“大极差”的规律可以作为建立极差模型的借鉴。

请根据题目所给的模拟数据2.1和2.2,讨论两阶段的成绩整体的变化和两阶段极差整体的变化,分析两阶段评审方案相比不分阶段评审方案的优劣。注意到极差大和创新性强两大特点之间会有一定的关系,为了发掘创新论文,请建立“极差”模型(含分析、分类、调整等),并针对所给数据,尝试给出第一评审阶段程序化(不需要人工干预)处理非高且非低分段作品的 “大极差”的办法。

问题四 对“创新类”竞赛,给出一个完整的评审模型(提示:例如优化模型),并针对所给的数据研究如何求解?也可对现行的评审方案给出改进的具体建议(包括未来还要收集哪些数据)。

附件:

  1. 极差的定义及标准分的计算方法
  2. 数据1:模拟某大型创新类竞赛的评审数据,其第二阶段被评选为一等奖作品的排序经专家协商取得一致。
  3. 数据2: 模拟某大型创新类竞赛两阶段的评审数据,有两组2.1和2.2。

备注

名词解释

极差:是指同一组(本题指同一评审阶段同一份作品的成绩集合)数据中最大值与最小值之差。

标准分的计算方法

【多思路附源码持续更新】2023年华为杯(中国研究生数学建模)竞赛C题_第2张图片

仅参加第一阶段评审作品的最终成绩为五位专家给出成绩的标准分的平均值,并据此排序。
参加两个阶段评审作品的最终成绩为第一阶段标准分的平均分加上第二阶段评审时三位专家给出三份成绩转换成三个标准分并进行必要的调整后的和,两阶段评审后按此最终成绩给参加两个阶段评审的作品排序,但始终排在仅参加第一阶段评审的作品之前。

解题思路

  • 目标:我们希望找到一个评审方案,它应该是公正、公平且科学的。这意味着该方案应尽可能减少由于评审专家的主观差异所导致的偏见,并且应该是在科学的基础上制定的。
  • 挑战:由于评审专家的数量有限,他们之间的评分可能存在很大的差异。我们需要一个方法来处理这些差异。
  • 当前方案的局限性:现有的评审方案虽然有一定的合理性,但它们过于简单,尤其是在大规模的创新类竞赛中。

更新中 ~

问题一:交叉分发方案

思路与方法:

  1. 使用组合优化或图论的方法分配作品到评审专家。
  2. 为确保交集的存在,可以考虑将评审专家和作品视为图中的节点,并建立相应的边来表示评审与作品之间的关系。
  3. 为了最大化交集,可以使用最大匹配或最小覆盖等算法。
  4. 设计一个指标来衡量交集的大小和分布。例如,使用熵或基尼系数来衡量交集的均匀性。
  5. 使用贪婪算法或模拟退火等启发式方法来寻找最优的分配方案。

其他思路:

  1. 遗传算法:
    • 使用基因编码来表示作品到评审的分配。
    • 通过交叉、突变和选择操作来产生新的解决方案。
    • 这种方法适用于那些难以通过传统方法解决的组合优化问题。
  2. 粒子群优化:
    • 模拟鸟群觅食的行为,每个“鸟”都代表一个解决方案。
    • 鸟群通过跟随当前最好的“鸟”来更新它们的位置。
    • 这种方法通常用于连续优化问题,但可以通过离散化技术应用于组合优化问题。
  3. 混合整数线性规划:
    • 将问题建模为一个线性规划问题,但包含整数决策变量。
    • 使用现有的工具或库(如CPLEX或Gurobi)来求解。
    • 这种方法适用于规模较小的问题,但可能不适用于本问题。
  4. 启发式方法:
    • 设计一个简单的启发式方法,如贪婪算法,来分配作品。
    • 例如,可以按照某种顺序为每份作品分配评审,同时确保交集的大小。
    • 这种方法可能不会找到最优解,但它是一个有效的近似方法。

实现代码下载

https://download.csdn.net/download/weixin_47723732/88365402

【多思路附源码持续更新】2023年华为杯(中国研究生数学建模)竞赛C题_第3张图片【多思路附源码持续更新】2023年华为杯(中国研究生数学建模)竞赛C题_第4张图片

问题二:评审方案的可比性

思路与方法:

  1. 使用统计方法比较不同评审方案下的成绩分布。例如,可以使用Kolmogorov-Smirnov检验来比较两个分布是否显著不同。
  2. 为了验证标准分的假设,可以考虑使用因子分析或主成分分析来查看不同评审专家评分的共性。
  3. 设计新的标准分模型,可能会考虑使用机器学习或数据挖掘方法,如聚类或回归分析,来考虑不同评审专家的评分特点。
  4. 使用数据1中的协商结果作为“真实”的评审结果,并与不同方案的结果进行比较,以验证其有效性。

问题三:极差模型

思路与方法:

  1. 使用描述统计方法分析极差的分布,并查看其与整体成绩的关系。
  2. 设计一个模型来预测或分类极差大的作品。这可以使用逻辑回归、随机森林等分类方法。
  3. 为了自动处理大极差,可以考虑使用异常值检测方法来识别并调整这些作品的成绩。

问题四:完整的评审模型

思路与方法:

  1. 结合上述方法,设计一个综合的评审模型。这可能会包括作品分配、成绩标准化和极差处理等步骤。
  2. 使用优化方法来求解模型,以找到最公平和最科学的评审结果。
  3. 分析现有数据,提出改进建议。这可能包括收集更多的数据,如评审专家的背景信息或作品的其他特征。

总结:

  • 问题一关注的是如何公平地分配作品给评审专家,确保每位专家都有足够的交集来进行比较。
  • 问题二关注的是如何确保不同评审专家的评分具有可比性,并设计更科学的标准分模型。
  • 问题三关注的是如何处理和理解极差大的作品,以确保评审的公正性。
  • 问题四希望设计一个综合的评审模型,结合上述的所有方法,并提供实施建议。

需要全套的添加获取

【多思路附源码持续更新】2023年华为杯(中国研究生数学建模)竞赛C题_第5张图片【多思路附源码持续更新】2023年华为杯(中国研究生数学建模)竞赛C题_第6张图片

相关实现代码以及思路过程可移步到文末添加卡片

你可能感兴趣的:(化数为金之Python数据分析,数学建模,华为杯,中国研究生数学建模,大规模创新类竞赛评审方案研究)