2021美赛F题解题思路

新队伍,大家都差不多是小白,借鉴的博客:(19条消息) 2021年美赛F题总结_wzu_cza123的博客-CSDN博客_美赛2021f题

  • 一、数据的查找和处理
  • 二、TOPSIS
    • 1.TOPSIS熵权
  • 三、时间序列分析
  • 总结




一、数据的查找与处理

由于是第一次正正经经的写一道题,找数据网站把我们难住了!!找了差不多由快一周的时间,最后在u21网站找到2020,2019年50个国家24个评价指标,和他们的权重。

Resources (weight of 20%)

R1:(5%)政府在高等教育院校的开支占国内生产总值的百分比。

R2:(5%)高等教育院校整体开支总额占国内生产总值的百分比

R3:(5%)每位学生的年度支出(相当于全日制)美元购买力平价的高等教育机构

R4:(2.5%)高等教育机构的研发支出占国内生产总值的百分比

R5:(2.5%)高等教育机构的研发支出按美元购买力平价计算的人均人口

Environment (weight of 20%)

E1:(1%)高等教育女生比例(上限为50%)

E2:(2%)高等院校中女性学术人员的比例(上限为50%)

E3:(2%)数据质量评级。对于每个定量系列,如果数据可用于变量的精确定义,则值为2;1如果存在与变量相关的数据,但需要进行一些知情的调整;否则为0

E4:(10%)政策环境的定性衡量

E5: (5%)对世界经济论坛调查问题(7分制)的回答:“贵国的教育体系在多大程度上满足了竞争性经济的需要?”

Connectivity (weight of 20%)

C1:(4%)接受高等教育的国际学生比例

C2:(4%)与国际合作者合著的文章比例

C3:未使用WebMetrics透明度。

C4:(4%)网络计量能见度指数。大学网站域收到的外部链接数量除以国家人口。截止日期为前10000所高等院校

C5:(4%)在瑞士IMD世界发展中心年度调查中对企业高管提出的“公司和大学之间的知识转移高度发达”问题的回答

C6:(4%)与行业研究人员合著的大学科研出版物的百分比

Output (weight of 40%)

O1:(10%)高等教育机构编制的研究文件总数

O2:(3%)高等教育机构编制的研究文件总数/人口

O3:(5%)通过2014-18年出版的文件类别标准化引用影响衡量的文章平均影响。O4:(3%)一个国家世界一流大学的深度。这是一个国家的大学在上海交通1000强院校中的总分除以人口;

O5:(7%)通过2019年上海交通大学全国三所最好大学的总分计算得出的全国最好大学的优秀程度

O6:(3%)高等教育入学率占合格人口的百分比,定义为中学教育后的五岁年龄组

O7:(3%)占25-64岁具有高等教育资格的人口的百分比

O8:(3%)全国每百万人口中的研究人员(相当于全日制)人数

O9:(3%)25-64岁受过高等教育的人的失业率除以只有高中教育的人的失业率的倒数

因为指标太多,尝试用主成分分析法和因子分析法做删选,但结果都不太符合这两个模型,水平有限就没有删选。

·插值和归一化

        因为缺失数据很少(整个表一共12个),并且各个国家只有一年的数据,不能拉格朗日插值,所以用的平均值来补充,然后min-max标准化。



二、TOPSIS优劣解距离法

TOPSIS  法是一种常用的综合评价方法,能充分利用原始数据的信息,其结果能精确地反映各评价方案之间的差距。
基本过程 为先将原始数据矩阵统一指标类型(一般正向化处理)得到正向化的矩阵,再对正向化的矩阵进行标准化处理以消除各指标量纲的影响,并找到有限方案中的最优方案和最劣方案,然后分
别计算各评价对象与最优方案和最劣方案间的距离,获得各评价对象与最优方案的相对接近程度,以此作为评价优劣的依据。该方法对数据分布及样本含量没有严格限制,数据计算简单易行。

1 正向化 将所有的指标(极大型,极小型,中间型,区间型)统一转化为极大型指标

2 正向化矩阵标准化

标准化的目的是消除不同指标量纲的影响。

3 计算得分并归一化

(py实现)



2.TOPSIS熵权

1 )判断输入的矩阵中是否存在负数,如果有则要重新标准化到非负区间
(后面计算概率时需要保证每一个元素为非负数)
2021美赛F题解题思路_第1张图片
2 )计算第 j 项指标下第 i 个样本所占的比重,并将其看作相对熵计算中用到的概率

 2021美赛F题解题思路_第2张图片

3 )计算每个指标的信息熵,并计算信息效用值,并归一化得到每个指标的熵权
2021美赛F题解题思路_第3张图片

实现后,得到每个国家每个指标的打分和国家排名。

三,时间序列分析

(19条消息) 2021美赛F题——5,6题时间序列分析_奶茶收割机.的博客-CSDN博客

预测到2021-2025 5年的得分情况 依据我们的建议 修改得分 再次进行预测




总结

还未实现好看的画图,数据搜集较为困难

下一步:latex模板,尝试论文摘要部分

你可能感兴趣的:(笔记,数学建模,美国大学生数学建模竞赛)