新队伍,大家都差不多是小白,借鉴的博客:(19条消息) 2021年美赛F题总结_wzu_cza123的博客-CSDN博客_美赛2021f题
由于是第一次正正经经的写一道题,找数据网站把我们难住了!!找了差不多由快一周的时间,最后在u21网站找到2020,2019年50个国家24个评价指标,和他们的权重。
Resources (weight of 20%)
R1:(5%)政府在高等教育院校的开支占国内生产总值的百分比。
R2:(5%)高等教育院校整体开支总额占国内生产总值的百分比
R3:(5%)每位学生的年度支出(相当于全日制)美元购买力平价的高等教育机构
R4:(2.5%)高等教育机构的研发支出占国内生产总值的百分比
R5:(2.5%)高等教育机构的研发支出按美元购买力平价计算的人均人口
Environment (weight of 20%)
E1:(1%)高等教育女生比例(上限为50%)
E2:(2%)高等院校中女性学术人员的比例(上限为50%)
E3:(2%)数据质量评级。对于每个定量系列,如果数据可用于变量的精确定义,则值为2;1如果存在与变量相关的数据,但需要进行一些知情的调整;否则为0
E4:(10%)政策环境的定性衡量
E5: (5%)对世界经济论坛调查问题(7分制)的回答:“贵国的教育体系在多大程度上满足了竞争性经济的需要?”
Connectivity (weight of 20%)
C1:(4%)接受高等教育的国际学生比例
C2:(4%)与国际合作者合著的文章比例
C3:未使用WebMetrics透明度。
C4:(4%)网络计量能见度指数。大学网站域收到的外部链接数量除以国家人口。截止日期为前10000所高等院校
C5:(4%)在瑞士IMD世界发展中心年度调查中对企业高管提出的“公司和大学之间的知识转移高度发达”问题的回答
C6:(4%)与行业研究人员合著的大学科研出版物的百分比
Output (weight of 40%)
O1:(10%)高等教育机构编制的研究文件总数
O2:(3%)高等教育机构编制的研究文件总数/人口
O3:(5%)通过2014-18年出版的文件类别标准化引用影响衡量的文章平均影响。O4:(3%)一个国家世界一流大学的深度。这是一个国家的大学在上海交通1000强院校中的总分除以人口;
O5:(7%)通过2019年上海交通大学全国三所最好大学的总分计算得出的全国最好大学的优秀程度
O6:(3%)高等教育入学率占合格人口的百分比,定义为中学教育后的五岁年龄组
O7:(3%)占25-64岁具有高等教育资格的人口的百分比
O8:(3%)全国每百万人口中的研究人员(相当于全日制)人数
O9:(3%)25-64岁受过高等教育的人的失业率除以只有高中教育的人的失业率的倒数
因为指标太多,尝试用主成分分析法和因子分析法做删选,但结果都不太符合这两个模型,水平有限就没有删选。
·插值和归一化
因为缺失数据很少(整个表一共12个),并且各个国家只有一年的数据,不能拉格朗日插值,所以用的平均值来补充,然后min-max标准化。
1 正向化 将所有的指标(极大型,极小型,中间型,区间型)统一转化为极大型指标
2 正向化矩阵标准化
标准化的目的是消除不同指标量纲的影响。
3 计算得分并归一化
(py实现)
(19条消息) 2021美赛F题——5,6题时间序列分析_奶茶收割机.的博客-CSDN博客
预测到2021-2025 5年的得分情况 依据我们的建议 修改得分 再次进行预测
还未实现好看的画图,数据搜集较为困难
下一步:latex模板,尝试论文摘要部分