翻译不写了,烂大街了,写一下个人思路。
顺便推一下公众号:LanternTeam (不过公众号专注于大数据方向技术~有兴趣的可关注)
以下分析只是本人大致看看题目的第一想法,没有经过严格推理,勿喷,纯粹兴趣,有问题评论里可讨论讨论。然后只写了CEF,其他想写的,不过没时间了sorry~
需要分别找发达,发展,落后国家的高等教育数据,这是一个思路。系统点的话,先定义什么是高等教育健康度,这里可以直接以那些大学排行计算的因子作为高等教育健康度的因素,但是这里的题目讲的是国家层面的,所以还需要加上数量,地域分布(教育资源分布是否均匀)等等
这里可以查那些大学排名数据,如泰晤士,QS等官网。教育资源分布情况可以根据该大学的排前列的大学分布在该国的地区为依据
第一题就建立一个评价模型,可以加点花里胡哨的东西,例如决策树结合AHP,神经网络模糊评价之类的
第二题就是将第一题的模型应用到具体国家,这里也可以加点深度,例如先判断国家的经济情况,对发达、发展中、落后国家弄个权重啥的,因为落后国家没办法和发达国家相比,但是如果落后国家的教育水平是处于一个持续发展的状态,那么也可以称之为相对健康
第三题就可以根据不同经济情况的国家的情况具体分析了(语言建模)
建模难度:最易
找数据难度:较易,因为方向清晰
E题第一眼看去有点蒙批,先理解以下题目,题目的重点是“…粮食短缺”,“粮食系统留下了大量的环境足迹…”,所以我们要做的应该就是分析食物系统在人类健康(生存)以及环境可持续发展两方面上的
然后来理解以下食物系统
第一题:“如果一个食物系统在公平性和可持续性方面得到优化,会发生什么?” 公平性方面就可以是处于饥饿人数(或死亡人数),饥饿人数减少了,温饱问题搞定了,就可以发展经济等等。至于可持续性的话,就是对环境的影响啦,对环境的影响又可以反馈到食物系统本身的问题,例如淡水消耗就会造成缺少饮用水等问题,展开讲好复杂。
暂时有个不成熟的想法就是做回归,量化公平性(国家)和可持续性,或者简单点,对于公平性,就只找饥饿人数数据,婴儿发育数据之类的,找一些比较容易找的,可持续性的话就找气候数据
第二:“改变食物系统的优先次序的好处和代价是什么?什么时候会发生?发达国家和发展中国家的这些利益和成本有何不同”
首先是第一小问,最直观的并且基于人道主义的理解的话,改变次序首先是对人的生存和健康的影响,然后代价是环境(经济发展),然后这问也可以反过来分析,都一样。
然后是第二小问,感觉有点难,一时想不到,第一想法是城市化对农业的影响,气候的变化对生产的影响,政治对进出口食品依赖的影响,这些都可能会导致一个国家或地区的食物系统的改变。
第三小问题,就比较容易分析了,例如在低收入地区,牛奶的涨价可能就会导致其销量大幅度减少,而高收入地区可能影响不大。
至于具体怎么做第二题呢,先看一下第三题的题目“一旦建立了你的食物系统模型,至少在一个发达国家和一个发展中国家应用你的模型来支持你的发现”
所以从第三题可以看到问题是层层递进的,第二题可以建立在第一题的基础上,做成两层模型,加上优先次序
然后是第四题,可伸缩性,就可以根据该地区气候类型,地形分布来进行分析了~
这里查到了一个报告,应该可能或许有点用:
EAT-Lancet食品、地球和健康委员会关于可持续食物系统与健康膳食的最新研究报告:http://www.sci-hub.ren/10.1016/S0140-6736(18)31788-4
感觉D题是最有趣的,图数据挖掘
大概看了一下数据集,看到有的人说有视频好复杂0-0,那个视频就几秒钟,而且视频量不多而已,截图当图片得了。
先做一下数据分析把:
首先是Lab status:
Unverified 2342
Negative ID 2069
Unprocessed 15
Positive ID 14
正负样本极度不平衡。
然后再可以根据经纬度画一下蜂的分布地点,最好可以根据时间再看看蜂的数量变化和分布转移情况,然后再决定第一题怎么做吧,如果规律明显就容易了,有个脑洞是可以加上某个范围内的黄蜂数量和分布的影响,做一个类似于种群繁衍的模型
至于错误分类的可能性,直接上深度学习吧我觉得,无脑一点,输出概率值,可以找一些小目标检测论文搞搞,本身小目标检测就是CV的一个难题,不好搞,不过这里是数模,懂的都懂。然后做一下深度学习模型可视化
这里比较有趣的是Unverified的蜂,当做好了分类模型,就可以来将Unverified的也分类一下
如果有其他新报告,如何更新模型,以及更新的频率。这里的话,感觉可以根据第一题的基础来做,当种群繁衍达到某个阈值,就怎样怎样。
有什么证据可以证明华盛顿州已经消灭了这种有害生物,这一问的话,感觉也是可以继续搬第一题0-0