27岁华裔青年成疫情预测界新星

【编者按】疫情疫情给全球造成了不同程度的影响,美国每日新增病例一直以万计数。而传染性疾病的传染和预测模型,在传统的机器学习当中非常普遍,然而这次夺人眼球的不是大厂的模型或者医学院的报告,而是一位 27 岁青年顾右洋(音译,Youyang Gu)搞出来的预测模型,该项目和模型被放在了covid19-projections.com 网站上。模型得到了美国疾控中心的引用,受到了包括包括《华尔街日报》,《经济学人》,《纽约时报》,《华盛顿邮报》,NPR,CNN 等媒体的报道。最重要的是,这个项目是他独立完成的,没有团队。

作者 | 八宝粥

出品 | CSDN(id:CSDNnews)

27岁华裔青年成疫情预测界新星_第1张图片

美国民众也感受了一把 “研究机构的参差”

2020 年疫情爆发之后,全球对于此次疫情都较为关注,但是关于疫情走势的论文寥寥无几,只有国内几家医学院和医院进行了数据采集和有效的文章报道。2020 年 3、4 月份,美国有两大预测机构,一个是伦敦帝国理工,另一家是美国华盛顿大学健康指标和评估研究所(IHME)。然而常在河边走,这两家机构的结果真的让美国民众感受到了“研究机构的参差”。

帝国理工提出警告,美国到 2020 年夏天将有 200 万人死于疫情;而 IHME 则发出了保守的预测,表示到 2020 年 8 份死亡人数会达到 6 万人。结果表明,八月初,美国有 16 万人次死于疫情。这种“巧妙”避开了真实值量级的预测,令人失望,也让 26 岁的顾同学决心利用自己的专长进行大数据预测。

2020 年 4 月,他建立了关于疫情的网站,没有多久,该网站显示的结果就被发现比拥有更多财力和人才的机构更加准确的结果。

2020 年 5 月下旬,顾同学在社交网络发布内容,宣布该网站一直是每周最精确的模型,甚至对于 5 月 16 日的死亡人数的误差在万分之一。『模型预计 5 月 16 日有 88767 人死亡,实际报告有88,751人死亡』


27岁华裔青年成疫情预测界新星_第2张图片

该模型预测能力在 2020 年 5 月几乎成为了最优解,连杨立昆(Yann LeCun)大佬都连连称赞:

27岁华裔青年成疫情预测界新星_第3张图片

这种精度难免让人怀疑他是不是发现了数据发布的规律或者搞到了预测的 Bug,话说回来,这也不是什么算法比赛,而他所利用的数据也都是公开的数据,所以,这些大厂、机构预测不过人家少年,究竟是技不如人,还是存在人为控制,也不得而知。

但是顾同学确实发现了一些问题,最初在考虑住院人数、其他因素等关系的时候,发现各州和联邦政府的结果不一致,因而选择了“死亡人数”这样一个更可靠的数值来进行衡量,依靠过去的死亡,预测未来的死亡,并将其作为唯一可以可以用来过滤噪声的变量。

IHME 此前一直为美国联邦政府大量引用,IHME 主管克里斯托弗·默里(Christopher Murray)曾表示,一旦该组织在 4 月以后更好地控制了该病毒,其预测就会大大改善, 试图告诉人民死亡人数将在 7 月份清零。该做法不得不让人怀疑这种预测可能受到了某种不可抗力的影响。也正是因为如此,其他机构通过大量因素参考得到的预测结果,就不可避免地比顾同学的模型多出了更多的噪声。

4 月底 华盛顿大学著名生物学家卡尔·伯格斯特伦(Carl Bergstrom)在社交网络发布了关于顾同学模型的内容,而美国疾控中心也将该模型纳入了预测网站。

为什么不做预测了?为什么又来了?

当顾同学看到其他机构的模型已经逐渐成熟和精确以来,觉得自己的工作已经王成了,准备停止项目了。项目停止前的 1 个月,对于 11 月的死亡人数依然有较高精度的预测,仿佛先天知道结果一般。

即使如此,依然有人在“酸”,比如 IHME 的默里就表示,顾同学的机器学习算法能理解短期预测,但是不能理解“全局”。于此,顾同学没做过多回应,而是感谢了默里等人做出的贡献,深藏身与名。

当然,深藏身与名是不可能了。毕竟已经这么“火”了。

然后他又继续在网站上开始自己的贡献,因为疫苗的出现和群体免疫的提出,他开始在这些方面进行一系列的预测和定期信息收集。研究对象也从美国个州个镇到了世界各地。

27岁华裔青年成疫情预测界新星_第4张图片

顾同学其人

27岁华裔青年成疫情预测界新星_第5张图片

顾同学出生于中国上海,在伊利诺伊州长大。公开信息显示,顾同学拥有 MIT 电气工程与计算机科学和数学双学士、电气工程与计算机科学硕士学位。在 MIT 的计算机科学与人工智能实验室的自然语言处理小组完成了自己的论文。

此后他从事了金融行业,从事交易算法工作。他的项目也只是在网站众筹捐款,希望自己的数据不受任何利益冲突和政治偏见的影响。

最后以 Youyang 在社交媒体发布的内容结尾:

27岁华裔青年成疫情预测界新星_第6张图片

于我而言,年龄只是一个数字。进行批判性思考和适应新的信息无需数十年的积累。作为局外人甚至是一种优势。在这个信息易得的数字时代,不要让缺乏专业领域的知识阻碍你追求自己真正的兴趣!

【参考资料】
https://www.linkedin.com/in/youyanggu/
https://www.bloomberg.com/news/articles/2021-02-19/covid-pandemic-how-youyang-gu-used-ai-and-data-to-make-most-accurate-prediction
https://covid19-projections.com/about/
https://youyanggu.com/about

你可能感兴趣的:(综合资讯,机器学习)