受访者:谢瑶教授 (佐治亚理工)
专访:田嘉晨,谢倩,张云天
编者按
1. 科研中,我们如何从实际问题出发,解决社会所需,并进一步深挖学术研究价值,产出高质量文章与有影响的工作?
2. 从数据到决策:统计学、机器学习与运筹学的相遇,将带来什么机遇?以Predictive Data-driven Optimization for Police为例。
3. 作为优秀的女性学者,对考虑进入学术圈和正在攻读博士的后辈有何经验与建议?
我们很荣幸地邀请到佐治亚理工学院的谢瑶教授来接受专访,教授以在2022年INFORMS荣获Donald P. Gaver, Jr. Early Career Award for Excellence in Operations Research的相关工作经历为引子,分享她的工作、学习心得,回答我们上述的疑问。以下是专访回顾。
*谢瑶教授与学生在2022年Informs Award Ceremony
一、研究背景与经历
Q1、可否请老师简单介绍一下您的研究背景和经历?
A1:2013年的八月,我来佐治亚理工学院(Georgia Institute of Technology)工作,此前在杜克大学(Duke University)一年半,担任Research Scientist。我在斯坦福电子工程(Electrical Engineering, EE)系读的博士,也读了一个Math Ph.D. Minor。本科是中科大电子与信息工程系(6系)的。
Q2、我们注意到,在您的INFORMS Donald P. Gaver, Jr. Early Career Award for Excellence in Operations Research in 2022获奖致辞中,您提到自己是运筹学社区的“immigrant”,您是如何一步步与运筹学结缘的呢?
A2:我的本科和硕士研究网络(Networking)和信号处理(Signal Processing),这些研究方向本身与优化和统计建模有相关的问题。比如网络也会涉及很多排队论的问题。信号处理,本质也是基于随机带噪的观测(Noisy Observation)恢复信号本身,这和统计理论和计算(包括优化算法)息息相关。本科和硕士的研究经历,为我后续的研究打下了坚实的基础。
转向这个方向,发现机器学习(Machine Learning, ML)在运筹学(Operation Research, OR)社区有很多的机会。我研究的手法主要也是基于统计和随机理论建模,并用优化的方法来求解。针对数据、和机器学习的问题,认为这方面有特别多的机会,也是当下一个主要的研究方向。
通过了解Gaver 的生平(奖项以Gaver命名),我也认识到OR是个非常广泛的领域。总的来说,为什么与运筹学结缘?可能也是因为在OR社区,不同领域的人都可以做贡献,它非常“Welcome immigrant”。我觉得这是非常好的文化。
Q3、您未来关注的研究方向主要是什么呢?或者您可以分享下您不同研究方向之间的关联关系,与围绕的某个或几个核心点?
A3:我希望研究方向有一定的实际背景。从一个具体的、亟需被解决的问题中,发现其与统计、优化和OR的关系,深挖它的学术研究价值,最终产出一些高质量文章,并希望最终有影响力的工作。
二、研究工作
*谢瑶教授与Atlanta police开会
Q1、我们关注到,您关于数据驱动的优化服务警务的工作“Data-Driven Optimization for Police Districting in South Fulton, Georgia [2, 3] ”,并在INFORMS Wagner Prize、INFORMS "Doing Good with Good OR" Paper Competition等荣誉评价上有突出表现,可否介绍一下这项研究工作?
A1:2016年,我在个人生活与研究的新阶段,一方面在整理先前的研究,另一方面也在寻找新的研究点。当时警察找到Georgia Tech的教授寻求帮助,看能不能解决一些实际问题。当然,这不是一个很传统、或是说很常规的研究话题。
但实际上,在研究项目的过程中,我们发现Policing Operation和OR是有渊源的。MIT的Richard Larson先生的《Urban Operation Research》这本书 [4] 给了我启发。我在2018年组织并参与的一个NSF workshop上(主题关于Data-driven decision making for policing operation),有幸见到了作者Richard先生。他觉得我们的工作很有意思,因为他们那个年代做Policing Operation要从建模(比如排队论,这是一个很经典的服务系统构建问题)的角度出发,研究所构建的排队论模型的理论属性,并没有很多数据。传统排队论可能不考虑location/space information。此外,作者Richard虽然是从警察的问题出发的,但后来发现更多领域(如医疗急救系统)也和其有互通之处。
第一个项目,是破案,关于犯罪事件的因果推断、数据挖掘。这更需要统计和机器学习方面的研究工作。最难的地方在于数据非常复杂,既有时间、也有地点、还有许多警察手动输入的文本描述(Piece of text)。每个人输入方式与习惯也不一样,不是填表,就是直接输入。所以要借鉴一些自然语言处理(Natural Language Processing, NLP)的研究,来提取一些信息和特征,并且提取到的特征要和时间、地点结合才能够使用。这样,才能找到案件之间的最优关联。许多先前的研究考虑了时间地点信息,但没有考虑文本信息,因为文本也很难处理。
另一个问题和优化,和Optimization更为紧密,是关于巡逻区域划分(划片)。我们将其建模为混合整数规划问题(Mixed Integer Programming)求解。实际上,和Richard时代不同,现在我们有很多数据可以协同模型做这样一件事。每一个电话接入后会有一个ID,警察什么时候派出、完成案件、时间戳。警察会记录案件的一些细节,是文本信息。事实上,这样一套区域划分方法在很多领域都有应用,比如医疗救护、消防甚至投票站的优化。开展这个项目后,我们发现很多不同国家的人也开始关心这个事情。在我们的工作发表之后,巴西的研究者致信我们,想合作解决里约热内卢救护车的划片问题,所以这个问题看起来很通用。
后续,我们也在开展一些其他工作。例如,相比于静态(Static)的划片问题,还有一些动态(Dynamic)的问题。对于一个案件,需要派哪个区域的警察去,派多少个警察。没有案件的时候,警察应该去哪里巡逻(只巡逻热点,还是尽量覆盖整个区域?)。这可以建模为一个马尔可夫过程,或者说强化学习的问题。输入:警察在什么地方、忙/不忙(这是一个很大的状态空间);输出:一个事件(Instance)出现,应该派哪个警察去响应(Response to the call)。这就形成一个输入输出映射,即策略。如何设计一个高效的服务系统,减小响应时间(Response time),让警察尽快抵达现场?这块我们也在尝试解决,可以建模为一个Reinforcement learning的问题,并在2022年Informs上给了一个Talk。
最后还有一个容量(Capacity)的问题。一个时间段内最好分配多少个警察,肯定有约束,比如一共100个警察,但有10个区域需要被巡逻覆盖。那么我如何优化每个区域的警察数量,最后能保证在这个区域里面,就是说在最坏的情况下,响应时间要小于某个指标?或者保证警察的工作负载(Workload)比较平衡。我们也在和其他教授合作,里面要涉及因果推断(Causal inference),以及一些其他研究方法。
[1] Crime linkage detection by spatial-temporal-textual point processes. Zhu, Xie. Annals of Applied Statistics. Vol. 16, No. 2, pp. 1151-1170. 2022. Selected to be presented in "The Best of AOAS" Session at JSM 2022, 2023.
[2] Data-driven optimization for police zone design. Zhu, Wang, Xie. INFORMS Journal on Applied Analytics: 52, 5, 412-432. 2022.
[3] Data-Driven Optimization for Police Districting in South Fulton, Georgia. Zhu, Bukharin, Lu, Wang and Xie. KDD Workshop on Data Science for Social Good 2021. (Oral)
[4] Larson, R. C., & Odoni, A. R. (1981). Urban Operations Research.
Q2、研究过程中用到的重要研究方法和心得包括什么?
A2:
统计概率建模,随机过程模型。细化来说,统计里需要用到Point process modelling,泊松过程的推广,Latent factor model,时间序列建模。最近我们也很感兴趣Conformal inference,因为很多ML算法是黑盒,可解释性差。
连续优化算法和混合整数规划(Mixed Integer Programming, MIP)。统计模型的训练(Estimation and learning)需要设计采用有效的优化算法。比如我们用比较前沿的monotone operator variational inequality problem(VIP)的方法有效求解,用分布式鲁棒优化(Distributionally Robust Optimization, DRO)达到在有限数据造成不确定条件下的决策(Decision making under uncertainty)。近年来的许多工作,也是在这个方向上,是个热点研究领域。
未来还可以更精细地考虑更多方面和因素,例如划片的公平性(Fairness),不仅考虑警察数据,也有许多其他数据,比如居民区人口普查数据(Census data)。数据的分布可能改变,需要Change-point detection for distributional drift.
Q3、数据驱动的优化研究中,数据是一个基本而重要的要素,否则研究者是“巧妇难为无米之炊”。您可以分享一下在数据获取与处理工作上遇到的难点和经验心得吗?
A3:就与警察合作的这个项目,确实有很多的困难。一开始两边相互的交流比较困难,彼此难以理解。要花很多很多时间去和警方沟通,这需要耐心。一开始警方提了很多需求,但无法都做到,这时就需要提取核心问题 + 找到核心工具。
过去我的研究工作比较理论,理论模型往往都已经建立好,在其基础上开展研究工作。但是,警察这个项目是从非常具体的问题、数据、和要求出发,去做面向实际问题的建模。也有可能最后这个事情就没有做成。“High risk, high reward”。幸运的是,我们的问题打开方式对了,最后做成了这件事情,并应用在了他们的Aware系统里, 我们的划片被亚特兰大警方在2019年采用(用一年以后的数据验证,我们提高了5.8%的警察响应速度,和减少了43%工作量不平衡),我们对此感到很自豪。
数据的获取与处理上,我们遇到了许多问题,并有针对性地设计方法解决:
有些研究需要的数据警方无法提供。例如GPS tracking,对方没有这样的数据,那我们只能建立新的数学模型。在数据的获取过程中,也需要遵从一些标准流程,签订规范的协议。
数据库事实上也不是很完善。这是一个很大的挑战,有些案件的记录非常详尽,但更多来说,警察往往为了快速结一个案子,在文本记录过程中有很多typos之类的,还有很多缺失信息。数据本身很noisy,并不是为了后期做数据分析与研究准备的。
需要做数据预处理。我们要将警察的文本映射到我们的算法可以处理的特征空间。但也不只是预处理,比如Word2Vector,这样不够,没有做到智能地提取关键词、与找到关键词的关系。具体来说,可能有7万多个关键词,非常高维,最有用的可能只有十来个,而且每一个案件系列都不一样。我们借鉴了许多自然语言处理领域的研究,但相比于较为成熟的翻译领域等,还需要做很多新工作。例如,我们构建了机器统计学习模型,引入受限玻尔兹曼机(Restricted Boltzmann Machine, RBM)做embedding,在新的空间里发现案件之间的相关性。为了找到最有用的keywords,我们创新性地引入了一个正则惩罚项。总的来说是一个端到端(End-to-end)的系统,输入是raw data,输出是我们要的结论,尽可能减少警察的人力成本。我们的方法发表在应用统计方向的顶刊Annals of Applied Statistics (AOAS),申请了一项专利,论文还荣获Best of AOAS in 2022, in 2023的奖项。
缺乏足够的label。我们问了一圈,全警局人只记住6个案件关联系列(Crime series),一共包含40多个案件,但总共上百万个案件。最后我们设计了一个半监督模型(Semi-supervised model)。
具体的工程转化与对接。我们作为研究者构建模型、设计算法并创建方案原型(Prototype)。方案原型需要集成到对方的系统。当然,这也不全是我们学生的专长,且警方也有自己的Software engineering(数据库维护与使用对警方也很重要),他们会做接口。这个时候,有效积极的沟通对接是最行之有效的。
Q4、您对Machine Learning + Operation Research的交叉融合有何展望?以及这类工作在实际中的潜在高价值应用。
A4:近些年机器学习特别火,而很多运筹学正在研究的话题也是在机器学习里非常重要的理论、方法基础。比如说机器学习的研究中需要很多优化算法,如何能够设计一个优化算法去帮助机器学习达到它的目的是运筹学的研究话题之一,因此运筹学能够比较快的和机器学习联系在一起,从而开启一些关于ML+OR的交叉工作。然后ML和OR本身研究的领域和话题很广,让学者能一直发现有意思的新问题,运筹方向也很欢迎新研究者一起寻找更多新的可能性。因此ML+OR的融合未来还有很多可能性和机会。
但正因为这些问题很新,所以也会存在一些风险。很多新方向需要一步一步去挖掘和探索,而最初的这一步特别难,同时也特别重要。在最初可能无法保证很快就找到一个好的研究切入点,这需要我们愿意去接受这样的挑战。并且,有时由于一个新工作刚出来,和过去其他话题不太一样,所以想让大众接受认可也需要花时间。
举个例子,比如说我们的警察项目。我和我的博士生Woody Zhu 2016年开始接触警察这方面的内容,给他们做了一些比较实用的工作。后来我们觉得这个方向很新,问题也很有意思,考虑说这部分工作有没有可能挖掘一下,推向下一个深度。因此随后又做了很多其他的工作,花了很长时间做了更深入的研究,做验证实验,想要出一篇好的论文。一开始这篇论文是投到一些机器学习和统计的顶刊,被拒了两回,没有马上被认可。他们可能觉得这篇文章太不一样了,一方面可能是很少有人使用警察的数据,另一方面我们的方法本身不是一个非常传统的统计学习模型。但是我们没有放弃,最后终于在2022年将这篇论文在Annals of Applied Statistics期刊发表出来。这个工作从开始到发表中间经历了五年的时间。虽然时间很长,但最终确实收获了一个很好的结果,我们也非常的开心。警察划片的项目发表在INFORMS Journal on Applied Analytics,然后那个项目本身也得了一些关注,我们拿到了2021 Wager Prize Finalist.
Q5、我们注意到,您还有很多其他优秀的研究工作。如果您有意愿的话,也可以简单介绍与分享一下?
A5:我们另一个正在做的项目是Health Care相关的项目,用ICU data来服务ICU里面的病人。在ICU里会有很多设备去检测用户的体征,例如心跳,温度。我们希望通过算法,利用这些数据去监测病人状态,判断病人此刻是否需要某类关注,比如此刻是否需要吸氧。这个算法可以帮助医护人员更好,更及时为病人提供医学护理。这类算法也需要考虑到算法公平性,例如病人年龄,性别,种族等不同人群的体征对应的状态可能会有细微的区别。我们希望算法能够察觉到这些区别的存在。对于数据较少的人群,我们也要考虑如何提高其预测精准度。同时量化预测准确性也是我们在探索的内容。受到这个应用的启发,我们发展了一个叫做”Conformal inference for time series”的算法:EnbPI和SPCI,发表在ICML 2021, ICML 2023,IEEE TPAMI 2023, 也收到了工业界的广泛关注:包括Scikit-learn, AWS Fortuna, Meta Kats都采用了我们的算法。
三、经验分享与建议
Q1、许多同学也希望能开展一些在业界有实际应用的研究工作,您觉得在和警方开展工作的过程中,是否会有业界/学界关注点不同的情况,或是遇到一些工作推进上的困难(工作对接/数据安全/数据隐私等),你们又是怎么处理的呢?(或者简单分享一些项目过程中印象深刻/难度较大的事情~)
A1:这一次的工作对我们来说其实也是比较具有挑战性的,算是走出了过去主要做理论研究的舒适区。我们需要对接真实的人群,从具体问题,具体数据,具体要求出发去建模。
在这个过程中首先是需要和警察有很多耐心且细致的交流。像是最初其实警察方提出了很多很多的需求,但实际上很多要求很广,在现实中是很难达成的。因此需要花大量的时间进行沟通,提炼出他们要求里的核心,最终找到比较合适的切入角度。在提取了具体的需求之后,我们可以开始寻找合适的工具去完成建模。而寻找到合适的工具这一步也是花费了我们很多的时间。中间也涉及到很多需要进一步跟警方确认的过程,例如更详细的数据情况,什么数据是现有的,什么数据是可能在后续过程中方便收集的,什么是他们确实没办法提供的数据。
处理实际应用的工作,寻找切入点是个风险很大的事。比如说我们有可能最终没法完成这个工作,或者是做出来的模型由于使用者(例如在我们的例子里的警察)不了解模型觉得模型没什么用而导致最终无法真正使用。不过高风险背后也是高回报,比如我们的两个项目很幸运找到了正确的打开方式,虽然花很多时间但最终都完成了并且被运用在了警察的真实工作中。在这个过程中需要我们有耐心并且放宽心态。如果成功做出了能被使用的产品那很棒很开心,但没有成功也没有关系。因为整个过程涉及了很多方面,你会在其他方面有一些收获。例如我在做警察的项目时就是走出自己做理论研究的舒适区,这让我发现了实际的问题中藏着很多机会,有很多新的角度。从实际问题出发会让你看到之前可能没有关注过的真实需求,没有被解决的问题,从而发现新的角度,做出一些创新性的工作。
Q2、(书籍/文献/课程推荐)根据我们的了解,您的研究领域交叉融合了统计学、运筹学和机器学习。您可否给希望从事相关研究的读者提供一些书籍/文献/课程建议?或是提供一些从事学科交叉融合研究的心得与洞见?
A2:我觉得想要做这方面的工作的话,可能一是需要从打基础的角度,把统计跟优化学好。我简单推荐一些经典的书目:
统计方向:《Statistical Inference》by George Casella, Roger L. Berger。这本书比较精炼,但它基本上包括了统计最重要的方向。
优化方向:《Convex Optimization》 by Stephen Boyd and Lieven Vandenberghe 是比较好的进阶教程。虽然现在很多问题都是non-convex的,但这里面的很多经典算法还是非常值得学习的。网上也可以找到它的相关课件,非常适合学习。《First-order and Stochastic Optimization Methods for Machine Learning》by George Lan。这是Georgia Tech的Lan老师写的一本书。这本书也非常的好,里面有很多算法上面的问题的研究总结,然后比较适合学生。我自己当年学习优化的时候非常喜欢的两本书是”Lectures on Modern Convex Optimization” by Aharon Ben-Tal and Arkadi Nemirovski, “Lectures on Stochastic Programming” by Alexander Shapiro. 后来觉得自己非常有幸,能跟这样的知名学者们,Nemirovski, Shapiro和Lan老师成为同事。
其他的参考有《The Elements of Statistical Learning》 by Trevor Hastie, Robert Tibshirani, Jerome Friedman,《Probabilistic machine learning》by Kevin Murphy。
另外,虽然今天没有分享太多关于深度学习(Deep Learning)的内容,但我觉得就是Deep Learning其实是一个有很多机会的方向。因为现在可能Computer Science从做实验,或者说利用一些heuristic的方法发现了很多好的算法,但是理论基础还存在很多挑战。Deep learning方面跟优化和OR的结合,可能是一个非常有趣,但非常难的方向,存在很多挑战。感兴趣的同学也可以就是看一下这个方向。
其他的话,例如说可以看看我前年夏天的时候录的一个tutorial。这个tutorial是给information data theory summer school的。里面我讲到了我研究用到的,比如说包括change point detection、Sequential data modeling。如果同学们感兴趣,我也可以把那个课件还有录像分享给大家。
关于如何在交叉的方向有一个突破的话,可能就是要梳理清楚有什么东西是near go,什么东西是faraway go。当我们把它想清楚了以后,可以找到一个可行的方向,一个好的切入点,这样比较容易有一个比较好的进展。
其他一些建议:
A. 需要非常的耐心。有的时候在交叉学科工作,一开始的工作可能也复杂,包括如何能够把数据搞清楚,如何搞清楚对方的问题,如何把这个问题从一个非常实际的问题提炼出来。这个过程要非常的耐心,不是马上就能有回报而且有时候可能不是一上来就可以写个论文,并投出去。它是一个比较缓慢的过程。
B. 要学会交流。因为在交叉学科工作的过程很漫长,在这个过程最好的方式可能是说跟对方合作,要学会communicate。从学生的角度来说,可能就是要每天都要和导师交流讨论。比如说我和Woody合作时,我们有很多很多的讨论。我们会把我们各自的想法都说出来,去综合一下,从里面去找到一个好的角度。
C. 要学会自我鼓励/鼓励学生。在研究过程中有开心的时刻,例如得奖,发表paper的时候等,但是更多的时候可能是充满了很多的困难。那么这种困难的时候,我觉得就是需要很多的自我鼓励,和学会鼓励你的学生。我也是希望在我的组里面,在每周开组会时,大家坐在一起讲一下这周做了什么,有什么困难。不仅仅是分享有什么好的结果,也要说说有没有遇到什么困难,然后大家互相帮助解决这些困难。如果paper被拒的话,需要跟导师之间多交流,然后吸取教训,思考如何能够improve,继续去try out。不要失去信心,我觉得这是非常重要的。
D. 要学会一步一步来完成任务。作为一个研究者,要学会如何攻克难题。有时候一个问题太难,我们就把它变成几个小的steps,然后可以在中间的每一个小步骤上得到一点成功,这样积累下去会感觉更加顺利吧。因为有的时候,人确实还是需要一点reward的。我们可以先从拿到一个小的结果开始,比如说发一篇小论文,或者去做一个报告。在拿到一个好的feedback之后,我们再完成next steps。
E. 不要害怕走出舒适区,学会一点一点走出舒适区,去探索新方向。在研究初始可以先从比较舒服的问题开始,然后要逐渐离开舒适区域,逐渐去挑战一些新问题。因为有的时候金矿不会出现在舒适区里。我们最开始可能只是在别人的模型上去做一些小的改动,这是很好的开始。但最终要去做一些不太一样的东西。在探索新的方向的时候,也不要害怕这需要花很多的时间。要愿意花时间去看文献,学新知识,和同学一块去学。我们会发现很多东西是共通的,在这里花费的时间其实是在帮助我们做一些基础训练,这些能力在后续会让我们能更轻松得学习其他新的知识。一定要Get your hands dirty。
Q3、恭喜您INFORMS Donald P. Gaver, Jr. Early Career Award for Excellence in Operations Research in 2022等一系列杰出奖项,可以请您分享一下获奖心得和对各位学者的建议吗?
A3:我分享一个有意思的小故事吧。在申请这个奖之前,我阅读了它的描述。它提到说这个奖是想要鼓励Diverse Operations Research。我当时就在想我警察的这个工作是不是属于Operations Research呢?相比起其他专门研究Operations Research的人,我这个工作更像是Related Work,用到了Operations Research相关的东西,好像没有那么OR。但我还是去申请了。最终很高兴也很感谢组委会让我们得到了这个奖。我觉得这本身也是一件很有意思的事。这个奖叫做Gaver Award,我当时看了一下组委会分享的Gaver的生平,发现Gaver本身自己的也是这样的学者。Gaver本身是做Applied Probability Modeling,Statistics的,但他的工作非常diverse, 比如说如何算Inverse Laplace Transform,Modeling Of the Queue。他觉得OR是一个非常非常广泛的领域,很多研究就是跟着实际问题一起出现的。没有一个明确的定义去说什么样的东西才是Operations Research。这也让我非常启发,我们可以在使用一些工具去解决实际问题,并在此过程中发现一些宝藏,然后进而去深挖,找到新的方向。在这个很大的背景里面,各个领域的人都可以为这个领域做出贡献。这是一个非常好的文化和氛围。希望这个小故事也能给大家带来一点启发。
Q4、我们注意到您在个人主页上分享了本次获奖典礼上与您指导的学生的合影,可以请您分享一下与学生合作开展研究工作的经历吗?
A4:我有很多的工作都是跟学生一起完成的。然后我觉得非常的幸运,能够有一些非常优秀的学生。比如说Woody,我们一起做的警察的这个项目。刚开始的时候其实我们也有一点挫败。虽然我们的工作做出来了,警察也用上了,但是发表的时候遇到了一些困难。幸好中间我们没有放弃,最后结果是好的。Woody他当时找工作的时候,Job talk也是讲了这个police operation的工作,最后去到了卡耐基梅隆(CMU)的Heinz学院做Assistant Professor。
其他的学生也是非常优秀的,他们在各行各业的有很好的发展。目前在学界的,除了Woody在CMU,我还有两个学生,Xie, Liyan和Li, Shuang他们现在是在港中文(深圳)做Assistant Professor,做了很多非常优秀的工作。还有一些学生在国家实验室,和业界,他们在Uber,Morgan Stanley,Amazon, ByteDance等等。
这一次参加Informs,很多学生也去讲我们的工作,所以我们就一起合了个影。也还有一些同学没有到场。他们都是非常优秀的同学,在做一些很有意思的工作,和他们一起工作很开心。
(小编案:由于篇幅限制这里省略了谢老师介绍组里学生的部分。在采访时老师非常认真详细的分享了每个学生的研究内容和去向,如数家珍。一方面感叹老师组里项目之丰富,另一方面从谢老师的分享中可以感受到组里关系之融洽,让人神往。)
Q5、作为优秀的女性学者,可以请您与考虑进入学术圈和正在攻读博士的女性后辈分享一下您的感悟和建议吗?
A5:作为女性工作者,在学术圈确实有一些挑战。其实在任何领域,我觉得作为一个女性要出类拔萃,都是要付出非常多的努力。虽然说每个人想做到出类拔萃都需要付出很多努力,但是对于女性而言,确实会付出更多。比如说,兼顾家庭,照顾小孩。
其实我有两个孩子,一个八岁,一个六岁,照顾他们需要非常多的精力,从出生到他们长大,作为母亲要付出非常多。但是我认为我们心态上先不要害怕,我们其实是可以做到平衡好这些的。以我的经验和心得来说,明显的感觉到孩子出生后比出生前自己的时间要少很多,所以我们需要提高工作效率,做好时间管理,分清楚家庭也好,工作也好,各个事项的优先级。在有限的时间里,集中精力去把最重要的事情做了。
我举个例子,在我在2016年生第二个小孩的时候,其实当时还在申请NSF career award (美国自然科学基金奖)。这是个对我们年轻教授非常重要的一个奖吧,我也是第一次申请。虽然自己当时在怀孕,身体上也不大舒服,但是还是非常想试一下,不想错失那个机会。所以我就想,那我就集中我的精力只做这一件事情。那个夏天我别的都没有做过,就集中精力每天都在写proposal,为了这个奖也看到很多文献。那个proposal是7月20号截止,我7月20号把稿子交了,然后7月26号我家小孩儿就出生了,中间只差了一个星期。最后有幸,我也真的在当年成功拿到了这个奖项。我的经验就是,在我觉得我的精力很有限的时候,我会去做我认为当下最重要的事情,有些别的事情就得退后一点。当然我自己本身也挺幸运的,有幸能够在工作和家庭中找到一定的平衡,同时取得进展。
除了时间管理和理智放弃一些事以外,我觉得心态也很重要。不要害怕失败。失败有时也是没有关系的,人生有很多的alternative。如果最后发现工作做的不够好或者这个工作不太适合我,我也可以去做别的工作,甚至take a break。我当时觉得我自身的价值并不是说一定要通过我做一个professor成功拿到tenure来实现。拿到了当然最好,如果没有拿到没有关系。Take it easy。因为即使失败了,我在那个过程中也学到了很多东西。至少我有一个过程,这个过程中我也就是在做着我想做的事情。我比较喜欢写paper,比较喜欢去探索和学习,我觉得这都是做教授能够提供给我的,所以最后的结果并不是很重要的。我总是觉得失败没有关系,人生总有多种可能性。只要我把现在的事情做好,那么最终的最终我总有一个办法能够继续做我想做的事情。
当然我也不是时时刻刻都能心态放松,我也会有焦虑的时候,就比如说论文被拒,做研究不顺利。读博士都会有这种压力和焦虑的时候,一帆风顺的人非常的少。有的时候自己一个人的力量不够排解这些压力,可以试着寻求外界的帮助,例如去看心理咨询,寻求朋友甚至自己的小朋友的帮助。学会如何能够管理自己的情绪,处理你自己的焦虑,然后把这个压力能够排解出去。
以上的建议也不仅仅适用于女性研究者,我觉得所有研究者都一定要把工作和生活或者其他的方面平衡好,因为人的创造力往往是在一个比较轻松愉悦的环境中爆发出来的。
*家庭与工作:谢瑶教授的宝宝和办公桌
四、结语
Q:感谢Yao Xie老师接受我们的采访。最后还有什么话想跟读者说的呢(欢迎合作者的研究领域与工作等)?
A:非常开心能和同学们分享。我觉得我过去真的是非常幸运,能够碰到非常好的学生,然后这些学生逐渐的成长,也变成了professor,变成了他们各个领域非常优秀的人。我也非常欢迎年轻的同学们来申请,来我们这里读PHD,或者是来访问,做博后。
我们这边研究的领域包括Uncertainty quantification for Machine Learning,data-driven decision making, decision making and uncertainty。目前从application的角度来说,我们做很多警察policing,health service的问题。我们和医院也有很多合作,有医疗保健的数据。然后还有一些新能源方向的研究,包括风能,太阳能的预测和这些跟优化的结合。还有最新的两个NSF funded project。一个项目是做的mathematical foundation of deep learning。我们想用hypothesis testing的方法跟deep learning结合,做一些reliable and transfer learning的machine learning相关研究。然后还有一个项目是想要用predictive model and graph neural networks去预测蛋白质结构,这个是一个比较新的项目,今年年刚开始。这个是跟我们这边biomedical engineering的人一起合作的,里面有非常多的统计、建模,还有优化的问题。欢迎感兴趣的同学联系我,加入我们实验室。