第二次考核

机器学习是基础
入门最快的方式是学习最新的东西
一定要发文章
面试：做过什么；怎么做的；遇到过什么问题；怎么解决的
看文章最重要的就是知道我们可以做什么

做正确的事

看最好的东西

发最好的文章

https://www.ijcai.org/proceedings/2019/

增量学习(incremental learning)

能不断地从新样本中学习新的知识，并能保存大部分以前已经学习到的知识。
例如：大型数据库：Web日志记录
流数据：股票交易数据类似于线上学习
https://www.jiqizhixin.com/graph/technologies/09134d6a-96cc-409b-86ef-18af25abf095
https://zhuanlan.zhihu.com/p/41422048
https://blog.csdn.net/Losteng/article/details/51058026

模仿学习(Imitation Learning)

行为克隆（Behavior Cloning：根据人类提供的状态动作对来习得策略，是作为监督学习的模仿学习。
逆强化学习（Inverse Reinforcement Learning ）：因为缺乏显式reward，只能根据人类行为，进行 reward的估计。在得到 reward 函数估计后，再进行策略函数的估计，即解释专家的行为。
结构化预测（Structured prediction）：拟合的目标不是输出一个标量或者一个类别，而是输出些有结构的输出，比如，一个序列，一个句子，一个图，一颗树。
GAN：我们可以假设expert轨迹属于一个 distribution，我们想让我们的 model，也去 predict 一个分布出来，然后使得这两者之间尽可能的接近。Generator：产生出一个轨迹；Discriminator：判断给定的轨迹是否是 expert 做的
https://huangwang.github.io/2019/01/26/%E6%A8%A1%E4%BB%BF%E5%AD%A6%E4%B9%A0%E7%A0%94%E7%A9%B6%E7%AC%94%E8%AE%B0/

应用领域：自动驾驶
https://www.jiqizhixin.com/articles/2018-01-28-4

多任务学习(Multi-task Learning)

把多个相关（related）的任务（task）放在一起学习，多个任务之间共享一些因素，它们可以在学习过程中，共享它们所学到的信息。相关联的多任务学习比单任务学习能去的更好的泛化（generalization）效果。

是多标签学习，多分类学习的一种提升

https://zhuanlan.zhihu.com/p/27421983