引言
大学刚毕业那会儿, 听好友疯子李聊起王国维在《人间词话》谈学问的三种境界:
"昨夜西风凋碧树。独上高楼,望尽天涯路。" 此第一境也 (晏殊《蝶恋花》)。
"衣带渐宽终不悔,为伊消得人憔悴。" 此第二境也 (柳永《蝶恋花》)。
"众里寻他千百度,蓦然回首,那人却在灯火阑珊处。" 此第三境也 (辛弃疾《青玉案》)。
读研究生的时候, 听师姐说一流学者提问题,二流学者做回答,三流学者编概, 直观来说一流学者是挖坑的,二流学者去填一流学者的坑,三流学者跟着二流学者灌水。
当然, 这些都太高深, 不入流的无法体会和评价。不过, 没吃过熊猫肉,就当看见过熊猫跑吧 :- ) 想闲话就算真的练就一流境界,但是你的名字,也是不容易的。
你的名气得够大
虽然微积分是牛顿和莱布尼兹独立创建的,莱布尼兹甚至还做出更系统的符号工具, 但是牛顿名气要比莱布尼茨大, 就算并列天下第一, 有时候慢慢名气大的独占了名字。
另外, 对于正态分布,高斯,棣莫弗都做出极大贡献, 甚至棣莫弗更早些, 另外拉普拉斯也贡献, 后来因为不同国家争议大, 命名不一致。 才提出使用正态分布。 但是还是扛不住高斯名气太大, 现在基本都使用高斯分布了。
想起了『三傻大闹宝莱坞』里面,问第二个登上月球的人是谁, 没有人知道一样。 这里,就算同时登上月球, 最后大家也只是记得名气大的那个了。
一句话,就算做出来了成果, 你的名字的绑定也得靠知名度。
实践并不够,得有理论
先说点热门的, 譬如, 深度学习的Geoffrey Hinton, 搞出了惊世骇俗的深度学习, 但是某种意义上的不可解释性, 尽管Hinton牛掰的搞定BP, Boltzmann Machine,DBN, Attention, Dropout等等, 居然没有入IEEE和ACM大殿。可能这个也不能那么说, 毕竟Hinton的名字还是杠杠的流行着。
换到另外一个神,Leo Breiman, 随机森林的发明者, 随着随机森林和SVM并驾齐驱的神效,而广为知名。
但是, 其实最早发现随机森林神效的, 是另外两个人Amit 和 Geman:
人家不仅仅发现了随机树林, 而且发现树与树之间要随机独立性, 但是人家基本没有对泛化能力做任何理论解释。
而Breiman抓住了这一点, 改了个名字, 叫随机森林, 满满的开始解释泛化能力, 最后也没有解释的特别成功。 从此随机森林就是Breiman发明的了, Amit哭死。
一句话, Breiman不仅仅更有名气, 而且有理论解释。
理论并不够, 得有实验
我们知道深度学习那么火, 那么优化算法的改进就很必要, 目前很有名的stochastic variance reduced gradient (SVRG) 算法, 某种意义上SVRG算法让Variance Reduction的概念狠狠的火了一把, 但是当时,同时录取了两个Poster论文, 对这个思想有两个相似的算法都提出了 Epoch Mixed Gradient Descent (EMGD) 和SVRG。
EMGD vs SVRG 算法的思想一致, 两个文章也都有严格理论证明, 但是EMGD居然没有实验说明。 那么人们引用的时候,就必然选择有实验的了。
从此没有人知道EMGD了。
从此,Zhang Tong成了这个思想的主要代言人, 不知道Zhang Lijun做何感想。
一句话, 有理论了还得有实验。
实验并不够, 还得推广
2013年的诺贝尔经济学家里面有一个GMM广义矩估计算法, 其实本质上就是3SLS3阶段最小二乘法(参考GMM的世界,你不懂?), 但是3SLS的作者Henri Hans Theil 并没有将他的工具广泛的找合作制进行应用,发表新的应用成果。 但是GMM的作者Lars Peter Hansen 发表了大量应用GMM的论文。 最后,强大应用效应使得GMM广泛的流行使用, 而3SLS几乎被忽视了。
一句话,你觉得你的成果好, 那么要记得拼命找人合作, 让别人应用上你的成果。
小结:
这些例子可能不算很合适, 只是看过熊猫跑的不入流的人的闲话,不要当真。
相关话题:
GMM的世界,你不懂?(上篇)
攒说 Geoff Hinton
乔丹上海行