Prof. FeiFei:如何教计算机理解图片

1.Stanford / profile

Dr. Fei-Fei Li is an Associate Professor in the Computer Science Department at Stanford, and the Director of the Stanford Artificial Intelligence Lab and the Stanford Vision Lab. Her research areas are in machine learning, computer vision and cognitive and computational neuroscience, with an emphasis on Big Data analysis. Dr. Fei-Fei Li has published more than 100 scientific articles in top-tier journals and conferences, including Nature, PNAS, Journal of Neuroscience, CVPR, ICCV, NIPS, ECCV, IJCV, IEEE-PAMI, etc. Research from Fei-Fei's lab have been featured in New York Times, New Scientists and a number of popular press magazines and newspapers. Dr. Fei-Fei Li obtained her B.A. degree in physics from Princeton in 1999 with High Honors, and her PhD degree in electrical engineering from California Institute of Technology (Caltech) in 2005. She joined Stanford in 2009 as an assistant professor, and was promoted to associate professor with tenure in 2012. Prior to that, she was on faculty at Princeton University (2007-2009) and University of Illinois Urbana-Champaign (2005-2006). Dr. Fei-Fei Li is a recipient of the 2014 IBM Faculty Fellow Award, 2011 Alfred Sloan Faculty Award, 2012 Yahoo Labs FREP award, 2009 NSF CAREER award, the 2006 Microsoft Research New Faculty Fellowship and a number of Google Research awards.

2.明明可以靠脸吃饭,却偏要拼才华

出生在北京的李飞飞,16岁随父母移居美国。或许对科学的爱就是这样不分性别,李飞飞在1999年以最高荣誉获普林斯顿大学物理学学士学位,辅修工程物理专业。
随后,她在加州理工攻读电子工程的硕博学位,并在2005年顺利毕业。她的研究兴趣主要集中在视觉研究领域,包括计算机视觉和视觉心理学,例如物体识别、场景分类和事件分类等。
2009年,李飞飞来到了斯坦福,仅仅三年,李飞飞就晋升为终身教授,并成为斯坦福大学人工智能实验室(SAIL)及斯坦福大学视觉实验室的主管。

不过比起那些只埋头工作的学者,李飞飞靠着自己的颜值才华参加了不少演讲,在她19页的简历里,有四页是关于参加过的各种演讲。她和媒体的关系也一直不错,上过New York Times和TED。

3.ImageNet,图像识别的考场

作为全球计算机视觉领域的知名专家,李飞飞的主要贡献在于参与建立了两个被AI研究者广泛使用来教机器分类物体的数据库:Caltech 101和ImageNet,而后者,目前已经成为了全球最大的图像识别数据库。
如果说李飞飞是图像识别的大考官,那么她一手创建的ImageNet就是科技公司在图像识别的考场。
利用互联网,ImageNet提供了一个庞大的图片数据库,让计算机系统能够在1500万张照片里认识22000种物品。而教会了计算机看东西还只是第一步,我们还需要算法的力量!
作为和大脑神经原理类似的卷积神经网络,用ImageNet来训练实在是再合适不过了。卷积神经网络,最早由Kunihiko Fukushima,Geoff Hinton, 和Yann LeCun三人在上世纪七八十年代开创。 就像神经的最小运算单元是神经元一样,神经网络的最小单位也是一个小节点。节点通过连结不同的结点,能够输入输出信息,实现“思考”。如果将一张图片以不同维度分为各种层次,每个层次用来识别不同的内容,比如花色、颜色、形状等等。在一个用来训练对象识别模型的典型神经网络中,有着2400万个节点,1.4亿个参数,及150亿个联结。借助ImageNet提供的巨大规模数据支持,研究者可以通过大量最先进的CPU和GPU,来训练这些模型。这两者相辅相成,在对象识别领域发展成为一个成功的体系。通过让计算机读出谷歌街景,实际上能得到很多有意思的结果。比如道路上的汽车价格与家庭收入,甚至是和犯罪率的关系。然而计算机能读懂了图片,这一切就到此为止了吗?当然不。在大数据和机器学习算法的合力协作下,我们可以让计算机这个刚刚认识一些事物的baby慢慢组织语言,并用完整的句子表达出来——就像一个真正的小孩一样。
或许,终极考官李飞飞面临的是这样的境地:一方面,她希望ImageNet考场里的“试题”能难倒前来应试的计算机们,因为这说明算法的突破口就在这里;而另一方面,如果计算机成功答出了试题,说明图像识别的技术又进步了一分。哪怕是攻克了一道“难题”,正确描述出了某张图片上的内容,都值得双方欢呼雀跃;而这样甜蜜的烦恼,也是考官李飞飞所享受的。
而最最重要的是,ImageNet——这个集合了全球智慧和力量的数据库——是免费的。这也就意味着,全球所有致力于图像识别的公司,都可以免费对自己的算法进行反复测试。这就好像一个庞大的试题库,只要愿意,任何公司都可以一直接受考官的检验。

你可能感兴趣的:(论文写作,美国名校)