汤晓鸥领导的计算机视觉研究组 (mmlab.ie.cuhk.edu.hk) 开发了一个名为DeepID (深分证)的深度学习模型, 在LFW (Labeled Faces in the Wild)数据库上获得了99.15%的识别率。
LFW是人脸识别领域使用最广泛的测试基准。实验表明,如果仅仅给出人脸中心区域,人用肉眼在LFW上的识别率为97.52%。
在此之前,汤晓鸥的研究组开发了一个基于高斯过程的人脸识别技术GaussianFace (高斯脸),取得了98.52%的识别率。这也是计算机自动识别算法的识别率首次超过肉眼。
DeepID将GaussianFace的人脸识别世界纪录又向前推进了一个台阶,首次超过99%的LFW识别率。
人脸识别是计算机视觉和人工智能研究领域一个重要挑战,在公共安全、执法、移动互联网和娱乐领域都有大量应用。它也成为检验人工智能是否可以在解决某些特定智能问题上达到甚至超越人的重要测试基准。
汤晓鸥的研究组在人脸识别领域有十几年的研究经历。他们从2011年开始开展深度学习方法的研究工作,在2013年达到了92.52%的识别率。过去一年,他们将这一数字提高到99.15%,
今年早些时候,汤晓鸥和王晓刚的研究组曾发布了一套基于深度学习的人脸识别算法,在LFW上取得了当时最高的97.45%的识别率. 与此同时,Facebook(67.44, 1.72, 2.62%)发布了另一套基于深度学习的人脸识别算法DeepFace,在LFW上取得了97.35%的识别率。
DeepFace需要700多万人脸数据作为训练。而DeepID仅使用了20万张人脸数据以及数台Nvidia(18.61, 0.19, 1.03%) K40 GPU。目前,汤晓鸥实验室的三个人脸识别算法占据了LFW识别率的前三名,而FaceBook的DeepFace排在第四。
汤晓鸥认为,人脸识别领域还有大量的工作需要做,很多算法需要在实际应用中得到不断的改进和提高。他的实验室已经基于最新的技术突破制作出完整的一套人脸图像处理系统SDK,包括人脸检测,人脸关键点对准,人脸识别,表情识别,性别识别,年龄估计等各种基础技术包。
汤晓鸥计划把人脸识别技术免费提供给Android、iOS及Windows Phone开发者;在这套FreeFace-SDK的帮助下,开发者能够在手机上开发基于人脸识别的各类应用。此外,汤晓鸥还希望利用用户反馈进一步提高算法的准确率。
除人脸识别外,汤晓鸥和王晓刚的研究组的另一核心研究方向是深度学习。他们设计了多个深度学习模型,可被用于研究计算机视觉领域的许多重要问题,包括人脸对准、行人检测、姿态估计、人体图像分割、车型识别、大规模人群监控、通用物体识别和检测、互联网图像检索等。