商汤科技43篇论文横扫2017ICCV 实习生摘得五项世界冠军

华人学者7月在夏威夷CVPR 掀起的中国风尚未完全褪去,近日又在水城威尼斯ICCV 引爆中国学术研究风暴。数据显示,中国学者发表的关于深度学习的期刊论文数量已超过美国。今年ICCV 接收论文中,有40%的第一作者都是华人。

中国最大新锐AI企业商汤科技与香港中大-商汤科技联合实验室,继以23篇论文横扫CVPR后,又以20篇论文力压群雄称霸ICCV。

CVPR和ICCV是2017年度举办两大全球顶级视觉学术会议,商汤科技43篇的论文发表量,领先于谷歌、Facebook等国际巨头,居亚洲第一。

商汤科技43篇论文横扫2017ICCV 实习生摘得五项世界冠军_第1张图片

商汤实习生摘冠

随着深度学习和计算机神经网络的快速发展,人工智能企业想要形成技术壁垒保持领先,最关键的制胜因素就是人才。在商汤科技这个博士密度最高的中国企业、人工智能领域的科学家豪门,实习生不仅可以直接接受顶级科学家的辅导,还能运用所学知识和创新去挑战一些具有世界影响力的事情。

商汤科技的实习生刘枢在ICCV期间举办的MS COCO(Microsoft Common Objects in Context,常见物体图像识别)Workshop上,摘取了三项比赛的一个冠军(Segmentation)及两个亚军(Detection和Keypoint)。

在Keypoint Challenge上商汤科技实习生取得的单模型的最高识别率,仅靠单一模型就接近多模型的融合结果,由于计算复杂度的限制,在工业应用中单模型更具实用价值。

此前,商汤科技的实习生刘枢、潘新钢、李晓潇、张熠还在7月举办的CVPR期间摘取了四项赛事的桂冠,包括:

  • 视频分割领域最具权威的DAVIS视频分割竞赛

  • 北美著名高校和自动驾驶团队组织的图森杯车道线识别竞赛

  • 著名国际自动驾驶组织Mappillary Research 和普林斯顿大学组织的LSUN17大规模街景场景理解竞赛-语义分割及物体分割竞赛

这些技术未来可以广泛应用在自动驾驶等领域,具有非常强的实用性。

过往两年,在CVPR、ICCV和ECCV全球三大计算机视觉顶级会议上,商汤科技与香港中大-商汤科技联合实验室发表的论文数量高达76篇,超过世界伯克利大学、斯坦福大学、麻省理工等国际名校及Google、Facebook等国际巨头。

与生俱来的人工智能基因

在中国,提到人工智能不得不提到一个人——汤晓鸥,现任香港中文大学信息工程系系主任,兼任中国科学院深圳先进技术研究院副院长。

商汤科技43篇论文横扫2017ICCV 实习生摘得五项世界冠军_第2张图片

2016年,其领军的中国人工智能团队与麻省理工、斯坦福等著名大学一道,入选世界十大人工智能先锋实验室,成为亚洲区唯一入选的实验室。汤晓鸥被业界称为全球人脸识别技术的“开拓者”和“探路者”,而他还有一个身份——商汤科技创始人。

作为一家中国的人工智能领军企业,商汤科技成立至今其实才仅有三年的时间。商汤科技基本是通过汤晓鸥教授以及实验室师兄弟的关系,在创立开始完成了最为重要的原始人才积累。

其实验室的许多博士生加入商汤,成为最早的创始团队成员。在香港中文大学读博三年、又作为博士后驻站三年的徐立也在2015年初加入商汤,担任CEO。

当初选择离开实验室,徐立说有两个原因,“一方面,技术突破工业化红线的契机已经到来。当机器能够超越人工的能力,技术的工业化条件成熟之时,是切入一个市场的最好时机。如果早两年入场,就需要较多时间来教育市场。

2014年,当计算机人脸识别准确率首次超越人眼识别的准确率时,我们意识到时机到了。另一方面,从学术转换成工业应用,本身是一种责任。商汤目前正在做一件真正惠及国计民生的事业——布局智慧城市安防项目。

商汤此前已与某市级公安局合作,在40天时间内识别出69个嫌疑人,最后实际逮捕14人。要知道,此前仅靠人力进行图像识别,一年时间才能够抓捕两人。”

虽然当下人工智能势头正劲,国内BAT等巨头纷纷布局,徐立坦言商汤想做的是人工智能源头的事情。“我们是做底层架构的,坚持原创技术和在底层技术架构上的原始积累。”

徐立说,商汤的优势就是原创技术加核心人才,一方面商汤拥有最早投入深度学习研究的华人团队、亚洲最大的深度学习研究团队。在计算能力方面,商汤科技建设了大规模GPU计算集群,由近4000块GPU的计算芯片组成。

原创技术给商汤带来的竞争力在于能够生产独特的产品,换句话说是高效率并且稀缺的产品。以金融领域为例,其已经可以做到亿分之一的误识率,比现在十万分之一、百万分之一的误识率高两到三个数量级,这就是技术上的差异化。

商汤的人才造血机制

商汤是汇聚科学家数量最多的中国创业公司,注重人工智能领域的基础研究,对行业趋势始终保持敏感性,是商汤科技运营发展最鲜明的特点。那么它是如何吸引众多博士人才纷纷加入的?

徐立说,商汤有自己的人才造血机制,先通过学术上的联系把师兄弟吸纳进来,形成导师纽带,配备基础设施和架构,包括给予硬件资源、数据标注、硬件平台等方面的投入,通过导师的示范作用,把其他人才吸引进来。

除此之外,商汤还与香港中文大学、浙江大学建立了深度合作,共建联合实验室和研发中心,与清华大学、北京大学等多所高校成立研究团队。

一名AI人才的成熟大概需要5~7年的积累。商汤目前已经有了一支120人组成的博士队伍,未来还会尽可能多地招揽市场上已经成熟的AI人才,公司将大约一半的资金投入到人才招聘方面。

商汤科技43篇论文横扫2017ICCV 实习生摘得五项世界冠军_第3张图片

商汤科技联合创始人、CEO徐立博士

作为CEO,徐立表示,商汤发展到现在一共经历过三个阶段:

第一是早期创业期(2014年10月到2015年上半年),那时研究、工程、商务都没有明确的划分,一人承担多职,几十个人对任何事情都快速响应,利用大家积累的学术能力和对行业的认识来做行业的突破。

第二个阶段是2015年上半年到2016年上半年,做了两件事情:人才聚集和产品打磨。人才聚集期这一年进行了快速的扩张。

第三个阶段是2016年上半年至今, 开始引入职业化的经理人来做职业化的管理,包括商务、HR、法务、财务、市场PR,每一个核心岗位,都是从大公司来的高管。用更多的现代化的管理手段去调整公司的架构,把产研和销售渠道打通,建立起有规模的销售团队。

商汤的主要业务板块是智慧金融、智慧商业、智慧安防和互联网+,涉及的领域有很多。目前来看,安防的市场正在逐渐变大,除此之外,金融、商业、互联网都各自占据了一部分比较重要的位置。

其原创AI技术的应用场,包括SensePose、SenseFace、SenseVideo、SensePhoto、SenseAR等解决方案。这些人工智能应用产品,未来将在全球多个行业和场景下得到广泛运用,如智慧城市、智慧家居、互联网娱乐、手机、无人驾驶、医疗等领域,未来我们将会看到大量传统的低效率工作被高效的人工智能机器所取代。

“目前,商汤正处在一个快速起飞的状态。之前的增长是接近线性增长,但是现在处于拐点,接下来会有快速的聚集效应和产业效应,就要进入快速发展通道了。”徐立说。

让中国的技术领先全球

人脸识别目前的盈利模式以to B为主。目前来说人脸识别企业的主要盈利模式包括企业级技术服务和软硬件销售。商汤以B2B2C的商业模式,与各行业领军企业合作,共同推进人脸识别在各行业的应用和变现。

徐立说:“ B2B2C是通过量级的企业来辐射的,而且还有一个好处是标准化,你这个做的是一个什么概念,也就是标准化。第三点就是B2B2C,如果客户大规模发展,反而会推动我们B端的发展。

所以我们做的布局是“1+1+X”, 第一个“1”是基础研究,第二个是“1” 是产业结合,第三个“X”是行业伙伴。目前最重要的是推动技术在更多场景下的落地,真正的提高行业效率、改变人类的生活。”

在徐立看来,人工智能的定义,是通过人的工程使第三方主体拥有类人的思维和类人的意识,所以它的目的是仿人类。“但是和我们之后做的事情不完全一样,或者有比较大的差别。

现在我们大部分计算机工程或者工程学所做的事情,其实叫机器智能,它的目的并不是仿人,是在一些人类所指定的存储任务情况下超越人,只有在超越人的标准上才有更广泛的应用。

人工智能产业链根据技术层级从上到下分为基础、技术和应用层,目前人工智能的产业链刚刚开始,研究领域取得的进展逐渐开始工业化,所以新进入者还有一些机会,更多的聚焦在应用层,但在深度算法上,已经涌现出了独角兽,机会已然不大。”

如今,商汤在这个行业中所做的事情,是很多企业所做的目标,信息的连接到最后万物互联。万物互联走向一个万物智能的阶段,商汤要在万物互联这个大势之下,为更多合作伙伴和更多企业提供智能的核心。“正如商朝是中国有文字记载的第一个朝代,商汤又是它的创始人。我们希望通过不懈努力,让中国的技术领先全球。”徐立说。

推荐阅读

训练一辆无人车,到底需要多少数据?

全球首支AI基金:365天无间断工作

马斯克OpenAI实验室的17岁高中生

细数李彦宏的40位“出走门徒”

苹果AI人才报告:斯坦福等名校被挖空

Airbnb使用AI技术 让设计图秒变代码

被新浪科技的编辑套路后

清华大学计算机专业排名全球第一

深度学习库大排名:TensorFlow第一

谷歌中国首席工程师详解TensorFlow

长期招聘志愿者

加入「AI从业者社群」请备注个人信息

添加小鸡微信  liulailiuwang

format,png

你可能感兴趣的:(商汤科技43篇论文横扫2017ICCV 实习生摘得五项世界冠军)