作者 | 鸽子
9月2日,由IBM与CSDN共同举办的第三季 "Power AI 人工智能马拉松编程大赛"在马哥孛罗酒店开幕。此次赛季围绕人工智能在制造业的应用展开,赛题为《挖掘制造工艺和流程的金矿》。
从AI科技大本营提前了解到的报名情况来看,选手阵容非常豪华,来自北大、清华、中科院、北邮、北师大、北航、腾讯、微软亚洲研究院、搜狗、今日头条等知名院校及科技公司的选手比比皆是。
据悉,本次大赛总共分为20组,需要在12个小时内现场编写程序代码。此次编程大赛的内容为:参赛选手通过对大量非结构化文本数据建立相关模型,来分析和理解其中语义。
比赛要求:这些模型可以应用于制造业的新产品设计、工艺流程改进等方面,帮助设计和研究人员,快速借鉴前人的经验,从而加速产品的设计、工艺及流程的改进过程。
根据比赛介绍,选手将遇到来自三个方面的难点:
一、准确判断问题意图(类别)
二、精准定位问题所在文档位置
三、自动抽取并精确组成答案
在经历12个小时不间断的紧张的编程比拼后,终于迎来了比赛的最终结果。
冠军出炉
最终结果:一等奖1名,获奖团队为:来自中科院声学所的4位博士。
注意,这是三女一男哦,威武啊我的娘子军
根据比赛规则,一等奖团队将获得现金奖10000元;二等奖将获得现金奖8000元,而三等奖的现金奖励则为5000元。
结果出来后,AI科技大本营在第一时间对获得一等奖的中科院声学团队进行了独家专访,以下为专访内容:
AI科技大本营:恭喜恭喜,拿下了此次大赛的第一名。回顾这12个小时的紧张比赛,最大的感受是什么?
声学所团队:累
AI科技大本营:这次比赛中遇到的最难解决的难关在哪里?花了多长时间,用什么方式最后解决了这个问题?
声学所团队:最难是数据处理的问题,没有有效的标注数据几乎奔溃了。
AI科技大本营:咱们团队在这次比赛中,取得了第一的成绩,你觉得是运气还是实力?
声学所团队:运气多一些吧,但是我们比赛前也做了一些准备。比如文本预处理的脚本的准备。
AI科技大本营:运气总是留给有准备的人,跟我们分享一下咱们团队在赛前做了怎么样的准备,在比赛中又是怎样的一个协同配合?你觉得此次比赛能胜出的最关键因素是什么?
声学所团队:我觉得我们队就是分工明确,自己明确的自己的任务,做完了自己的工作就去帮其他人
AI科技大本营:参加过别的AI挑战赛吗?体验上有何不同?
声学所团队:有两个队员参加过一次,我本人没参加过类似的活动,这次我感觉还是很激动,最后的结果也是惊喜!
AI科技大本营:这次比赛最大的收获是什么?
声学所团队:最大的收获,我们能在一个团队中工作搭配的很完美。我觉得这是最重要的。借用一句话独狼死,群狼生。
AI科技大本营:想好这一万块元要怎么花了吗?
声学所团队:先吃顿大餐,写代码都没吃饭。
专家点评:
这是来自选手们的真实体会。那作为此次大赛的出题人——IBM中国系统实验室高性能计算部门开发部经理宋煜,他对今天的比赛及选手表现又有怎样的点评呢?
虽然attention的模型不能完全使用,但是可以使用attention的表示层,这样会对模型有很大的改进,使得句子表达更好。
换掉的r-net的最后一层,使用前面的encoder, 最后一层换了一层decoder再进行检索,这样的模块对文档的表示更好,准备了两个plan,有分工,在两个plan中寻找最优点。
宋煜在简短点评中提到了几个非常关键的点,非常吸引人,无奈时间有限,再无过多剖析。但我们仍希望能从源头上搞懂此次大赛:
我们想知道为什么选题要定位在制造业?
赛题设置的背后到底在侧重考察选手的什么能力?
为了考察这些能力,赛题做了哪些精心的设计?
比赛的机制是否仍有缺陷?
我们更想知道从这个比赛中折射出来的更大的影像:
选手们的表现离企业的实际需求还有多远?
如果这是一场笔试,那么当这些选手展现出怎样的特质,会得到企业的橄榄枝?
为什么IBM会一年办四次大赛,它到底想要什么?
带着这些问题,AI科技大本营第一时间对宋煜进行了约访,希望能从宏观和微观两个角度,聊透比赛背后那些有价值却未经挖掘的海底冰山。
深度访谈:关于比赛背后的那些事儿
AI科技大本营:其实我很好奇,制造业总的来说,在数据这一块相对是比较落后的,为什么会选择制造业? 为什么比赛的内容要选择问答系统?
宋煜:从AI的角度来说,真正能产生价值,能够改变大家命运和生活的,还是制造业这种与人们息息相关的行业。
这是第三次大赛了,为什么选制造业?其实有两个考虑。
制造业实际上是很传统的企业,那它到底会不会使用AI?实际上IBM这大半年,跟各个行业,包括金融、电信、制造业、医疗,所有的行业沟通来看,制造业使用AI的意愿是非常强的。
这里面包括有好几个点,
第一:质量控制。这一块像传感器、图像都是很直接就能够用到AI技术的地方。随着工业制造4.0时代的到来,制造业已经有大量的数据产生了。比如,在质量检测上,传感器将数据已经收集好了,所以,在质检这个场合里面,可以以更标准、更专业化的方式衡量这个产品的质量。
第二:流程控制。国内大多数制造企业已经有很完整的ERP系统,从原料采购到工艺流程进行明确的控制,甚至有60%、70%的企业已经用上了MES系统。所以,整个制造流程中的控制,其实已经数字化了。
第三:IOT。一小部分企业已经在制造业的各个生产环节、生产线、机床设备上面安装IOT设备,将机床更底层的参数收集上来或者下发下去。
你可以看到,在这种趋势之下,很明确的一件事情是,制造业的数据准备工作其实已经相对成熟,这也是为什么我们开始选制造业的原因。因为,一旦数据比较成熟了,就可以做分析。
基于这种要求,我们将这次比赛的主题设置为制造业行业。我们可以帮制造业做三件有价值的事。
第一:质量控制。这里面主要用到图像识别。
第二:良品率分析。因为一两个百分点的良品率的提升,对于制造业来说就是几千万甚至上亿的利润。这个里面主要用到自然语言处理。但是,这一块数据会更敏感一些,不太容易拿出来做大赛,可能跟企业单独来做会比较容易。
第三:工艺流程的描述。虽然这块也是自然语言,但偏重理解,也就是如何理解制造工艺的过程,所以,这部分数据相对没有那么敏感。因此我们针对这个方向,将比赛的具体形式设计为问答系统。
这样,就解释了你刚刚的疑问,为什么选择制造业和为什么选择问答系统来做我们第三季的比赛。
AI科技大本营:准备这一次的赛题花了多长时间?
宋煜:大概准备了一个多月,收集了医疗、制造、重工业、轻工业等各行各业的文本资料,大概50M左右,这是很大的量级了。
AI科技大本营:这里面设计了哪些坑,专门用来考验选手的能力?
宋煜:有三个方面吧。
第一,数据没有清洗。我们没有特意帮选手做数据的清洗工作。这些数据大部分都是来自于标准的PDF(生产手册、word文档),然后把它直接转换成了我们的训练数据。
这里面涉及到中文的繁体、简体问题,有编码问题,全角、半角的问题,这些其实都是中文里非常常见的问题。
数据一旦清洗的不是很好,一定会影响到后面训练的过程,包括生成词向量和句子向量,包括对于文章表达式的生成。所以如果不对数据做很好的处理,最终导致的结果很有可能是机器无法理解你真正希望他学习的东西。很有可能,我给了它一个跟我文章内容很相似的主题,机器居然不能找到相关性主题的内容出来。
那如果选手是带着知识和经验来的话,就会很容易做。如果这方面经验不足,就会很容易与其他团队拉开差距。
另外,没做数据清洗,也是希望每个参赛团队能够真正往产品化更进一点,真实的行业数据就是这样的,你要懂得怎么去解决。
第二,特意规避了一些字词。
你如果试图用关键字、关键词、关键短语来搜索问题的答案是找不到的,因为有很多问题的答案是跨行的,甚至是有顺序关系的。
这里面可能需要涉及到DCN这种网络,还有一些合作协同网络,还有dynamic memory network,微软的reason network等。
所以我们想看看这些选手在这种最新的领域里面,是不是能够很快地把新的paper转换成能够实验、尝试的模型。这实际上是一个很重要的考验。
第三、还有一些比较小的细节。我们考察的时候,其实也用了一套AI系统来评判。实际上在评判时,我们做了一些有意思的东西。
比如说我们会问,在葡萄酒的制造过程中,酸度到底多少是合适的。你的机器如果能理解葡萄酒制造工艺的过程的话,它真正的描述是,最好的情况下选择什么样的葡萄会合适,这个葡萄的甜度、酸度是百分之多少。
你读懂了以后,能回答这个问题,但是回答的时候,可能有百分比,比如说,给了80%的语料,或者是0.8,但是我们问的时候,问的是百分比是多少,那你如果能回答出是80%,可能就比0.8要好很多,当然0.8是可以得分的,但是如果你回答的是80%,而另外一个团队是0.8,我们的AI系统会判断你的答案会贴近我的答案的主题,所以会有这样的细节的考察。
但是这个没有第二个点那么有挑战,我觉得第二点是最难的,如何把attention的模型在12个小时内做出来,非常难,况且还是在数据不是那么好的情况下,你还得考虑数据信息的问题。
AI科技大本营:那针对第三点,我有一个问题,如果有一个选手的答案是79%,另外一个选手给的是0.8,那机器会判定谁的分更高?
宋煜:这其实是一个相关性的判定,这个问题特别好,老实说,我没有试过,我不知道,可能要看一下机器的相关性。
从相关性来说,应该是0.8的分会更高一些,因为数字上准确。毕竟机器判断相关性时,就是算了一个余弦距离,即你的答案和正确答案之间的余弦距离。毕竟8这个词出现了的话,要比7、9出现更靠近8这个答案。我可能是80%,和你写0.8,这两个的余弦距离要远大于79%的距离。
AI科技大本营:如果是79.9%和80.9%,那机器会判定哪一个?
宋煜:这个的确可能需要看一下,因为我觉得,从我们的角度来说,我们肯定会认为79.9%会更接近,但是那个有8,可能有的时候完全靠距离也会有一点问题。其实这带来另外一个比较有意思的问题,现在新的大赛、论文也在提,用一个模型解决多个问题,比如说图像、声音、理解放在一个模型上做。
就你刚才问的问题是,的确我们现在的评判标准不是一个模型能考量好几个不同的维度,可能更多的是内容的相关性,但是好一点的是,我们会有裁判辅助看,因为很有可能,出来的结果是0.98和0.97,因为我们最主要还是考量时间,谁抢答的速度最快。假设抢答的速度也相同的情况下,那裁判这时候会介入,看一下实际的答案的内容,由人来做最后的裁判。
AI科技大本营:在这一次比赛当中,人的决策和机器的判断,大概的占比是多少?
宋煜:人的决策会比较少,大部分都是机器判断,因为这个大赛的比赛规则是比较明确的,首先要快,我们会有一个相似度的门限,超过这个门限之上的答案,我们会认为它都是差不多的,在这种情况下,主要是看谁先抢到这个问题第一个能够回答出来。
这个有一点像真实的模拟,可能你的回答还没有另外一个人标准,但是如果抢答器按下去,你回答的时候,答案基本是正确的,实际上那个人已经没有机会再回答了,所以,其实是不会有机会能够真的说出一个更精确的答案的,而如果一个相对没有那么精确的答案,能够更早地被说来的话,实际上会被判定得分的。我们其实也是模拟智能抢答环节的过程。
所以,一旦超过门限以后,我们会以谁先到谁为主,但是如果没有超过这个门限,这个门限很大程度上就不需要人干预了,因为时间和门限这两个机器都能做。在一个很低的门限,我们知道在哪一个门限之下,这个答案就没有意义了,这个也是可以判断出来的,所以,机器也能判断这部分。
唯一比较模棱两可的是,在某两个门限区间之间,所谓机器的confidence也没有那么强的情况下,需要人的干预,而这个时候,我们会看谁的答案,从人的角度理解更靠谱一些,所以这个大概占比也就是30%左右,人可能就是30%左右的参与就可以了。
AI科技大本营:本次大赛总共比赛的时长是12个小时,在这么长的时间里,这20组选手都需要完成哪些既定的动作呢?
宋煜:说到既定的动作:
第一部分,你要能够训练出一个模型。
这是基本要求,你要能训练出一个模型,基本上就得分了,即使你不参加最后的抢答问题你也是能得分的。
第二部分,你要能够跟我们的抢答系统对接。
这个其实很简单,实际上你要做一个对接系统,这个对接系统主要是跟你的模型之间要有一个比较好的对接,如何高效起来。有选手说,那我是不是可以无限循环不停地发消息给你。可能大家会觉得,我用无限循环的方式我可以把别人拦住,因为毕竟是个消息队列嘛,我大胆地发,方式是不是可以这样。
实际上,因为我们是个抢答系统,所以你可以不停地发消息过来,但是我一定会以你新来的消息为准,而不是以最开始送上来的那个答案为准。这个时候你的时间戳,其实是晚于你可能最先提交的那个答案的。在时间戳这一点,这样去写你的一个inference(推理)系统是不划算的。
所以,选手们一定要想好我如何能够最有效地对接上这个问答系统。
首先,我的答案是准的。
然后,在我的答案出来之前,因为我们可能会给一分钟的评判时间,你可以多次提交,在一分钟之内你是可以反复提交的,20个队我不限制你,但是这个时候,答案靠不靠谱儿,要不要稍微调整一下排序的顺序以及我生成的一些thressold的,然后再次能够灵活地在不中断的情况下,送一个新的答案出来,这个是考验做接口设计的能力.
第三,设计思路的描述。
所有团队都会按照我们的一个问题模板,回答他们的设计思路。这里会有些加分项,我们希望能够追踪到一些我们认为比较好的技术,包括IBM正在实现的技术,甚至是现在一些比较前沿的paper提到的一些技术,是不是有人能够把它实现出来。
这种奖励机制是,即使你最后的问答系统得分没有那么高,但是你试图在实现这种新技术,我们也会给你有特定的加分。
而这就是通过第三部分你对设计思路的描述来体现的。基本上完成这三个步骤,就完成了整个比赛。
AI科技大本营:在比赛过程中,有哪个团队给你留下了深刻印象吗?
宋煜:在比赛开始时,我就发现有些团队有明确的分工,有人去做模型的事情,有人去做系统对接接口的事情,从工程化和项目管理上来说,这是非常重要的。这种团队胜出的机率会比较大。
有时候大家会觉得调整技术是最难点,可是一个团队怎么真正能够让他们团队的能力最大化,其实这个是很重要的。我看到有一两个团队就是这样子在做,还蛮不错的。
AI科技大本营:看来这是一个团体综合力量的比拼,而不是集中在某一个点上精兵突进?
宋煜:对。
AI科技大本营:这次比赛的选手中,不乏有研究生和博士,那现在从他们的表现来看,他们在校园里边学到的这些能力和知识,离企业的实际的需求到底有多远,因为我觉得今天的比赛还是比较贴近实际情况的一个呈现,具有一定的参考性?
宋煜:这个问题就不一定完全基于这次比赛了。
此前,我们已经做了两次黑客松了,都蛮成功的。从整体来看,这些毕业生的能力还是比较符合的,特别是数学系的博士生,特别是博士的话。你会发现他们在思考问题以及找寻一些新的方法的时候,会更有创造性一些,而且这种创造性对公司来说是最重要的。
有很多公司觉得招应届生,进来能干活就不错了。
但是我反而觉得,学生如果他真的很扎实学习过最基本的理论知识,那他来到公司以后,他的能力反而会更大化,甚至比老员工会更厉害、更优秀。因为,毕竟AI这个东西更多的还是数学,他通过数学解释一些本质性的问题。比如刚才我提到的attention模型,其实无外乎就是两个相关矩阵之间的乘积以后的一个结果。
那我们在IBM,产品化以及跟客户对接,项目管理都会很成熟。但是,如何用这些新的技术能够解决实际问题,反而是挑战的。
实际上我相信,应届生,包括前两次我们大赛里看到的其实就有很不错的选手,就很明显就是在根据自己需求改模型,我们给的数据的确是有些很特别的地方,比如第一次大赛的图像数据,那他会根据这个东西来适当地去改他的模型,使它性能更好,或者是准确率更高,这是功底。
更多还是看他们的这个数学功底能力到底有多强。
AI科技大本营:总结起来,数学在所有能力中国,占了一个非常重要的比例?
宋煜:非常重要。
AI科技大本营:如果把这次马拉松的比赛当做一次笔试,而您手上正好也有一些招聘名额,看到怎么样的团队,您会迫不及待抛出橄榄枝?
宋煜:如果是我的话,我可能会更看重模型的设计能力。
如果他只是把一个既有的模型用上或者实现出来了,可能不是特别吸引我。这次比赛拿到第一第二无所谓,但一般能有这种能力的,至少不会落到前三之后。
我会看重的是他的模型里有没有改过。不管他改的成功与否,我会很有兴趣跟他聊,问他为什么这样改,如果他想法很有意思的话,我可能第一时间会抛出橄榄枝。
我们现在团队里面有一个刚刚招进来的同事,今年6月份毕业的博士,他实际上就是参加第一季大赛第二名的团队,其实他们没有达到第一名,但是我觉得说实话,他们的模型比第一名做的更好,因为已经改了,完全是自己在修改模型,不仅仅是把一个最新的模型实现出来,或者是把一个很热的模型实现出来,或者用起来。
我们当天跟他就聊了,聊了以后第二天就开始,把他找到,然后就把他招进来了,大概四五月份的时候,那时候就把他定下来了,等毕业直接入职。
我们如果真的发现人才,不管公司现在的招聘策略是什么样,基本都会把他招进来,会尽到我们的最大努力把他招进来。
AI科技大本营:这个最大的努力在薪资方面的体现是多少呢?
宋煜:我觉得IBM在硬件的薪资上面还是有竞争力的。比如一个博士毕业,第一年应该三四十万吧。
AI科技大本营:咱们这个比赛是一年举行四次吗?
宋煜:对,这个比赛是今年才开始,应该是四个,每个季度做一次。明年会怎么样我不知道,但是今年是比较频繁了。
AI科技大本营:所以今年其实是启动年?
宋煜:启动年。
AI科技大本营:下一次比赛大概会是在12月份举行?
宋煜:对,应该是这样。
AI科技大本营:下次比赛大概的赛题会集中在哪个行业呢?
宋煜:这个现在还没有想好,因为我们每一次找每一个行业,我们第一次其实是金融。第二次也是金融,但是不一样的是,第一次是图象,第二次是语言模型。第三次是制造业,第四次,我们目前实话实说还没有想好,我们可能会看一下,什么样的领域会比较有挑战,主要是想看看什么领域比较有挑战。因为我们不太想做一个会跟大部分大赛都差不多,或者你拿着某些成果在这里也能拿到前几名,我们不希望做这样的大赛,我们希望真正能够挑战出一些不一样的东西。
AI科技大本营:基于这样一个考虑,这个大赛应该是市面上还没有出现的行业?
宋煜:可能不会说是完全没有出现的行业或者模型,但是至少不会是前三四的模型,一定是一个全新的模型,这个模型至少是2016年或者2017年TOP的paper里面肯定是出现的频率比较高的,解决相关的问题,但是我们反过来一定会找到他实际解决行业问题是怎么落地的,以这个点出发,反过来设计题目。
AI科技大本营:您提到两个关键词,一个是最热的paper里面提到的一些关键性的技术,第二个就是应用场景的落地?
宋煜:对。
AI科技大本营:把着这两个去设计下一届的赛题。现在可不可以请您给出几个建议,下一次参加这个比赛的选手,他们其实可以提前做一些怎么样的准备,比如说去研究研究行业的落地,多看一些这方面的行业落地方面的报道,还是说多关注一下最新论文的动态,还是说在比赛的时候提前做好分工,然后在比赛的时候提前吃好巧克力,保证一天的能量。
宋煜:做好准备。
AI科技大本营:对,所谓的建议或者经验之谈?
宋煜:其实从AI本身来说,首先我倒是建议追一下最新的paper,并且试图把它们实现出来。
其实这个也是IBM自己内部,至少在我这个团队里面他们在做的。基本上我们会有一个paper,除了我们自己要写paper以外,我们有一个很大的paper pool。我们的分类会比较多,比如说机器人领域的、自然语言处理的、图象领域、优化领域,还有一些其它的细节。
基本上我们每周都会有人来准备,然后分享给这个团队。其实我觉得在校的学生或者怎么样,大家其实不妨采取类似的方式去更新自己的知识。因为这个领域里头其实技术发展的太快,现在大量的培训、课程,包括一些免费的课程或者收费的课程,其实我觉得都太工程化了。一旦你学了一门课以后,你会发现剩下那些课对你的帮助都不会太大,而在这个领域真正能够帮助到大家的应该还是世界上这些大牛们的paper,真正能够启发大家思维,然后去做的。
说个有意思的事情,我们做了一个股指、期货,还有外汇的价格预测的一个信号模型。这个模型是叫好不叫做。因为这个东西并不能直接创造价值。大家都觉得还蛮有意思的,但是需要往下走一步。
但是往下走一步怎么走呢?其实所谓的以前量交易这种写Coding的方式其实是很多的,或者说有很多程序化的东西。
实际上如何用AI来解决,其实我们就是看其他的paper的时候,我们发现有一个叫多目标Deep Q Reinforce Network这么一个论文,它是解决多目标问题的。它其实解决的是机器人的问题,机器人做一件事情不是一个目标为准的,它可能有多个不同的衡量体系,这个就跟金融很像。
因为金融不可能只看一个retain rate或者一个夏普率,它还需要看回测情况,还需要其它的止损情况,它有很多不同的目标,然后共同决定一个策略模型。这个时候其实是完全不同领域的东西,但是拿过来我们来做这个模型就会觉得还蛮有意思的,一定是能成功的,至少这个放心是正确的。
所以我举这个例子的意思是说,不妨多看一些paper,这些paper也许不一定完全跟某一个行业领域直观相关,因为paper都是从数学的角度来抽象,但是反过来,你一旦有这种理解能力和你对行业的关注能力,你很容易把这个paper反向引导到,我再解决某一个实际问题的时候,我可以用什么样的方法来做,可能是是事半功倍的这样一个方法。
其次,我觉得动手也是需要很强的。很明显,刚才在底下的时候也是,不同的团队过来来测试这个系统的时候,有一些系统的知识,其实跟AI没有太大关系,但是很明显能够体现出这个团队的人平时动手能力强不强,有一些可能他的系统知识很足的时候,我们这个应答系统跟他的对接会很容易,包括一些权限问题,这种纯的工程化的事情,如果你动过手很容易,你要没动过手,对你来说就是一件很难事情。
我觉得选手如果想赢的话,一定要实实在在做过一些东西,不能只留在读paper和纸面上,我觉得这两块儿应该是个人建议比较重要。
第三、如果真的大家是组队来参加的话,我的建议是在比赛之前,其实不妨有一个好的分工。
因为一个团队协作,其实到了现场分工的话,其实效果会更好,特别是2Q的时候,我就看到有那种分工的,其实大家做到最后,而且真的是来自同一个公司。做到最后,有一个人不管了,你们不用我的模型我就不管了,整个团队明显士气一下就落下去了。
实际上谁做模型,怎么来做模型,大概怎么配合,其实是很重要的。因为一个模型训练好真,真的不是算法一件事情,也不是那个写Coding的能力有多强,它跟你的前置的数据处理,你的后面检查你的模型的方法都有很大的关系。
所以我的建议,大家如果是组团来参加比赛的话,一定要有一个明确的分工,知道每个人的角色是什么,这样的话在比赛的过程中就不会有冲突,减少不必要的冲突。
第四、睡个好觉。
因为比赛的强度其实挺高的,我建议至少头一天,一定要睡早一点,不然到这里,我看到有选手很困,中午会趴一下,其实那样子效率会低很多。
我觉得睡觉,睡眠是最重要的。我们昨天还在聊,要不要搞个24小时的。让大家能够打个地铺,因为现在的确有很多24小时的比,24小时因为时间会更多,可能出成果的可能性会更大一些,但是那个节奏强度会更高一些。
但是我觉得12个小时的强度其实就很大了,基本上大家不管平时上班还是怎么样,其实都不太会有这么高强度的。因为12个小时基本就是争分夺秒在做事情,不会有这么大的强度。所以我觉得休息是最重要的,我觉得这次在马可波罗的午餐还不错,所以大家能量应该是没问题。
第五、其实有一个建议,如果参加完这种介绍之后,一定反过来把这些介绍里面每一个点都要做一个准备,看看每一个点里面有多少种不同的方案。哪一种方法效率是最高的或者它可能够帮助你调整准确率的余量是最大的,都是你赛前值得准备的。
第六、还有一点,因为是IBM主办的,我们是以Power AI为基础的。所以大家也可以,因为Power AI现在可能越来越社区化了,其实power本身在社区化,open power的社区,所以大家不妨在这之前多去熟悉一下这套系统。
其实它从linux的角度来说没有任何区别,跟你平时用的linux都一样,但是当你要解决一些问题,你有一些自己特别的算法要重新编译的时候,可能它会对系统架构,如果你本身对以前的指令级有要求的话,那可能是要提前做一些准备的,我觉得这个是选手们可以去想的。
还有一点,我觉得值得大家去考虑的一个问题,我发现这几次比赛里面,使用Windows的人其实蛮多的,我倒不是说Windows不好,而是说毕竟在主流的领域里面,可能linux还是占主流,所以必要的linux的知识平时还是要去积累的。虽然Windows可视化各方面都会很方便,但是从技术本身来说,可能linux毕竟在这个领域里面还是占主导地位,所以或多或少还是要去熟悉这样一个套路,liiux的开发环境。
AI科技大本营:其实现在社会上各种各样的大赛越来越多了,前不久创新工场做了一个AI Charer,昨天知乎的算法大赛也公布了获奖结果。现在算法大赛越来越多,如果和这些大赛比起来,像咱们做的这个黑客松的大赛,在侧重点和价值上,跟这些有什么比较明显的区别,你也可以评价一下他们的侧重点是在哪里?
宋煜:我想广义的评论一下,刚才你举的这两个例子,稍微广义评论一下,因为可能单独针对某一个不太合适。
解决行业实际问题,这个是我们的大赛最注重的地方,如何能够让这个东西在实际的应用中体现它的价值,真正能够帮助到这个行业解决一个实际问题,这个是IBM的黑客松最核心的一点。
为什么不把东西放在算法这个领域,刚才我们说数据很重要、算法很重要。为什么不是放在这个地方呢?我觉得其实还是跟公司的风格有关系,如果比较IBM和微软或者其它的公司,他们在AI领域上的领先程度其实是各有千秋的,微软其实有很多很好的技术,IBM的沃森可能也会有一些技术。
但是我觉得这些都不重要,真正重要的是,IBM能够真正的,更快的落地。包括Google现在很多很好的算法paper特别特别多,AlphaGO也很厉害,但是这些东西怎么能够在实际的生产里面改变人的生活,其实我们并没有看到特别特别好的,鲜活的例子出来。
但是我觉得IBM可能瞄准的就是这个点,我觉得真正改变所有人日常的生活是IBM最看重的,也是这个大赛最重要的。
我们在解决实际问题的时候,我们真的把实际遇到的一些难点和痛点抛出来,让选手去解决,比如我说的,我们这次制造业的文档就是一个大问题。因为制造业数字化的文档相对还是量很小的,但是我们这次的话,很多文档都是PDF或者是影印的东西,直接转处理文字,所以它里面一定会有乱码,一定会有格式上的不统一,有些地方是回车,在计算机里面看到的是回车,但是实际上从文章的角度来说,它还是一个完整句子,其实不该被打断。
类似这种实实在在的问题,其实我们是把它抛出来,想看看选手们有没有办法解决。而大部分大赛可能都会把一个精细化很好的,很漂亮的训练数据集拿出来给选手,比的是最后的准确率,准确率很重要,模型也很重要。但是这种东西离最后能够落地还是有一段距离要走的。
我们更关注的是你有没有能力,除了把模型做好以外,还能把最后这短距离的差距弥补上,IBM的的黑客松所关注的点在这里。
AI科技大本营:最早为什么有办大赛的想法呢?初衷是什么呢?
宋煜:最早的初衷,我个人的理解,一个是AI现在越来越热,是一个比较新的技术,大家也觉得这个技术能够解决很多问题。
在这种情况下,IBM其实从去年开始就在推各种AI的技术,从硬件平台到软件平台,然后到一些实际的业务产品都有。在这种情况下,IBM是两个方面,一个是能够为power做一个推广,毕竟power和X86相比,它的市场份额是非常非常小的,在今天AI的世界里面。
实际上从性能或者各方面来说,是有一定优势的。如何让大家知道这个东西,我觉得是第一个出发点,是要推广这个。
第二个出发点,本身AI的技术在国内,我觉得是宣传的特别热和火的,大家也想看看,我们的水平到底在什么样一个level,跟我们自己的研究院比,跟我们自己的工程院比,当前高校和其它公司的水平到底到一个什么程度,大家解决实际问题的能力是什么样子。
第三,有点类似于以文会友的这种感觉,我们出一个比较难的题目,其实我们自己也试图在解决这种问题,我们可以看一看大家解决的结果是什么样,我们其实不光是想比赛,其实在比赛过程中我们也会看到,会比较多的跟团队去交流,互相学习到一些新的东西,有一个更好、更开放的社区来帮助所有的人,AI上面往前走一步,应该是这三个方向。
AI科技大本营:我能简单总结为六个字吗?一个是营销、第二个是摸底、第三个是圈人。
宋煜:可以,非常精准。
结语
第三季“PowerAI人工智能12小时编程马拉松大赛”活动已经成功落幕,让人感悟最大的一点是AI时代已经来临,大家已经激情满满开始拥抱AI,如果你没能参加大赛,没有体会到现场高涨的热情,那就和小编一起回顾下本次大赛的精彩瞬间吧!看看你有没有上榜呢?
第二十组专心讨论的伙伴们
咦,大家一起来看看,我发现了什么不明物种?
和妹子结对编程?
我站在大家中间,这么帅,你们忙着大赛都不看我,呜呜~~
现场捕捉一枚萌妹子
这个进度不错,我们有希望冲击一下第一名哦~~
本届大赛的颜值担当
太累了,我先休息会儿,等我满血复活!
来来来,大合照最后来一个
更多资讯请关注微信公众平台AI科技大本营(ID:rgznai100)