大赛官方网址:http://bss.csdn.net/m/topic/poweraiQ4
赛前培训地址:http://edu.csdn.net/huiyiCourse/detail/629
**大赛交流QQ群:**377825425
如今人工智能与传统行业的结合备受瞩目,尤其是医疗行业,而医疗影像则被认为是AI与传统医疗结合过程中最先有可能实现商业化落地的领域之一。
据了解,目前在医疗领域还存在很严重的资源不均衡,患者在患病后还是习惯第一时间去三甲医院就诊。但也正是因为这样的原因,导致影像科医生特有的工作环境和工作压力,并呈现持续增长的状态,渐渐我们发现医疗大数据中有超过80%的数据来自于医疗影像,大量的影像数据读取客观要求更为高效、准确的技术手段,而人工智能恰好可以满足要求,可见医学影像与AI 相结合势在必行!
为解决医疗影像的行业痛点,12月16日,IBM PowerAI人工智能线下马拉松编程大赛终极对决即将在北京拉开序幕。
本届大赛由CSDN与IBM联合发起,主要通过医工结合,运用深度学习、大数据驱动的方式,实现精准的X光胸片影像分析及目标定位。
具体来说,就是通过计算机视觉和大数据、深度学习的结合,将积累的医学数据转化为可用的模型,利用图像处理和机器学习算法对图像进行分析,检测异常部分;同时利用AI技术克服不同操作人员之间的主观差异,减轻人工处理的工作量,让计算机在精确度和速度上帮助医生提高诊断效率。
该项比赛结合大量真实影像数据,将人工智能技术应用到肺部X光胸片的病理检测和目标定位,将大赛成果转化于临床,辅助医生对疾病进行更加精准的诊断与筛查,实现疾病早期发现、早期干预,更有效减轻病人肺部损害,具有指导性的现实意义。
此外,大赛设置了四类奖项,并分别贯与称号。一等奖1名(数据科学家),奖金为10,000RMB/团队;二等奖2名(最佳分析师),奖金8,000 RMB/团队;三等奖3名(挖掘精英),奖金5,000 RMB/团队;鼓励奖,到场参赛即可获得50元京东卡,参赛且提交作者可获得100元京东卡。
作为既创新又落地的比赛,主办方特别邀请了重量级业界以及行业嘉宾组成强大的评审阵容,同时参赛选手有机会与诸位大咖面对的面接触,更有可能结识更优秀的团队来拓宽眼界,增长技术知识,据小编了解这次比赛现场全程配有视频直播,更令人期待!
说到底,最最重要的一点,怎样才可以去参加这样一场“打造医生的火眼金睛”的比赛呢?
本以为这次比赛和同类型的技术编程比赛在流程上大体无异,主要分为报名、集训、现场编程、提交作品、评审颁奖这几个基本环节,但细心的小编后来发现,在流程中主办方特别加入了赛前集训的环节,作为参赛选手硬性被要求参加的部分,也是为了能够在赛前充分了解赛题需要并做到答疑解惑。
这一点,不得不说主办方很悉心。
需要说明的一点,大赛对普通团队的选手身份没有特别的要求,这种普适性很赞,还比较细致地将参赛机构和人群进行了分类,用来保证医疗以及相关行业的参赛占比不少于总数一半。
其中,企业方面,医疗行业人工智能从业者与创业者都可以参与其中;高校方,无论是计算机视觉、图像处理与医学影像研究背景的教授、研究员,还是想从事医学影像分析的学生都鼓励参与。
此外,因为这场比赛有关医疗,当然也十分鼓励医院影像科、放射科、病理科的主任医师们以及信息中心主任们加大参与力度,同时为了保证参赛选手的多样性,主办方也希望CFDA等医疗相关监管机构的从业者为这次活动添砖加瓦。
打算参赛的选手请注意!
除了注意参赛选手的基本构成外,参赛者可以通过个人或团队形式参与比赛,但小编友情提示,最好是团队形式,建议每个组 3-5个人;需要自行携带笔记本电脑,更具挑战性的一点就是比赛12小时内需要现场编写程序代码,听起来很激动人心!此外参赛选手还必须基于大赛组委会提供的统一训练样本数据进行分类。
同时,组委会会相应为参赛者准备免费的开发环境,ML/DL的架构和库以及在比赛现场可免费使用的训练样本数据。
关于赛题,我们还需要知道些什么呢?
本次比赛希望通过利用半监督的训练方法从有标注和无标注的图像数据中训练出一个模型,这个模型可以准确地对图像数据中可能产生病变的位置进行自动侦测标注(detection)。
在没有足够量的位置标注(Bounding Box,但是有类别标注)的图片的前提下,如何结合数量不多的已标注的图片来进行半监督的训练,这是一个需要考察的方面,难点在于如何利用好所有的数据资源来提高传统的目标检测模型的准确度。
主办方表示,选手会在现场得到大赛组委会分发的医疗影像训练数据,其中包括图片和标签文件。标签文件为标准描述文件ImageNet和PascalVOC格式。
此外,比赛数据在比赛最后一小时提供,选手需要提交两个模型以及对模型的说明:第一个模型需要根据训练数据训练出一个多标签图像分类模型(Multi-label Classification);第二个模型需要根据训练数据训练出一个目标检测模型,类别同第一个模型,该模型需要能标记出目标位置(bbox)。
数据类别分类约为 8-14 类,具体数量以现场得到数据量为准。大赛鼓励选手发挥创意来解决标注数据不足的问题,对于特别有创意的实现方式会有附加分奖励。
说到附加分、奖励这些,本次大赛如何锁定优胜者或者优胜团队呢?小编来扒一扒评分标准吧!
1、成功完成两个模型的的团队给予基础分20分。
2、多标签分类模型准确率在前三名的团队分别给予加分,分别是第一名10分,第二名3分,第三名1分,其余团队不得分,正确率在正负2%以内的可以记为并列名次。
3、多标签分类模型正确率达到75%以上的按照运行时间从短到长取前三名给予性能分奖励:第一名10分,第二名5分,第三名3分。其余队伍不得分。未达到 75%以上准确率的队伍该轮都不得分。
4、第二组目标检测模型根据正确率评分标准 (mAP)给予加分40分。 分为6档, 档位为95%以上正确率40分, 89%以上30分, 82%以上20分, 75%以上15分, 65%以上10分, 其他0分。
5、目标检测模型正确率达到 75%以上的按照的按照运行时间从短到长取前三名给予性能分奖励:第一名10分,第二名5分,第三名3分。其余队伍不得分。
6、根据选手实现的模型新颖性,裁判会给出0-10分的附加分。
关于参赛的一些注意事项,通过与主办方沟通,小编暖心给予提示,参赛选手看过来!
首先,参赛者可以通过Caffe、Tensorflow、Torch and Theano进行模型训练,鼓励发挥GPU on Powe硬件特性;但是要求参赛者编写神经网络模型实现考题需求。
其次,参赛者可以修改Caffe,Torch, Theano或者Tensorflow源代码,需要注意的一点,必须在修改后提供代码修改说明来确定没有违规的部分。
此外,参赛者还可以使用github上开源的不同发行版的Caffe、Torch、Theano或者 Tensorflow,但是必须自己解决在Power上的依赖和编译问题。
最后一点,赛程当天环境只提供基于Python 2.7版本的深度学习框架。如需 Python 3版本的框架需自行设置;任何使用模式识别方式或通过编程方式直接识别物体或判断bbox都视为违规的。
小编先说这么多,想感受12小时现场PO 代码的酸爽吗?想近距离见识大咖评委的妙语连珠吗?方法只有一个!只有快来报名啦!