这个Kaggle三项排行榜的“顶级大师”,今年17岁

这个Kaggle三项排行榜的“顶级大师”,今年17岁_第1张图片

编译整理 | 费棋

编辑 | 阿司匹林

出品 | AI科技大本营


Kaggle,这是个坐拥 100 万会员的数据建模和数据分析竞赛平台,目前已被 Google 收购。企业和研究者可在这个平台上发布数据,而统计学者和数据挖掘专家则可以进行竞赛以得到最好的模型。


最近,该平台再次成就了一位名叫 Mikel Bober-Irizar 的少年——刷新了他在 Competitions 中的排名,第 31 位,晋级为最高级的 Grandmaster(其他等级依次为 Masters, Experts, Contributors, Novices),达到这一级别的在全球范围内共有 122 人。更让人津津乐道的是,他是个年仅 17 岁的英国高中生。


去年 8 月,Mikel 就成为了 Kaggle 的 Competitions, Kernels 和 Discussion 三项排行榜中首位达到 Master 级别的会员,而且在 Kernels 和 Discussion 中的排名位列前 10 。


凭借其在 Kaggle 社区中的表现,Mikel 甚至成为了 AI 社区中一颗冉冉升起的新星。


这个Kaggle三项排行榜的“顶级大师”,今年17岁_第2张图片


在其主页上,他的简介是对机器学习、硬件、虚拟现实、网络和加密货币感兴趣,喜欢打破常规。


在过去几年里,Mikel 花了很多时间在互联网上研究在机器学习和人工智能方面的编程技能,几乎完全属于自学成才。


说起他怎么解决学习面临的困难,Mikel 称只通过 Google 搜索来尝试寻找解决问题的方案,即便网上有很多免费课程,但他也没有通过参加课程进行系统学习。当他在网上了解到 Kaggle 后,他想的是为什么不试试呢?


不过 Mikel 并没有将他全部精力投入到 Kaggle 上,他只将自己描述为“决策树拥抱者,喜欢数据,喜欢挑战。”


在比赛中“打怪升级”


短期内历经各种比赛的磨砺后,Mikel 在 Kaggle 中的排名越来越高。在 2016 年 11 月的博世生产线性能挑战赛中,他们的 4 人团队在 1373 支参赛队伍中排名第 5。他们通过使用生产线上 200 万件产品和 5000 个传感器的数据构建了一种算法,以预测博世工厂的产品中存在的故障。


他们的解决方案是使用复杂的特征工程来捕获高维度训练数据中的模式,并在大型的 XGBoost 模型集合中使用,最终获得了 0.51173 的分数。


而在 2016 年 7 月,他们的团队在 Avito 重复广告检测比赛中与 548 个团队竞争获得了第 2 名。他们尝试构建了一个模型,通过大规模执行文本挖掘和图像处理,可以准确地检测同一产品的重复广告。他们的模型还广泛使用深度神经网络和梯度增强来实现这一结果。最终,他们的模型得分为 95.3%,而 Avito 的内部基线为 90.4%。


2017 年,他帮助创建了一种使用计算机视觉技术分析 800 万个 YouTube 视频以创建准确标签的算法。他的队伍在 650 支队伍中排名第 7,这引起了 Google 的注意。


该项目的目标是使用 AI 和机器学习来扫描 YouTube 视频,并确定将标签放在对应的视频上。这是一个非常具有挑战性的计算机视觉技术问题,因为这需要了解视频和上下文中的内容以选择正确的标签。这种标记方式在照片上就很难(如 Google 和 Facebook 所做的那样),不过由于缺乏用来训练 AI 的公共数据集,视频面临的是一个更大的挑战。


Mikel 的团队则编写了自己的神经网络,通过已提供的一套训练视频来训练算法,然后可以应用在新视频上。当然,由于涉及到大量的计算(数据集本身有 8TB),这也算是他们遇到的一个挑战。


想从事 AI 行业


Mikel 很想继续从事人工智能行业,但他首先需要从高中毕业。不过,他在高中时期的实习履历,无疑会对他以后的发展大有裨益。


在 2016 年 9 月 – 2017 年 6 月 (10 个月),他被 Udacity 选中参加自动驾驶汽车车工程师 Nanodegree 的学员(11,000 名申请者中共有 500 名),并成为该课程的 5 名学生领袖之一。


2017 年 7 月 – 2017 年 7 月,参与了 Voyage 自动驾驶汽车中部署的各种硬件和软件项目。


2017 年 9 月 – 2018 年 7 月 (11 个月),担任 EduNow 这家创业公司的技术总监,从头开始帮助构建 EduNow 平台,专注于后端和服务器开发。


现在,Mikel 正在剑桥的三菱电机研究实验室进行为期三个月的实习,研究方向是图像合成和表示学习。


他的目标是考上麻省理工学院、加州大学伯克利分校或者剑桥大学。而且他有自知之明,尽管知道自己在 AI 研究中的天赋,但现在仍然有很多知识盲区。


“我不知道算法背后的数学知识,就实际使用它而言,我认为对它的运作方式找到一个合理的解释很重要。即使我不能从头开始写,也能知道它做了什么,这有助于我理解它可能存在的其他价值。”


相关链接:


https://mashable.com/2017/07/28/16-year-old-ai-genius/#QprEihGNliqL


https://www.linkedin.com/in/mikel-bober-irizar-a46b7230


——完——



招聘

AI科技大本营现招聘内容运营实习生,有意者请将简历投至:[email protected],期待你的加入!


工作要求:


  • 熟练使用微信、今日头条等平台发布文章,并负责其他对外推广渠道的内容铺建,用户管理以及互动;

  • 追踪AI领域动态,协助AI内容生产;

  • 能保证每周三天的工作时间。


工作地点:

北京市朝阳区酒仙桥路10号院恒通商务园仙桥路10号院恒通商务园


640?wx_fmt=gif

AI科技大本营在线公开课第15期

机器学习专场

时间:9月6日 20:00-21:00

形式:线上直播+社群答疑

添加小助手微信csdnai,备注:机器学习

邀你加入课程交流群,即有机会获得定制T恤或者技术书籍


这个Kaggle三项排行榜的“顶级大师”,今年17岁_第3张图片

你可能感兴趣的:(这个Kaggle三项排行榜的“顶级大师”,今年17岁)