开源免费!谷歌用于训练AI模型的强化学习框架!

强化学习 - 一种人工智能(AI)技术,使用奖励(或惩罚)来驱动代理人朝着特定目标前进 - 训练打败Alpha Go世界冠军的系统并掌握Valve的Dota 2.它是Google子公司的核心部分 DeepMind的深度Q-network(DQN),可以在多个工作人员中分配学习,例如,在Atari 2600游戏中实现“超人”性能。 麻烦的是,强化学习框架需要时间来掌握一个目标,往往不太灵活的,而且不是很稳定。

开源免费!谷歌用于训练AI模型的强化学习框架!_第1张图片

 

这也就是谷歌提出替代方案的原因:基于TensorFlow的开源强化框架,它是一个机器学习库。 目前,它已经上线Github。

开源免费!谷歌用于训练AI模型的强化学习框架!_第2张图片

 

“受到大脑中奖励动机行为的主要成分之一的启发,并反映了神经科学与强化学习研究之间强烈的历史联系,该平台旨在实现可以推动激进发现的那种投机性研究,”Pablo Samuel Castro和 Google Brain Team的研究人员Marc G. Bellemare在一篇博文中写道。 “这个版本还包括一组阐明如何使用我们框架的colabs。”

他们和Google Brain团队开发了强化框架,其中考虑了三个原则:灵活性,稳定性和可重复性。

为此,它包括一套精心编写的代码(15个Python文件),专注于街机学习环境 - 一个用视频游戏评估AI技术的平台 - 以及四种不同的机器学习模型:上述DQN;C51; Rainbow代理的简化版本; 和隐式分位数网络。 为了重现性,代码在Arcade学习环境支持的60个游戏中提供完整的测试覆盖率和训练数据(采用JSON和Python pickle格式),并遵循标准化经验评估结果的最佳实践。

开源免费!谷歌用于训练AI模型的强化学习框架!_第3张图片

 

除了增强框架的发布,谷歌还推出了一个网站,允许开发人员快速可视化多个代理的培训运行。 它还提供经过训练的模型,原始统计日志和TensorFlow事件文件,用于TensorBoard绘图,TensorBoard是Mountain View公司的TensorFlow程序可视化工具套件。

“我们的希望是,我们的框架的灵活性和易用性将使研究人员能够尝试新的思想,包括增量和激进,”Bellemare和Castro写道。 “我们已经积极地将它用于我们的研究,发现它使我们能够灵活地快速迭代许多想法。 我们很高兴看到社区可以帮助做些更伟大的事。“

开源免费!谷歌用于训练AI模型的强化学习框架!_第4张图片

 

鉴于TensorFlow目前这么流行,想要学习和实践的程序员们也可以了解下谷歌最近的AI开源项目——AIY Projects。AIY 全称是 Artificial Intelligence Yourself,顾名思义就是利用 AI 来进行的 DIY 功能套件。谷歌目前为 AIY Projects 推出了两款硬件--AIY Voice Kit 和 AIY Vision Kit。其中, Vision Kit(视觉套件)附带的软件可运行三个基于TensorFlow的神经网络,可以处理图像识别和计算机视觉, 支持离线识别上千种常见物体(动物、植物)以及人脸、面部表情等。

开源免费!谷歌用于训练AI模型的强化学习框架!_第5张图片

 

谷歌为此还发布了一个TensorFlow.js的工具,有了这项工具,即使不是机器视觉领域的专家,大家也可以实现很多应用场景,比如在浏览器中训练自己的宠物脸辨识系统,在自家的监视系统中使用等等。

你可能感兴趣的:(人工智能)