一个模型库学习所有:谷歌开源模块化深度学习系统Tensor2Tensor丨数据工匠简报(Jun. 26)

一个模型库学习所有:谷歌开源模块化深度学习系统Tensor2Tensor


在谷歌提交热点论文《Attention Is All You Need》和《One Model To Learn Them All》不久之后,这家公司很快就发布了最新研究的模型和训练集。昨天,谷歌发布了一个名为 Tensor2Tensor(T2T)的 TensorFlow 开源系统,希望能够以此提高机器学习社区的研究和开发速度,其中包含了谷歌近期提出的多个最新模型。此外,T2T 将深度学习所需的各个组件以模块化呈现,这意味着开发者和研究人员能够更快地实现自己的新想法。

深度学习(DL)在很多技术领域中都已获得广泛应用,包括机器翻译、语音识别和物体识别等。在研究社区中,人们可以找到各类研究作者开源的代码,复制他们的结果,进一步发展深度学习。但这些深度学习系统大多为特定的任务进行了专门的设置,只适用于特定的问题和架构,这意味着人们难以开展新的实验并比较结果。

一个模型库学习所有:谷歌开源模块化深度学习系统Tensor2Tensor丨数据工匠简报(Jun. 26)_第1张图片

Kaggle是建模比赛,不算数据产业实践

一个模型库学习所有:谷歌开源模块化深度学习系统Tensor2Tensor丨数据工匠简报(Jun. 26)_第2张图片

最近跟一些高校老师同学沟通,大家都非常认可一个理念,就是:数据科学的教育,必须非常强调注重相关的产业实践。

但是,怎样才能把“数据产业实践”带入数据科学的教育,却没有统一的认识。其中有一种看法就是:参加Kaggle这样的数据建模比赛就可以了。对于这样的看法,熊大不认同。

毋庸置疑,Kaggle是一个非常优秀的平台,组织的赛事备受全球数据科学爱好者追捧。国内也不乏有类似的模仿者。这都是值得称许的努力,对数据科学的普及教育帮助很多。但是,这不是数据产业实践!

一个模型库学习所有:谷歌开源模块化深度学习系统Tensor2Tensor丨数据工匠简报(Jun. 26)_第3张图片

柯洁首战负于 AlphaGo,但胜负其实早已没有悬念

一个模型库学习所有:谷歌开源模块化深度学习系统Tensor2Tensor丨数据工匠简报(Jun. 26)_第4张图片

深度学习的概念已经非常火,并广泛应用在计算机视觉、计算机图形学等人工智能方向中。深度学习极大推动了人工智能的发展,当前无论科研界还是企业界,都在发力深度学习的研究和应用;谷歌大脑、百度的IDL、腾讯的AI lab等都在布局人工智能,花重金招兵买马。

深度学习,作为机器学习的一个特定分支,为什么在诸多应用领域中的表现,远超传统的机器学习方法?它的原理或本质到底是什么?深度学习的概念于2006年提出至今,大量的深度学习模型被改进和优化。但遗憾的是,至今没有一套严谨科学的课程体系适合本科生或者研究生入门,专注于前沿科技的在线教育平台—深蓝学院近期正式推出《深度学习:从理论到实践》在线直播课程。此次课程的讲师团队成员均为中国科学院自动化所博士(2017年,中科院自动化所成为大陆地区唯一一家在人工智能领域发表超500篇论文的单位,被评为全国人工智能研究Top 1的机构)。

一个模型库学习所有:谷歌开源模块化深度学习系统Tensor2Tensor丨数据工匠简报(Jun. 26)_第5张图片

更多课程和文章尽在微信号:「datartisan数据工匠」

一个模型库学习所有:谷歌开源模块化深度学习系统Tensor2Tensor丨数据工匠简报(Jun. 26)_第6张图片

你可能感兴趣的:(一个模型库学习所有:谷歌开源模块化深度学习系统Tensor2Tensor丨数据工匠简报(Jun. 26))