tensorflow2.0概述

文章目录

  • 前言
  • tensorflow summary
    • 简介
    • 全景图
      • training 阶段
      • develpment部分
    • tensorflow扩展工具
    • tensorboard(模型训练驾驶舱)
    • XLA
    • 机器学习的工作全景

前言

通过这一节,了解tensorflow可以做什么,遇到一个问题能够判断tensorflow有什么现成的库,最后需要明白自己要学什么,不要一窝蜂地都学,那样没啥效果。我们要知道哪些内容需要理解并熟练掌握,哪些内容可以选择记忆,用到的时候再看这部分内容。

tensorflow summary

简介

tensorflow是一个非常全的,开源的,针对机器学习(不止是深度学习),**平台(具体怎么发挥取决你)**的软件包。

全景图

tensorflow2.0概述_第1张图片
上图是tf的全景,左边train部分包括distribution统一调度底层的硬件,tf.keras和estimators这两个高级api去搭建模型,这里还可以通过底层custm层自定义层(学术型的工作)。tensorflowhub里面有很多先进的算法实现,可以拿到本地去使用。read&preprocess data 是花费时间最多的地方,很多时候模型搭建写不了多少时间,大都在data处理上,因此这部分要掌握好。
右边是开发部分,serving是把训练好的model设置成后端api, lite部署到嵌入式,针对前向传播进行大量的编译优化,.js是面对前端网页的。此外还有其他语言的转换。
tf2.0 和1.0相比,它把高层api统一合并到keras,并删除了大量的冗余的api,降低学习难度。

training 阶段

tensorflow2.0概述_第2张图片
这是训练的流程,其中tf.data和feature colums用好的话可以大大降低在数据处理上花费时间,因此是整个训练部分最应该要熟练掌握的。 tensorboard可以对训练整个过程进行调控和监视。keras和estimators简单知道几个常用的就行,其他的用到时候可以查google,但是custom自定义层要熟练掌握。

develpment部分

把模型部署出来,略。

tensorflow扩展工具

tensorflow2.0概述_第3张图片
tensorboard:模型可视化工具,经常会用到

XLA:加速库

probability:自己加入先验知识,强加到模型中,也就是掌舵tf变化。

ragged tensor: 让tensor 变成可变长的tensor,常用在rnn中。

tensor2tenor: 加速dl的研究,将先进的模型放入进去。

privacy: 加密。

federated: 解决数据分散和数据不能共享问题,但是所有人基于共同的数据能够训练出来一个好的模型。有点像区块链。

rl :强化学习,但是不完善。

其他:也有很多其他的生态扩展包,用到时候可以查。

tensorboard(模型训练驾驶舱)

tensorflow2.0概述_第4张图片

XLA

工业中对模型的大小和运行进行优化,学术领域用不到。
tensorflow2.0概述_第5张图片

机器学习的工作全景

从下图可以看出,机器学习真正code只有中间很少的一部分,如果只钻到ML code很容易陷入一个技术瓶颈。大多数的时间会在data收集、验证、提取特征上。很多研究人员在ml code领域,虽然他们工作很少,但是整个流程都是围绕他运行的。因此要对ML code有正面评价,但是还要有负面评价。如果在大公司一个人只做其中的一个小方向,好处是能够做到精尖的水平,但是小公司就要全做了,这样能锻炼水平但是我觉得增值慢。没有精尖增值快。
tensorflow2.0概述_第6张图片

你可能感兴趣的:(其他,AI+Python)