提示:原文链接为https://viso.ai/deep-learning/pytorch-vs-tensorflow/
例如:TensorFlow、Pytorch、Keras、Chainer、Paddle飞浆等。深度学习框架可提供神经网络单元、损失函数和优化器,用来帮助我们组装和训练神经网络模型。其中,TensorFlow、Pytorch是使用最广泛的深度学习框架,本文就这两个对比展开了论述。
Tensorflow是由谷歌支持的一个非常流行的机器学习端到端开源平台。目前最新的版本是2021年5月14日发布的2.5.0。
TensorFlow 2.0专注于简洁性和易用性,相对于1.x版本陡峭的学习曲线,2.0入门深度学习难度大大降低。取代了 Google 的 DistBelief 框架,并在几乎所有可用的执行平台(CPU、GPU、TPU、Mobile 等)上运行。TensorFlow 2.0的优势和缺点如下:
支持和库管理: TensorFlow 由 Google 提供支持,并经常发布新功能。它广泛用于生产环境。
开源: TensorFlow 是一个开源平台,可供广泛的用户使用并且非常受欢迎。
数据可视化: TensorFlow 提供了一个名为 TensorBoard 的工具来以图形方式可视化数据。它还允许轻松调试节点,减少查看整个代码的工作量,并有效地解析神经网络。
Keras 兼容性: TensorFlow 与 Keras 兼容,允许其用户编写一些高级功能部分并为 TensorFlow 提供系统特定的功能(流水线、估计器等)。
非常可扩展: TensorFlow 部署在每台机器上的特性允许其用户开发任何类型的系统。
兼容性: TensorFlow 与多种语言兼容,例如 C++、JavaScript、Python、C#、Ruby 和 Swift。这允许用户在他们舒适的环境中工作。
**架构支持:**由于工作模型的并行性,TensorFlow 被用作硬件加速库。它在 GPU 和 CPU 系统中使用不同的分配策略。TensorFlow 还有它的架构 TPU,它的计算速度比 GPU 和 CPU 快。因此,使用 TPU 构建的模型可以轻松地以更便宜的速度部署在云上,并以更快的速度执行。然而,TensorFlow 的架构 TPU 只允许执行模型,而不是训练它。
基准测试:计算速度是 TensorFlow 与竞争对手相比落后的地方。与其他框架相比,它的可用性较低。
符号循环: 虽然 TensorFlow 减少了代码长度并使用户更容易访问它,但它增加了其他用户使用的复杂性。每个代码都需要使用任何平台执行以获取其支持,这增加了执行的依赖性。
符号循环: TensorFlow 用于确定的序列,不能为不定序列提供符号循环。。
GPU 支持: TensorFlow 只有NVIDIA和 Python支持的GPU编程,因为在深度学习中存在其他语言的增长。
PyTorch 于 2016 年首次推出。在 PyTorch 之前,深度学习框架通常专注于速度或可用性,但不能同时关注两者。PyTorch能将对可用性的关注与对性能的仔细考虑相结合,它提供了一种命令式和 Python编程风格,支持将代码作为模型,使调试变得容易,并且与其他流行的科学计算库保持一致,同时保持高效并支持 GPU 等硬件加速器。
PyTorch 是一个 Python 库,它通过自动微分和 GPU 加速执行动态张量计算,同时保持与当前最快的深度学习库相当的性能。今天,它的大部分核心都是用 C++ 编写的,这也是 PyTorch 与其他框架相比可以实现低得多的开销的主要原因之一。
就目前和可预见的未来而言,随着它从测试版转向生产,PyTorch 似乎最适合大幅缩短特定用途的新神经网络的设计、训练和测试周期。因此,它在研究界变得非常流行。
多种流行的深度学习软件都建立在 PyTorch 之上,包括 Tesla Autopilot 或 Uber 的 Pyro。
PyTorch 基于 Python: PyTorch 以 Python 为中心或“pythonic”,旨在深度集成 Python 代码,而不是作为其他语言编写的库的接口。Python 是数据科学家使用的最流行的语言之一,也是用于构建机器学习模型和 ML 研究的最流行的语言之一。
更容易学习: 由于其语法类似于 Python 等传统编程语言,PyTorch 比其他深度学习框架更容易学习。
调试: 可以使用许多广泛使用的 Python 调试工具(例如 Python 的 pdb 和 ipdb 工具)之一来调试 PyTorch。
动态计算图: PyTorch 支持动态计算图,这意味着可以在运行时以编程方式更改网络行为。这使得优化模型变得更加容易,并为 PyTorch 提供了优于其他机器学习框架的主要优势,后者将神经网络视为静态对象。
**数据并行:**数据并行特性允许 PyTorch 在多个 CPU 或 GPU 内核之间分配计算工作。虽然这种并行性可以在其他机器学习工具中完成,但在 PyTorch 中要容易得多。
社区: PyTorch 有一个非常活跃的社区和论坛(discuss.pytorch.org)。它的文档(pytorch.org)非常有条理,对初学者很有帮助;它与 PyTorch 版本保持同步,并提供一组教程。PyTorch 使用起来非常简单,这也意味着开发人员的学习曲线相对较短。
**在生产中缺乏模型服务:**虽然这将在未来发生变化,但其他框架已更广泛地用于实际生产工作(即使 PyTorch 在研究社区中变得越来越流行)。因此,与其他框架相比,文档和开发人员社区更小。
**有限的监控和可视化接口:**虽然 TensorFlow 还带有用于构建模型图的功能强大的可视化工具 (TensorBoard),但 PyTorch 还没有这样的东西。因此,开发人员可以使用许多现有的 Python 数据可视化工具之一或从外部连接到 TensorBoard。
不如 TensorFlow 广泛: PyTorch 不是端到端的机器学习开发工具;实际应用程序的开发需要将 PyTorch 代码转换为另一个框架,例如 Caffe2,以将应用程序部署到服务器、工作站和移动设备。