TensorFlow 决策森林来啦!

TensorFlow 决策森林来啦!_第1张图片

发布人:Mathieu Guillame-Bert、Sebastian Bruch、Josh Gordon、Jan Pfeifer

我们很高兴开放 TensorFlow 决策森林 (TensorFlow Decision Forests,TF-DF) 源代码。TF-DF 是用于训练、解释并服务于决策森林模型(包括随机森林和梯度提升树)的最先进算法集,可用于生产环境。得益于 TensorFlow 和 Keras 的灵活性和可组合性,您现在可以将这些模型用于分类、回归和任务排序。 

图片

随机森林是一种主流的决策森林模型。在这个动图中,您可以看到决策森林中的树通过对结果投票的方式对示例进行分类

决策森林简介

决策森林是一类机器学习算法,其质量和速度堪比神经网络(并且通常优于神经网络),尤其是在处理表格式数据时。决策森林由多个决策树构成,因此易于使用和理解,并且现在还有大量的可解释性工具和技术供您使用。

TF-DF 为 TensorFlow 用户提供了这类模型以及整套量身定制的工具:

  • 初学者会发现开发和解释决策森林模型更为轻松。无需显式列出或预处理输入特征(因为决策森林可以自然处理数字属性和分类属性),无需指定架构(例如,相较于神经网络,无需通过尝试不同的层组合来指定架构),也无需担心模型发散。训练好模型后,您就可以直接对其进行绘制,或使用易于解释的统计数据对其分析。

  • 高级用户将从推理速度非常快的模型中受益(在多数情况下每个示例的推理时间为亚微秒级)。同时,该库为模型实验和研究提供了大量的可组合性。特别是,用户可以很轻松地将神经网络和决策森林结合起来。

如果您之前通过其他库使用决策森林,那么可以在此了解一下 TF-DF 的部分功能:

  • 它提供一系列最先进的决策森林训练和应用算法,例如随机森林、梯度提升树、CART、(Lambda)MART、DART、极端随机树、Greedy Global Growth、Oblique Tree、单边采样、分类集学习、随机分类学习、包外评估、特征重要性以及结构特征重要性。

  • 可连通丰富的 TensorFlow 生态系统,使您能够更轻松地将基于决策树的模型与各种 TensorFlow 工具、库以及 TFX 等平台集成。

  • 如果你还没有接触过神经网络,则可以通过决策森林轻松入门 TensorFlow,并以此为起点,继续深入探索神经网络。

代码示例

详尽的示例胜过千言万语。因此,在本文中,我们将为您展示使用 TensorFlow 决策森林训

你可能感兴趣的:(TensorFlow,tensorflow,机器学习)