什么是MicrosoftML?

MicrosoftML为R和Python功能添加了最先进的数据转换,机器学习算法和预先训练的模型。MicrosoftML提供的数据转换允许您在管道中组成一组自定义变换,这些变换在训练或测试之前应用于您的数据。这些转换的主要目的是允许您格式化数据。

MicrosoftML功能通过随机器学习服务器,Microsoft R客户端和SQL Server机器学习服务一起安装的MicrosoftML包提供。

功能提供快速且可扩展的机器学习算法,使您能够处理常见的机器学习任务,例如分类,回归和异常检测。这些高性能算法是多线程的,其中一些在磁盘上执行,因此它们可以在单个节点上扩展到100个GB。它们特别适用于处理大量文本数据或高维分类数据。它使您能够在Windows或Linux计算机或Azure HDInsight(Hadoop / Spark)群集上本地运行这些功能。

还可以使用MicrosoftML安装和部署用于情绪分析和图像特征的预训练模型。有关预先训练模型和样本的详细信息,请参阅R个采样的MicrosoftML和Python的样品MicrosoftML。

将算法与机器学习任务相匹配

将数据转换和机器学习算法匹配到适当的数据科学任务是设计成功的智能应用程序的关键。

机器学习任务

MicrosoftML包实现,可以执行各种机器学习算法的任务:

  • 二进制分类:学习预测数据实例属于哪两类的算法。这些提供了监督学习,其中分类算法的输入是一组标记的示例。每个示例表示为特征向量,并且每个标签是值为0或1的整数。二进制分类算法的输出是分类器,其可以用于预测新的未标记实例的标签。
  • 多类分类:学习预测数据实例类别的算法。这些提供了监督学习,其中分类算法的输入是一组标记的示例。每个示例表示为特征向量,并且每个标签是0到k-1之间的整数,其中k是类的数量。分类算法的输出是分类器,可用于预测新的未标记实例的标签。
  • 回归:学习从一组相关的自变量中预测因变量值的算法。回归算法对此关系进行建模,以确定因变量的典型值如何随着自变量的值变化而变化。这些提供了监督学习,其中回归算法的输入是具有已知值的因变量的一组示例。回归算法的输出是一个函数,可用于预测其因变量未知的新数据实例的值。
  • 异常检测:识别不属于某个目标类或符合预期模式的异常值的算法。一类异常检测是一种无监督学习,因为输入数据仅包含来自目标类的数据,并且不包含要学习的异常实例。

机器学习算法

下表总结了MicrosoftML算法,它们支持的任务,可伸缩性以及列出了一些示例应用程序。

什么是MicrosoftML?_第1张图片
image.png

数据转换

MicrosoftML还提供转换以帮助定制数据以进行机器学习。它们用于清理,争吵,训练和评分数据。有关转换的说明,请参阅机器学习R转换和机器学习Python转换参考文档。

你可能感兴趣的:(什么是MicrosoftML?)