基于开源产品的机器学习平台

规划了一个基于开源产品h2o的机器学习平台,基于租户模式,可以对委办局提供从构建模型到模型应用全流程的能力支撑。架构图如下:
基于开源产品的机器学习平台_第1张图片
其中,

  1. 平台基于H2O平台,支持多种数据来源,除了H2O平台的交互式建模界面,也支持Python、R等脚本语言构建模型;
  2. 平台分类算法模型开发和算法模型应用两大部分,其中,算法模型开发主要是H2O所提供的功能,包括数据导入、训练模型、验证模型等功能,但要在数据分析、数据标准化、模型发布等几个方面加强;
  3. 算法模型应用是新增的功能,主要是将构建好的模型应用于实际业务场景,包括两种形式,一是离线结果导出,比如,法人分群明细列表等;一是在线接口调用,比如,图像识别等。在算法模型应用功能中,也包含了模型的上下线管理、审批管理等功能。
  4. 安全管理部分包括数据权限和模型权限两类,一方面是使用的数据是授权数据,另一方面发布的模型要有范围;
  5. 平台对外提供的算法模型应该是具有业务用途的算法,比如,法人分类、车牌识别等。

你可能感兴趣的:(数据分析,机器学习)