NTCore:机器学习开发与部署管理平台

NTCore:机器学习开发与部署管理平台_第1张图片

01背景介绍

人工智能和机器学习得到越来越广泛的应用,但对于绝大多数企业而言,超过80%的机器学习模型并不能投入到实际应用中。机器学习模型的实际应用面临着以下几个主要挑战:

  • 数据科学家与软件工程师对于开发环境有着不同的需求,模型训练与软件开发存在着壁垒,而企业通常缺乏能将模型直接投入生产的机器学习系统。

  • 业务需求将决定模型的开发方向。机器学习模型的成功部署离不开大规模的模型训练,并需要对从数据处理到模型迭代进行版本控制,保证模型的实时性与持续交付,以此应对快速变更的业务需求。然而企业往往缺乏能规模化进行模型训练的工具。

  • 投入生产后的模型需要持续的模型监控,以保证模型的输出结果符合业务需求。如果模型输出出现偏离现象但缺乏及时的报错系统,将导致机器学习模型的失败。

为了解决上述难题,南图科技团队开发了NTCore。NTCore是一个开源的机器学习开发与运维(MLOps)平台,旨在帮助用户开发、测试模型,控制模型版本,部署模型以及监控模型。NTCore为机器学习和数据科学团队提供了完整的开发体验,可以大大减少模型从研发到落地需要的时间和成本。

02主要功能 

NTCore开源版本提供了四个关键功能,包括:开发IDE,模型训练,模型版本控制和模型部署。

开发IDE

NTCore平台利用Jupyter Notebook和Theia Python提供无缝的开发体验, 支持多种框架和语言。富文本开发环境并让模型开发工作更透明,易理解,可重复和可共享。

  • 模型训练

机器学习项目需要不同模型之间的多次训练,比一般的软件开发项目需要更多的分支管理和训练次数。NTCore平台记录所有模型训练,进行数据对比并获得最佳的训练结果。

  • 版本控制

NTCore平台提供了类似git的版本控制功能,用户可以快速进行实验和迭代,追踪储存所有的模型版本,并对重要参数进行对比。

  • 模型部署

在整个机器学习开发流程中,模型部署可能是最困难但也是最关键的操作。NTCore提供一键生成模型API,可帮助用户轻松部署模型到各种目标环境。

用户界面:

NTCore:机器学习开发与部署管理平台_第2张图片

NTCore:机器学习开发与部署管理平台_第3张图片

NTCore:机器学习开发与部署管理平台_第4张图片

NTCore企业版本除了上述功能外,还支持规模化模型开发,灵活性模型部署等企业级功能:

  • 支持多语言(Python, R),更多模型训练框架

  • 支持公有云,私有云或本地服务器部署

  • 多用户分工合作,数据共享与权限管理

  • 个性化的模型管理与运维监控

  • GPU算力支持

  • 模型数据库管理与技术支持

03产品Roadmap 

目前NTCore开源实现了对sklearn的框架进行自动化版本控制,一键部署模型API等关键功能。在未来的几个月,南图科技团队将对NTCore开放更多的开源功能。

  • 支持TensorFlow

  • 支持PyTorch

  • 支持XGBoost

  • Kubernetes部署

  • AWS部署

  • 阿里云部署

  • 腾讯云部署

南图核心团队来自于北美顶尖科技和金融企业,具有十多年机器学习模型开发与软件开发经验。我们深知模型开发与部署的痛点,并专注于帮助数据科学团队提高研发与部署成功率,降低技术运营成本。欢迎开源社区更多志同道合的朋友加入我们!

相关链接

NTCore Github 地址:https://github.com/nantutech/ntcore

快速入门指南:https://nantutech.github.io/ntcore-doc/#/zh-cn/

南图官网:https://nantu.io

你可能感兴趣的:(运维,python,人工智能,机器学习)