IBM Watson Machine Learning Accelerator 加速深度学习和大规模、高分辨率的图像处理

IBM Watson Machine Learning Accelerator

加速深度学习工作负载。利用 AI 模型训练和推理,加快实现价值。

为何要在数据和 AI 平台上进行深度学习?

随着人类在计算、算法和数据访问上不断取得进步,企业正在更广泛地采用深度学习,通过语音识别、自然语言处理和图像分类来提取和深化洞察。深度学习可以大规模地解释文本、图像、音频和视频,为推荐引擎、情感分析、财务风险建模和异常检测生成相关模式。

由于训练神经网络时会用到多个数据层和大量的数据,因此就需要很高的计算能力来处理神经网络。此外,企业还在努力展示在数据孤岛中开展的深度学习试验的结果。IBM Watson® Machine Learning Accelerator 是 IBM Cloud Pak® for Data 上 IBM Watson Studio 中的一项深度学习功能,它可帮助企业:

  • 跨任何云动态扩展计算、人员和应用。
  • 以透明的可见方式管理和统一大型数据集与模型。
  • 利用从边缘到混合云的实时数据不断调整模型。
  • 通过更快的训练和推理来优化云和 AI 投资。

优势
加快取得深度学习成果
加快从初始原型到企业级模型的模型构建速度。缩短训练时间,精准地部署深度学习工作负载。

深化 AI 支持的洞察和预测能力
利用集成了数据和 AI 服务的信息架构。在容器化的混合云基础上推动应用的深度学习模型。

简化 AI 和云投资
随时随地联合数据和模型部署。共享并优化根据工作负载需求调整的 GPU 和 CPU 分配情况。

扩大使用范围并提高模型的准确性
加速大规模、高分辨率的图像处理。通过自动缩放提高吞吐量和可用性并减少延迟。

提升系统使用率和灾备能力
通过多租户技术促进跨业务部门和跨企业的使用。通过灵活的分布式训练和推理最大限度利用 GPU 资源。

管理和保护关键业务型 AI 工作负载
从数据准备到模型部署,全程提高透明度和可见性。您还可以降低合规、法律、安全和声誉风险。

用途

  • 用于疾病诊断、公共安全和社交媒体的图像分类
  • 用于呼叫中心管理、移动应用和自动化转录的语音转文本识别
  • 用于异常和欺诈检测、自动化文档验证和网络安全的光学字符识别 (OCR)
  • 用于法规遵从、信用评估和投资组合管理的金融风险建模
  • 用于情感分析、语气分析和品牌监控的自然语言处理 用于行为预测、定制优惠和后续最佳措施的推荐引擎
  • 用于公共安全、防盗、工人安全和库存管理的视频分析

主要特性

  • 快速构建原型并部署
    使用共享计算资源池随时随地启动数据科学项目。缩短训练时间,产生更高质量的模型。通过对批处理、流式传输和交互式部署的 API 支持,横向扩展企业级训练和推理服务。

  • 端到端信息架构
    在支持流行框架的数据和 AI 服务中部署深度学习。在统一管理的环境中整合开源工具和第三方工具。

  • 容器化基础架构管理
    在 Red Hat® OpenShift® 中以本机方式运行机器学习和深度学习模型。在防火墙内部部署容器化模型,同时在本地保存数据并保持云可移植性。

  • 高分辨率、大型模型支持
    增加可用于深度学习模型的内存量,超出 GPU 占用范围。使用更大规模、更高分辨率的图像实施更复杂的模型。

  • 多租户部署
    在多租户架构中分配和共享根据模型需求调整的计算能力。在租户之间安全共享计算资源,实现最大限度地使用。

  • 灵活的分布式训练和推理

  • 自动缩放、自动搜索和负载均衡
    根据确保更高优先级作业快速运行的策略,启用资源的动态扩展或收缩。实现实时训练可视化和运行时模型监控。自动进行超参数搜索和优化以加快开发速度。

  • AI 生命周期管理
    准备、构建、运行和管理机器学习和深度学习模型。利用更多数据运行训练周期,不断改进模型。

  • 具有模型监控功能的可解释 AI
    管理和监控从小型到企业级部署的深度学习模型。监控模型公平性和可解释性,同时减少模型漂移和风险。

  • 部署验证和优化
    通过预先编译且经过验证的机器学习和深度学习模型,提高模型部署的可靠性和灾备能力。利用在目标系统上优化运行的软件加速提升性能。

技术详细信息

软件需求
Red Hat Openshift 4.5
RHEL 7.7
CUDA 深度神经网络 (cuDNN) 7.6.5 库
NVIDIA CUDA 10.2
NVIDIA GPU 驱动程序 440.33.01
NVIDIA NCCL2 2.5.6

硬件需求
带有 NVIDIA Tesla T4、P100 或 V100 GPU 的 x86 64 位服务器

你可能感兴趣的:(LSF任务调度系统,深度学习,机器学习,图像处理,人工智能,AI)