价格OR配套,11项指标盘点国内外AI算力GPU共享服务

先放结论:由于Nvidia的政策,云主机并不是提供GPU算力的经济方案。GPU算力租赁是新方向,相关企业比较少,国内外都处于起步阶段。由于GPU算力的稀缺,这个方向,成长空间巨大。众所周知的原因,国内用户使用国外GPU是不要想了。就国内而言,易学智能(gpu.easyaiforum.cn)提供了比较完备的解决方案,最近在搞各种优惠简单AI实验室(www.easyailab.cn)处于推广期,学习资料比较丰富。这两家,大家可以去撸羊毛~~~

撸羊毛是大家关心的,先列各家的优惠活动。

公司名

GPU主机相关的优惠活动

华为云

新手体验活动,但未见GPU专门的活动

美团云

UCloud

针对AI Challenger竞赛,可申请免费GPU(但不一定申请成功)

EasyAI

可免费体验,但没有GPU提供

易学智能

注册完成可免费领取1小时的1080ti使用时长,最近在开展年终特惠活动。

人工智能(AI, Artificial Intelligence)成为了全球瞩目的科技焦点,各大公司、各行各业纷纷布局人工智能。随着人工智能的需求快速膨胀,从业人员的薪资也水涨船高。据估计,国内AI人才缺口在数百万以上,与AI密切相关的算法工程师,平均薪资已接近30万。如此火热的行情,吸引了越来越多的学生、程序员转行人工智能。

在算法性能突飞猛进之后,是什么限制了AI技术的落地?总结起来,以下几方面是普通企业拥抱人工智能、程序员们转行人工智能的拦路虎:

  • 模型训练耗时长:当前人工智能的核心是深度学习,它需要构建复杂的深度神经网络来完成各种任务。这些神经网络可能有数十亿的节点与训练参数。这种复杂模型的训练,往往需要数天甚至数月。
  • 算力成本大:算力是AI的基础。英伟达(Nvidia)的GPU显卡是深度学习主要的算力平台。然而,以GTX、Tesla等为代表的显卡,售价动辄数千甚至数万。
  • 学习门槛高:人工智能涉及高等数学、概率统计、线性代数等,又与程序设计、分布式计算、图像处理与自然语言处理等密切关联。许多人对人工智能的兴趣浓厚,却不知如何去学。
  • 开发门槛高:人工智能开发通常在Linux,开发环境安装步骤多、配置复杂。相关技术处于快速发展中,容易出现各种Bugs。人才短缺、开发环境难建等难题,使AI业务难以开展与落地。

需求就是商机。在美国西部淘金热的时代,真正淘金发财的少之又少,为淘金客提供饮水、衣服与盆铲的李维斯们,却大发其财。现在,AI的热度几与淘金可比,那么,面向AI提供算力、配套与培训等服务,是否又是巨大的商机呢? 

算力共享租赁方面,传统上,云计算是一种主要的算力共享模式。许多大公司,如Google、亚马逊、微软及华为、阿里、腾讯、百度、UCloud等,均提供GPU云主机。去年Nvidia制定了一项政策,用于个人的显卡,不可用于云与数据中心。这两个市场的显卡,算力相近时售价差近十倍。GPU云主机,火爆的同时,我们的感觉就是—“贵”。

另一种方式是共享主机。采用共享经济的理念实现经济实惠。主机可公司自建,也可采用P2P。用户按需租用。主机为普通PC或服务器,可使用相对实惠的GTX显卡(其实GTX 1080Ti 6K+的售价,也是贵)。

我们共选择了9家相关公司:

  1. 云服务:华为云、美团云与UCloud。云服务厂家多,这里选它们为代表。
  2. 国外共享主机:FloydHub、VectorDash、Vast.ai与ClusterOne。
  3. 国内共享主机:EasyAI与易学智能。

公司官网信息如表1所示。由于相关资料有限,描述未必完全准确,详情请到公司官网了解。

1公司官网

公司名

官网

华为云

https://www.huaweicloud.com/

美团云

https://www.mtyun.com

UCloud

https://www.ucloud.cn/

FloydHub

https://www.floydhub.com/

Vast.ai

https://vast.ai

VectorDash

https://vectordash.com/

ClusterOne

https://clusterone.com/

EasyAILab

简单AI实验室

https://www.easyailab.cn/

EasyAIforum易学智能

https://gpu.easyaiforum.cn

闲言少述,直接上表格。各指标的详细解读,请阅文后附录

2服务指标比拼-1

公司名

价格

开发环境配套

数据集配套

培训配套

讨论社区配套

华为云

11元/小时

美团云

UCloud

2107元/月

FloydHub

5元/小时

Tensoflow、PyTorch、Keras、MXNet、Caffe等

有公开数据集但详情未知

自建教程

Vast.ai

约2元/小时

通常支持Tensorflow、Caffe

VectorDash

约4.5元/小时

ClusterOne

未知

Tensorflow等

未知

EasyAI

仅CPU租赁

仅支持Jupyter Notebook

Jupyter Notebook有大量案例,部分收费

易学智能

2元/小时

 

Tensoflow、PyTorch、Keras、MXNet、Caffe等

还预装openCV、Pandas、Numpy、Matplotlib等软件包

学术公开数据集齐备

竞赛数据集齐备

Jupyter Notebook有大量免费案例

论坛版块多,有深度内容

表3服务指标比拼-2

公司名

分布式训练

用户自有数据

用户数据加密

存储与算力的可扩展

远程调试

主机形态

华为云

可以,但无内置优化

支持

支持

支持

云服务支持

公司自有,

云模式

美团云

可以,但无内置优化

支持

支持

支持

云服务支持

公司自有,

云模式

UCloud

可以,但无内置优化

支持

支持

支持

云服务支持

公司自有,

云模式

FloydHub

支持

未知

未知

支持

未知

公司自有

Vast.ai

可以,但无内置优化

支持,但性能不确定

未知

未知

P2P共享

VectorDash

可以,但无内置优化

支持,但性能不确定

未知

未知

P2P共享

ClusterOne

支持

未开放测试

未知

未知

未知

公司自有

EasyAI

公司自有

易学智能

支持

支持

支持

支持

支持

公司自有

4 算力共享服务总体感受

公司名

总体感受

华为云

操作复杂,价格贵,没有面向AI的优化。

美团云

操作复杂,价格贵,GPU基本租不到,没有面向AI的优化,

目前,个人用户已不可充值,后续发展有待观察。

UCloud

操作比前两者简便,价格贵,没有面向AI的优化

FloydHub

开发功能较齐备,有学习内容,缺少交流社区。

Vast.ai

价格超低,但基本租不到

VectorDash

价格实惠,刚刚上线,也基本租不到

ClusterOne

只开放内测,详情未知

EasyAI

偏重于AI教学培训,租赁算力主要用于学习。

易学智能

涵盖论坛、开发平台与培训,支持分布式、用户自定义与加密保护等,

主流框架都支持,数据集最齐备,免费案例多。

后起之秀,功能完备,体验好。

附录:指标详解

我们采用的11项指标如下:

  • 价格:以1080Ti或算力相近的显卡为例。
  • 开发环境配套:虚拟机是否预装深度学习框架及常用软件包
  • 数据集配套:公开数据集主要包括两类,一是用于学术的公开数据集,二是各种AI竞赛的数据集。
  • 培训配套:AI学习的配套教程,既包括算力平台的使用,也包括AI知识技能的学习。
  • 讨论社区配套:AI开发所采用的各种框架、开发包,本身就在急速发展中。可以预见,AI开发面临的bug必然是层出不穷,一个AI学习与讨论社区,对于算力租赁是十分必要的配套。
  • 分布式训练:加速AI算法的训练与执行,并发是主要手段。然而,现在的并发方法都很复杂很不好用。方便易用的并发执行,对AI开发者很有吸引力。
  • 用户自有数据:具体的AI业务,当然要用业务相关的数据来训练。支持用户自定义数据上传,算力平台才能支撑各种实际业务的开发。
  • 用户数据加密:用户数据的隐私保护,重要性不需多言。能否将私人数据保护好,也是用户挑选算力平台的重要依据。
  • 存储与算力的可扩展:任务的不同,所需要的数据量与计算量,差别可以很大。这就要求算力平台提供足够的灵活性,可以让用户按需扩展资源。
  • 主机形态:共享经济是好东西,优点是实惠,缺点是可靠性可用性的损失。一种形式是公司自建算力平台,分时租给不同用户;还有一种彻底的共享——P2P,提供主机的也是散落各地的普通用户,它的可靠性要差一些。
  • 远程调试:直接在远程主机编程并不方便。有些IDE已经支持远程调试。远程调试需要远程主机打开相应的端口与服务,本地还需要进行配置。虽然工序复杂,但对用户而言,体验很好。

你可能感兴趣的:(价格OR配套,11项指标盘点国内外AI算力GPU共享服务)