汇总阿里云GPU云服务器常见问题解答FAQ

阿里云GPU云服务器是基于GPU应用的计算服务,适用于AI深度学习、视频处理、科学计算及图形可视化等应用场景,型号有AMD S7150, Nvidia M40, Nvidia P100,Nvidia P4,Nvidia V100,InstanceTypes分享GPU云服务器常见问题解答FAQ:

GPU服务器简介

阿里云GPU云服务器适用于于AI深度学习、视频处理、科学计算及图形可视化等应用常见,有AMD S7150, Nvidia M40, Nvidia P100,Nvidia P4,Nvidia V100。

阿里云GPU云服务器规格族包括:vgn5i、gn6i、gn6v、gn5、gn5i、gn4及ga1,详细参考:阿里云GPU型ECS云服务器

GPU服务器常见问题解答FAQ

  • Nvidia驱动安装成功,但是nvidia-smi无效,显示驱动未安装。
  • 问题分析:kernel-devel和kernel版本不一致,导致在安装driver rpm过程中driver编译出错。

    解决方案:

    查看kernel版本号,网上下载对应的kernel-devel包,在实例里运行rpm –qa | grep kernel检测版本是否一致。确认版本后,再重新安装驱动。

  • gn5和gn5i的Windows实例安装官网驱动时断网。
  • 问题分析:Nvidia对图形功能做了限制,需要特定的驱动并认证License。

    解决方案:

    当前只在特定可用区(华北5、华北2可用区E)安装测试版本的驱动可用,保证不断网,测试驱动有效时间为7−100天。100天后需要认证的License。

  • Windows图形不支持DirectX等功能。
  • 问题分析:对于Windows系统,GPU驱动安装生效后,Windows自带的远程连接(RDP)协议不支持DirectX、OpenGL等相关应用。

    解决方案:

    您需要自行安装VNC服务和客户端,或其它支持的协议,例如PCOIP、XenDeskop HDX 3D等。

  • ga1实例使用云市场预装AMD驱动的镜像,但是进入Windows设备管理器时显示GPU驱动未能正常加载。
  • 登录实例后,打开 设备管理器,右击GPU设备名称,单击 更新驱动程序软件,再选择 自动搜索更新的驱动程序软件。待Windows系统完成设备驱动更新,重启系统即可。

  • 使用云市场预装AMD驱动的镜像,启动实例时蓝屏。
  • 阿里云会更新云市场中预装驱动镜像里所包含的驱动程序来修复此问题。如果您使用的是老版本镜像,可以通过更新GPU驱动程序来避免此问题。

    如果出现蓝屏无法启动实例,您必须进入 安全模式,卸载之前的驱动程序,再正常启动Windows系统,然后安装新版的GPU驱动。

  • GPU实例支持安卓模拟器吗?
  • 不支持。

  • 我能变更GPU云服务器的配置吗?
  • 带本地盘的GPU云服务器规格族,如ga1、gn5,不能变更配置。不带本地盘的GPU云服务器实例,您可以变更它们的规格。

  • 按量付费GPU云服务器支持停机不收费功能吗?
  • 不带本地盘的GPU云服务器规格族,包括 gn4(Nvidia M40)、gn5i(Nvidia P4)和 gn6v(Nvidia V100),支持按量付费实例停机不收费功能。

  • 如何查看GPU监控数据?
  • 可以通过云监控控制台或DescribeMetricList来查看GPU监控数据,参考:GPU监控数据查询。

    参考文档

    官方文档:GPU实例FAQ - 阿里云

    聊完这些,那么该选择哪家的云服务器呢?

    主流云平台例如阿里云、腾讯云的活动机在安全性、稳定性、易用性及高性价比等方面都占据绝对的优势,是上云的最佳选择。

    国内云服务器性能和配置对比参阅:【云服务器推荐】腾讯云、阿里云、华为云服务器价格和配置评测

    参考来源:CSDN
    作者:云计算开发工程师宋佳

你可能感兴趣的:(阿里云,云服务器)