关于GPU云服务器体验-深度学习模型训练

博客采用的云地址 极客云-超高性价比GPU云服务_GPU云服务器_GPU服务器_GPU高性能运算服务器价格_购买

您只需要专注于深度学习本身,无需安装任何深度学习环境,零设置开启您的深度学习之旅。

极客云,为深度学习而生,您只需简单几步操作即可测试和训练您的模型。

1.上传代码和训练集数据(不收费)

上传的数据将会被挂载到 连接后服务器的 /data 目录下

2.选择适合配置,创建云服务器。

我第一次配置时候选择最便宜的,来熟悉环境,下载所需软件包。

3. 配置好云主机后,打开Jupyter Notebook,并在内打开命令端

 

类似Linux命令的使用方法

  

4.将上传数据解压并运行

极客云-性价比最高的GPU云服务_GPU云服务器_GPU服务器_GPU高性能运算服务器价格_购买

不要在/data追直接解压,否则很慢 

 
  
  1. unzip /data/keras-yolo-master.zip -d /input/zeng

  2. zip -r /input/zeng/logs.zip   &&   mv /input/zeng/logs.zip /data/

 

No module named 'PIL'  'matplotlib'

是因为需要 pillow 和 matplotlib

 
  
  1. pip install Pillow

  2. pip install matplotlib

安装完成之后,重新运行程序,就没问题了 

输入样本批次数过大,会导致GPU内存耗尽。

5.训练的结果,存入 /data 目录,就可以在 我的数据 里下载了

cp -r /input/zeng/keras-yolo-master/logs/ep96-loss14.h5 /data


补充:

常用解压命令 

 
  
  1. unzip /data/somefile.zip -d /input/dir_you_want

  2. cp /data/somefile.gz /input/ && gzip -d /input/somefile.gz

  3. cp /data/somefile.7z /input/ && 7z x /input/somefile.7z -o/input/

  4. cp /data/somefile.bz2 /input/ && bzip2 -d /input/somefile.bz2

  5. mkdir -p /input/dir_you_want && rar x /data/somefile.rar /input/dir_you_want/

  6. mkdir -p /input/dir_you_want && tar xvf /data/somefile.tar -C /input/dir_you_want/

  7. mkdir -p /input/dir_you_want && tar zxvf /data/somefile.tar.gz -C /input/dir_you_want/

  8. mkdir -p /input/dir_you_want && tar jxvf /data/somefile.tar.bz2 -C /input/dir_you_want/

  9. 如果不想下次使用时再次解压可以通过命令 mv /input/dir_you_want /data/ 将解压好的数据移动到 /data 下

  10. 这样 /data 下就会存一份解压后的数据,下次开机后可以直接读取 /data 下解压好的数据,不用再次解压

  11. 注意:这样 /data 下存储的数据量会增大,收取的存储费用会有所增加(每GB数据每月存储费用0.5元)

  12. 技巧:遇到 tar.7z rar.7z rar.gz rar.bz2 这样扩展名的文件先通过 p7zip gzip bzip2 解压掉最后面的扩展名,

  13. 再通过 tar rar 解压出已经解压掉一层的 .tar .rar 文件

压缩命令(将训练结果压缩后存入 /data 目录,就可以在 我的数据 里下载了): 

 
  
  1. 将 /output/dir_you_want 目录压缩为 /input/file_you_want.zip 文件然后移动到 /data/ 目录下

  2. zip -r /input/file_you_want.zip /output/dir_you_want && mv /input/file_you_want.zip /data/


关于云主机的迁移:

您可以对您的机器进行迁移,以便于您在另一台机器上使用和您之前完全相同的环境。迁移会将您原机器的所有内容,
包括您自己装的软件等等数据迁移到另一台机器上。(但不包括 /input 文件夹下的内容)
迁移所需的时间和您的实例中的增量数据大小有关,数据量越大,迁移需要时间越长。
您也可以选择与现有机器相同的类型的云主机进行迁移,相当于在同一台机器上克隆一个和之前一样的环境。
在迁移结束之前,请 不要 开启、关闭、释放迁移相关的两台云主机,以免迁移失败。
您可以在 我的云主机 页面查看迁移的进度,如果由于网络或其他原因迁移失败,您可以手动恢复迁移。
恢复迁移是断点续传的,您不会丢失迁移的进度。


在Windows环境下如何使用Putty登陆GPU主机

极客云-性价比最高的GPU云服务_GPU云服务器_GPU服务器_GPU高性能运算服务器价格_购买

云服务器搭载业务,选择合适的平台最重要!

从目前国内云计算市场的格局来看,国内云计算前三强分别是阿里云、腾讯云和华为云,阿里云、腾讯云作为背靠互联网平台的企业,更偏向于B端用户;华为与作为传统的通信巨头,更偏向于G端。

当然如何选择服务器机型,这里有篇文档汇总的比较详细,文档地址:

云服务器哪家好!2021年阿里云、腾讯云、华为云的服务器配置及价格对比?​

如果是高并发,高IO业务场景,需要确定服务器规格,可让业务应用性能发挥到最佳,参考官方文档:

阿里云服务器规格:规格实例族 - 云服务器 ECS

腾讯云服务器规格:规格实例族 - 云服务器CVM

你可能感兴趣的:(服务器,windows,linux)