GPU租用

因为阴差阳错,毕设方向选择了机器翻译,因为数据集庞大,因此实验需要大量的gpu时长,而我们实验室的gpu又一直没搞好,所以只能去租gpu了。

因为这事,这大半年踩了很多坑,最后也总结了一些经验,以下是我使用恒源云的体验

恒源云好在价格不贵,代金券多,活动多,使用便捷,这也是我见到的对学生党最最友好的一个平台了

GPU方面:

有很多种类的显卡,代金券可以使用3090和5000.RMB玩家也可以上V100,这里都是有的,并且今年仍然再不断推出显卡。

服务器环境方面:

用了很多不同的平台,每次最烦的就是配环境,因为每个平台的基础环境都不一样,每次都要踩坑。有些包在这个平台上适用,到另一个平台就又瓦特了,真实吐血了。。但这个是我配环境中感觉最便捷的一个,很少踩坑,用户体验极佳。内置框架一大堆,每个框架版本也贼多选择,不想有些平台版本还是比较老的,还得更新。

存储方面:

这里的数据存储是我个人感觉体验最好的平台,真心没有之一!!我常用的数据存储方式有使用oss存储个人空间、临时数据存储hy-tmp、共享数据存储hy-nas(都是个人习惯~)。另外oss传大数据无敌快,真心好使,我在colab做测试时也能跟恒源云的个人空间通过oss连起来,巨方便。今年又推出了无卡启动模型,只能说传数据核配环境变得更方便了,舒服~

恒源云还有很多公开常用数据集,但因为个人实验需要没有用过

DJQ:

我的主要来源:参加各种活动,每日签到(可以换元宝元宝再换代金券,我前几天又换了一些),邀请同学

恒源云的活动每年绝对是最多的,给的代金券是最多的,学生认证给,邀请人给,社区发经验贴给,参加活动给,参加比赛给。。。。(我甚至有点怀疑他们还赚钱不。。)

tips:

还有些小功能,模型有时候大半夜训练完了我懒的写脚本自动上传数据、关闭服务器啥的,恒源云有定时关机。

而且还有社区社群,里面有些大神有时候会发一些跑实验的技巧、读论文笔记啥的(还有水水贴)

文档中心中也有很多linux小技巧,刚接触服务器时候经常去翻,现在很多常用的都会背了。。。

奥对了,今年又推出一个小功能,跑实验是可以直接在平台看gpu、cpu的实时详细使用情况,这让我不用每次再开个tmux去watch nvidia-smi了。。。

这里还有很多很多功能,只不过因为自己的需求只用到了其中的一部分,相信使用该平台的各位都会有一个绝佳的体验~

你可能感兴趣的:(GPU,python,linux)