Google Colaboratory

一.前言

Google Colab,全名Colaboratory,是由谷歌提供的免费的云平台,可以使用keras、tensorflow等框架进行深度学习。最近Colab平台已经将K80 GPU更换成Tesla T4 GPU,提供了更强的算力,可以完美“薅谷歌的羊毛”。对于刚入门机器学习或深度学习的用户,这个平台是不二之选。
Colab是一个免费的 Jupyter 笔记本环境,不需要进行任何设置就可以使用,并且完全在云端运行。借助 Colab,我们可以编写和执行代码、保存和共享分析结果,以及利用强大的计算资源,所有这些都可通过浏览器免费使用。

二.如何使用Colab

(1)登录Google云端硬盘 https://drive.google.com/drive/my-drive(要FQ)

Google Colaboratory_第1张图片

然后:新建-->更多-->Google Colaboratory

得到一个ipynb文件,类似Juypter Notebook

Google Colaboratory_第2张图片

(2)使用GPU/TPU

修改-->笔记本设置-->硬件加速器*

Google Colaboratory_第3张图片

Google Colaboratory_第4张图片
Nvidia Tesla GPU算力排行

(3)Google云服务器的存储性能

在Colab主界面右上角点击连接便可连到Google的云服务器(远程主机),在开启GPU的情况下,Colab提供了12.72GB的内存性能,与kaggle中kernel的13GB内存相比相差不大。

Google Colaboratory_第5张图片

(4)基础指令

colab与linux环境指令类似,仅需要在指令前添加 “!” 即可。

比如使用 !nvidia-smi 查询显卡信息,可见Google服务器分配的显卡是Tesla P100

Google Colaboratory_第6张图片

比如使用 !ls -a 列出指定目录下的所有文件信息:

image.png

比如使用 !pip list 列出安装的库和包:

Google Colaboratory_第7张图片

(5)导入数据

在colab环境下导入数据一般有三种办法:

(1)直接上传文件

可以直接在文件中点击上传
比如上传一张图像----2.png

Google Colaboratory_第8张图片

这是上传结果:
Google Colaboratory_第9张图片

注:从这里上传文件,是直接上传到远程主机,没有经过Google Drive;并且上传的文件只在这个主机的Runtime中有效。对于这种方法不推荐,因为分配的云服务器是暂时的,断开连接后空间释放,数据文件直接消失,下次连接的新服务器不会保留数据文件。
Google Colaboratory_第10张图片

(2)上传Google Drive并挂载导入

因此建议使用第二种方法,将数据文件上传到Google Drive(Google云端硬盘)中,然后将Google云端硬盘挂载到远程主机上,这样不会存在数据丢失的情况。Colab的运行原理实际上就是Google给我们分配一台远程的带GPU的主机,所以它的原始路径不是我们的Google云端硬盘所在的路径,远程主机的目录像这样:

Google Colaboratory_第11张图片

在Google云端硬盘新建一个目录----DeepLearning
它的完整目录是: My Drive/DeepLearning/
注:My Drive就是表示 “我的云端硬盘”

将Google云端硬盘挂载到远程主机上:

方法一:

(1)上传一个本地文件----test.txt到 My Drive/DeepLearning/ 目录下
Google Colaboratory_第12张图片
(2)在Colab的会话下输入下面指令:
  from google.colab import drive
  drive.mount('/drive')

注:这里的 '/drive' 是远程主机的目录,且它不能是已经存在的目录;它是Google云端硬盘挂载到远程主机的具体位置:/drive/My Drive/xxx

Google Colaboratory_第13张图片

代码运行后出现以上链接,点击链接登录会出现验证码,复制粘贴到方框内便能在文件目录下挂载Google Drive文件夹,读取数据。
Google Colaboratory_第14张图片

Google Colaboratory_第15张图片

Google Colaboratory_第16张图片
加载完成后,会出现如下结果:
Google Colaboratory_第17张图片

Google Colaboratory_第18张图片

方法二:

直接在文件中点击装载Google云端硬盘

Google Colaboratory_第19张图片

Google Colaboratory_第20张图片

装载结果:

Google Drive默认装载在 /content/drive/ 目录下

Google Colaboratory_第21张图片

(3)从github仓库下载导入

三.小结

colab平台的优点和缺点如下:

优点:

(1)免费提供GPU,降低成本,对买不起GPU的学生党来说是重大福音。
(2)显卡对比前一代K80有较大提升。

缺点:

1)网络不稳定,经常出现断连的情况, 每隔一段时间需要切进来点击连接,一旦断连时间过长就会停止运行,等于白跑了。
(2)内存不够,大型网络会显得捉襟见肘。

Colab平台对于入门机器学习或深度学习的用户来说是较好的工具,但是如果想要在CV/NLP领域做科研,发好论文显然性能是不够的,建议配好的服务器,或者到极客云/阿里云/腾讯云租云服务器。

你可能感兴趣的:(Google Colaboratory)