目录
1.1在谷歌云盘上创建文件夹
1.2 创建一个新的Colab Notebook
1.3 设置免费的GPU
1.4 执行命令
1.5 挂载Google Drive
1.6 如何上传文件
1.7 运行自己的代码
1.8 如何防止Colaboratory断掉
1.9 数据解压
注意事项
当登录账号进入谷歌云盘时,系统会给予15G免费空间大小。由于Colab需要依靠谷歌云盘,故需要在云盘上新建一个文件夹。比如,我建立一个名为mask_Rcnn的文件夹:
--先把谷歌云盘关联上colab
点击 New -> More -> 关联找到更多应用, 找到Google Colaboratory,关联上。
--在文件夹内的空白处右键 -> 更多 -> Colaboratory
--或者点击 新建 -> More ->Google Colaboratory
创建完就出现下边的界面,点击文件名可以重命名文件:
它是很容易更换默认的硬件(None,GPU,TPU),通过 修改->笔记本设置或者代码执行程序->更改运行时类型来选择GPU,作为硬件加速.
import tensorflow as tf
tf.test.gpu_device_name()
colab这个相当于jupyter notebook,可以直接运行python 代码,如
import os
import numpy as np
x='ok'
print(x)
这个notebook又可以执行linux下的一些命令,因为这其实是一台linux的虚拟机,只不过执行linux命令的时候前面要加!,比如:!ls , !pwd等等
其实就是让这个notebook可以访问到你的谷歌云盘,运行以下代码,会出现一个授权链接。
from google.colab import drive
import os
drive.mount("/content/drive", force_remount=True)
将当前目录切换到谷歌云盘,然后查看你云盘里的文件;
之后每次重新登录都要1.5这两个步骤.接下来就可以像使用linux系统一样去使用了。
第一种:直接上传
第二种:代码上传
进入到文件所在目录
import os
path="/content/drive/My Drive/Colab Notebooks/Your directory name"
os.chdir(path)
os.listdir(path)
!python train.py //注意colab中执行命令前要加!
第三种:github上传
通过colab使用github或本地Notebook,点击 文件->上传笔记本,然后在弹出的窗口中选择合适的选项:
最新colab 默认是可以导入tensorflow 和pytorch,默认的安装包可以通过如下命令查看:
!pip list
便会输出所有pip的包。如果没有可以通过命令安装
!pip install
!apt-get install
接着是Pytorch, Pytorch的安装和我们在Linux上安装一样,点击官网选择要环境。然后只需要将官网提供的代码copy到我们的代码块中,并且在代码前加上一个“!”点击运行即可,如下
!pip3 install https://download.pytorch.org/whl/cu80/torch-1.0.0-cp36-cp36m-linux_x86_64.whl
!pip3 install torchvision
然后我们可以输入官网提供的代码作安装的测试 如果有如下输出就证明我们安装成功
import torch
x = torch.empty(5, 3)
print(x)
tensor([[1.1790e-25, 0.0000e+00, 4.4842e-44],
[0.0000e+00, nan, 1.6255e-43],
[3.3587e-06, 5.2898e+22, 6.5625e-10],
[2.0804e+23, 8.2726e+20, 6.6715e-10],
[1.6993e-04, 2.7150e-06, 6.0611e-39]])
如果要安装其他的包,框架,或者某一版本的方法和我们在Linux环境下安装几乎没有差别 只需要注意在运行前加上“!”,换计划说你可以把Google Colab看成是一个Linux系统的页面。
注意:
cuda/cudnn的安装,直接贴链接Google Colab NVIDIA安装,不过现在不需要安装了。
首先挂载,然后进入到文件所在的目录
import os
os.chdir('/content/drive/MyDrive/mask_Rcnn')
然后,就可以运行自己的主函数了
!python train.py
可以显示RAM和Disk才是正常的Colaboratory状态,如果出现busy表示GPU忙不可用。
如何改变busy的状态呢,重新连接Colaboratory即可。点完之后,状态就变成了restarting重启。
但是需要注意,重启之后,所有的状态就都清零了,需要重新再运行一遍代码才可以
用 Google Colab 解压zip大文件时,(授权后)先不要更改工作目录,直接在默认目录"/content"下解压!
!unzip xxx.zip
在Colab notebook中发现解压文件速度奇慢无比。在之后的几次尝试中发现,打开 Colab notebook 并授权后,先不要更改工作目录,直接将数据集压缩文件下载到当前目录"/content"下,并使用 "!unzip"命令解压,速度和在pc上解压差不多。再将解压后的文件移动到指定文件夹下即可,然后就可以更改工作目录了。
综上所述:先将数据集压缩打包,然后传压缩包到谷歌云端,再压缩,速度可以快很多。
1.10 使用技巧
与IDE相似,您可以通过按Ctrl,然后单击一个类名来转到类定义。例如,在这里我们通过按Ctrl并单击Dense类名来查看Keras中Dense层的类定义。
Colab是带有GPU的linux虚拟机,执行linux命令时前面需要加“ !”,执行python代码时可以直接编写执行。
每次重新登录需要挂载Google Drive,会在虚拟机里生成一个drive(即/content/drive/)文件夹,然后要执行命令将当前路径切换到/content/drive/My Drive/,才可以看到谷歌云盘上的文件。
Colab最多连续使用12小时,超过时间系统会强制掐断正在运行的程序并收回占用的虚拟机。并且经常使用GPU的colab用户之后分配到使用GPU的优先级会变低,所以不用的使用请将runtime type设置为None。
上传数据集的时候,一定要上传到谷歌网盘中,并且一定要上传的是压缩包,在Colaboratory中解压才行。
每运行一步的时候,需要等待的时间都特别长,一直是在转圈
挂载只有12个小时,也就是说12小时之后你就需要重现挂载一次,所以就需要我们在进行模型训练的时候记得要加上checkpoint,不然你如果训练的模型超过12小时,Google断开挂载你就白白浪费12小时啦。
假如自己离开页面太久的话,也会自动断掉的。假如电脑断网了,或者关机重启了,只要时间不是特别长一般是没事的,但假如说时间太久的话,就只能是重新训练了
长时间运行一类任务会断掉