JC-10、Good Colab使用指南

目 录

  • 前言
  • 常用命令
  • colab界面的其他按钮
  • 关于挂载的个人理解
  • 关于.ipynb文件的理解
  • 下载kaggle上的数据集

前言

colab相当于Linux系统下操作,所以在执行命令时,要先加上英文的感叹号“!”。

常用命令

从GitHub上获取repository:

!git clone <GitHub某仓库的url>

查看当前操作指令所在路径,而非当前工作文件所在路径

!pwd

进入git来的指定的目录路径:
先右键复制路径,再输入如下命令

cd <路径>

查看当前路径下的所有文件:

!ls

运行当前路径下的某python文件:

!python <python文件名及相关参数>

以上四个命令效果图如下:
JC-10、Good Colab使用指南_第1张图片
查看GPU:

!nvidia-smi

JC-10、Good Colab使用指南_第2张图片
区别:命令操作路径&当前文件工作路径
我们的所有命令操作都是针对当前指令所在路径的(若不指定,则默认在/content下,即云服务器而非你的云盘),而非当前工作文件所在路径。
例如cd ,此时我们所有的指令操作都是在该路径下的。再使用!git clone <某URL>,可以将代码拷到该“/content/drive/My Drive”下,而不是执行上述指令的工作文件所在的路径下。如果你不指定cd某路径,则会默认当前的命令路径为/content,clone来的代码会直接保存在云服务器上而非云盘,so,关闭即消失。本王亲踩此坑

colab界面的其他按钮

管理后台执行的文件:
JC-10、Good Colab使用指南_第3张图片
如果后台有其他会话(.ipynb文件)在执行,可以选择终止或在新的界面打开。
JC-10、Good Colab使用指南_第4张图片

在“修改”,“笔记本设置”中,可以选择打开GPU:
JC-10、Good Colab使用指南_第5张图片
选择GPU
JC-10、Good Colab使用指南_第6张图片

输入以下代码可检查GPU是否打开成功:

import tensorflow as tf
tf.test.gpu_device_name()

获得如下结果,则说明成功:
在这里插入图片描述
colab会自动配置cuda等。
如何上传并调用自己的数据集,参考:https://zhuanlan.zhihu.com/p/54389036

关于挂载的个人理解

首先区别两个概念“云盘(drive)”和“云服务器”。
我们的分歧大都源自对概念定义的不统一————尼古拉斯·毋华
云盘(drive):理解为存储器,仅有存储功能,但没有执行文件的功能。
云服务器:理解为主要有文件的执行功能,也有临时存储文件的功能。但如果我们执行的文件(或生成的文件)地址仅在云服务器上,而不是由云盘读写过来的,那么关掉当前界面就相当于电脑关机,云服务器上保存的临时文件(当路径在云服务器而非云盘时,即使点了保存)都会消失。
挂载:相当于建立云盘和云服务器之间的联系通道。
不挂载就不能cd进入云盘中的任何路径中。
当然如果你是直接由云盘打开的文件(这相当于一个bug,特殊情况),则默认通道已经建立,你在云服务器上的操作都是实时针对云盘的,即使是不进行挂载,最后只要点击保存,也会将数据实时保存到云盘。但不挂载就不能cd进入云盘中的任何其他路径中进行访问。也就是说,直接从云盘打开的文件不挂载时,只能保存自身,而不能操作其他任何云盘文件。当然你可以操作云服务器上的任何东西,但是别忘了关掉界面会消失。JC-10、Good Colab使用指南_第7张图片
在不挂载时,在云服务器上操作仍然可以实时保存到云盘,但不能访问云盘中的其他所有东西。
JC-10、Good Colab使用指南_第8张图片

关于.ipynb文件的理解

colab上的.ipynb文件不是什么特殊文件,他和py文件一样,都可以执行功能性的代码(如import numpy),也可以执行某些命令(cd /content/drive)。只是colab支持的ipynb这种文件的打开,而不支持py文件的打开,所以我经常拿ipynb当cmd使用来打开我的py文件。其实如果是我的程序都是ipynb的,我完全没必要新建一个ipynb当cmd来用。

下载kaggle上的数据集

首先获取kaggle的下载权限(秘钥):在My Account中点击create new api token,会下载一个json文件,其中包含秘钥。同时会在网页上弹出图示的绿框,提醒我们必须要将此文件放在哪个路径下。
JC-10、Good Colab使用指南_第9张图片
然后我们指定一个创建一个py或ipynb文件,执行以下命令,进入欲下载的目录和安装kaggle包。
JC-10、Good Colab使用指南_第10张图片

按照如下操作,在指定位置放好刚才下载的json文件,并给予文件权限。注意我们对json文件的所有操作都是为了将其放在/.kaggle下。JC-10、Good Colab使用指南_第11张图片
然后我们到kaggle官网中寻找需要的数据集,并复制它的下载命令。如下所示:
JC-10、Good Colab使用指南_第12张图片
接着我们指定下载路径,并粘贴下载命令即可完成下载。
JC-10、Good Colab使用指南_第13张图片
打开目录,检查一下(当然了,他会给你放到一个competitions的文件夹下,这只能在后期修改,上面的命令中不能改):
JC-10、Good Colab使用指南_第14张图片

在本地使用命令来下载kaggle的数据集时,如果出现json放到./kaggle出错的情况,可以参考这篇文章。

你可能感兴趣的:(深度学习-基础知识,git,python)