使用colab平台训练自己的模型
Colab平台使用(GPU、挂载、tf版本、运行py脚本、设置点击脚本)
Google Colab Tips for Power Users
20种小技巧,玩转Google Colab
Google Colab训练数据集教程
Colab:Pytorch训练模型
!pip install torch===1.4.0 torchvision===0.5.0 -f https://download.pytorch.org/whl/torch_stable.html
!pip install tensorboard
!pip install tensorboardX
%cd "/drive/MyDrive/xxx"
import os
os.chdir('drive/MyDrive/xxx')
colab没有内置的交互终端,但可以使用bash命令以交互方式试用shell指令。
!bash
退出shell:
exit
!pip show tensorflow
或者
!pip list | grep tensorflow
如果需要切换tensorflow版本,推荐使用方法一。方法一是 colab 内置的tensoflow,是 google 服务器专门优化过的,比pip安装的版本表现更好。
%tensorflow_version 1.x
import tensorflow as tf
tf.__version__
!pip uninstall tensorflow
!pip install tensorflow==1.11
注意:上面两种方法使用完成后,都需要重启runtimeimport os
os.kill(os.getpid(), 9)
!nvidia-smi
不推荐操作
在COLAB上面安装CANDA
Colab中安装conda
安装Miniconda
!python /content/drive/MyDrive/yolov4-tiny/yolov4-tiny-pytorch-upload/VOCdevkit/VOC2007/voc2yolo4.py
或者
!cd /content/drive/MyDrive/yolov4-tiny/yolov4-tiny-pytorch-upload/VOCdevkit/VOC2007
!python voc2yolo4.py
查看文件内容;
!cat old_file.py
输出
print('This is old_file.py')
复制输出内容;
粘贴在新单元格;
修改新单元格内容;
This is new_file.py
在新单元格顶部,添加 %%writefile new_file.py
%%writefile new_file.py
print('This is new_file.py')
执行new_file.py
%run new_file.py
输出
This is new_file.py
长时间不动colab,可能会出现断开连接的情况,这时候程序就停了。虽然还保存了已经训练得到的模型,但还是没有训练完,所以设置一个定时点击页面的脚本:
function ClickConnect(){
console.log("Clicked on connect button");
document.querySelector("paper-button").click()
}
setInterval(ClickConnect,60000)
如果想要停止该脚本,刷新浏览器,colab不会断开。
在colab操作临时指令,打开一个特殊的 scratch notebook,该 notebook 所做的任何更改都不会保存到主目录中。
colab提供内置功能来计算一段代码执行耗时,在执行一个单元(cell)之后,将鼠标悬停在单元运行图标上,可以获取代码执行时间的估计值。
用colab训练自己的模型:
方法一(小项目推荐,上传文件小)
import os
os.chdir('drive/MyDrive/xxx')
!git clone https://github.com/WZMIAOMIAO/deep-learning-for-image-processing.git
将数据集上传到google云盘,建议直接上传压缩包,速度快,后面直接在Colab中解压即可。
#解压文件
!unzip /PATH/TO/images.zip -d /PATH/TO
from google.colab import drive
drive.mount('/content/drive')
!python /content/drive/MyDrive/yolov4-tiny/yolov4-tiny-pytorch-upload/VOCdevkit/VOC2007/voc2yolo4.py
手把手教你更换Colab上的python版本
!cp -r /usr/local/lib/python3.7/dist-packages /usr/local/lib/python3.6/
!python --version
!ls /usr/local/lib/
# 已安装的python版本
# python2.7
# python3.6
# python3.7
!python3.6 -m pip install numpy
# 安装pip
!apt-get install python3-pip
# 运行python程序
!python3.6 main.py
pip freeze > ./requirements.txt
pip install -r ./requirements.txt
参考资料
获取GoogleDrive无限网盘
一分钟获取GOOGLEDRIVE无限网盘
使用谷歌Colab(Colaboratory)免费GPU训练自己的模型及谷歌网盘无限容量(Google drive)申请教程
受够了百度网盘?如何注册无限容量的Google Drive网盘
参考资料
用Colab训练机器学习的经验以及踩坑的那些事
问题原因:
colab跑神经网络的第一个epoch需要加载数据集,跑完第一个epoch之后就很快了;
解决办法:
耐心等待第一个epoch完成
上传数据集,上传项目文件夹的时候,有重复的文件。
问题原因:
由于网络的原因,上传出现文件,google云盘支持相同的名称。
读取图片的时候读取不到,但是不会出现没有这个文件的报错,可能会出现Nantype的报错。
解决办法:
写一个python脚本,删除重复的文件。
问题原因:
google解压的文件数量有限。
解决办法:
分批次上传,并分批次解压,之后汇总。