在colab上使用自己的数据集

1、colab 可以非常方便地将ipynb保存到github上!有趣。

2、colab 从github上加载数据集,666,简直不能更方便啊。

使用
!git clone https://github.com/JameyWoo/myDataSet.git
即可将github上的文件克隆到colab的当前目录下,然后就可以愉快地使用自己的数据集了。

!ls -R 查看当前目录下的文件及所有的子目录文件,可以看到被正确克隆。
在colab上使用自己的数据集_第1张图片
接下来导入csv文件,看看是否能行,确实可以!

import pandas as pd
pd.read_csv('./myDataSet/datasets/housing/housing.csv')

在colab上使用自己的数据集_第2张图片
在colab上使用自己的数据集_第3张图片

3、还可以将数据集上传到google drive上,然后分享并用一些代码来调用,感觉这样的好处是可以单独加载文件,而github需要将整个仓库都clone过来。这样速度可能会快一些。

具体用法参考https://www.jiqizhixin.com/articles/2018-10-23-2

4、有一个网站提供下载github的某个文件夹
https://minhaskamal.github.io/DownGit/#/home

在colab中,虽然下载某个文件夹很麻烦,但是可以下载单个文件,如一个csv文件。这样也比较方便。

在github中获取该文件的下载链接,然后使用wget下载即可。

在colab上使用自己的数据集_第4张图片

你可能感兴趣的:(colab,machine,learning,机器学习,机器学习之路)