【机器学习】sklearn数据集fetch默认下载位置修改

1. jupyter中不适合下载数据集和调试代码

2.所以下载数据集最好在IDE中

2.1 传参修改位置(解决方式一:传参)


from sklearn.datasets import fetch_20newsgroups, fetch_openml
news = fetch_20newsgroups(data_home='E:/DataSets/scikit_learn_data')
mnist = fetch_openml('mnist_784', data_home='E:/DataSets/scikit_learn_data')

不过要记住位置,之后调用数据集还是要传位置的,不然还是会默认下载到用户目录下的

3.修改源码(解决方式二:改源码,一劳永逸)

1.点进调用方法中,搜索data_home关键词

【机器学习】sklearn数据集fetch默认下载位置修改_第1张图片

 【机器学习】sklearn数据集fetch默认下载位置修改_第2张图片

【机器学习】sklearn数据集fetch默认下载位置修改_第3张图片

 因此,只需要修改默认目录即可,继续在模块中查找data_home关键字,找相关源码。

【机器学习】sklearn数据集fetch默认下载位置修改_第4张图片

2.点进get_data_home方法中查看

【机器学习】sklearn数据集fetch默认下载位置修改_第5张图片

到这里几乎就了解,数据集下载的位置是怎么来的了。

接下来只需要,修改模块代码即可,(java中IDE一般源码是只读的,但是python中是可以直接在IDE中修改的

【机器学习】sklearn数据集fetch默认下载位置修改_第6张图片

直接点击修改即可。 而且源码是在base模块中的,改完对所有数据集都生效。

 【机器学习】sklearn数据集fetch默认下载位置修改_第7张图片

3.将 ~ 修改为 自定义的目录

【机器学习】sklearn数据集fetch默认下载位置修改_第8张图片

之后再下载、加载数据集就不用在括号中传参指定了,直接一步到位。

只要下载好数据集,jupyter中就可以调用了。

4.over

你可能感兴趣的:(人工智能,sklearn,机器学习,人工智能)