sklearn的英文20新闻数据集fetch_20newsgroups加载错误解决方案

进行机器学习的文本分类练习时候,如果用到的20新闻数据集加载如果发生错误,比如ssl错误等,需要如下修复

1、手工下载数据集:

下载地址是:
链接:https://pan.baidu.com/s/1xjF1O6s_sL44psOqnsx6Iw

提取码:3hxn

2、复制下载后的20newsbydate.tar.gz文件到指定文件夹,进行更名,更改为20news-bydate.tar.gz。但注意无需解压。需要复制到的文件夹需要从代码里获取,代码如下:

import sklearn
print(sklearn.datasets.get_data_home())

3. 打开_twenty_newsgroups.py这个文件,进行编辑(archive_path改为数据集所在路径即可)

sklearn的英文20新闻数据集fetch_20newsgroups加载错误解决方案_第1张图片

5、最后如果还不行,那就重新启动下pycharm或者jupyter notebook就可以了。

你可能感兴趣的:(pycharm问题,sklearn,python,人工智能)