sklearn.datasets.fetch_20newsgroups下载报错的问题

先说此过程遇到的错误都有哪些?
第一个错误:

forbidden 403

第二个错误:
明明路径是正确的,但是报这个错

No such file or directory

第三个错误:

EOFError: Compressed file ended before the end-of-stream marker was reached

这个是因为第一次直接从外网下载时那个压缩包内容不完全导致的。

如何解决
第一步,手动下载正确的安装包,很多文章给的链接已经失效,最终重新找到一个可以用的链接

https://ndownloader.figshare.com/files/5975967

第二步,在我的电脑 C:\Users(你的user_name)\scikit_learn_data\20news_home 目录下,将下载好的压缩包拖进去(如果之前没有的需要自己手动创建)
第三步,通过D:你的项目下\venv\Lib\site-packages\sklearn\datasets找到其中的 twenty_newsgroups.py,打开进行如下的修改
sklearn.datasets.fetch_20newsgroups下载报错的问题_第1张图片
将红框的地方内容注释掉,并且添加

    archive_path = "C:/Users/Judy/scikit_learn_data/20news_home/20newsbydate.tar.gz"
    logger.debug("Decompressing %s", archive_path)
    tarfile.open(archive_path, "r:gz").extractall(path=target_dir)
    os.remove(archive_path)

注意:archive_path是刚才放那个压缩包的路径
至此,便可以再次运行程序,可以成功运行
压缩文件变成了sklearn.datasets.fetch_20newsgroups下载报错的问题_第2张图片
查看输出内容
sklearn.datasets.fetch_20newsgroups下载报错的问题_第3张图片

你可能感兴趣的:(机器学习,sklearn,python,人工智能)