该攻略未能说透:https://blog.csdn.net/weixin_42655901/article/details/124246300
我的实际经历,已经根本解决。
问题:from datasets import load_dataset 下不下来,各种bug
解决方法:
1、(在xxx路径下)git clone https://huggingface.co/datasets/imdb
2、在python里:
imdb = load_dataset(r’xxx\imdb’, cache_dir=‘.\cache_dir’)
第二步的第一次运行会很慢,可能持续几分钟,实际是下载东西到cache_dir;
但实际使用时,还是运行第二步的同一行,加载就是瞬间了。