在没有网络的情况下,datasets.load_dataset如何加载cnn_dailymail

在有网络的时候,下面这个命令可以轻易的运行成功

import datasets
dataset = datasets.load_dataset("cnn_dailymail", '3.0.0')

但是,没有网络的时候,只需要从https://huggingface.co/datasets/cnn_dailymail/tree/main/data下载cnn_stories.tgz和dailymail_stories.tgz这两个文件即可,dataset_infos.json和cnn_dailymail.py
无需下载。

把cnn_stories.tgz、dailymail_stories.tgz这两个文件放在python脚本的同一路径下,执行下面的命令即可

import datasets
dataset=datasets.load_dataset("text", 
              data_files=["cnn_stories.tgz","dailymail_stories.tgz"])

你可能感兴趣的:(huggingface,深度学习,人工智能)