AG_NEWS的数据集

项目地址:(但基本无法下载)
https://github.com/mhjabreel/CharCNN/tree/master/data/ag_news_csv 

AG是由ComeToMyHead超过一年的努力,从2000多不同的新闻来源搜集的超过1百万的新闻文章
ComeToMyHead是一个学术新闻搜索引擎,开始于2004年7月

csv的数据

每一条数据有三列,第一列为标签,第二列为title,第三列为content:

AG News Dataset 拥有超过 100 万篇新闻文章,其中包含 496,835 条 AG 新闻语料库中超过 2000 个新闻源的文章,该数据集仅采用了标题和描述字段,每种类别均拥有 30,000 个训练样本和 1900 个测试样本。

下载地址:https://hyper.ai/datasets/5475

智一面算法工程师的面试题提供在线GPU加速训练可直接使用数据集

 

 

你可能感兴趣的:(AG_NEWS的数据集)