亿级微博语料库

亿级微博语料库




简介:


灵玖WBK微博监控系统(www.lingjoin.com)日均采集数据200万条,目前已经积累了微博博主语料库(包括:微博名、真实姓名、性别、出生日期、所在地、工作经历、教育经历、简介、用户级别、粉丝数、关注数等字段信息)约1亿条;博主关注关系库20亿,微博内容10亿条(包括内容信息、发布时间、回复转发数等)、微博话题库2万个(记录热门的话题数据);适用于网络科学、舆情监测、潜在客户分析等科研与商业用途。


样本:


亿级微博语料库_第1张图片

你可能感兴趣的:(亿级微博语料库)