数据分析:今日头条阅读量和评论量前1000名的文章内容和标题特征

先占个坑,先写个大概的内容,得空后再补充完整的。

之前花了不少时间采集了2017年1月1日到17年12月6日今日头条上阅读量和评论量前100的文章,具体数据如下:

数据分析:今日头条阅读量和评论量前1000名的文章内容和标题特征_第1张图片

总共1000条数据,有标题、评论数量、阅读数数量、文章类型、发布时间等维度。分析的主要点:

1、文章标题都包含哪些方面内容?

2、文章标题的情感倾向是什么?

3、文章内容主要讲的是什么?

4、文章阅读量和评论量之间的关系?

数据分析:今日头条阅读量和评论量前1000名的文章内容和标题特征_第2张图片
文章类型分布


数据分析:今日头条阅读量和评论量前1000名的文章内容和标题特征_第3张图片
文章评论量和阅读量,红色虚线是阅读量,蓝色实线是评论量
数据分析:今日头条阅读量和评论量前1000名的文章内容和标题特征_第4张图片
阅读量和评论量散点图分布
数据分析:今日头条阅读量和评论量前1000名的文章内容和标题特征_第5张图片
文章情感色彩分析,其中62.8%是正面内容
数据分析:今日头条阅读量和评论量前1000名的文章内容和标题特征_第6张图片
文章标题标题分词

你可能感兴趣的:(数据分析:今日头条阅读量和评论量前1000名的文章内容和标题特征)