自媒体作者如何用大数据技术分析热点新闻标题,打造爆文

做为自媒体新手,一直在思考一个问题,我该写什么才能获得更多阅读量。很笨础的试了几次,试图找到爆文的模式。然而经常是花了很久写的一篇文章没有推荐,也没人评论。那就是说推荐引擎和人类都看不上我这篇文章。

那有没有什么办法呢?在以前的博客时代,我们可以用GA分析点击量,找出读者喜欢的文章然后多写一些类似的,投其所好。但做为媒体是不大可能给你这些信息的。那有没有办法获取呢?当然有啊,我们知道,评论往往和阅读量是正相关的,头条的AI算法也会根据评论给更多的推荐。那我们看评论量就可以看出人们的喜好了。

标准的新闻基本有这样的格式


title.PNG

我们可以看到标题,作者,评论数,以及发布时间。这样我们就可以用一些常见的爬虫技术去自动抓下来,比如火车,八爪鱼。 不过很多网站需要手动滚动刷新,这就需要一些技巧了。

在拿到数据后,我们可以导入到EXCEL, 根据评论数排序,这样就知道当前的热点新闻了

result.PNG

其实这时就可以告一段落了,你可以去学习这些人的技巧和标题模式去优化你的文章。比如前几篇都是关于移动,马云,支付宝,华为的, 可见人们比较喜欢关注大公司。

但能不能再给力一点呢?当然可以, 看上图最后一档,我把所有的标题按词组分开了,这样我们就知道热点真正是什么,而不会被那些修饰词困扰。我们把这些词计数,找出最多被提到的词并图形化,这就是热门的标签云,很多工具都可以做到。我用python的word_cloud写了一个,结果如下

pjl_cloud4.jpg

字体最大的几个比如手机,小米,支付宝就是热点新闻的关键字了。如果你的新闻提到了,很大概率会引起关注的。

整个流程都是可以用各种工具或者编程实现的,我用了60多行python两个小时就实现了。

你可能感兴趣的:(自媒体作者如何用大数据技术分析热点新闻标题,打造爆文)