浅析豆瓣电影TOP250榜单——总结

这篇文章主要做了以下这些内容:

  1. 收集豆瓣电影排名榜单信息并加以处理成便于调用的文档形式。
  2. 分析榜单中影片相关的数据,并运用了多种不同的图表展示这些数据之间的关系关系。

经过前几段的简单分析,我们可以发现豆瓣TOP250榜单对于国内电影主流文化还是比较契合的

我们都知道世界上没有一份绝对公平的榜单,世界上的好电影绝对不止250部,孰优孰劣这种主观的问题本身就没有绝对的答案。现在大量的算法在研究如何做智能算法、个性化推荐算法、预测型算法,但是算法得到的结果总是客观存在的,以客观事物来揣摩人们的主观内心想法始终是一件很难做得面面俱到的事情。
因此我们也不能忽视此类普适的非个性化推荐算法,这份TOP250榜单以其广泛的适应性,在缺乏足够多的数据支撑智能算法分析的情况下来说,是一个很好的解决方案。

有待改进的地方

  • 对于评分相同的影片并不一定代表影片质量就相当,还需要考虑评分的标准差、不对称性等高阶数据的影响因素。
  • 数据可视化部分增加更多交互性,比如显示鼠标悬停位置的数据详情显示。
  • 数据源的动态分析,增加时间维度的分析。追踪排行榜的变化,相应的自动调整展示的分析结果。
  • 单一数据源局限性较大,增加与其他榜单如IMDb的数据比较可以更加凸显其特点。

上一章: C4 分析&展示

你可能感兴趣的:(浅析豆瓣电影TOP250榜单——总结)