python电影数据分析报告_Python进行电影数据分析及可视化

一、提出问题

作为一名业务分析师顾问,客户是一个电影制作新公司,他们将制作一部新电影。客户想确保电影能成功,从而使新公司立足市场。他们希望我能帮助他们了解电影市场趋势,使他们能做出正确的决策。他们提供了指导,希望我能研究以下三大领域:问题 1:电影类型是如何随着时间的推移发生变化的?

问题 2: Universal Pictures 和 Paramount Pictures 之间的对比情况如何?

问题 3: 改编电影和原创电影的对比情况如何?(通过keywords变量中的based on novel字段来判断)

更重要的是,客户请我根据提供的数据,额外回答第四个问题。

二、理解数据

1)获取数据

本次项目选用Movie Database,一个可以公开使用的电影数据。TMDB 5000 Movie Dataset​www.kaggle.com

2)导入数据

3)理解数据

moviedf数据集中,有20个字段,以下是每个字段的含义介绍:

● id:标识号

● imdb_id:IMDB 标识号

● popularity:在 Movie Database 上的相对页面查看次数

● budget:预算(美元)

● revenue:收入(美元)

● original_title:电影名称

● cast:演员列表,

你可能感兴趣的:(python电影数据分析报告)