统计2018年在国内上映的所有电影,分别获取上映电影的票房、评分(豆瓣、猫眼、时光、imdb)、类型、上映日期、演员、导演等数据。利用所获数据绘图,对国内上映电影进行定量分析
movies_data 文件夹: 包括了所有获取数据所需的 .py 文件
movie_draws 文件夹
output_data 文件夹
client = pymongo.MongoClient()
db = client.chinamovies # 连接到数据库
collections = db.movies # 数据表 movies
collections_detail = db.moviesdetail # 豆瓣数据都放入了数据表 moviesdetail 中
collections.insert_many(data['pData'])
collections_detail.insert_one(datadetail)
# 更新数据到数据库中
collections_detail.update({'_id': i['_id']}, {'$set': {'猫眼':{
'title': movie['nm'], 'rank': movie['sc'],
'id': movie['id'], 'pubDesc': movie['pubDesc']
}}})
# 必须要名称一致且2018年大陆上映才符合要求
if movie['nm'] == i['title'] and re.findall(r'2018.*大陆上映', movie['pubDesc']):
... # 符合要求
完整项目代码下载地址:基于Python+pyecharts 实现国内上映电影票房评分可视化分析