电影评分预测

一、简介

电影作为文化产业的中流砥柱,带来了巨大的经济效益和社会效益,而电影票房是衡量电影经济效益最重要的指标。中国电影市场正进入飞速发展的阶段,年全国电影票房收入接近亿元,中国电影市场己经成为全球票房收入增长的主引擎。由于电影具有高投入高风险的特性,提前预测电影的票房是确保电影发行回报、控制发行风险的手段,对于电影的投资决策具有重要参考价值。

二、电影票房影响因素

1.电影本身
名字、类别、年份、公司、技术效果、时长、语言、上映地点、上映时间。主创、故事性(情节)、制作成本、广告投入

2.观众口碑
电影预告片评分:豆瓣上的评分。
电影关注度:新浪微博的关注度、豆瓣上的搜索量。
3.其他因素
媒体关注度
同期上映电影
天气
三、选择对票房影响较大的因素

1.导演影响力
电影导演作为电影生产的组织者和领导者,很大程度上决定了影片的创意质量和艺术风格。在内地观众的心目中,知名导演的影响力有时甚至比明星演员要大的多,具有一定的票房影响力。
可以先根据导演最近三年的电影作品算出其历史平均票房,然后将其从低到高划分为五个等级(1-5),还根据是否是跨界、是否是自编自导自演等情况加以调整,最后形成导演影响力等级。

2.编剧影响力
编剧为影片打造一个好故事,是整部电影的核心与灵魂,是电影产业中最为重要的创意人才。编剧决定了故事的内容质量,编剧的影响力反映了观众对于其剧本的喜爱和认可度。 同导演影响力类似,可以先根据编剧最近三年的电影作品算出其历史平均票房,然后将其从低到高划分为五个等级(1-5),还根据是否是小说作者、是否是成熟作品、是否是自编自导自演等情况加以调整,最后形成编剧影响力等级。
3.演员影响力
一部电影的吸引力在一定程度上取决于“演员效应”,演员精堪的演技和受观众喜爱的性格特征等都是票房成功的重要保障。
根据每个演员最近三年的电影作品算出其历史平均票房,然后将其从低到高划分为五个等级(1-5),并根据其参演电影的数量、获奖情况调整修正。
4.故事熟悉程度
若是续集或改编,设置为1,否则为0。续集的票房受到同系列前几部的影响。
5.电影类型
受欢迎类型设为1,否则为0。
6.电影预告片评分
以豆瓣评分为主,取平均值。(0-10)
7.电影受关注度
以新浪微博数据为主,根据网友对电影的关注量,评论深度等来衡量电影的受关注度。
8.技术效果
若是3D或者IMAX,设为1,否则为0。
9.同期上映电影
如果同期上映电影的预测票房较高,那么受到影响,电影的票房会偏低。
四、预测模型建立

1.国内研究模型
参考国内关于电影票房预测的研究,多使用多元线性回归模型或神经网络模型,其中多元线性回归模型优于神经网络模型。
2013年,Google在一份名为“用谷歌搜索量化电影魔术(Quantifying Movie Magic with Google Search)”的白皮书中公布了其电影票房预测模型,该模型主要利用搜索、广告点击数据以及院线排片来预测票房,Google宣布其模型预测票房与真实票房的吻合程度达到了94%,但未见其公开对未上映电影的预测结果。这篇文章中提到的模型是运用四个变量的线性回归模型,模型的R2是0.92——即这四个变量可以反映票房数据92%的方差,但该模型可能存在着过拟合和测试数量偏少的问题。

2.多元线性回归数学模型
我们假设因变量是票房Y,有m个自变量x1,x2……xm, 代表不同的因素(电影类别,导演影响力,……),Y与m个自变量之间的内在联系是线性的,则其多元线性回归模型如下:
Y=b0+i=1mbixi

其中,b0,b1, …… , bm,是m+1个待确定参数。
通过最小二乘法等方法来确定参数的值,以得到最终的回归方程来预测电影的票房。

参考文献:
聂鸿迪. 中国电影票房的影响因素及其实证研究.

你可能感兴趣的:(回归分析)