大家好,说到吴孟达,他和周星驰的喜剧可是我们少时美好记忆里的不可或缺的一部分。
达叔
星爷已经转到幕后很久了,而达叔其实一直都有活跃在荧幕。2019年国产高票房科幻电影《流浪地球》里的姥爷韩子昂,今年刚上线不久的网络电影《少林寺之得宝传奇》里的客商老者。达叔一直都在带给我们快乐与感动,可惜这些都在今后成为回忆,定格在了2021年2月27日。
今天,我们通过Python爬取豆瓣里达叔的238部作品,看看那些年, 达叔出演过的作品与合作过的演员们。
大家可以在公众号聊天框 回复 0303 获取 达叔全部作品详情数据、爬虫代码和图表词云绘制代码文件。
目录:
1. 那些年达叔出演过的作品
1.1. 达叔作品上线时间分布
1.2. 达叔作品类型分布
1.3. 达叔作品的分类
1.4. 达叔作品豆瓣评价
1.5. 达叔作品评分分布
1.6. 达叔作品的评价数分布
2. 那些年达叔合作过的他们
2.1. 达叔合作过的导演
2.2. 达叔合作过的演员
3. 达叔获得过的奖项
4. 豆瓣作品详情爬虫代码
1. 那些年达叔出演过的作品
从豆瓣数据显示,达叔最早上线的作品是1975年香港TVB电视台播映的古装短篇剧集《宋江怒杀阎婆惜》,这部剧里还有大家熟悉的发哥。在至今的46年里,达叔作品238部,平均每年高达5部有余。
1.1. 达叔作品上线时间分布
从1975年至今的46年时间里,达叔基本上每年都有作品上线,其作品上线最多的年份在90-93年,像《赌神系列》、《逃学威龙系列》、《整蛊专家》、《审死官》、《鹿鼎记》、《武状元苏乞儿》等经典都是在这几年上线的。像我们更熟知的《大话西游系列》则是在95年上线,《喜剧之王》和《少年足球》分别在99年和01年上线。
达叔作品上线时间分布
1.2. 达叔作品类型分布
在达叔238部作品中有67部电视剧和171部电影,其中83版的《射雕英雄传》里达叔出演的是丐帮净衣帮彭长老,彼时的星爷是宋兵乙。除此之外,我比较熟悉的还有他和曹骏、释小龙主演的《九岁县太爷》。
电视剧与电影占比
1.3. 达叔作品的分类
达叔的作品主要以喜剧为主,我少时记忆里达叔就是一个无厘头搞笑的形象。
分类形式
1.4. 达叔作品豆瓣评价
达叔的作品,在豆瓣有评价的共177部,其中电影较多有134部,电视剧有43部。
以下树状热力图中,颜色越深代表评分越高(更受观众喜欢),面积越大代表评价数越多(更火)。咱们可以看到最火的依次是《流浪地球》、《大话西游系列》、《喜剧之王》和《九品芝麻官》,这其中《大话西游系列》最受观众喜欢,评分超高都在9分+。
达叔作品豆瓣评价
1.5. 达叔作品评分分布
达叔出演过的电视剧评分基本都在6分左右及以上,达叔出演过的电影则大部分集中在6-8分。
达叔作品评分分布
达叔作品中评分前五:
评分前5的作品
1.6. 达叔作品的评价数分布
除了电视剧普遍都是较低评价数之外,达叔的高分电影的评价数也都较多。
达叔作品的评价数分布
达叔作品中评价数前五:
评价数前5的作品
2. 那些年达叔合作过的他们
和达叔合作过的导演有166位(同一部电影或电视剧都存在多个导演),演员则高达1,157位(豆瓣作品详情页记录的演员)。
2.1. 达叔合作过的导演
和达叔合作过的166位导演中,与朱延平合作14次,和王晶合作13次,同杜琪峰合作10次。
《赌神系列》、《九品芝麻官》、《鹿鼎记》和《整蛊专家》等都是王晶导演作品;
和朱延平导演合作的作品中比较知名的大概就是周杰伦主演的08年上线的《大灌篮》;
像电视剧《射雕英雄传》和电影《阿郎的故事》则是达叔与杜琪峰和王天林导演合作过的。
和达叔合作过的导演云图
2.2. 达叔合作过的演员
达叔合作过的演员则高达1,157位,其中星爷首屈一指,合作剧作高达30部+,其次是黄一飞和张敏的21部以及华仔的18部。
与星爷合作的30不戏除了01年的《少年足球》之前,其余全部为上个世纪的作品,不过星爷作为演员在01年之后也只出演过三部电影而已;
月光宝盒
有黄一飞的地方也基本都是有星爷的地方,也就是基本上有达叔的地方;
基本上在90-93年之间达叔的戏,星爷、张敏、华仔都在咯。
和达叔合作过的演员云图
3. 达叔获得过的奖项
达叔荣誉
4. 豆瓣作品详情爬虫代码
这里不介绍详情爬虫过程了,直接贴源码:
思路:从个人页作品列表中找到每个作品的详情页采集详情数据。
“”"
Created Feb 28 10:30:56 2021
@author: 可以叫我才哥
“”"
importrequests
importre
importpandasaspd
importhtml
fromlxmlimportetree
fromtqdmimporttqdm
importrandom
importtime
defget_html(url):
time.sleep(1)
headers = {
“User-Agent”:“Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.66 Safari/537.36”,
}
r = requests.get(url, headers=headers)
r = html.unescape(r.text)
r = re.sub(’:\xa0’,’’, r)
returnr
url =‘https://movie.douban.com/celebrity/1016771/movies?start=0&format=pic&sortby=time&role=A1’
r = get_html(url)
pages = int(re.findall(
r’(共(\d+)条)’, r)[0])//10+1
works = []
forpageintqdm(range(15,pages)):
url =f’https://movie.douban.com/celebrity/1016771/movies?start={page*10}&format=pic&sortby=time&role=A1’
r = get_html(url)
r_html = etree.HTML®
ul = r_html.xpath(’//*[@id=“content”]/div/div[1]/div[2]/ul’)[0]
lis = ul.xpath(’./li’)
forliinlis:
work = {}
work[‘url’] = li.xpath(’.//dl/dt/a/@href’)[0]
r_info = get_html(work[‘url’])
r_info_html = etree.HTML(r_info)
a = r_info_html.xpath(’//div[@id=“info”]//text()’)
b =’’.join(a)
c = b.replace(’ ‘,’’)
d = re.sub(r’\n+’,’\n’, c)
e = d.split(’\n’)
keys = [i.split(’:’)[0]foriine[1:-1]]
values = [i.split(’:’)[1]foriine[1:-1]]
work.update(dict(zip(keys, values)))
work[‘作品名称’] = li.xpath(’.//h6/a/text()’)[0]
work[‘年份’] = re.findall(r’(\d+)’, li.xpath(’.//h6/span/text()’)[0])[0]
try:
work[‘评分’] = li.xpath(’.//dl/dd//div/span[2]/text()’)[0]
work[‘评价数’] = li.xpath(’.//dl/dd//div/span[3]/text()’)[0]
except:
pass
works.append(work)
df = pd.DataFrame(works)
如果你符合下面的情况中的任意一条,那我十分建议你加入跟着一起学习
1.准备从事编程工作,但是不知道选择什么语言好
2.只掌握了Python基础,缺乏系统性的学习以及企业级项目实战,达不到求职的能力
3.有一定Python基础,但是求职屡屡碰壁,各种问题频繁暴露,甚至怀疑自己不适合做开发
4.准备转行从事开发的同学
5.年满18即可
6.想利用Python副业月入3000-80000
****扫码二维码领取Python学习试学课程+课程咨询!
领取福利加小姐姐微信:python7762
免费领取学习+课程规划