大家好,我是 【Python当打之年(点击跳转)】
剧荒了?
本期利用 python 分析一下「近期的影视剧作品数据」 ,看看最近有哪些热门的电视剧、电影、综艺、动漫 等等,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。
涉及到的库:
import pandas as pd
from pyecharts.charts import Bar
from pyecharts.charts import Pie
from pyecharts.charts import Grid
from pyecharts.charts import WordCloud
from pyecharts.charts import PictorialBar
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')
df = pd.read_excel("影视剧信息.xlsx")
df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 750 entries, 0 to 749
Data columns (total 6 columns):
影视剧名称 750 non-null object
影视剧标签 750 non-null object
弹幕数量 729 non-null object
热度 750 non-null int64
关键词描述 750 non-null object
高清图片网址 750 non-null object
dtypes: int64(1), object(5)
memory usage: 35.2+ KB
一共有750部影视剧数据,包含影视剧名称、影视剧标签、弹幕数量、热度、关键词、图片等字段信息。
df1 = df.drop_duplicates(subset=['影视剧名称'])
df1 = df1.sort_values('热度',ascending=False)
df1[['类型','年份','剧情类型','演员','其他']] = df1['影视剧标签'].str.split(' / ',expand=True)
df1.head(10)
def get_pie1(df_type,range_color):
pie1 = (
Pie()
.add(
"",
[list(z) for z in zip(df_type.index.tolist(), df_type.values.tolist())],
radius=["30%", "60%"],
label_opts=opts.LabelOpts(formatter="{b}: {c} ({d}%)")
)
.set_colors(range_color)
.set_global_opts(
title_opts=opts.TitleOpts(title='1-各影视剧类型数量占比',pos_top='2%',pos_left="2%",
title_textstyle_opts=opts.TextStyleOpts(color='#fff200',font_size=20)),
legend_opts=opts.LegendOpts( pos_top="5%"),
)
)
return pie1
def get_pie2(word_count,range_color):
pie2 = (
Pie()
.add(
"",
[list(z) for z in zip(list(word_count.keys()), list(word_count.values()))],
radius=["25%", "70%"],
label_opts=opts.LabelOpts(formatter="{b}: {c} ({d}%)"),
rosetype='radius',
)
.set_colors(range_color)
.set_global_opts(
title_opts=opts.TitleOpts(title='2-各剧情类型数量占比',pos_top='2%',pos_left="2%",
title_textstyle_opts=opts.TextStyleOpts(color='#fff200',font_size=20)),
legend_opts=opts.LegendOpts(pos_top='10%', pos_right="6%",orient='vertical'),
)
)
return pie2
def get_pie2(x_data,y_data,icons,schs,range_color):
p1 = (
PictorialBar()
.add_xaxis(x_data)
.add_yaxis('',
icons,
label_opts=opts.LabelOpts(is_show=False),
category_gap='40%',
symbol_repeat='fixed',
symbol_size=25,
is_symbol_clip=True,
)
.set_global_opts(
title_opts=opts.TitleOpts(
title='3-电视剧热度榜单TOP20',
pos_top='1%',
pos_left="1%",
),
graphic_opts=[
opts.GraphicGroup(
graphic_item=opts.GraphicItem(right="5%", top="60%"),
children=[
opts.GraphicImage(
graphic_item=opts.GraphicItem(
id_="logo", right=10, top=20, z=-10, bounding="raw", origin=[75, 75]
),
graphic_imagestyle_opts=opts.GraphicImageStyleOpts(
image=schs[-1],
width=300,
height=200,
opacity=0.5,
),
)
],
),
]
)
.reversal_axis()
)
p2 = (
PictorialBar()
.add_xaxis(x_data)
.add_yaxis("",
icons,
label_opts=opts.LabelOpts(is_show=False),
symbol_pos='start',
symbol_size=[40,30],
is_symbol_clip=False,
)
.set_global_opts(
xaxis_opts=opts.AxisOpts(is_show=False),
yaxis_opts=opts.AxisOpts(
is_show=True,
is_scale=True,
axistick_opts=opts.AxisTickOpts(is_show=False),
axisline_opts=opts.AxisLineOpts(is_show=False),
axislabel_opts=opts.LabelOpts(font_size=16,color='#FFC107',font_weight=700,margin=20),
),
)
.reversal_axis()
)
return p1,p2
电视剧热度榜单前三:
电影热度榜单前三:
综艺热度榜单前三:
def get_bar1(x_data,y_data,range_color):
bar = (
Bar()
.add_xaxis(x_data)
.add_yaxis('', y_data, category_gap='30%')
.set_global_opts(
title_opts=opts.TitleOpts(
title='8-演员参演影视作品数量TOP20',
pos_top='1%',
pos_left="1%",
title_textstyle_opts=opts.TextStyleOpts(color='#fff200',font_size=20)
),
visualmap_opts=opts.VisualMapOpts(is_show=False, max_=6, min_=0, dimension=0,
range_color=range_color),
legend_opts=opts.LegendOpts(is_show=False)
)
.set_series_opts(
label_opts=opts.LabelOpts(is_show=True,position='right',font_style='italic')
)
.reversal_axis()
)
return bar
演员参演影视作品数量榜单前三:
黄景瑜 6 部:《极限挑战第9季》、《检察风云》、《爱上特种兵》、《罚罪》、《王牌部队》、《破冰行动》
肖燕 5 部:《南洋女儿情》、《半是蜜糖半是伤 》、《小娘惹》、《民国奇探》、《招摇》
朱一龙 5 部:《消失的她》、《知否知否应是绿肥红瘦》、《叛逆者》、《重启之极海听雷第一季》、《重启之极海听雷第二季》、《人生大事》
参演 4 部影视剧的演员有:杨颖、赵丽颖、张新成、白鹿、孙红雷、魏大勋
参演 3 部影视剧的演员有:白敬亭、宋轶、丁禹兮、范丞丞、沈腾、戴向宇、陈伟霆、张颂文、李一桐、倪妮、王鹤棣、杨迪、陈赫、雷佳音、李沁、陈晓、秦岚、任嘉伦、黄渤、张艺兴
点击跳转:【全部可视化项目源码+数据】
以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享(注明出处)让更多人知道。