可视化 | Python电影Top250数据可视化

文章目录

  • ️‍ 1. 数据可视化
    • ️‍ 1.1 读取数据
    • ️‍ 1.2 各年份上映电影数量柱状图(纵向)
    • ️‍ 1.3 各地区上映电影数量前十柱状图(横向)
    • ️‍ 1.4 电影评价人数前二十柱状图(横向)
  • ️‍ 2. 可视化项目源码+数据

大家好,我是 【Python当打之年(点击跳转)】

本期我们以电影Top250为例,向大家展示如何用python分析电影相关信息,包括:片名、上映年份、评分、评价人数、导演、编剧、主演、类型、国家/地区、时长等信息,最后将数据进行可视化处理,希望对小伙伴们有所帮助。

在这里插入图片描述

涉及到的内容:

  • pandas–读取表格数据
  • pyechars–数据可视化

️‍ 1. 数据可视化

️‍ 1.1 读取数据

用pandas模块读取:

import pandas as pd
from pyecharts import options as opts
from pyecharts.charts import Bar

df = pd.read_excel('TOP250.xlsx')

可视化 | Python电影Top250数据可视化_第1张图片

️‍ 1.2 各年份上映电影数量柱状图(纵向)

代码:

def getzoombar(data):
    year_counts = data['上映年份'].value_counts()
    year_counts.columns = ['上映年份', '数量']
    year_counts = year_counts.sort_index()
    c = (
        Bar()
        .add_xaxis(list(year_counts.index))
        .add_yaxis('上映数量', year_counts.values.tolist())
        .set_global_opts(
            title_opts=opts.TitleOpts(title='各年份上映电影数量'),
            yaxis_opts=opts.AxisOpts(name='上映数量'),
            xaxis_opts=opts.AxisOpts(name='上映年份'),
            datazoom_opts=[opts.DataZoomOpts(), opts.DataZoomOpts(type_='inside')],)
        .render('各年份上映电影数量.html')
        )

效果:

️‍ 1.3 各地区上映电影数量前十柱状图(横向)

代码:

def getcountrybar(data):
    country_counts = data['国家/地区'].value_counts()
    country_counts.columns = ['国家/地区', '数量']
    country_counts = country_counts.sort_values(ascending=True)
    c = (
        Bar()
        .add_xaxis(list(country_counts.index)[-10:])
        .add_yaxis('地区上映数量', country_counts.values.tolist()[-10:])
        .reversal_axis()
        .set_global_opts(
        title_opts=opts.TitleOpts(title='地区上映电影数量'),
        yaxis_opts=opts.AxisOpts(name='国家/地区'),
        xaxis_opts=opts.AxisOpts(name='上映数量'),
        )
        .set_series_opts(label_opts=opts.LabelOpts(position="right"))
        .render('各地区上映电影数量前十.html')
        )

效果:
在这里插入图片描述

️‍ 1.4 电影评价人数前二十柱状图(横向)

代码:

def getscorebar(data):
    df = data.sort_values(by='评价人数', ascending=True)
    c = (
        Bar()
        .add_xaxis(df['片名'].values.tolist()[-20:])
        .add_yaxis('评价人数', df['评价人数'].values.tolist()[-20:])
        .reversal_axis()
        .set_global_opts(
            title_opts=opts.TitleOpts(title='电影评价人数'),
            yaxis_opts=opts.AxisOpts(name='片名'),
            xaxis_opts=opts.AxisOpts(name='人数'),
            datazoom_opts=opts.DataZoomOpts(type_='inside'),
            )
        .set_series_opts(label_opts=opts.LabelOpts(position="right"))
        .render('电影评价人数前二十.html')
        )

效果:
在这里插入图片描述

️‍ 2. 可视化项目源码+数据

网盘: https://pan.baidu.com/doc/share/Olj4d~aKuXT7AF0cq01MrQ-437060019167360
提取码: pyra


以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享让更多人知道哦

你可能感兴趣的:(Python可视化系列,python,pandas,数据分析)