Python实现的《数据处理与可视化》实验报告(温度和出行人数的比较、骑行长度和性别年龄)

目录
一、 实验内容 1
二、 数据读取 1

  1. import pandas as pd 1
    三、 数据清洗 2
    四、 数据可视化 2
    这是清洗前的数据,可以看到订阅用户占比为86.15% 5
    五、 相关性分析 9
  2. import pandas as pd 9
    六、 感想总结 12
    一、实验内容
    数据读取
    数据清洗
    数据可视化
    相关性分析
    二、数据读取
    首先,需要进行导包操作:
    1.import pandas as pd
    2.import numpy as np
    接着,用pandas来进行对csv中数据的读取:
    1.df = pd.read_csv(“201506-citibike-tripdata.csv”)
    2.print(df.head())
    输出前五行,得到如下结果:
    在这里插入图片描述

可以看到,读取成功。
四、数据可视化
数据可视化用到的工具有matplotlib.pyplot、pyecharts、seaborn和百度api(在pyecharts中调用绘制地图数据)。下面是我绘制的一些图像:
性别占比:
由于数据的局限性,我没有追加该地区男女比例的占比,这里仅仅展示骑行共享单车中的男女占比:

1.# 起点分布图  
2.def draw_start_station_pos():  
3.    list_station_val = read_start_pos()  
4.    c = (  
5.        BMap(init_opts=opts.InitOpts(width="2000px",height="1000px"))  
6.        .add_schema(baidu_ak="GF7GOq6CbjMcGfDvFGuIFjrCKYi3zeTy", center=[-73.99069656,40.72502876],zoom=15)  
7.        .add_coordinate_json("infor_start.json")  
8.        .add(  
9.            series_name="起点分布图",  
10.            type_="scatter",  
11.            data_pair=list_station_val  
12.        )  
13.        .set_global_opts(  
14.            title_opts=opts.TitleOpts(title="起点分布图"),  
15.            visualmap_opts=opts.VisualMapOpts(max_=5000),  
16.  
17.        )  
18.        .set_series_opts(label_opts=opts.LabelOpts(is_show=False))  
19.        .render("draw_start_station_pos.html")  
20.    )  
21.  
22.# 起点分布热力图  
23.def draw_start_station_pos_heat():  
24.    list_station_val = read_start_pos()  
25.    c = (  
26.        BMap(init_opts=opts.InitOpts(width="2000px",height="1000px"))  
27.        .add_schema(baidu_ak="GF7GOq6CbjMcGfDvFGuIFjrCKYi3zeTy", center=[-73.99069656,40.72502876],zoom=15)  
28.        .add_coordinate_json("infor_start.json")  
29.        .add(  
30.            series_name="起点分布图",  
31.            type_="heatmap",  
32.            data_pair=list_station_val  
33.        )  
34.        .set_global_opts(  
35.            title_opts=opts.TitleOpts(title="起点分布图"),  
36.            visualmap_opts=opts.VisualMapOpts(max_=12000,min_=0),  
37.  
38.        )  
39.        .render("draw_start_station_pos_heat.html")  
40.    )  

Python实现的《数据处理与可视化》实验报告(温度和出行人数的比较、骑行长度和性别年龄)_第1张图片
Python实现的《数据处理与可视化》实验报告(温度和出行人数的比较、骑行长度和性别年龄)_第2张图片
Python实现的《数据处理与可视化》实验报告(温度和出行人数的比较、骑行长度和性别年龄)_第3张图片
Python实现的《数据处理与可视化》实验报告(温度和出行人数的比较、骑行长度和性别年龄)_第4张图片
Python实现的《数据处理与可视化》实验报告(温度和出行人数的比较、骑行长度和性别年龄)_第5张图片
Python实现的《数据处理与可视化》实验报告(温度和出行人数的比较、骑行长度和性别年龄)_第6张图片
Python实现的《数据处理与可视化》实验报告(温度和出行人数的比较、骑行长度和性别年龄)_第7张图片
Python实现的《数据处理与可视化》实验报告(温度和出行人数的比较、骑行长度和性别年龄)_第8张图片
Python实现的《数据处理与可视化》实验报告(温度和出行人数的比较、骑行长度和性别年龄)_第9张图片
Python实现的《数据处理与可视化》实验报告(温度和出行人数的比较、骑行长度和性别年龄)_第10张图片
Python实现的《数据处理与可视化》实验报告(温度和出行人数的比较、骑行长度和性别年龄)_第11张图片
Python实现的《数据处理与可视化》实验报告(温度和出行人数的比较、骑行长度和性别年龄)_第12张图片

你可能感兴趣的:(python,pandas,html,骑行指数,课程设计)