数据分析案例-航班准点分析

目录

加载数据

数据详细

数据探索和清洗

缺失值处理

重复值查看

起飞和到达延迟总体状况分析

 机场飞机延迟数量分析


数据分析案例-航班准点分析_第1张图片

数据集为美国各州机场的航班信息,包含出发地,目的地,是否出 发延迟15分钟,是否到达延迟15分钟等。

加载数据

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
#支持中文显示
plt.rcParams['font.family']='Kaiti'
# 使用非unicode的负号,当使用中文时候要设置
plt.rcParams['axes.unicode_minus']=False
data = pd.read_csv('airport-ontime.csv')

数据详细

数据分析案例-航班准点分析_第2张图片

数据探索和清洗

data.info()

数据分析案例-航班准点分析_第3张图片

可以看到总共502617行、17列。其中DEP_DEL15(起飞是否延迟)非空 值是492974行,ARR_DEL15(到达是否延迟)非空值是490716 行,Unnamed这列全部为空值。

缺失值处理

#删除Unnamed列
data.dropna(axis=1,how='all',inplace=True)
data.info()

重复值查看

# 重复值查看
data.duplicated().any()
data.drop_duplicates(inplace=True)
data.info()

起飞和到达延迟总体状况分析

查询起飞是否延迟

data['DEP_DEL15'].head()

统计起飞延迟与不延迟,使用饼状图来显示

s = data['DEP_DEL15'].dropna()
delays = s.value_counts()
display(delays)
delays.name=''
delays.plot(kind='pie',labels=['起飞不延迟','起飞延迟'],autopct='%.2f',title='起飞延迟总体情况')

数据分析案例-航班准点分析_第4张图片

统计到达延迟与不延迟,使用饼状图显示

s = data['ARR_DEL15'].dropna()
delays = s.value_counts()
display(delays)
delays.name=''
delays.plot(kind='pie',labels=['到达不延迟','到达延迟'],autopct='%.2f',title='到达延迟总体情况')

 数据分析案例-航班准点分析_第5张图片

 机场飞机延迟数量分析

机场航班起飞延迟百分比=机场起飞延迟的航班数/机场航班总起飞 数。机场起飞延迟的航班数前面已经获取到变量 depart_delay_counts中,还需要获取机场总航班。

机场起飞延迟数

#针对机场延迟数量来分析,找出哪个机场延迟数量最多
# 缺失值处理
d =data[['ORIGIN_STATE_ABR','DEP_DEL15']].dropna()
depart_delay_couots =d.groupby('ORIGIN_STATE_ABR')
['DEP_DEL15'].sum()
# 设置画布大小 figsize=(a,b) a表示画布宽,b表示画布高,单位英寸
depart_delay_couots.sort_values(ascending=False).plot(kind='bar',figsize=(14,6))

数据分析案例-航班准点分析_第6张图片

 机场到达延迟数

# 缺失值处理
d =data[['DEST_STATE_ABR','ARR_DEL15']].dropna()
arrive_delay_couots =d.groupby('DEST_STATE_ABR')
['ARR_DEL15'].sum()
# 设置画布大小 figsize=(a,b) a表示画布宽,b表示画布高,单位英寸
arrive_delay_couots.sort_values(ascending=False).plot(kind='bar',figsize=(14,6))

数据分析案例-航班准点分析_第7张图片

 合并机场起飞和延迟状况

# 合并机场起飞和延迟状况
delay_df=pd.DataFrame([depart_delay_couots,arrive_delay_couots]).T
delay_df.columns=['起飞延迟','到达延迟']
delay_df.sort_values('起飞延迟',ascending=False).plot(kind='bar',figsize=(14,6),title='机场起飞到达延迟状况')

数据分析案例-航班准点分析_第8张图片

以下是心得体会:

通过这次Python项目实战,我学到了许多新的知识,这是一个让我把书本上的理论知识运用于实践中的好机会。原先,学的时候感叹学的资料太难懂,此刻想来,有些其实并不难,关键在于理解。

在这次实战中还锻炼了我其他方面的潜力,提高了我的综合素质。首先,它锻炼了我做项目的潜力,提高了独立思考问题、自我动手操作的潜力,在工作的过程中,复习了以前学习过的知识,并掌握了一些应用知识的技巧等

在此次实战中,我还学会了下面几点工作学习心态:

1)继续学习,不断提升理论涵养。在信息时代,学习是不断地汲取新信息,获得事业进步的动力。作为一名青年学子更就应把学习作为持续工作用心性的重要途径。走上工作岗位后,我会用心响应单位号召,结合工作实际,不断学习理论、业务知识和社会知识,用先进的理论武装头脑,用精良的业务知识提升潜力,以广博的社会知识拓展视野。

2)努力实践,自觉进行主角转化。只有将理论付诸于实践才能实现理论自身的价值,也只有将理论付诸于实践才能使理论得以检验。同样,一个人的价值也是透过实践活动来实现的,也只有透过实践才能锻炼人的品质,彰显人的意志。

3)提高工作用心性和主动性。实习,是开端也是结束。展此刻自我面前的是一片任自我驰骋的沃土,也分明感受到了沉甸甸的职责。在今后的工作和生活中,我将继续学习,深入实践,不断提升自我,努力创造业绩,继续创造更多的价值。

这次Python实战不仅仅使我学到了知识,丰富了经验。也帮忙我缩小了实践和理论的差距。在未来的工作中我会把学到的理论知识和实践经验不断的应用到实际工作中,为实现理想而努力。

你可能感兴趣的:(数据分析,python,数据分析)