失业率数据分析

数据记录1948年~2016年每个月份的美国失业率情况

显示中文

在代码中加入

from pylab import *
mpl.rcParams['font.sans-serif']=['SimHei']

报错:TypeError: only size-1 arrays can be converted to Python scalars

给plt.bar函数传的参数y列表里面不是纯数字

载入数据

import pandas as pd
data=pd.read_csv('UNRATE.csv')
# 求每一年的平均值
year=[]
for i in range(1948,2017):
    year.append(i)
year_mean=[]
for i in range(len(year)):
    year_mean.append(float(data[i*12:12+12*i].mean()))

折线图

# 折线图
from pylab import *
mpl.rcParams['font.sans-serif']=['SimHei']
import matplotlib.pyplot as plt
fig=plt.figure(figsize=(15,4))
plt.plot(year,year_mean,'o-')
plt.xticks(year,rotation=90)
plt.title('1948~2016平均失业率')
plt.show

失业率数据分析_第1张图片

失业率是否与经纪危机有关?

美国自1783年取得了对英国殖民者的独立战争胜利后,先后分别于1825年、1837年、1847年、1857年、1866年、1873年、1882年、1890年、1900年、1907年、1920-21年、1929-33年、1937-38年、1948-49年、1957-58年、1969-70年、1974-75年、1980-82年、1990-91年、2007-12年多次发生过经济危机。

可以看到失业率与经济危机有一定关系

失业率数据分析_第2张图片

条形对比图

失业率数据分析_第3张图片

 

我不知道要画哪种图,有什么想要从数据中知道的信息

失业率和很多因素有关,这里我只有年份和失业率,所以只能够画出折线图来看失业率在哪些年份增长快,可能是因为当年的一些因素。整体的趋势就是上升下降

失业率会不会和月份有关?

每三年放在一起看了一下,除了那一年失业率平均值上升的年份,每月的失业率有浮动外,其他基本不变,所以说失业和月份没关系。

失业率数据分析_第4张图片

还有啥?

ARIMA时间序列预测趋势

时间序列分析

几个关键性的图

1.原始数据的趋势图

失业率数据分析_第5张图片

2.一阶差分图

失业率数据分析_第6张图片

3.ACF&PACF

失业率数据分析_第7张图片失业率数据分析_第8张图片

4.AIC:(4,2);BIC(3,2)

5.预测趋势图

失业率数据分析_第9张图片

这预测的我也是醉了。预测趋势上升,实际下降。。。

 

你可能感兴趣的:(python,学习笔记)