numpy.insert计算pandas.core.series.Series类型的数据长度时会多1个

原始数据

将数据导入pandas DataFrame里,如下
df1
站点 年 月 日 时 NO NO2 NOx O3
0 1028 2017 1 1 1:00 27 59 100 8
1 1028 2017 1 1 2:00 14 60 82 5
2 1028 2017 1 1 3:00 15 53 75 8

报错

只给O3列用numpy.insert插入0时总是报长度比index暗示的多1个:

np.insert(df1['O3'],1,0)
ValueError: Length of passed values is 105119, index implies 105118.

这样看第一个也是数值,不是列名

df1['O3'][0]
8

用下列方法看长度也都是105118,不是105119:

len(df1['O3'])
105118

df1['O3'].index
RangeIndex(start=0, stop=105118, step=1)

df1['O3'].size
105118

df1['O3'].shape[0]
105118

解决

不知道numpy.insert到底是用什么计算长度的,只好传入df1[‘O3’].values便解决了:
np.insert(df1[‘O3’].values, 0, 0)
这里没指定axis会将series摊平成一个array,使用下面数组之间的减法才能让每个数值相减,如果传入的依然是series则相减得不到想要的值,全是NaN.
cumsum_vec = np.cumsum(np.insert(data, 0, 0))
ma_vec = (cumsum_vec[window_size:] - cumsum_vec[:-window_size]) / window_size

你可能感兴趣的:(numpy.insert计算pandas.core.series.Series类型的数据长度时会多1个)