Python对数据进行插值和下采样

使用Python进行插值非常方便,可以直接使用scipy中的interpolate

import numpy as np
x1 = np.linspace(1, 4096, 1024)
x_new = np.linspace(1, 4096, 4096)
from scipy import interpolate
tck = interpolate.splrep(x1, data)
y_bspline = interpolate.splev(x_new, tck)

其中y_bspline就是从1024插值得到的4096的数据

但是,scipy中好像并没有进行下采样的函数,嗯..难道是因为太过简单了么,不过好像用一个循环就可以完成,但如果把向量看成一个时间序列,使用pandas中的date_range模块也可以十分方便的以不同频率进行采样,并且,很多对文件的操作都是使用pandas操作的。

import pandas as pd
index = pd.date_range('1/1/2000', periods=4096, freq='T')  #这个起始时间任意指定,freq为其频率
data = pd.read_table(filename, names=['feat'])
data.index = index
data_obj = data.resample('4T', label='right')  #第一个为抽样频率,label表示左右开闭区间
data_new = data_new.asfreq()[0:]

因为data.resample返回的是一个 pandas.tseries.resample.DatetimeIndexResampler对象
所以想要获取其中的值可以通过 data_new.asfreq()[0:]获取

更多方法详见pandas.DataFrame.resample

你可能感兴趣的:(Python学习)