Pandas 结构化数据(上)

最近在学习python的数据分析库,把练习的代码贴出来,记录一下。

创建序列

如果不是基础包内的函数,就要把相应的包名写上(pd,np之类的)

s = pd.Series([1,3,5,np.NaN,6,8])

产生时间序列 pd.date_range

pandas.date_range(start=None, end=None, periods=None, freq='D', tz=None, normalize=False, name=None, closed=None, **kwargs)

其中freq参数用来确定按什么频率产生序列,默认按天(D天,M月,W周,H小时,min分钟,s秒),不同的freq参数也会影响时间序列

period指定时间长度,如果缺失,需要指定开始、结束日期

dates = pd.date_range('20160101',periods=6)

df = pd.DataFrame(np.random.randn(6,4), index=dates, columns=list('ABCD'))

布尔索引

df[df.A > 0]

df2[df2['E'].isin(['two','four'])]

df['F'] = s1 # 按索引进行关联

df1.dropna(how='any')

你可能感兴趣的:(Pandas 结构化数据(上))