pandas学习笔记(4)

pandas学习笔记(4)

时间序列(TimeSeries)

#时间序列(TimeSeries)
# date_range() 参数 start 开始时间, periods 生成的时间序列长度,freq 按照什么间隔 d w 5h,W-MON
date = pd.date_range(start='2019-01-1', periods=5, freq='d')
print(date)

在这里插入图片描述

s= pd.Series(np.random.rand(5), index=date)
print(s)

pandas学习笔记(4)_第1张图片

# 传入字符串
print(s['2019-01-01'])
print(s['20190101'])
# 单纯写年月,可以得到该年月下的所有内容
print(s['2019-1'])

pandas学习笔记(4)_第2张图片

#但是使用字符串'201901'传入时,则会报错
print(s['201901'])

pandas学习笔记(4)_第3张图片

drop_duplicates:去除重复项

#drop_duplicates:去除重复项
#subset : column label or sequence of labels, optional用来指定特定的列,默认所有列
#keep : {‘first’, ‘last’, False}, default ‘first’删除重复项并保留第一次出现的项
#inplace : boolean, default False是直接在原来数据上修改还是保留一个副本
c=pd.DataFrame({
     
    'call':[2011,2011,2008,2013,2013],
    'age':[5,4,3,2,1],
    'sex':['M','F','M','F','M'],
    'num':[123,123,123,123,45]
})
print(c)

pandas学习笔记(4)_第4张图片

print(c.drop_duplicates(['call']))

pandas学习笔记(4)_第5张图片

分类(Categoricals)

#分类(Categoricals)
data_list = pd.DataFrame(np.random.randint(0, 20, size=10),columns=['A'])
data_list['B']=['M','F']*5
print(data_list)

pandas学习笔记(4)_第6张图片

# 用pd.cut(ori_data, bins, labels) 方法
# 以 bins 设定的画界点来将 ori_data 归类,然后用 labels 中对应的 label 来作为分类名
bins = [-1,10,21]
new_list=pd.cut(data_list['A'], bins)
print(new_list)

pandas学习笔记(4)_第7张图片

# 查看数据,通过pd.value_counts()查看Categories数据
print(pd.value_counts(new_list))

在这里插入图片描述

# 传入labels标签,进行分类
data_list['C'] = pd.cut(data_list['A'],bins, labels=['good','bad'])
print(data_list)

pandas学习笔记(4)_第8张图片

plot()

#在一个DataFrame中, plot() 方法可以方便地绘制带有label的所有列:
f=open(('D:/学习/day-data/数据.csv'))
df=pd.read_csv(f)
print(df)

pandas学习笔记(4)_第9张图片

new_df=pd.DataFrame(np.array(df[['总人口(万人)','老龄化人数(万人)']]),index=df['年份'],columns=['SUM','Old'])
print(new_df)

pandas学习笔记(4)_第10张图片

# 折线图
new_df.plot(grid=True)
# 柱状图
new_df.plot(kind='barh', stacked=True, figsize=[16,6],colormap='flag')

pandas学习笔记(4)_第11张图片pandas学习笔记(4)_第12张图片

你可能感兴趣的:(pandas,学习笔记)