pandas基本操作

1 pandas数据结构

1.1 series

s=pd.Series([1,2,3,np.nan,5,6])

pandas中的序列,接受参数为列表,默认索引为0,1,2….

1.2 DataFrame

dates=pd.date_range('20180310',periods=6)
df = pd.DataFrame(np.random.randn(6,4), index=dates, columns=['A','B','C','D'])#生成6行4列位置
print(df)#输出6行4列的表格

DataFrame为表格类型,有行索引和列索引,可以看做一组series的集合

1.2.1 DataFrame属性

print(df_1.index)#行的序号
#Int64Index([0, 1, 2, 3], dtype='int64')
print(df_1.columns)#列的序号名字
#Index(['A', 'B', 'C', 'D', 'E', 'F'], dtype='object')
print(df_1.values)#把每个值进行打印出来

DataFrame.sort_values(by='E')
(我运行时报错:’DataFrame’ object has no attribute ‘sort_values’,尚不清楚怎么回事.
解决方法:更新pandas,之前的版本不支持没有sort_values函数,需要用sort,更新pandas时记得sudo)

1.3 pandas合并数据

https://blog.csdn.net/XiaoYi_Eric/article/details/79506660

你可能感兴趣的:(机器学习)