numpy&pandas 学习笔记2-pandas

numpy 与 pandas的区别

numpy:数值型,无索引,重点在于进行矩阵运算
pandas:多数据类型,有索引,重点在于进行数据分析

一、pandas 的基本用法

s = pd.Series([1,3,6,np.nan,44,1])
print(s)

dates = pd.date_range('20200807',periods=6)
print(dates)

#自己设定行列的索引名称(也可用字典直接导入)
df = pd.DataFrame(np.random.randn(6,4),index = dates,columns = ['a','b','c','d'])
print("自己设定索引名称:",df)

#默认索引名称
df1 = pd.DataFrame(np.arange(12).reshape(3,4))
print("索引名称默认:",df1)
#输出列的索引,index
print("列的索引:",df.index)
#输出行的索引,columns
print("行的索引:",df.columns)
#输出所有的值
print("所有的值:",df.values)
#输出有关属性,和,平均值,方差等等
print("相关属性:",df.describe())
#同理,要进行行的提取计算,对矩阵进行转置即可
print("相关属性(行):",df.T.describe())
#排序
print("按列排序:",df.sort_index(axis=1, ascending=False))
print("按行排序:",df.sort_index(axis=0, ascending=False))
#对某一列进行排序
print("对a列进行排序",df.sort_values(by='a'))

numpy&pandas 学习笔记2-pandas_第1张图片
numpy&pandas 学习笔记2-pandas_第2张图片

你可能感兴趣的:(python,numpy)