关于什么是datefram及以及基础操作可以参考:Pandas数据结构–Series、DataFrame详解
构建DateFrame对象的方法有两个:
1、通过
列表
构建
import pandas as pd
# 以列表方式创建dataframe
data = [['小太阳',8.5,244],['鼠标',72.5,20],['小刀',3.5,100]]
columns = ['名称','单价','数量']
df = pd.DataFrame(data=data,columns=columns)
print(df)
结果:
名称 单价 数量
0 小太阳 3.5 244
1 鼠标 72.5 20
2 小刀 3.5 100
2、通过
字典
构建
import pandas as pd
# 以字典方式创建dataframe
data = {
'名称':['小太阳','鼠标','小刀'],
'单价':[8.5,72.5,3.5],
'数量':[244,20,100]}
df = pd.DataFrame(data=data)
print(df)
结果:
名称 单价 数量
0 小太阳 8.5 244
1 鼠标 72.5 20
2 小刀 3.5 100
序号 | 属性 | 描述 |
---|---|---|
1 | values | 查看所有元素的值 |
2 | dtypes | 查看所有元素的类型 |
3 | index | 查看所有行名,重命名行名 |
4 | columns | 查看所有列名,重命名列名 |
5 | T | 行列数据转换 |
6 | head | 查看前N条数据,默认5条 |
7 | tail | 查看最后N条数据,默认5条 |
8 | shape | 查看行数和列数,shape[0]表示行,shape[1]表示列 |
9 | info | 查看索引,数据类型和内存信息 |
序号 | 函数 | 描述 |
---|---|---|
1 | describe() | 查看每列的统计汇总信息,DateFrame类型 |
2 | count() | 返回每一列非空值的个数 |
3 | sum() | 返回每一列的和,无法计算的返回空值 |
4 | max() | 返回每列的最大值 |
5 | min() | 返回每列的最小值 |
print("查看所有元素的值:\n",df.values)
-------------------------------------
查看所有元素的值:
[['小太阳' 8.5 244]
['鼠标' 72.5 20]
['小刀' 3.5 100]]
print("查看所有元素类型:\n",df.dtypes)
-------------------------------------
查看所有元素类型:
名称 object
单价 float64
数量 int64
dtype: object
print("查看所有行名称\n",df.index)
-------------------------------------
查看所有行名称
RangeIndex(start=0, stop=3, step=1)
通过index修改索引
df.index=[1,2,3] #修改索引
print(df)
-------------------------------------
名称 单价 数量
1 小太阳 8.5 244
2 鼠标 72.5 20
3 小刀 3.5 100
print("查看列索引\n",df.columns)
-------------------------------------
查看列索引
Index(['名称', '单价', '数量'], dtype='object')
通过columns修改列索引
df.columns=["商品名称","最新单价","实时数量"]#修改列索引
print(df)
-------------------------------------
商品名称 最新单价 实时数量
1 小太阳 8.5 244
2 鼠标 72.5 20
3 小刀 3.5 100
pd.set_option('display.unicode.east_asian_width',True)#规整格式
new_df = df.T#行列转换
print(new_df)
-------------------------------------
1 2 3
商品名称 小太阳 鼠标 小刀
最新单价 8.5 72.5 3.5
实时数量 244 20 100
print("查看前2条数据:\n",df.head(2))
-------------------------------------
查看前2条数据
商品名称 最新单价 实时数量
1 小太阳 8.5 244
2 鼠标 72.5 20
print("查看后2条数据:\n",df.tail(2))
-------------------------------------
查看后2条数据:
商品名称 最新单价 实时数量
2 鼠标 72.5 20
3 小刀 3.5 100
#查看几行几列
print('行',df.shape[0],'列',df.shape[1])
-------------------------------------
行 3 列 3
print("查看索引,数据类型,内存信息:\n",df.info)
-------------------------------------
查看索引,数据类型,内存信息:
<bound method DataFrame.info of 商品名称 最新单价 实时数量
1 小太阳 8.5 244
2 鼠标 72.5 20
3 小刀 3.5 100>
print(df.count())
-------------------------------------
名称 3
单价 3
数量 3
dtype: int64
print(df.sum())
-------------------------------------
名称 sunmouseknife
单价 84.5
数量 364
dtype: object
print(df.max())
-------------------------------------
名称 sun
单价 72.5
数量 244
dtype: object
print(df.min())
-------------------------------------
名称 knife
单价 3.5
数量 20
dtype: object