【python DateFrame的重要属性和函数】

文章目录

  • 什么是DateFrame?
  • 1. 构建一个DateFrame对象
  • 2. DateFrame的重要属性
  • 3. DateFame重要函数
  • 4. 实例
    • 4.1 属性
      • 4.1.1 values属性
      • 4.1.2 dtypes属性
      • 4.1.3 index属性
      • 4.1.4 columns属性
      • 4.1.5 T 属性
      • 4.1.6 head属性
      • 4.1.7 tail属性
      • 4.1.8 shape属性
      • 4.1.9 info属性
    • 4.2 重要函数
      • 4.2.1 count()函数
      • 4.2.2 sum()函数
      • 4.2.3 max()函数
      • 4.2.4 min()函数


什么是DateFrame?

关于什么是datefram及以及基础操作可以参考:Pandas数据结构–Series、DataFrame详解


1. 构建一个DateFrame对象

构建DateFrame对象的方法有两个:

1、通过列表构建

import pandas as pd
# 以列表方式创建dataframe
data = [['小太阳',8.5,244],['鼠标',72.5,20],['小刀',3.5,100]]
columns = ['名称','单价','数量']
df = pd.DataFrame(data=data,columns=columns)
print(df)

结果:

    名称    单价   数量
0  小太阳   3.5  244
1   鼠标  72.5   20
2   小刀   3.5  100

2、通过字典构建

import pandas as pd
# 以字典方式创建dataframe
data = {
    '名称':['小太阳','鼠标','小刀'],
    '单价':[8.5,72.5,3.5],
    '数量':[244,20,100]}
df = pd.DataFrame(data=data)
print(df)

结果:

    名称    单价   数量
0  小太阳   8.5  244
1   鼠标  72.5   20
2   小刀   3.5  100

2. DateFrame的重要属性

序号 属性 描述
1 values 查看所有元素的值
2 dtypes 查看所有元素的类型
3 index 查看所有行名,重命名行名
4 columns 查看所有列名,重命名列名
5 T 行列数据转换
6 head 查看前N条数据,默认5条
7 tail 查看最后N条数据,默认5条
8 shape 查看行数和列数,shape[0]表示行,shape[1]表示列
9 info 查看索引,数据类型和内存信息

3. DateFame重要函数

序号 函数 描述
1 describe() 查看每列的统计汇总信息,DateFrame类型
2 count() 返回每一列非空值的个数
3 sum() 返回每一列的和,无法计算的返回空值
4 max() 返回每列的最大值
5 min() 返回每列的最小值

4. 实例

4.1 属性

4.1.1 values属性

print("查看所有元素的值:\n",df.values)
-------------------------------------
查看所有元素的值:
 [['小太阳' 8.5 244]
 ['鼠标' 72.5 20]
 ['小刀' 3.5 100]]

4.1.2 dtypes属性

print("查看所有元素类型:\n",df.dtypes)
-------------------------------------
查看所有元素类型:
 名称     object
单价    float64
数量      int64
dtype: object

4.1.3 index属性

print("查看所有行名称\n",df.index)
-------------------------------------
查看所有行名称
 RangeIndex(start=0, stop=3, step=1)

通过index修改索引

df.index=[1,2,3] #修改索引
print(df)
-------------------------------------
    名称    单价   数量
1  小太阳   8.5  244
2   鼠标  72.5   20
3   小刀   3.5  100

4.1.4 columns属性

print("查看列索引\n",df.columns)
-------------------------------------
查看列索引
 Index(['名称', '单价', '数量'], dtype='object')

通过columns修改列索引

df.columns=["商品名称","最新单价","实时数量"]#修改列索引
print(df)
-------------------------------------
  商品名称  最新单价  实时数量
1  小太阳   8.5   244
2   鼠标  72.5    20
3   小刀   3.5   100

4.1.5 T 属性

pd.set_option('display.unicode.east_asian_width',True)#规整格式
new_df = df.T#行列转换
print(new_df)
-------------------------------------
              1     2     3
商品名称   小太阳  鼠标  小刀
最新单价     8.5  72.5   3.5
实时数量     244    20   100

4.1.6 head属性

print("查看前2条数据:\n",df.head(2))
-------------------------------------
查看前2条数据
   商品名称  最新单价  实时数量
1   小太阳       8.5       244
2     鼠标      72.5        20

4.1.7 tail属性

print("查看后2条数据:\n",df.tail(2))
-------------------------------------
查看后2条数据:
   商品名称  最新单价  实时数量
2     鼠标      72.5        20
3     小刀       3.5       100

4.1.8 shape属性

#查看几行几列
print('行',df.shape[0],'列',df.shape[1])
-------------------------------------33

4.1.9 info属性

print("查看索引,数据类型,内存信息:\n",df.info)
-------------------------------------
查看索引,数据类型,内存信息:
 <bound method DataFrame.info of   商品名称  最新单价  实时数量
1   小太阳       8.5       244
2     鼠标      72.5        20
3     小刀       3.5       100>

4.2 重要函数

4.2.1 count()函数

print(df.count())
-------------------------------------
名称    3
单价    3
数量    3
dtype: int64

4.2.2 sum()函数

print(df.sum())
-------------------------------------
名称    sunmouseknife
单价             84.5
数量              364
dtype: object

4.2.3 max()函数

print(df.max())
-------------------------------------
名称     sun
单价    72.5
数量     244
dtype: object

4.2.4 min()函数

print(df.min())
-------------------------------------
名称    knife
单价      3.5
数量       20
dtype: object

你可能感兴趣的:(pandas,python,pandas,开发语言)