Pandas统计分析基础之DataFrame

Pandas统计分析基础

  • 掌握DataFrame的常用操作
    • 1、基础属性
    • 2、查看DataFrame中的数据
      • 查询DataFrame的数据
      • loc,iloc访问方式
    • 3、更改DataFrame中的数据
    • 4、增加DataFrame中的数据
    • 删除DataFrame中的数据

掌握DataFrame的常用操作

DataFrame类似于数据库的表或者Excel的表格,panda将数据读取之后,以DataFrame的数据结构存储在内存中。
下面就来介绍一下DataFrame的增删查改操作。

1、基础属性

Pandas统计分析基础之DataFrame_第1张图片

2、查看DataFrame中的数据

查询DataFrame的数据

因为DataFrame是一个带有标签的二维数组,每一个标签相当于每一列的列名。因此,可以以字典访问某一个Key值得方式使用对应的列名,实现单列数据的访问。

order_id = detail['order_id']
#order_id就是一个Series类型,本质上和一个一维数组一样,有类似的访问形式
type(order_id)

对单列多行数据的访问

dishes_name5 = detail['dishes_name'][:5] 
a=np.array(disher_name5,dtype='U8') # 去除了索引

对多行多列数据的访问

orderDish = detail[['order_id','dishes_name']][:5]

多列多行数据的访问:

orderDish = detail[:5][:5] #访问前五列前五行的函数 

loc,iloc访问方式

  • 使用loc方法和iloc实现多列切片,其原理的通俗解释就是将多列的列名或者位置作为一个列表或数据传入
  • 使用loc,iloc方法可以取出DataFrame中的任意数据
  • 在loc使用的时候内部传入的行索引名称如果为一个区间,则前后均为闭区间;iloc方法使用时内部传入的行索引位置或列索引位置为区间时,则为前闭后开区间。
  • loc内部还可以传入表达式,结果会满足表达式的所有值
dishes_name1 = datail.loc[:,'dishes_name']
dishee_name2 = datil.iloc[:,3]
orderDish1 = detail.loc[:,['order_id','dishes_name']]
orderDish2 = detail.iloc[:,[1,3]]
detail.loc[2:6,['order_id','dishes_name']]
detail.iloc[2:7,[1,3]]

3、更改DataFrame中的数据

# 将order_id为458的,变换成45800
detail.loc[detail['order_id']=='458','order_id'] = '45800'

4、增加DataFrame中的数据

  • DataFrame添加一列的方法非常简单,只需要新建一个列索引。并对该索引下的数据进行赋值操作。
  • 新增的一列值是相同的则直接赋值一个常量即可
# 两个列进行相乘之后赋值给新的列
detail['payment'] = detail['counts']*detail['amounts']
# 直接赋值为常量,则该列都是相同的值
detail['pay_way'] = '现金支付'

删除DataFrame中的数据

drop(labels,axis=0,level=None,inplace=False,error='raise')
# labels:接收string或array
# axis:代表操作轴向,0或1
# levels: 接收int或者索引名,代表标签所在级别
# inplace: 接收Boolean,代表操作是否对原数据生效

例:

detail.drop[lebels = 'pay_way',axis = 1,inplace = True] # 将pay_way这一列删除掉,对原数据生效

你可能感兴趣的:(Python数据分析,python,数据库)