DataFrame获取数据

DataFrame获取数据

1、获取行数和列数 shape

除了索引和列名,查看数组中有几行几列

2、获取行索引 index.tolist( )
3、获取数据类型 dtypes
4、获取内容 values

values属性也会以二维ndarray的形式返回DataFrame的数据

5、显示头几行,默认显示5行 head
6、显示后几行 tail
7、获取DataFrame的列

获取某一列,直接写列名即可。例如:df[‘列名’]

8、获取多列,返回的是一个DataFrame类型

获取多列,写多个列名。例如:df[[‘name’,‘age’]]

9、获取一行,一定要使用切片
10、获取多行,切片
11、获取多行里面的某一列(不能进行多行多列的选择)

例如:print(df[1:3][[‘name’,‘age’]]) 前面利用切片取前2行的内容,再获取这两行中的name和age列

12、获取所有列名,columns.tolist()
注意:df[]只能进行行或者列选择,不能同时多行多列选择

df.loc 通过标签索引行数据

1. 获取某一行某一列的数据,df.loc[行,列] (具体的值)

df.loc[‘0’,‘name’] 第一行,name列的那个值

2. 一行所有列,取出来的是这一行所有的列还有值

df.loc[‘0’,:] 第一行的所有列,即第一行所有值

3. 某一行多列数据

df.loc[‘0’,[‘name’,‘age’]] 第一行的name和age列的值

4. 选择间隔的多行多列

df.loc[[‘0’,‘2’],[‘name’,‘national’]] 选择第一行和第三行的name和national列的值

5. 选择连续的多行和间隔的多列

df.loc[‘0’:‘2’,[‘name’,‘national’]] 选择0-2行的name和national的值

df.iloc 通过位置获取行数据,数字类型

1.取一行

df.iloc[0] 取第一行数据

2.取连续多行

df.iloc[1:3]

3.取间隔的多行

df.iloc[[0,2],:] 取第0行和第2行的数据

4.取某一列

df.iloc[:,1]) 取索引为1的那列

5.取某一个值

df.iloc[1,0] 取索引为1 行 0 列的那个数据

6.修改值

df.iloc[0,0]=‘panda’ 修改索引为0行0列的那个值为‘panda’

7.dataframe中的排序方法

df=df.sort_values(by=‘age’,ascending=False)
根据age降序排序

ascending=False 降序排列,默认是升序

你可能感兴趣的:(Pandas,索引,python)