pandas数据取值

Series和Dataframe

Series是一维的向量,Dataframe是二维的

取值方式


numb (Series):

a  0.25
b  0.75
c  1.00
d  1.50

city (Dataframe):

                       area        pop
Califonia        42.2         10.9
FLorida          23.1         9.2
NewYork        87.8         30.4

两种类型的第一列都是索引

  1. data[]方式
    numb['b'] 取值为0.75,'b'索引为行
    city['area']取值为列,除此之外,Dataframe不能再用['XX']的方式直接取值,与city.area一样
  2. Series的其它几种
  • numb['a':'c']
  • numb[0:2] #注意不要超出索引
  • numb[(numb > 0.3)]
  • numb[['a','c']] # 间隔取值
  1. Dataframe的iloc和loc
    ix方式的取值已经废除,iloc方式只能使用数字索引,loc方式可以实现行列名索引、以及数字和行列名混合索引(替代ix的功能)
  • city.iloc[:3,:1]
  • city.loc[:'NewYork',:'pop']
  • city.loc[:2,:'pop'] # 混合索引
  • city.loc[['Florida','NewYork'],'pop'] # 间隔取值

你可能感兴趣的:(pandas数据取值)