Pandas是一个非常好用的工具,可以用来处理各种格式的数据,本文主要介绍Pandas中的四种选择数据的方法:

  简单的筛选类型有四种,按照标签索引、元素位置以及综合筛选,具体如下:

  #select by label : loc

  #select by position : iloc

  #mixed selection : ix

  #使用判断

  建立一个DataFrame表,程序如下:

  <<<

  import pandas as pd

  import numpy as np

  dates = pd.date_range(‘20160101’, periods=6)

  df = pd.DataFrame(np.random.randn(6,4), index=dates, columns=[‘A’, ‘B’, ‘C’, ‘D’])

  print(df[‘A’])

  print(df.A)

  输出如下:

  A B C D

  2016-01-01 0 1 2 3

  2016-01-02 4 5 6 7

  2016-01-03 8 9 10 11

  2016-01-04 12 13 14 15

  2016-01-05 16 17 18 19

  2016-01-06 20 21 22 23

  (1)简单的筛选

  选择名称为’A’的这一列,有两种输出方式;

  (2)选择跨越多行或多列:

  <<< print(df[0:3])

  输出:

  “”"

  A B C D

  2016-01-01 0 1 2 3

  2016-01-02 4 5 6 7

  2016-01-03 8 9 10 11

  “”"

  #'20160102’是行索引

  print(df[‘20160102’:‘20160104’])

  “”"

  A B C D

  2016-01-02 4 5 6 7

  2016-01-03 8 9 10 11

  2016-01-04 12 13 14 15

  “”"

  loc

  loc是使用标签来选择数据, 本例主要通过标签名字选择某一行数据, 或者通过选择某行或者所有行,然后选其中某一列或几列数据。

  print(df.loc[‘20160102’])

  “”"

  A 4

  B 5

  C 6

  D 7

  Name: 2016-01-02 00:00:00, dtype: int64

  “”"

  <<

  ##(:代表所有行)

  “”"

  A B

  2016-01-01 0 1

  2016-01-02 4 5

  2016-01-03 8 9

  2016-01-04 12 13

  2016-01-05 16 17

  2016-01-06 20 21

  “”"

  <<

  “”"

  A 4

  B 5

  Name: 2016-01-02 00:00:00, dtype: int64

  “”"

  iloc郑州人流多少钱 http://mobile.zyyyzz.com/

  另外我们可以采用索引进行选择 iloc, 在这里我们可以通过位置选择在不同情况下所需要的数据例如选某一个,连续选或者跨行选等操作。

  <<

  <<

  “”"

  13

  “”"

  “”"

  B C

  2016-01-04 13 14

  2016-01-05 17 18

  “”"

  <<

  “”"

  B C

  2016-01-02 5 6

  2016-01-04 13 14

  2016-01-06 21 22

  #注意,索引从0开始。

  ix

  我们还可以采用混合选择 ix, 其中选择’A’和’C’的两列,并选择前三行的数据。

  print(df.ix[:3,[‘A’,‘C’]])

  “”"

  A C

  2016-01-01 0 2

  2016-01-02 4 6

  2016-01-03 8 10

  “”"

  使用判断

  如筛选出’A’的值大于8的行。

  <<8])

  “”"

  A B C D

  2016-01-04 12 13 14 15

  2016-01-05 16 17 18 19

  2016-01-06 20 21 22 23

  “”"