python的iloc与loc函数

Pandas库中有iloc和loc以及ix可以用来索引数据,抽取数据。但是方法一多也容易造成混淆。下面将一一来结合代码说清其中的区别。

1. iloc和loc的区别:

iloc主要使用数字来索引数据,而不能使用字符型的标签来索引数据。而loc则刚好相反,只能使用字符型标签来索引数据,不能使用数字来索引数据,不过有特殊情况,当数据框dataframe的行标签或者列标签为数字,loc就可以来其来索引。

好,先上代码,先上行标签和列标签都为数字的情况。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

import pandas as pd

import numpy as np

a = np.arange(12).reshape(3,4)

print a

>>>

[[ 0 1 2 3]

 [ 4 5 6 7]

 [ 8 9 10 11]]

df = pd.DataFrame(a)

print df

>>>

 0 1 2 3

0 0 1 2 3

1 4 5 6 7

2 8 9 10 11

print df.loc[0]

>>>

0 0

1 1

2 2

3 3

Name: 0, dtype: int32

print df.iloc[0]

0 0

1 1

2 2

3 3

Name: 0, dtype: int32

print df.loc[:,[0,3]]

 0 3

0 0 3

1 4 7

2 8 11

print df.iloc[:,[0,3]]

 0 3

0 0 3

1 4 7

2 8 11

接下来是把行标签[0, 1, 2]改成['a', 'b', 'c'],则成这样了。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

df.index = ['a','b','c']

print df

>>>

 0 1 2 3

a 0 1 2 3

b 4 5 6 7

c 8 9 10 11

print df.loc[0]

# TypeError: cannot do label indexing on with these indexers [0] of

print df.iloc[0]

>>>

0 0

1 1

2 2

3 3

Name: a, dtype: int32

print df.iloc['a'] # TypeError: cannot do positional indexing on with these indexers [a] of

print df.loc['a'] # 正确

>>>

0 0

1 1

2 2

3 3

Name: a, dtype: int32

同样地,把列标签[0, 1, 2, 3]改成['A', 'B, 'C', 'D'],则成这样了。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

df.columns = ['A','B','C','D']

print df

>>>

 A B C D

a 0 1 2 3

b 4 5 6 7

c 8 9 10 11

print df.loc[:,'A']

>>>

a 0

b 4

c 8

Name: A, dtype: int32

print df.iloc[:,'A'] # ValueError: Location based indexing can only have [integer, integer slice (START point is INCLUDED, END point is EXCLUDED), listlike of integers, boolean array] types

2.ix是一种混合索引,字符型标签和整型数据索引都可以。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

print df.ix[0]

>>>

A 0

B 1

C 2

D 3

Name: a, dtype: int32

print df.ix['a']

>>>

A 0

B 1

C 2

D 3

Name: a, dtype: int32

print df.ix[:,0]

>>>

a 0

b 4

c 8

Name: A, dtype: int32

print df.ix[:,'A']

>>>

a 0

b 4

c 8

Name: A, dtype: int32

你可能感兴趣的:(python)