Pandas提取指定行列

取列

1.通过列名称来提取指定列(推荐)

#列名:irline_sentiment_gold   name    negativereason_gold retweet_count   text    
get_data=data[['airline_sentiment','text']]

2.通过loc函数传入列名称来获取列
loc : location 指定列名的位置

data.loc[:,'text']  #获取列名为text的那一列

3.通过iloc函数传入默认索引切片获取列
iloc : integer-location 整数位置,也就是索引方式来获取所需要的列

df.iloc[:,0]  #获取第一列

取行

1.通过索引切片取(推荐)

data[0:3]  #取索引0,1,2行

2.通过loc函数默认索引值来取(不推荐)

data.loc[0:3]  #取索引 0,1,2,3行

注意区别,行列索引,以及默认pandas给的索引值。如下图,我们数据存储本身起始列是tweet_id,但是pandas读取后会默认给一个递增的索引id,这个就是索引值。通过loc就是通过值来切。
Pandas提取指定行列_第1张图片

总结

iloc带i的可以理解通过行或者列本身的索引顺序(从0开始,0表示第一行或者第一列)来确定位置。
loc可以理解通过默认pandas索引值来确定位置,仅在获取行时使用。0:3表示默认索引值0-3行。

你可能感兴趣的:(python,pandas,pandas,python,大数据)