python——pandas(切片)

pandas数据提取

一、比较loc,iloc,ix与去重
1.loc——标签索引,行和列的名称;
.loc主要是基于标签(label)的,包括行标签(index)和列标签(columns),即行名称和列名称,可以使用
df.loc[index_name,col_name]选择指定位置的数据。
python——pandas(切片)_第1张图片

#dataframe在加判断条件时可以不通过.loc直接去写效果一样
在这里插入图片描述
python——pandas(切片)_第2张图片
2.iloc——通过行号索引行数据
是基于位置的索引,利用元素在各个轴上的索引序号进行选择,序号超出范围会产生InedxError,切片时允许序号超过范围,用法包括。
python——pandas(切片)_第3张图片

3.ix——通过行标签或者行号索引行数据(基于loc和iloc 的混合)
python——pandas(切片)_第4张图片

4.去重清洗:
python——pandas(切片)_第5张图片
解释:先对数据进行去重在生成新的索引

二、pandas对列(colums)的处理:

python——pandas(切片)_第6张图片
df.columns 获取列的索引
df.columns[0] 获取列的标签(0表示取第一个)
df.columns.tolist 获取列的索引后以列表的形式存储
df[‘C’] 选这C对应的列生成Series
df[[‘C’]] 选这C对应的列生成DataFrame
df[[‘A’,’B’]] 选这AB两列
df[[‘C’,’B’,’A’]] 改变顺序
df[df.columns[0]] 选这第一列Series
df[df.columns[[0,3]]] 生成DataFrame
df.A选择A列生成(Series)
三、pandas对行(rows)的处理:
df.index 获取行的索引
df.index[0] 获取行的标签(0表示取第一个)
df.index.tolist() 获取行的标签以列表形式存储
df.index=id 新建索引
四、pandas切片
在切片大家都特别容易看不懂df.iloc[:,:],不知道’:’切片时如何处理我简单的说下我的理解:
我们在说话时都喜欢说行列,而这里前一个冒号表示对行的处理,后面的则是对列的处理
在对字符串处理时都学过切片,都知道切片时是左含右不含的关系。而这里我们就可以分开理解先看行的切割在看列的切割。
注意:对列切割时索引不算
索引时,选取是列
切片时,选取时行
python——pandas(切片)_第7张图片
df0[0:1] 左含右不含根据行进行切片
df1.ix[:,0:2] 前面的冒号代表对行的操作,后面表示队列的操作且都包含

python——pandas(切片)_第8张图片
df[‘one’,’twwo’] 结果为:
在这里插入图片描述

你可能感兴趣的:(python——pandas(切片))