pandas查询数据

pandas查询数据

我们可以通过布尔索引有针对的选取原数据的子集、指定行、指定列等。

我们先导入一个student数据集:
student = pd.read_csv(‘student.csv’, encoding=‘utf-8’)


查询数据的前5行或末尾5行
student.head()
student.tail()


查询指定的行
student.ix[[0,2,4,5,7]] #这里的ix索引标签函数必须是中括号[]


查询指定的列
student[[‘Name’,‘Height’,‘Weight’]].head() #如果多个列的话,必须使用双重中括号


也可以通过ix索引标签查询指定的列
student.ix[:,[‘Name’,‘Height’,‘Weight’]].head()


查询指定的行和列
student.ix[[0,2,4,5,7],[‘Name’,‘Height’,‘Weight’]].head()

以上是从行或列的角度查询数据的子集,现在我们来看看如何通过布尔索引实现数据的子集查询。

查询所有女生的信息
student[student[‘Sex’]==‘F’]


查询出所有12岁以上的女生信息
student[(student[‘Sex’]==‘F’) & (student[‘Age’]>12)]


查询出所有12岁以上的女生姓名、身高和体重
student[(student[‘Sex’]==‘F’) & (student[‘Age’]>12)][[‘Name’,‘Height’,‘Weight’]]

上面的查询逻辑其实非常的简单,需要注意的是,如果是多个条件的查询,必须在&(且)或者|(或)的两端条件用括号括起来。

你可能感兴趣的:(机器学习)