Dataframe根据给定范围取行数据的几种方法

如取出下列dataframe的14

或者利用apply函数。如

df1 = pd.DataFrame({'name': ['tom', 'jack', 'lili', 'nick'], 'sex': ['male', 'male', 'female', 'male'], 'age': [14, 23, 21, 34]})
print('一')
print(df1[df1['age'] < 23][df1[df1['age'] <23]['age'] > 14])
print('二')
print(df1.loc[df1['age'].apply(lambda x: 14 < x < 23)])
print('三')
print(df1.query('14 < age < 23'))
print('四')
print(df1[(df1.age < 23) & (df1.age > 14)])
print('五')
print(df1[df1['age'].between(left = 14, right = 23, inclusive = 'neither')])

其中一、二、四、五都是通过制造布尔类型的series来进行索引;且二则是通过apply来对数据类型为series的df1['age']将给定范围内的行索引设为True,然后使用loc方法来取出数据

你可能感兴趣的:(Python学习日志,大数据,python)