判断一个日期是否在一个期间内pandas

新方法:

用一个.loc也是可行的,连接的不是and ,是别的!!!!

去除的方法把不符合条件的变成None值,然后就可以了。

import pandas as pd

df  = pd.DataFrame([1,2,3,4,5,6,3,2,1,3,4])
df.loc[ (df[0]>2) & (df[0]<5) ] =None  #这里大于2小于5是我们要去除的条件,令这些为none值,然后#下面删除
print('df是',df)
z = df.dropna()       #把定义成的none值删了
print('z是',z)
df是       0
0   1.0
1   2.0
2   NaN
3   NaN
4   5.0
5   6.0
6   NaN
7   2.0
8   1.0
9   NaN
10  NaN
z是      0
0  1.0
1  2.0
4  5.0
5  6.0
7  2.0
8  1.0

pandas的.loc并不支持 and这种组合,所以需要两次,即.loc.loc

例如

import pandas as pd
a  = [1,2,3,4,5,6,7,78]
sdf = pd.DataFrame(a)
'''筛选出大于3小于6的行
'''
newdf = sdf.loc[sdf[0]>3].loc[sdf[0]<6]

如果写在一个里面,就会

import pandas as pd
a  = [1,2,3,4,5,6,7,78]
sdf = pd.DataFrame(a)
'''筛选出大于3小于6的行
'''
newdf = sdf.loc[sdf[0]>3 and sdf[0]<6]

报错信息:

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

对于日期判断也类似,需要两次loc操作

 

你可能感兴趣的:(算法练习,机器学习理论相关)