使用pandas做数据筛选的一个坑

使用pandas做数据筛选,使用简单的列值筛选的方法非常简单,比如需要找出列type不属于[30,40,56]集合的列:

subreview = parray[(parray['type']!=30) & (parray['type']!=56) &(parray['type']!=40) ]


但是发现结果不符合预期,没有筛选功能,小编排查之后发现,是pandas加载的时候,‘type’列默认是string格式,不是整形数值,因此用

[parray['type']!=30]的筛选是无法正常进行的,需要使用astype转化一下就可以了,后续的同学也注意,不要踩这个坑了。

parray['type'] = parray['type'].astype(int)

你可能感兴趣的:(使用pandas做数据筛选的一个坑)