pandas 进行数据筛选后再进行赋值操作 and(列类型转换)

原数据dataset


在python里 可以通过dataframe.loc[rowindex=,colindex=] 给整列赋值

df.loc[:,'index'] = list(range(6))

但是对于筛选过后的数据则不可以整体赋值, 如果我只想为在b列中有值的record 写index 则会报错

d = (df["b"].isna()==False).values  #选出b列有值的行的list
df[d].loc[:,'index'] = [1,2,3,4]


没办法╮(╯_╰)╭,只能一行一行赋值。。。。( ̄﹏ ̄;)

d = (df["b"].isna()==False).values     #b有值的行的list
f = list(enumerate(d))

f会生成一个list, 对应每一行的位置以及值判断, 如果b有值则为True

e = 0
for i in f:
    if i[1]:
        df.loc[i[0],'index'] = e #如果f中为TRUE那就是说有值,对index赋值
        e += 1

完成


但是index 的类型有问题,需要转换为int, 但是index中含有nan 所以不能直接转换, 需要先将nan替换为其他值

使用 fillna() 方法 填充

df['index'].fillna(0,inplace = True)   # 参数iplace = True时 填充会作用与原dataframe
df[['index']] = df[['index']].astype(int)   # 修改index 的类型

暂时只想到这个办法,当再有新的办法时再更新把

你可能感兴趣的:(Python)