原数据dataset
在python里 可以通过dataframe.loc[rowindex=,colindex=] 给整列赋值
df.loc[:,'index'] = list(range(6))
但是对于筛选过后的数据则不可以整体赋值, 如果我只想为在b列中有值的record 写index 则会报错
d = (df["b"].isna()==False).values #选出b列有值的行的list
df[d].loc[:,'index'] = [1,2,3,4]
没办法╮(╯_╰)╭,只能一行一行赋值。。。。( ̄﹏ ̄;)
d = (df["b"].isna()==False).values #b有值的行的list
f = list(enumerate(d))
f会生成一个list, 对应每一行的位置以及值判断, 如果b有值则为True
e = 0
for i in f:
if i[1]:
df.loc[i[0],'index'] = e #如果f中为TRUE那就是说有值,对index赋值
e += 1
完成
但是index 的类型有问题,需要转换为int, 但是index中含有nan 所以不能直接转换, 需要先将nan替换为其他值
使用 fillna() 方法 填充
df['index'].fillna(0,inplace = True) # 参数iplace = True时 填充会作用与原dataframe
df[['index']] = df[['index']].astype(int) # 修改index 的类型
暂时只想到这个办法,当再有新的办法时再更新把