cannot index with vector containing NA / NaN values

关于这个小问题,其实是pandas使用中经常出现的问题。具体原因就是在dataframe里面nan是一个特殊的存在,因为你的数据里包含nan或者inf类型的数据类型,所以你在对这一数据进行处理时,就会出现标题上出现的错误。

怎么解决呢?

方法也是有很多的,这里举一个简单的方法,但是绝对不是最科学的方法,

df['近期销量']=df['近期销量'].replace(np.nan,'0').astype(int)
df=df.sort_values(by='近期销量',ascending=False)

这里是用字符串形式的0将nan给替换了,当然你也可以用pandas里面的fiina()函数进行处理,但是要注意处理的范围,因为数据里的维度比较多,很可能将所有的nan都处理掉了。

df[['城市','省份']]=df[['城市','省份']].fillna('暂无')

总结:在进行数据处理之前,要对数据内容进行预处理,预处理是就要对数据的异常值进行处理,这是要保证数据的质量问题,也是保证数据分析结果的科学性。

你可能感兴趣的:(数据分析)