Python数据清洗-——(1)选择子集,列名重命名;(2)缺失值处理;(3)数据转换(重复值等);(4)异常值的处理
注:我在这里用的工具是jupyternotebook,代码里面的注释有些挺重要的,大家要仔细看1、选择子集,列名重命名在数据分析的过程中,有可能数据量会非常大,但并不是每一列都有分析的价值,这时候就要从这些数据中选择有用的子集进行分析,或重命名列,这样才能提高分析的价值和效率。此时,我们应该用到列索引In[1]:importnumpyasnpIn[2]:importpandasaspdIn[3]: