用编程方法进行 数据清理

用编程方法进行 数据清理

编程清理步骤分三步:
1. Defining
2. Coding
3. Testing

清理之前先将数据备份:df_clean = df.copy()

注意:不能只简单地赋值:df_clean = df。因为它不能产生新的 pandas 对象,只会产生一个引用,对 df_clean 进行操作,仍能改变 df

举例说明

用编程方法进行 数据清理_第1张图片

1. 方案确定(Define)

确定处理问题的方案,以文字形式记录下来。
用编程方法进行 数据清理_第2张图片

2. 代码编写(Code)

然后,将处理方案转化为代码。
用编程方法进行 数据清理_第3张图片

3. 效果检验(Test)

最后,检验数据,看代码是否奏效。
用编程方法进行 数据清理_第4张图片

也可以确定完一个方案后,立即进行代码编写,效果检验。对于数据问题较多时,尤其适用。

你可能感兴趣的:(学习笔记)