数据分析----数据清洗

文章目录

  • 前言
  • 一、数据清洗是什么?
  • 二、步骤
    • 1、选择列
    • 2、缺失值处理
      • 1、找到缺失值
      • 2、处理缺失值的方法
    • 3、数据类型转化
    • 4、重复值处理
  • 总结


前言

随着科技的不断发展,数据在我们生活中越来越多,面对繁杂的数据,我们根本无从下手,本文就简单的介绍一下数据分析中的数据清洗。

一、数据清洗是什么?

这是数据分析中最重要的一步,是指发现并改正数据中错误的一步,其中包括检查数据一致性、处理无效值和缺失值。

二、步骤

切记!!!!数据在清洗之前一定要先备份,先备份。(如果没有进行备份,在处理数据过程中不小心处理错了,而此时没有原始数据,就…,懂得都懂啦)

1、选择列

根据自己所要分析的内容,在整个数据表格中只选择自己要分析的列即可,其余的列可以删除也可以隐藏,当然,隐藏是最好的选择。

2、缺失值处理

1、找到缺失值

如何在所得数据中快速找到缺失数据呢?可以关注每一列的行数,先定位到列,然后通过筛选,找到缺失值。

2、处理缺失值的方法

手工填写平均值:若数值是常规性的,则可以进行求取平均值进行填写。
删除:若不知道该处填什么,则删除。

3、数据类型转化

选中数据中的任意一个单元格,这个单元格的数据类型是文本。点击下拉按钮,可以将数据类型进行转化。
数据分析----数据清洗_第1张图片

4、重复值处理

在EXCEL中,开始——>样式——>条件格式——>突出显示单元格规则——>重复值,既可以找到数据中的重复值。
找到重复值之后,可以结合业务要求,是否需要删除重复值。需要删除重复值的宝子们继续向下看哈~~
在EXCEL中,数据——>数据工具——>删除重复值——>如下图,按照自己的需求进行重复值删除
数据分析----数据清洗_第2张图片

总结

以上就是今天总结的数据清洗的主要4个步骤,想要学习数据分析的伙伴们抓紧时间吧,动起来!!!

你可能感兴趣的:(数据分析,数据挖掘)