谁说菜鸟不会数据分析-入门篇(第4章 三心二意--数据处理)

1.数据处理

1.1 数据清洗

  • 重复数据的处理:COUNTIF法,删除重复数据法,透视表法等
  • 缺失数据的处理:
    • 方法一:用样本统计量的值代替,通常用样本平均值代替
    • 方法二: 用统计模型计算出来的值代替,常见的模型有回归模型\判别模型
    • 方法三: 将有后发制人值的记录删除,这会导致样本量减少
    • 方法四: 将有缺失的记录保留,仅在缺失值 不大的情况下做分析时排除
    • 方法五:查找替换
      技巧:CTRL+G 定位,Ctrl+Enter同时输入一个值
  • 检查数据数据
    • 用IF函数
    • 用条件格式

1.2 数据加工

  • 数据抽取:取出字段时需要的信息
    • 字段分列法
    • 函数 LEFT,MID,RIGHT截取法
    • 字段合并: &连接字符,concatenate合并函数,text限定显示格式等
    • 字段匹配:vlookup,lookup,hlookup等
  • 数据计算
    日期函数date,year,month,day,today,datedif的组合运用
  • 数据分组
    用vlookup,lookup等函数将数据分组,比如将43寸以下的电视定义为"小板",将43寸(含)-55寸的电视定义为"中板",将55寸(含)以上的尺寸定义为"大板"
  • 数据转换
    • EXCEL的转置功能
    • 二分法:用if,isnumber等将调查转为1或0的两种结果

1.3 数据抽样

rand,randbetween随机函数的运用

你可能感兴趣的:(谁说菜鸟不会数据分析-入门篇(第4章 三心二意--数据处理))