【Excel数据分析一】 数据处理

Excel主要进行10w以下的数据分析,虽然分析的数据少但分析方法与思路值得练习与打磨。

数据分析之前需要对数据进行处理。把表内数据进行处理与整理,此步骤为“数据处理”,直接影响之后数据分析的效率与准确性。

(以下函数在与and、or、not嵌套搭配时功能更强)


1.数据格式处理


通常为对日期、数字的格式转换。可用“分列”功能进行操作(快捷键alt+a+e+f)

快速填充

    说明:把应该为“空值”的数据与不应为“空值”的数据区分。

    方法:方法比较多,可以双击右下角小十字,完成自动填充;可以选择“开始-编辑”里面的填充功能进行填充;可以使用“crtl+G”+“crtl+Enter”完成填充。(Shift+Crtl+方向键,是选择范围的常用快捷键之一)

去除重复数据

    说明:很多时候提取的数据会有重复值。为保证准确性,很多时候在数据分析前排除重复值比较重要。

    方法:“数据-数据工具-删除重复值”

错误值的去除

    说明:错误值的存在很可能会影响分析

    方法:找到错误的原因,使用“定位条件”定位后批量更改。也可在数据处理时嵌套“iferror”函数。

(其他本类别常用函数,Trim函数)


2.数据的变换


长日期与短日期的变换

    说明:在后续分析中分别按年、按月、按日分析的情况时有发生,这一操作比较常用。

    方法:使用text、day、days360函数

单元格中文本内容的变换

    说明:对之后根据身份证号差用户归属地,男女,生日;根据手机号判断运营商,归属地有很大帮助。

    方法;使用函数“left、righ、find、mid、concatenate等文本处理函数,使用“开始-编辑”中的替换功能(此类函数的嵌套使用处理各种数据功能强大)

(其他本类别函数,replace、subtitute)


3.数据的判断与增加


根据单元格内容判断

    说明:一些列的内容过多,可使用if函数对内容进行判断,形成2个或多个分类,方便数据分析。

    方法:使用if函数(或if嵌套if的函数也可嵌套and、or等函数,if使用较频繁。)

根据本sheet单元格与外部sheet单元格,进行判断或计数。

    说明:根据已有的内容,根据外部内容查询并计数,功能使用场景较多

    方法:使用函数countif、countifs

根据本sheet或外sheet数据添加列(利用之间的联系)

    说明:在已有列上增加新的列,内容由查询、参考得到。

    方法:使用vlookup、lookup、index+match等函数

对数据进行多个分组

    说明:对连续与不连续的数据,根据已有参考,分组。

    方法:lookup、vlookup等函数。

根据日期对周一至周日的判断。

   说明: 很多数据分析中的时间需参考是否周末等情况

    方法:使用Weekday函数。

(其他本类别函数,offset)


4.数据的计算


日期间隔的计算

    说明:计算距今的时间、距离某一天的时间、两个时间中间的时间差

    方法:datedif、date

文本长度的计算

    说明:有较少数情况,需要根据单个数据的长度进行区分或分组

    方法使用:lan函数

单元格内容重复情况

    说明:可根据群体中数据的个数标记部分群体

    方法:使用count函数。

使用函数进行计算

    说明:用于计算的函数较多,一些函数的计算结果对整体的数据分析有一定的帮助。

    方法:averagea、stedy、sum等


函数的种类有很多,用法也是有海量的组合。在数据处理步骤中灵活运用以上函数与方法对效率提升有很大帮助。

你可能感兴趣的:(【Excel数据分析一】 数据处理)