Excel主要进行10w以下的数据分析,虽然分析的数据少但分析方法与思路值得练习与打磨。
数据分析之前需要对数据进行处理。把表内数据进行处理与整理,此步骤为“数据处理”,直接影响之后数据分析的效率与准确性。
(以下函数在与and、or、not嵌套搭配时功能更强)
1.数据格式处理
通常为对日期、数字的格式转换。可用“分列”功能进行操作(快捷键alt+a+e+f)
快速填充
说明:把应该为“空值”的数据与不应为“空值”的数据区分。
方法:方法比较多,可以双击右下角小十字,完成自动填充;可以选择“开始-编辑”里面的填充功能进行填充;可以使用“crtl+G”+“crtl+Enter”完成填充。(Shift+Crtl+方向键,是选择范围的常用快捷键之一)
去除重复数据
说明:很多时候提取的数据会有重复值。为保证准确性,很多时候在数据分析前排除重复值比较重要。
方法:“数据-数据工具-删除重复值”
错误值的去除
说明:错误值的存在很可能会影响分析
方法:找到错误的原因,使用“定位条件”定位后批量更改。也可在数据处理时嵌套“iferror”函数。
(其他本类别常用函数,Trim函数)
2.数据的变换
长日期与短日期的变换
说明:在后续分析中分别按年、按月、按日分析的情况时有发生,这一操作比较常用。
方法:使用text、day、days360函数
单元格中文本内容的变换
说明:对之后根据身份证号差用户归属地,男女,生日;根据手机号判断运营商,归属地有很大帮助。
方法;使用函数“left、righ、find、mid、concatenate等文本处理函数,使用“开始-编辑”中的替换功能(此类函数的嵌套使用处理各种数据功能强大)
(其他本类别函数,replace、subtitute)
3.数据的判断与增加
根据单元格内容判断
说明:一些列的内容过多,可使用if函数对内容进行判断,形成2个或多个分类,方便数据分析。
方法:使用if函数(或if嵌套if的函数也可嵌套and、or等函数,if使用较频繁。)
根据本sheet单元格与外部sheet单元格,进行判断或计数。
说明:根据已有的内容,根据外部内容查询并计数,功能使用场景较多
方法:使用函数countif、countifs
根据本sheet或外sheet数据添加列(利用之间的联系)
说明:在已有列上增加新的列,内容由查询、参考得到。
方法:使用vlookup、lookup、index+match等函数
对数据进行多个分组
说明:对连续与不连续的数据,根据已有参考,分组。
方法:lookup、vlookup等函数。
根据日期对周一至周日的判断。
说明: 很多数据分析中的时间需参考是否周末等情况
方法:使用Weekday函数。
(其他本类别函数,offset)
4.数据的计算
日期间隔的计算
说明:计算距今的时间、距离某一天的时间、两个时间中间的时间差
方法:datedif、date
文本长度的计算
说明:有较少数情况,需要根据单个数据的长度进行区分或分组
方法使用:lan函数
单元格内容重复情况
说明:可根据群体中数据的个数标记部分群体
方法:使用count函数。
使用函数进行计算
说明:用于计算的函数较多,一些函数的计算结果对整体的数据分析有一定的帮助。
方法:averagea、stedy、sum等
函数的种类有很多,用法也是有海量的组合。在数据处理步骤中灵活运用以上函数与方法对效率提升有很大帮助。