Excel中的小技巧&大智慧

将OneNote中的笔记部分经过整理转来博客,主要根据自己较为不熟悉的点进行记录。

Excel作为一款微软开发的数据分析和报表制作软件,有其自身良好的可用性和对windows系统的适应性。

诚然,对于从事数据算法的专业从业者,完全可以使用Python、R、SAS等更为高端的操作来实现各种相同的数据操作,但是Excel作为一款易于使用的大众化的分析软件,我们完全可以将其加入自己的技能库,对一些数据量较小的数据进行分析和查看。用好Excel,可以大大提升数据分析的工作效率。

用好Excel,就是要学好其三个重要核心应用:数据处理函数、各类图表应用、透视图

那么本篇文章主要就以Excel为依托,从数据操作、图标制作、分析报告撰写三个角度,来探讨一下数据分析的小操作和一些重要注意事项(大智慧)

主体分为:1. 数据操作篇;2. 图表篇;3. 分析报告篇。

操作篇主要针对在使用过程中的一些难点进行记录整理,不成体系;对于下面一些业务则介绍的更为系统。看官们可酌情自取。

数据操作篇:

设置单元样式、条件样式

设置保护,解除全局锁定,锁定需要保护的单元格,开始→格式设置锁定密码。需要解除锁定才能修改内容

排序和筛选,通过套用表格格式,下拉箭头可进行筛选

高级筛选:可根据表头和条件来框取表格内容进行筛选,条件在同一行为and、条件在不同行为or

分列:将一列拆分,与导入数据规则相似

数据验证:检查不合法输入,下拉列表序列保证所有更新值为范围内的值;设置输入提示

数据验证:设置验证条件后圈出无效数据,保护+隐藏单元表

Countif(表2[人数]">=3000")

Countifs、sumif、sumifs、rank、rank.avg

对二维表的访问操作

  1. match函数返回某个标签对应的位置,组合成行列坐标值
  2. index函数检索得到二维表中的数值、
  3. 文本字段处理
  4. 通过数据验证制作下拉列表,方便标签选择
  5. 对原始数据加锁保护

vlookup匹配,选择匹配关键字,然后选择关键字及右侧区域(绝对引用),选择求值的列。(近似匹配、精确匹配)

hlookup:与vlookup相似,横向排列

间接饮用indirect,可以用于在数据验证中的序列取值应用设置二级下拉列表

选择表格,查找和选择→定位条件,选择常量,可以伸缩变化表格形状,去除空值

Excel文本函数left、right、mid、find、len、substitute

数据透视表:对数据各个维度做高级展示

尽量把操作放在数据透视表中,而尽量少的对原表进行操作

切片器,对透视图中数据进行筛选

 

图表篇:

样式调优,内容筛选(也可在切片器中完成),

我认为的Excel的三大核心:函数、透视图、图表

 

帕累托图 直方图:反映二八原则,二和八不是一个范畴,二代表对象,八代表效果:20%客户贡献了80%的利润

面积图,饼图,折线图,箱型图,环形图,龙卷风图(轴对称的直方图),旭日图(类型分层表示),树状图(面积大小体现)

 

Excel分析工具库

回归、指数平滑(一种改良的加权平均法,根据最近时期的实际数据和前期预测数据,并借助平滑系数进行销售预测)

移动平均(根据时间序列逐步推移,依次计算定期数据的均值,形成均值时间序列。移动期数少能快速反映数据变化,但不能反映变化趋势;移动期数多则能反映变化趋势)

简单来说移动平均是利用时间发展进行预测,并且是适合短期预测的一种方法

时间预测常用指数平滑和移动平均;另外还有季节变动法和趋势外推法

 

描述性统计分析:一种快速的上手方法,常用指标为均值、方差、中位数、求和、众数、峰度系数、偏度系数(>0正偏,长尾)等

相关分析:统计学中将 自变量之间的关系称为依存关系,主要分为回归函数关系和相关关系

回归函数关系:一种可以用数学表达式反映的依存关系,对某一变量的每一个数值,都有亮一个变量值与之对应

相关关系:一种变量间存在不确定依存关系,具有随机性,常常在均值上下波动

直线相关:相关系数表示

曲线相关:相关指数表示

多重相关:复相关系数表示

电商数据案例:

角度:

  1. 会员数据:包括个人信息、社交信息(微信、微博等)、消费习惯(交易记录、购买记录等)
  2. 营销数据:营销费用、覆盖用户数、用户点击率
  3. 行业数据:品牌关键字搜索、店铺排名、销量
  4. 交易与服务数据:金额、数量、人数、商品、时间等

定指标:

  1. 会员指标:有价值会员数、活跃会员数、会员活跃率、回购率、存留率、平均购买次数、流失率等
  2. 流量指标:跳失率(进入一个页面便离开)、二跳率(是体现流量是否有效性的指标)、浏览量(PV页面点击量)、PV/IP(流量真实性)、订单转化率(访客到买家)、访客数(UV 独立人,按时间分为最近、回访、新访)、到达率(从广告点击到网站页的比例)、平均在线时间
  3. 运营指标:成交指标、效率指标(企业生产水平、推广力度的高低  包括客单价、件单价、连带率(也叫效益比、购物篮系数,反映用户购买产品的深度)、动销率)
  4. 采购指标:数量、金额
  5. 库存指标:库存天数、库存周转率、售罄率
  6. 供应链指标:订单满足率、订单响应时长
  7. 订单指标:监控用户数量的波动
  8. 退货指标:金额、订单、数量
  9. 转化指标:注册转化率(用户界面是否得当)、推广信息转化率、客服转化率(衡量服务质量)、收藏转化率、添加购物车转化率、成交转化率

 

对于图表:

核心方法:

  1. 避免生成无意义的图表
  2. 不要信息过多
  3. 选对的,不选高级的
  4. 一句话标题

饼图:

  1. 从12点钟位置排列,最重要信息放12点位置
  2. 数据项不要超过5项,定位理论表明人脑容易记住前5位
  3. 不要使用“爆炸式”饼图分离
  4. 饼图不要使用图例,写在饼上
  5. 尽量不使用标签连线,如果要用切勿凌乱
  6. 尽量不使用3D效果,如果要用,尽量薄。3D容易使人无法判断面积
  7. 当扇区填色时,推荐使用白色边框线,切割感较好

复合饼图:当数据项超过5项,提取其中需要描述的项目制作符合饼图

 

柱状图:

  1. 同一序列使用相同颜色
  2. 不要使用倾斜的标签,不要让人歪脑袋
  3. 纵轴刻度合适,一般从0开始
  4. 最好添加数据标签,一眼看到具体数值
  5. 若已有数据标签,刻度线则成为多余

条形图:横版柱状图

  1. 同一数据序列使用相同颜色
  2. 尽量数据从大到小排列
  3. 不要使用倾斜标签
  4. 添加数据标签,没有数据标签时可添加网格线

折线图:走势

  1. 折线图选用线性要相对粗,最好比网格线、坐标轴等更加突出
  2. 线条不超过5条
  3. 不使用倾斜标签
  4. 注意刻度起始
  5. 适当情况加数据标签,Arial字体

 

图表会说谎:

  1. 起始刻度做手脚,虚晃增长
  2. 3D效果的伪装,不合适的3D会有数据欺骗性
  3. 逆序排列的误导,注意横坐标
  4. 面积测度增长倍率的误导

 

数据分析师:懂业务、懂管理、懂分析、懂工具;还要懂设计、懂创意、懂艺术。

 

图标美化

  1. 图表美化原则:
    1. 简约:简单的手法揭露事物本质
    2. 整洁:整齐、干净、和谐自然。去除不必要的成分
    3. 对比:突出重点元素(字体、线形、颜色)
  2. 图表美化技巧:
    1. 最大化数据墨水比:每一滴墨水有存在的理由,减少和弱化非数据元素,增强和突出数据元素
    2. 找出隐形的线:描述轴刻度部分的文字说明采用靠近坐标轴的对齐方式
    3. 数据图标注意位置,找到何时的元素位置
    4. 图标喜欢的数字格式:数据元素拥挤时,统一Arial字体
    5. 突出对比:不要缩手缩脚,大胆让它突出(对比色、直线、箭头、阴影)。目的是让人快速领悟传达信息,其次才是吸引眼球调动兴趣
  3. 图表颜色搭配:

主色

配色

红色

白色、黑色、蓝灰色、米色、灰色

咖啡色

米色、鹅黄、转红、蓝绿色、黑色

黄色

紫色、蓝色、白色、咖啡色、黑色

绿色

白色、米色、黑色、暗紫色、灰棕色

蓝色

白色、粉蓝色、酱红色、金色、银色、橄榄绿、橙色、黄色

  1. 色彩的C大调:原色、原色间的中位=二次色、原色和二次色间中位=三次色
  2. 相似色:有一种色调极其响应的多种亮色和暗色组成,组合在一起素雅而正式。但是:画面较为平淡;对象区分度不够,容易忽视区别
  3. 邻近色:色环上相邻的颜色,组合在一起色调统一和谐,能够带给观众明显的情感特征
  4. 对比色:色环上相对的颜色,强调对比时可以使用;常用的有深浅、冷暖、亮暗等。其中深浅最常用的是黑白
  5. 冷暖色:主观情感导向,不需要刻意区分。暖色调更加夺目;暖色一般冬春使用、冷色调一般夏秋使用

                      4. 慎用的颜色:

  1. 红黄绿三种颜色有特殊含义,谨慎使用。
  2. 红色代表禁止或者危险
  3. 黄色代表告警和提醒
  4. 绿色代表安全、正常

                      5. 如虎添翼

  1. 图标模板,每完成依次设计,将其保存好,用于以后方便
  2. 修剪超大值,将特别突出的数值进行斜线剪裁示意

 

报表篇:

专业的报告:体现职场价值:

  1. 数据分析报告:根据数据分析原理和方法们运用数据来反映、研究和分析某项事物现状、问题、原因、本质和规律,并得出结论,提出解决办法的一种分析应用文体
  2. 原则 = 规范性+重要性+谨慎性+创新性
    1. 规范性:前后名词、术语要与业界统一,符号系统与国际主流一致
    2. 重要性:体现数据分析的重点,在各项分析中重点选取关键指标,科学专业的分析。
    3. 谨慎性:报告撰写过程谨慎,基础数据务必真实、完整,分析过程科学、合理、全面,分析结果要可靠,内容实事求是
    4. 创新性:数据分析报告要适时的引入新的研究模型或分析方法成果,一方面用实际验证理论,另一方面让人了解业界前沿成果
  3. 数据分析报告作用:实质上是一种沟通与交流的形式,主要目的在于将分析结果、可行性建议以及其他有价值信息传递给boss。
    1. 展示分析结果:报告以一种特定形式将数据分析结果清洗展示给决策者,使他们能够迅速理解、分析、研究问题的基本情况、结论与建议等
    2. 验证分析质量:分析报告也是对整个数据分析项目的一个总结。对数据的处理与分析结果进行质量验证,并让决策者感到整个过程的严谨、科学
    3. 提供决策者参考:大部分数据分析报告都具有时效性,因此得到的结论与建议可以作为决策的一个参考依据。
  4. 数据分析报告的种类:
    1. 专题分析报告:对社会某一方面或某一问题进行红钻门研究的分析报告,主要作用是为决策者指定某政策、解决某问题提供参考和依据
      1. 单一性:不要求反映事物的全貌,主要针对某一方面或某一问题进行分析,如用户流失、用户消费行为、提升企业利润率分析等
      2. 深入型:由于内容单一重点突出,要求集中重点深入分析。不仅要求的问题具体描述,还要对原因进行分析,提出可能的解决方案,这就需要对业务的理解
    2. 综合分析报告:全面评价一个地区、单位、部门业务或其他方面发展状况的一种报告形式。如人口发展、全国经济发展、企业运营分析报告等
      1. 全面性:站在全聚德高度总体分析,反映总体特征,例如4P法,产品、价格、渠道、促销四个角度解释运营分析
      2. 联系性:把互相关联的一些现象、问题综合起来进行全面系统的分析。不是对资料的罗列,而是建立在系统的分析指标体系基础上,考察现象之间的联系,常表现为宏观角度的分析
    3. 日常数据通报:定期的数据分析报表为依据,反映计划执行情况,并分析其影响和形成原因的一种数据分析报告。这种数据分析报告一般是按日、周、月、季等定期进行,可以是专题性,也可以是综合性
      1. 进度性:把计划执行的进度与时间结合分析,判断计划完成的好坏,通过一些绝对数字和相对数字突出进度
      2. 规范性:基本上称为数据分析部门例行报告,定时向决策者提供,因此通常形成规范结构的形式。标题和格式规范,内容也一般变化不大
        1. 反映计划执行的基本情况
        2. 分析完成或未完成的原因
        3. 总结计划执行中的成绩和经验,找出存在问题
        4. 提出措施和建议
        5. 《X年X月业务发展通报》
      3. 时效性:用于通报的性质和任务决定,是时效性最强的一种分析报告。只有及时提供业务发展过程中的各种信息,才能帮助决策者掌握企业精英的主动权
  5. 数据分析的报告结构:总分总,标题、目录、前言;正文部分主要包括具体过程与结果;街舞i额部分包括结论、建议和附录
    1. 标题页:题目简洁干练,清晰表现主题,激发读者兴趣,让数据开始讲故事
      1. 常见的数据分析报告标题形式
        1. 解释基本观点:这类标题往往用观点句来表示,点名数据分析报告的基本观点《不可忽视的高价值客户的保有》、《语音业务是公司发展的重要支柱》
        2. 概括主要内容:重点在叙述数据反映的基本事实,概括分析报告的主要内容,让读者能抓住全文中心,如《我公司销售额增长30%》《XXX运营良好》
        3. 交代分析主题:这类标题反映分析对象、范围、时间、内容等状况,并不点名分析者的主观思想《发展公司的业务途径》、《XX业务对比分析》
        4. 提出问题:这类标题以问题形式提出报告要分析的问题,引起读者的思考《客户流失到哪里去了?》《公司收入下降原因何在》
      2. 标题制作要求:
        1. 直接:毫不含糊、直截了当的表达观点,一看标题能够领会数据分析报告的基本精神,加快对内容的理解
        2. 确切:文题相符,宽窄适度,恰如其分表达数据分析报告的内容和对象的特点
        3. 简洁:标题要直接反映出数据分析报告的主要内容和基本精神,必须有高度概括的少量文字集中、准确、简洁的表述
      3. 标题的艺术性:
        1. 抓住对象特征展开联想,为数据讲故事写下序言
        2. 有时报告的作者也要在题目页出现,方便将来参考,另外日期也是体现时效性的重要因素
    2. 目录:重要的一级、二级标题信息,不要太过详细;另外有时boss只关心图标,可以考虑对图标单独制作目录
    3. 前言:分析报告的额重要组成部分,包括背景分析、目的和思路三个方面:
      1. 思路:前言写作一定要深思熟虑,前言内容是否正确,对整个报告的质量以及其解决业务问题、提供参考依据的好坏起决定性作用
        1. 为何要开展此次分析,有何意义?
        2. 要解决什么问题?达到有何目的?
        3. 如何开展此次分析?主要通过哪些方面?
      2. 分析背景:让读者对整个分析研究的背景有所了解,主要阐述此项分析的主要原因、分析的意义,以及其他信息
      3. 分析目的:开展此次分析能够带来何种效果,可以解决什么问题。分析报告需要有一个明确的目的,针对性越强,越能及时解决问题,指导意义就越强
      4. 分析思路:分析思路说明了完成这个数据分析项目的指导思路
    4. 正文:核心部分,将系统全面的表述分析的过程与结果。撰写正文是根据分析思路中确定的分析内容,利用各种方法一步步展开分析,通过图标文字结合,形成报告主体
      1. 科学严密的论证过程,如下特点:

        ① 最长的主体部分

        ② 包含数据分析的事实和观点

        ③ 通过图标、文字结合分析

        ④ 各部分逻辑紧密

    5. 结论和建议:对整个报告的综合与总结、深化和提高,是得出结论、提出建议、解决矛盾的关键所在,画龙点睛的作用帮助读者加深认识,明确题旨
    6. 附录:提供正文中涉及而未提供的有关资料,以及一些关键内容的注释
  6. 撰写报告的注意事项:不取决于篇幅长短,而在于内容是否丰富,结构是否清晰,是否有效反映业务真想,提出的建议是否可行
    1. 结构合理,逻辑清晰:应该有非常明确、清晰的架构,呈现简洁、清晰的分析结果
    2. 实事求是,反映真相:最重要的是必须具备真实性,不允许有虚假和伪造的现象存在。分析过程中一定保持中立态度,不持任何立场
    3. 用词准确,避免含糊:避免使用不明确的词汇,如“大概”,“大约”等。必须明确的告知,什么情况合理,什么情况不合理
    4. 篇幅适宜,简洁有效:报告价值体现在给决策者提供所需的信息,并且这些信息能够解决问题。工作的重点将问题在最短的时间内阐释清晰并解决
    5. 结合业务,分析合理:不能仅基于数据做工作,或仅仅看图说话,要结合公司所处的现状和业界大环境来进行更多维的广度分析,提出可操建议。切勿原理目标的结论提出不现实的建议,可能需要与其他部门进行沟通

你可能感兴趣的:(数据分析)