CDA Level1知识点总结之数据分析概述与职业操守

数据分析概述与职业操守

  • 策略分析
  • 考点总结
    • 前导课
    • 数据分析概述与职业操守
      • 1. 数据分析概念、方法论、角色
      • 2. 数据分析师职业道德与行为准则
      • 3. 大数据立法、安全、隐私
  • 习题整理(易错题、难题)

策略分析

PART 1 数据分析概述与职业操守(占比3%)
a. 数据分析概念、方法论、角色(占比1%)
b. 数据分析师职业道德与行为准则(占比1%)
c. 大数据立法、安全、隐私(占比1%)
这一节占比很小,1小时内搞定。可凭常识回答,无易混淆或难理解的点。
考试时单选3道,多选1道。

考点总结

前导课

前导课的内容和考试并不直接相关,但是对于提升从业认知很有好处,尤其是第4、5、6都是在为我们提供航向。
1.数据分析的价值
避免主观谬误(需求分析、AB测试)
提高判断效率(如:客服提高交接效率)
易推广、易迭代

2.数据分析的要求
简明化 、结论化、通用化

3.数据分析的本质–发现和解决问题
现状vs期望:(过去更好→解决已发生风险,现状很好→预防潜在风险,通用化判断,理想/未来更好→战略性、定性分析)

4.数据分析的四个层次
战略规划:内外部数据结合,长期规划,注重方向判断,弱化细节预测。
策略分解:根据战略和目标,拆解为可执行的层面,注重KPI设定。
市场营销:活动和获客驱动,注重成本核算、效果预测和事后评估。
业务运营:关注日常数据,注重监控预警和分析发现。

5.数据分析师的分类
数据部–数据分析师:数据驱动业务,关注现象背后的原因,对未来预测;独立于业务经验,提供不同视角产出
业务部门–业务分析师:业务为主,数据为辅,更关注业务变化,指标监控,活动效果评估,业务经验很重要

6.分析师进阶之路
a.初级分析师0-1年:临时性数据支持为主:SQL/Tableau/PPT
b.高级分析师1-3年:简单的分析需求为主:R/Python/PPT/分析思维
c.资深分析师3-5年:项目为主:R/Python的高级应用/沟通技巧
d.数据工程师5年以上:根据不同发展方向,有所侧重:提升对模型和业务的理解、开拓视野

数据分析概述与职业操守

1. 数据分析概念、方法论、角色

数据分析–利用数据来理性思考和决策的过程。
1.数据分析:以数据为分析对象,以探索数据内的有用信息为主要途径,以解决业务需求为最终目标。数据分为分类数据(定类型如男女;定序型如本科硕士生博士生)和数值数据(定距型如体温血压这种可加减不能乘除;定比型如重量高度有绝对零值,可加减乘除)
2.数据挖掘:用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发现模式的计算过程。
3.EDIT数字化模型–必考
CDA Level1知识点总结之数据分析概述与职业操守_第1张图片
一、业务运行探索(Exploration)
探索关注企业各项业务的运行状态、各项指标是否合规以及各项业务的具体数据情况等等。

二、问题根原因诊断(Diagnosis)
当业务指标偏离正常值时,采用定性和定量相结合的方式,在中、微观层面定位和分析问题。

三、 业务策略指导(Instruction)
在确定获客群体后,我们就需要考虑下如何制定业务策略指导。根据知识库、策略库、流程模版可以便捷地制定优化策略。

四、智能算法工具(Tool)
算法架构是EDIT数字化模型的发动机,服务于价值经营、客群运营、全面质量管理、全面风险管理等各个方面。

2. 数据分析师职业道德与行为准则

职业道德与行为准则的区别在哪里呢?
职业道德–应该不应该:不宽恕或帮助他人参与违法行为。
行为准则–怎么做
一、全面了解业务背景、痛点、需求,做出分析建议,与团队充分沟通,确定合理的业务指标,获取符合要求的源数据。
二、保持工具与算法的前沿性、适用性、高效性。根据业务需要,选择合理的工具、平台、系统及算法。
三、 不断迭代并优化业务指标与数据模型。
四、撰写专业可视化报告,逻辑清晰展示项目成果,并做出具有商业价值的建议。
五、尊重契约,按时按质完整交付工作成果,并对相关数据、代码、结果进行保密。
六、履行后期义务与责任。完整交付结果后,对客户须进行后期解答、咨询、维护等服务;对机构业务须进行后期跟进、优化、指导建议等工作。

3. 大数据立法、安全、隐私

不要背诵相关法,而是掌握数据安全法的立场与原则,分析实际问题

欧盟的《通用数据保护条例》GDPR–核心目标是将个人数据保护深度嵌入组织运营
企业在收集用户的个人信息之前,必须向用户说明:
将收集用户的哪些信息、收集到的信息将如何进行存储、存储的信息会如如何使用、企业的联系方式。
用户享有的权利有:
一、数据访问权
二、被遗忘权
三、限制处理权
四、数据携带权
保护公民个人数据信息安全已写入刑法
《中华人民共和国网络安全法》

  1. 网络运营者收集、使用个人信息必须符合合法、正当、必要原则;
  2. 网络运营商收集、使用公民个人信息的目的明确原则和知情同意原则;
  3. 公民个人信息的删除权和更正权制度。

数据安全相关答题原则:问题存在,逐步推进解决。

习题整理(易错题、难题)

1.以下行为中不触犯职业道德操守的是?
A.因工作需要将客户数据备份到个人U盘
B.从第三方企业购买竞争对手机密数据
C.适度美化分析结果让报告更加好看
D.在获得客户允许后,将数据脱敏,并隐藏能够特定客户信息的内容后,
可将客户案例用作自己企业宣传资料使用
答案:D。关键点:数据分析师需要保持真实性、保密性、安全性。

2.作为运营商,以下做法正确的是?
A. 将客户的消费记录出售牟利
B. 将公民身份信息加密保存
C. 为防泄密,企业负责人应将客户信息存入U盘并随身携带
D. 将客户信息直接交给合作方,以加快市场步伐。
答案:B。注意,C将U盘随身携带更容易丢失。

3.以下不属于现阶段大数据法治问题的是?
A. 信息安全有待加强
B. 数据立法有待推进
C. 政府数据开放与共享仍待推进
D. 算法技术仍需提高
答案:D。算法技术与大数据法治问题无关。

4.(模)EDIT数字化模型是企业在实现数字化工作的落地模板,以下关于数据分析EDIT模型描述错误的是
A.E指的是Exploration、探索
B.D指的是Data、数据
C.I指的是Instruction、指导
D.T指的是Tool,工具
答案:D是Diagnosis 诊断的意思。

5.(模)数据分析由许多关键的阶段性步骤构成,以下不属于数据分析步骤的是
A.业务理解
B.数据获取
C.数据处理
D.制定决策方案
答案:D
数据分析步骤包含:
业务理解(明确分析目的和内容)–数据收集–数据预处理–数据分析–数据可视化(数据展现)–报告撰写(《从零进阶!数据分析的统计基础》)

6.(模)数据安全是从事数据分析工作人员必须要严格保障的事项,以下对于保护数据信息安全不利的错误做法是
A.将机密数据U盘随身携带
B.对机密数据载体进行加密保存
C.不在咖啡厅等公共场所使用机密数据电脑办公
D.不使用能够连入外网的电脑处理企业机密数据
答:A

7.(模)数据分析方法论为分析项目提供了基础框架,以下不属于数据分析方法论的选项是
A.CRISP-DM
B.SEMMA
C.AB测试
D.UML
答:D。 UML是统一建模语言,用于需求分析,不属于数据分析范畴。

8.(模)(多选)CRISP-DM模型是应用最广泛的KDD过程模型,下面属于CRISP-DM模型的阶段有()
• A.业务理解
• B.数据理解
• C.数据准备、建模、模型评估
• D.模型发布
答:ABCD。 6个不同的阶段:商业理解(业务理解)、数据理解、数据准备、建模、模型评估、模型部署(发布)

9.下列有关数据分析说法正确的是()
A.数据分析规定其操作流程分为5步
B.SEMMA是数据挖掘项目方法论的名称
C.数据分析只是针对大数据情形,小数据是没有意义的
D.数据分析中模型的精度是第一位的
答:B
错选为A。但其实没有明确规定的步骤数量(沙雕选项)C项大数据小数据各有用处。D数据分析中要权衡成本、精度和效率,精度第一的那是算命,不是数据分析。
拓展:SEMMA
SEMMA 的基本思想是从样本数据开始,通过统计分析与可视化技术,发现并转换最有价值的预测变量,根据变量进行构建模型,并检验模型的可用性和准确性。
CDA Level1知识点总结之数据分析概述与职业操守_第2张图片
CRISP-DM模型Cross Industry Standard Process of Data Mining,被称为跨产业的数据挖掘标准流程
商业理解:其目的是要了解企业的整个运作过程。商业理解的作用主要是定题目,即通过数据挖掘想要解决什么问题。

数据理解:检查解决问题所需要的数据是否收集齐全,若没有则退回到商业理解这一步。

数据预处理:对收集到的数据进行处理,此阶段耗时最长。

建模:建立模型,若结果不好,则退回到数据预处理这一步,进行相应的调整。

评估:评估结果好就可以实施,评估结果不好就直接退回到商业理解这一步,重新开始。

实施:模型的实际应用。
CDA Level1知识点总结之数据分析概述与职业操守_第3张图片

10.数据分析8个层次中的最高层次是()
A.预报
B.优化
C.报警
D.统计分析
答:B.
错选为A,知识盲区。
8大层次:

  1. 标准报表
    回答: 发生了什么?什么时候发生的?
    示例:月度或季度财务报表
    我们都见过报表,它们一般是定期生成,用来回答在某个特定的领域发生了什么。从某种程度上来说它们是有用的,但无法用于制定长期决策。
  2. 即席查询
    回答:有多少数量?发生了多少次?在哪里?
    示例:一周内各天各种门诊的病人数量报告。
    即席查询的最大好处是,让你不断提出问题并寻找答案。
  3. 多维分析
    回答:问题到底出在哪里?我该如何寻找答案?
    示例:对各种手机类型的用户进行排序,探查他们的呼叫行为。
    通过多维分析(OLAP)的钻取功能,可以让您有初步的发现。钻取功能如同层层剥笋,发现问题所在。
  4. 警报
    回答:我什么时候该有所反应?现在该做什么?
    示例:当销售额落后于目标时,销售总监将收到警报。
    警报可以让您知道什么时候出了问题,并当问题再次出现时及时告知您。警报可以通过电子邮件、RSS订阅、评分卡或仪表盘上的红色信号灯来展示。
  5. 统计分析
    回答:为什么会出现这种情况?我错失了什么机会?
    示例:银行可以弄清楚为什么重新申请房贷的客户在增多。
    这时您已经可以进行一些复杂的分析,比如频次分析模型或回归分析等等。统计分析是在历史数据中进行统计并总结规律。
  6. 预报
    回答:如果持续这种发展趋势,未来会怎么样?还需要多少?什么时候需要?
    示例:零售商可以预计特定商品未来一段时间在各个门店的需求量。
    预报可以说是最热门的分析应用之一,各行各业都用得到。特别对于供应商来说,能够准确预报需求,就可以让他们合理安排库存,既不会缺货,也不会积压。
  7. 预测型建模
    回答:接下来会发生什么?它对业务的影响程度如何?
    示例:酒店和娱乐行业可以预测哪些VIP客户会对特定度假产品有兴趣。
    如果您拥有上千万的客户,并希望展开一次市场营销活动,那么哪些人会是最可能响应的客户呢?如何划分出这些客户?哪些客户会流失?预测型建模能够给出解答。
  8. 优化
    回答:如何把事情做得更好?对于一个复杂问题来说,那种决策是最优的?
    示例:在给定了业务上的优先级、资源调配的约束条件以及可用技术的情况下,请您来给出IT平台优化的最佳方案,以满足每个用户的需求。
    优化带来创新,它同时考虑到资源与需求,帮助您找到实现目标的最佳方式。

11.下列哪项不属于数据分析的基本流程?()
A.报表绘制
B.爬虫
C.业务理解
D.数据处理
答:B。错选为A,因为不明确数据分析到底包含哪些内容,界限在哪里。按理说爬虫属于数据获取部分,但并不是所有的数据分析都需要爬虫。一般来说,数据分析的基本流程为以下6步曲
问题定义、数据获取、数据预处理、数据分析与建模、数据可视化、数据报告的撰写。

12.下列哪类分析对数据的时效性要求最高?()
A.业务数据分析
B.描述性分析
C.数据挖掘分析
D.大数据分析
答:D。错选为B。大数据比普通数据特别的地方,不光是体量大,还有两个重要特征:多维度和时效性。比如说,做地图服务的公司,就能实时得到人员流动信息,并且根据流动速度和所在位置,区分步行的人群和汽车,然后提供实时的交通路况信息。

你可能感兴趣的:(数据分析,python,人工智能)