CDA level1 学习笔记(已通过考试)

CDA LEVEL1

2023年10月28日已顺利通过一级考试!用时一个月,利用下班休息时间看书、看视频、刷题。
题型:单选、多选、内容相关、案例分析 两小时 60分过
CDA教程学习笔记
数据分析是利用数据来理性思考和决策的过程。
数据分析:是以数据为分析对象,以探索数据内的有用信息为主要途径,以解决业务需要为重要目标。
数据挖掘:是一个跨学科的计算机科学分支,它是用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发现的模式的经计算过程。

数据分析的本质

发现和解决问题:现状与期待的落差
1.现状不如原状:风险已经发生(寻因–方案)
2.现状与期待一致:有潜在风险(计划、监控)
3.现状与理想有一定距离:追求更好(创新)
解决问题:
1、紧急处理—解决表面问题
2、避免复发:找到深层原因 (基于事实,使用数据,分解结构)
4、明确因果关系
防范风险:1、确定潜在风险 2、影响因素 3、可承受损失范围 4、策略制定
追求理想:合理的理想 1、明确理想 2、评估是否值得 3、规划性思考 4、行动计划
通用分析思路设计:业务增长模型
1、追求理想:提高客单价或者购买频次
2、防范风险:保持市场份额占比
3、解决问题:客户流失
数据分析四个层次
1、战略规划:内外部数据结合、长期规划的过程。注重方向判断,弱化细节预测。
2、策略分解:根据战略和目标,拆解为可以执行的层面。注重KPI设定
3、市场营销:活动和获客驱动。注重成本核算、效果预测和事后评估。
4、业务运营:关注日常数据。注重监控预警和分析发现。
数据分析常用方法:
结构化的分析方法
事实+前提+逻辑=观点
事实:客观的存在,是百分百成立的
前提:作出推断的依据,是不需要证明的公理
逻辑:作出推理的规则,本质上是数学
结论:最后得到的观点
说出论点,提出论据
事实的提炼:现实的抽象化
收集型数据:正常业务自然产生的数据
创造型数据:事先设计的实验产生的数据
逻辑的推进:逻辑顺序展现了组织思想的分析过程《金字塔原理》麦肯锡
演绎推理:大前提、小前提、结论
时间/步骤:第一、二、三
空间/结构:上海、北京、深圳
程度/重要性:最重要、其次、等等
矩阵分析:两个变量(因素)
选择原点:离散(高/低),连续(中位数/平均值)
四象限:问题的解刨
制定策略:依象限而定

进一步拓展
矩阵分析-----1、增加分段—九宫格
2、增加变量----三变量—RMF(最近一次、金额、频次)
----多变量—聚类
分解式思考:定位与寻因(将事物进行分解,从分支去理解全体)
画八爪图:交易、活跃、关联、投诉、活动、提升
观点的提炼:
观点的产生(论点、论据)但是,结论与论据(定性+定量)太过跳跃,说服力弱。
(注意逻辑推进过程)
结论的表达:听众想听什么
和他预期一致的结论:支持论据
预期之外的新思路:业务价值或启发
和预期相反的结论:难以接受
“唱反调“的技巧:先解释原因,再说明结果
1、原因一定要详细,全面 2、结果要和方案一起出现 3、规避原有预期
事实抽象(收集型数据、创造型数据)+具体场景(前提)+逻辑(陌生问题用矩阵式、寻因、定位用问题分解式)=结论

数据化工作:EDIT数字化的模式
Exploration: 探索(业务运行探索):指标体系。运行状态、具体数据。
Diagnosis: 诊断(问题根原因诊断):性质分析法,数量分析法。
定性和定量相结合,在中微观层面定位和分析问题。
Instruction: 指导(业务策略指导):知识库、策略库、流程模块。优化策略。
Tool: 工具(智能算法工具):数据模型、算法模型、优化模型。

职业道德与行为准则

道德操守:将数据产权、用户利益和机构利益置于个人利益之上,保护数据资产的安全性,遵循数据的真实性、可靠性,禁止技术欺诈、数据造假、非法交易,损害用户和机构利益。
保护和加强自身职业道德操守以及同行的操守。
不参与任何违法行为,包括但不限于:偷窃、欺骗、腐败、挪用或贿赂;
不使用或滥用他人的产权,包括数据资产、知识产权;
不参与诽谤和侮辱;
不宽恕或帮助他人参与违法行为。

行为准则:专业、审慎、高效地完成各项数据分析的业务流程:
全面了解业务背景、痛点、需求,做出分析建议,与团队充分沟通,确定合理业务指标,获取符合要求的源数据。
保持工具与算法的前沿性、适用性、高效性。根据业务需要,选择合理的工具、平台、系统及算法。
不断迭代并优化业务指标与数据模型。
撰写专业可视化报告,逻辑清晰展示项目成果,并做出具有商业价值的建议。
尊重契约,按时按质完整交付工作成果,并对相关数据、代码、结果进行保密。
履行后期义务与责任。完整交付结果后,对客户须进行后期解答、咨询、维护等服务;对机构业务须进行后期跟进、优化、指导建议等工作。
大数据立法、安全、隐私
掌握数据安全法的立场与原则,然后去分析相关实际问题。
合法、正当、必要原则;目的明确原则、知情同意原则;删除权和更正权;
2020年6月28日-30日,《中华人民共和国数据安全法》迎来初次审议。
答题原则:问题存在,逐步推进解决。

数据结构

数据类别:结构化数据、非结构化数据
表格结构数据:Excel、Wps、Numbers
表结构数据:数据库、ETL工具、可视化工具
表格数据层级:一个父级包含多个不同子级对象
一个子级对象只能属于某一个特定父级对象
表格结构数据的数据类型:数值型、文本型、逻辑型
单元格格式属性:
数字格式:决定显示形式
显示格式:决定显示效果

表格结构数据获取方法:
从业务后台数据库系统获取(电子表格工具支持的数据文件:文本文件、电子表格工具文件);
后台数据库系统获取数据流程;
前台操作平台获取数据;(ERP、CRM => 电子表格工具支持的数据文件)
从企业外部渠道获取数据;(CSV文本文件(分隔符“,”),TXT文本文件(分隔符为制表符),
XLSX(excel文件),ET(WPS表格文件&#

你可能感兴趣的:(学习,笔记,big,data,数据分析)