数据分析学习笔记+案例实操

学习资源来自:

刺猬大学数据分析体验营

学习笔记

第一讲:认识数据分析

why量化、客观分析,辅助决策

what战略层面、用户精准营销等

how数据分析方法

第二讲:八大实用数据分析模型

1行为事件分析:5W1H

2漏斗分析:各标志点用户转化率

3留存分析:留存率,延长用户生命周期

4分布分析:数据分析第一步要做的,重要

5点击分析:电商应用较多

6用户路径:获取用户偏好

7用户分群:精准营销,机器学习分类,勾勒用户画像

8属性分析:了解用户特点

第三讲:可视化工具介绍

1为什么需要可视化?现在数据量巨大,而大脑对图像信息处理快

2商业智能:数据库-数据分析-可视化,实现商业价值;“智能”在于可以实现动态交互

3Tableau商业智能工具平台

优点:可以实时分享

类型:图表、仪表盘、故事

学习目的:Excel数据处理,Tableau完成可视化

4数据爬虫:八爪鱼

分享一个自己用过的爬虫软件:集搜客(官网https://www.jisouke.com/,和导师一起完成的视频教程https://www.jianshu.com/p/cfabdc81f2d3)

第四讲:写代码分析数据

1传统数据分析工作者:Excel(报表)+PPT(报告+排版)

2SQL是一种编程语言

优点:数据处理高效

缺点:不能深度运算和建模

3Python

优点:基本语法功能不难;开源工具包(交互式图表-pyechars,matpotlib-seaborn,Gephi-关系网络可视化);数据爬虫

案例实操

案例实操结果展示

案例实操1(1):某时间段内广告投放人群记录(树状图)-图1

重点:

1vlookup匹配分组

2两个维度树状图(把维度多的做小一点维度,eg.男女用颜色、位置表示,年龄七个维度表示成方块大小)

步骤:

1年龄数据匹配:=VLOOKUP(要匹配单元格,匹配区域($绝对引用,快捷键F4),匹配列,FALSE(精确匹配))-双击小方框填充所有-粘贴值

2删除空值(性别):开始-查找和选择-定位条件-空值-删除整行

3去重(用户id):数据-删除重复项-选定用户id

4数据汇总:插入-数据透视表-拖动字段,设计-分类汇总(不显示分类汇总)-报表布局(以表格形式显示、重复所有项目标签)

5做树状图:粘贴值,插入-树状图,更改标题-调整配色(用PPT取色器,配色网站https://www.webdesignrankings.com/resources/lolcolors/)

案例实操1(2):多维度分析广告投放影响因素-图2

步骤:

1去重(用户id)

2定位空值,填充为“未知”(批量填充Ctrl+Enter)

3替换“是否点击”分别为“1,0”

4分别做数据透视表进行可视化

5粘贴值-调整格式

案例实操2:商品列表(气泡图)-图3、图4

重点:

1时间戳真实事件含义

2气泡图的含义(散点图的一种):三组数值之间的关系

3投放广告频率:一段时间内投放的广告次数

步骤:

1商品价格匹配:VLOOKUP(全选表格Shift+Ctrl+下键)

2处理时间戳:换算成天(用除法)-键入原始时间(重复填充:复制单元格-选中两个相同的双击小方框)-得出当前时间(天+原始时间)(验算工具https://www.timestampconvert.com/)-粘贴值(设置单元格格式:日期)

3设置时间段(一般显示小时或天的投放次数):=HOUR(要提取时间段单元格)(设置单元格格式:常规)

4填充空值为“未知”

5数据汇总:数据透视图(去掉空白:下拉菜单去掉勾选)

6做图:散点图-气泡图(设置数据系列格式:调整气泡面积,添加坐标轴标题和图例:选择数据-编辑系列名称)

案例实操3:用户行为(帕累托图)-图5

重点:

使用次坐标轴

步骤:

1处理时间戳

2数据汇总:数据透视表(只统计某一行为:“行动”放在“筛选器”,更改复制数据)

3做图:簇状柱形图(原理:先绘制一种行为-通过添加数据源增加数据可视化)-更改系列图表类型:可选次坐标轴

你可能感兴趣的:(数据分析学习笔记+案例实操)