数据分析学习笔记+案例实操

学习资源来自:
刺猬大学:刺猬大学数据分析体验营

学习笔记


第一讲:认识数据分析
why量化、客观分析,辅助决策
what战略层面、用户精准营销等
how数据分析方法
第二讲:八大实用数据分析模型
1行为事件分析:5W1H
2漏斗分析:各标志点用户转化率
3留存分析:留存率,延长用户生命周期
4分布分析:数据分析第一步要做的,重要
5点击分析:电商应用较多
6用户路径:获取用户偏好
7用户分群:精准营销,机器学习分类,勾勒用户画像
8属性分析:了解用户特点
第三讲:可视化工具介绍
1为什么需要可视化?现在数据量巨大,而大脑对图像信息处理快
2商业智能:数据库-数据分析-可视化,实现商业价值;“智能”在于可以实现动态交互
3Tableau商业智能工具平台
优点:可以实时分享
类型:图表、仪表盘、故事
学习目的:Excel数据处理,Tableau完成可视化
4数据爬虫:八爪鱼
分享一个自己用过的爬虫软件:集搜客(官网https://www.jisouke.com/,和导师一起完成的视频教程https://www.jianshu.com/p/cfabdc81f2d3)
第四讲:写代码分析数据
1传统数据分析工作者:Excel(报表)+PPT(报告+排版)
2SQL是一种编程语言
优点:数据处理高效
缺点:不能深度运算和建模
3Python
优点:基本语法功能不难;开源工具包(交互式图表-pyechars,matpotlib-seaborn,Gephi-关系网络可视化);数据爬虫

案例实操


数据分析学习笔记+案例实操_第1张图片
案例实操1(1):某时间段内广告投放人群记录(树状图)-图1
重点:
1vlookup匹配分组
2两个维度树状图(把维度多的做小一点维度,eg.男女用颜色、位置表示,年龄七个维度表示成方块大小)
步骤:
1年龄数据匹配:=VLOOKUP(要匹配单元格,匹配区域($绝对引用,快捷键F4),匹配列,FALSE(精确匹配))-双击小方框填充所有-粘贴值
2删除空值(性别):开始-查找和选择-定位条件-空值-删除整行
3去重(用户id):数据-删除重复项-选定用户id
4数据汇总:插入-数据透视表-拖动字段,设计-分类汇总(不显示分类汇总)-报表布局(以表格形式显示、重复所有项目标签)
5做树状图:粘贴值,插入-树状图,更改标题-调整配色(用PPT取色器,配色网站https://www.webdesignrankings.com/resources/lolcolors/)
案例实操1(2):多维度分析广告投放影响因素-图2
步骤:
1去重(用户id)
2定位空值,填充为“未知”(批量填充Ctrl+Enter)
3替换“是否点击”分别为“1,0”
4分别做数据透视表进行可视化
5粘贴值-调整格式
案例实操2:商品列表(气泡图)-图3、图4
重点:
1时间戳真实事件含义
2气泡图的含义(散点图的一种):三组数值之间的关系
3投放广告频率:一段时间内投放的广告次数
步骤:
1商品价格匹配:VLOOKUP(全选表格Shift+Ctrl+下键)
2处理时间戳:换算成天(用除法)-键入原始时间(重复填充:复制单元格-选中两个相同的双击小方框)-得出当前时间(天+原始时间)(验算工具https://www.timestampconvert.com/)-粘贴值(设置单元格格式:日期)
3设置时间段(一般显示小时或天的投放次数):=HOUR(要提取时间段单元格)(设置单元格格式:常规)
4填充空值为“未知”
5数据汇总:数据透视图(去掉空白:下拉菜单去掉勾选)
6做图:散点图-气泡图(设置数据系列格式:调整气泡面积,添加坐标轴标题和图例:选择数据-编辑系列名称)
案例实操3:用户行为(帕累托图)-图5
重点:
使用次坐标轴
步骤:
1处理时间戳
2数据汇总:数据透视表(只统计某一行为:“行动”放在“筛选器”,更改复制数据)
3做图:簇状柱形图(原理:先绘制一种行为-通过添加数据源增加数据可视化)-更改系列图表类型:可选次坐标轴

你可能感兴趣的:(数据分析学习笔记+案例实操)