离线电商数仓-用户行为采集平台-第3章 用户行为日志

前言

本博客是学习记录,可能存在错误,仅供参考。

如发现错误,欢迎在评论区指正,我会及时修改。

同时也希望大家能在评论区多和我讨论,或者私信我,讨论可以让我们学习效率更高。

现在的版本不是最终版本,我会在学习过程中不断地更新。

第3章 用户行为日志

3.1 用户行为日志概述

埋点:是收集用户的各项行为信息以及行为所处的环境信息的手段

分类如下:

****代码埋点****是通过调用埋点SDK函数,在需要埋点的业务逻辑功能位置调用接口,上报埋点数据。例如,我们对页面中的某个按钮埋点后,当这个按钮被点击时,可以在这个按钮对应的 OnClick 函数里面调用SDK提供的数据发送接口,来发送数据。(此方法已经基本被淘汰)

****可视化埋点****只需要研发人员集成采集 SDK,不需要写埋点代码,业务人员就可以通过访问分析平台的“圈选”功能,来“圈”出需要对用户行为进行捕捉的控件,并对该事件进行命名。圈选完毕后,这些配置会同步到各个用户的终端上,由采集 SDK 按照圈选的配置自动进行用户行为数据的采集和发送。(此方法更加简单操作,但也用的不多)

****全埋点****是通过在产品中嵌入SDK,前端自动采集页面上的全部用户行为事件,上报埋点数据,相当于做了一个统一的埋点。然后再通过界面配置哪些数据需要在系统里面进行分析。(小公司可能使用第三方埋点,但会造成数据泄露,大公司基本自己开发)

3.2 用户行为日志内容

本项目收集和分析的用户行为信息主要有页面浏览记录、动作记录、曝光记录、启动记录和错误记录。

3.2.1 页面浏览记录

离线电商数仓-用户行为采集平台-第3章 用户行为日志_第1张图片

3.2.2 动作记录

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6evbfgy2-1666278791053)(离线数仓-用户行为采集平台.assets/image-20221017154728629.png)]

3.2.3 曝光记录

曝光是指该页面展示过了哪些信息,例如轮播图,有的图可能还没有轮播到,页面就关了。

3.2.4 启动记录

离线电商数仓-用户行为采集平台-第3章 用户行为日志_第2张图片

3.2.5 错误记录

例如404,500这些错误,记录下来,排查是用户的问题,还是应用的问题。

3.3 用户行为日志格式

日志结构大致可分为两类,一是页面日志,二是启动日志。

每个类别中都用Json的文件格式记录日志,对于重复的信息,会共用一个。

3.4 服务器和JDK准备

有的内容在之前的组件中已经学习过了,此处省略

3.4.6 环境变量配置说明

离线电商数仓-用户行为采集平台-第3章 用户行为日志_第3张图片

这两种shell的主要区别在于,它们启动时会加载不同的配置文件,login shell启动时会加载/etc/profile,/.bash_profile,/.bashrc。non-login shell启动时会加载~/.bashrc。

而在加载/.bashrc(实际是/.bashrc中加载的/etc/bashrc)或/etc/profile时,都会执行如下代码片段,

离线电商数仓-用户行为采集平台-第3章 用户行为日志_第4张图片

因此将环境变量配置到/etc/profile.d/*.sh下,在登录Shell和非登录Shell下能有加载到。

3.5 模拟数据

见文档

你可能感兴趣的:(数据仓库,数据仓库,大数据)