DataEase开源数据可视化分析平台于2022年6月正式发布模板市场(https://dataease.io/templates/)。模板市场旨在为DataEase用户提供专业、美观、拿来即用的仪表板模板,方便用户根据自身的业务需求和使用场景选择对应的仪表板模板,并在优质模板的基础上轻松制作自己的仪表板。目前,DataEase模板市场的模板数量已经超过了100个。
DataEase模板市场定期进行模板上新。2023年9月共上新6个模板,涉及能源、交通、直播运营、地产运营等主题,欢迎大家在DataEase模板市场下载使用。
本月的模版技巧和大家分享一下如何使用DataEase开源数据可视化分析工具进行电商行业的用户运营分析。
一、数据来源
数据来源:https://tianchi.aliyun.com/dataset/649 (阿里天池数据集:淘宝用户行为数据)
1.字段定义
2.用户行为类型定义
二、数据清洗
1.列名的重命名
将获取的原数据导入到数据库中生成数据集时,原数据集中不包含表头。因此需要为列名进行重命名操作。
ALTER TABLE userbehavior CHANGE COLUMN `1` user_id VARCHAR(255);
ALTER TABLE userbehavior CHANGE COLUMN `2268318` item_id VARCHAR(255);
ALTER TABLE userbehavior CHANGE COLUMN `2520377` cat_id VARCHAR(255);
ALTER TABLE userbehavior CHANGE COLUMN pv behavior_type VARCHAR(255);
ALTER TABLE userbehavior CHANGE COLUMN `1511544070` time_stamp VARCHAR(255);
2.重复值与缺失值检验
导入数据后,需要先检查数据集中是否包含重复值或是否有缺失值。
# 重复值检验
SELECT *
FROM userbehavior
GROUP BY user_id,item_id,cat_id,time_stamp
HAVING COUNT(*)>1;
# 缺失值检查
SELECT COUNT(user_id) AS 用户数量
,COUNT(item_id) AS 商品数量
,COUNT(cat_id) AS 商品类目数量
,COUNT(behavior_type) AS 用户行为数量
,COUNT(time_stamp) AS 时间戳数量
FROM userbehavior;
根据查询结果,数据集中并不包含重复值,也不存在缺失值。
3.时间戳格式化
需要将原数据集中的时间戳格式转换为日期的时间格式,以便后续分析处理。
# 新增日期列
ALTER TABLE userbehavior ADD COLUMN `date` VARCHAR(255);
UPDATE userbehavior SET `date`=FROM_UNIXTIME(time_stamp,'%Y-%m-%d');
# 新增时间列
ALTER TABLE userbehavior ADD COLUMN `time` VARCHAR(255);
UPDATE userbehavior SET `time`=FROM_UNIXTIME(time_stamp,'%H:%i:%s');
# 新增小时列
ALTER TABLE userbehavior ADD COLUMN `hour` VARCHAR(255);
UPDATE userbehavior SET `hour`=hour(time);
三、数据分析
1.用户访问分析
1)数据预处理
将新建的SQL数据集导入DataEase后,在DataEase的数据集“字段管理”页面可以看到各字段均为初始的“文本”类型,需要数据集创建者自行将字段修改为合适的字段类型。如下图所示,将“date”和“time”修改为对应的时间格式,将“user_id”和“item_id”转换为维度。
2)视图设计
在DataEase中新建仪表板。选择刚创建的数据集userbehavior,在仪表板中新建名为“用户访问分析”的组合图。如下图所示,在仪表板制作页面右侧编辑栏的空白框中拖入对应字段并进行修改。
视图中需要展示的指标及其含义为:
■ UV(Unique Visitor):即独立访客。访问某网站的1台电脑客户端即为1个独立访客;
■ PV(Page View):即页面浏览量,或点击量。用户每1次对网站中的每个网页访问均被记录1次。
具体操作步骤如下:
① 将字段“data”拖入“类别轴/维度”空白框中,并设置排序为“升序”;
② 将字段“user_id”拖入“主轴值/指标”空白框中,设置汇总方式为“计数”,并将显示名改为“PV”;
③ 将字段“user_id”拖入“副轴值/指标”空白框中,选择汇总方式为“去重计数”,并将显示名改为“UV”;
④ 将字段“date”和字段“hour”按顺序拖入“钻取/维度”空白框中。
3)分析结果
配置视图下钻后,点击视图中想要查看的数据点,视图将根据下钻结果跳转至该日期的具体时段数据,以便于观看者查看“UV”和“PV”两项指标的当日数据趋势变化。
从折线图中可以看出:11月25日至12月1日的PV和UV数据波动相对稳定,12月2日至12月3日的PV、UV数据曲线则有明显增幅。其中11月25至26日和12月2至3日均为周末,但11月25、26日和工作日的PV、UV数据相近,而12月2日至3日却有明显增幅。
2.用户留存分析
1)数据预处理
① 设定自11月25日起新登录的用户为新增用户,查询每位新增用户第一次登录的日期;
# 创建视图,查询用户第一次登录的日期
CREATE VIEW first_log
AS
SELECT user_id,MIN(date) first_logday
FROM userbehaviorGROUP BY user_id;
② 查询每日新增用户数;
SELECT first_logday,COUNT(user_id) 日新增用户
FROM first_log
GROUP BY first_logday
ORDER BY first_logday;
③ 创建视图,查询用户登录当天与第一次登录的间隔天数;
# 创建视图,查询用户登录当天与第一次登录间隔天数
CREATE VIEW day_diffAS
SELECT a.user_id,b.first_logday,
DATEDIFF(a.date,first_logday) day_diff
FROM userbehavior a
INNER JOIN first_log b
ON a.user_id=b.user_id
GROUP BY a.user_id,a.date;
④ 在DataEase中新建SQL数据集,查询不同登录日期的用户每日留存统计。
SELECT first_logday,
SUM(CASE day_diff WHEN 0 THEN 1 ELSE 0 END) day_0,
SUM(CASE day_diff WHEN 1 THEN 1 ELSE 0 END) day_1,
SUM(CASE day_diff WHEN 2 THEN 1 ELSE 0 END) day_2,
SUM(CASE day_diff WHEN 3 THEN 1 ELSE 0 END) day_3,
SUM(CASE day_diff WHEN 4 THEN 1 ELSE 0 END) day_4,
SUM(CASE day_diff WHEN 5 THEN 1 ELSE 0 END) day_5,
SUM(CASE day_diff WHEN 6 THEN 1 ELSE 0 END) day_6,
SUM(CASE day_diff WHEN 7 THEN 1 ELSE 0 END) day_7,
SUM(CASE day_diff WHEN 8 THEN 1 ELSE 0 END) day_8
FROM day_diff
GROUP BY first_logday
ORDER BY first_logday;
2)视图设计
在仪表板中新建“明细表”视图,选择刚创建的用户每日留存统计SQL数据集,并按下图所示将各字段拖入“数据列/维度或指标”空白框中。
3)分析结果
在11月25日至30日之间首日登录的用户,在12月2日之前每日的留存率在50%-80%之间浮动;而在12月2日至3日不同批次的用户留存率均有大幅提升(超过90%),可能是由于平台或店铺推出了促销活动,或者每日打卡积分活动等提升了用户活跃度与留存率。
3.用户复购分析
1)数据预处理
① 在DataEase中新建SQL数据集,查询用户的购买次数;
# 查询用户的购买次数
SELECT user_id,COUNT(user_id) AS 购买次数
FROM userbehavior
WHERE behavior_type='buy'
GROUP BY user_id
ORDER BY 购买次数 DESC;
② 选择“字段管理”→“新建计算字段”,对购买频次做数据映射;
■ 字段名称:用户分层
■ 字段表达式,具体如下图所示:
CASE WHEN [购买次数] >=1 AND [购买次数] <= 4 THEN '1-4'
WHEN [购买次数] >=5 AND [购买次数] <= 9 THEN '5-9'
WHEN [购买次数] >=10 AND [购买次数] <= 14 THEN '10-14'
WHEN [购买次数] >=15 AND [购买次数] <= 19 THEN '15-19'
WHEN [购买次数] >=20 AND [购买次数] <= 24 THEN '20-24'
WHEN [购买次数] >=25 AND [购买次数] <= 29 THEN '25-29'
ELSE '>30'
END
2)视图设计
在仪表板中新建“基础柱状图”视图,选择刚创建的用户购买次数数据集。如下图所示,在“仪表板制作”页面右侧的编辑栏中将对应的字段拖入空白框并做修改。
① 将新建的“用户分层”字段拖入“类别轴/维度”空白框中;
② 将“购买次数”字段拖入“值轴/指标”空白框中,选择汇总方式为“求和”;
③ 将“记录数”字段拖入“值轴/指标”空白框中,选择汇总方式为“计数”,并将显示名修改为“购买人数”。
3)分析结果
有超过66%的用户发生过复购行为,但多数用户复购次数不超过5次,商家在提升用户复购意愿方面仍有进步空间。
4.用户转化分析
1)视图设计
新建“漏斗图”视图,选择userbehavior数据集。如下图所示,将对应字段拖入到“仪表板制作”页面右侧编辑栏的空白框中。
① 将“behavior_type”字段拖入“漏斗分层/维度”空白框中,并将显示名修改为“行为类型”;
② 将“user_id”字段拖入“漏斗层宽/指标”中,选择汇总方式为“计数”,并将显示名修改为“用户数”。
2)分析结果
从漏斗图中可知,从“点击”到“收藏”的路径中用户流失较多,而“添加购物车”到“购买”的路径中用户流失极少。
随着“社交电商”、“直播电商”等一次次的电商转型升级,电商平台不仅为企业提供了全新的商业模式,也为消费者带来了更为便捷和多样化的购物体验。然而,随着电商市场竞争的日益激烈,“如何更好地进行用户运营,满足用户需求,提升用户忠诚度”,就成为了电商企业亟需解决的关键问题之一。
数据分析与数据可视化作为强有力的工具,为电商企业开展用户运营提供了深入洞察消费者行为、趋势和偏好的途径。通过DataEase开源数据可视化分析工具进行仪表板制作与展示,电商企业可以对用户数据进行更为全面的分析,并且更准确地了解用户的购物习惯、兴趣爱好,甚至是情感态度。这些数据及其可视化视图不仅有助于企业优化产品和服务,更为重要的是,可以帮助电商企业制定精准的用户运营策略,从而更好地吸引、留存和发展用户群体。