基于mysql的淘宝用户、商品、平台价值分析

文章目录

一、项目背景和需求
- 1.项目背景及分析目的
二、数据集摸底并找出问题
- 2.1数据来源
- 2.2数据理解
- 2.3分析思路梳理
- - 2.3.1 分析流程
  - 2.3.2使用人货场拆解方式建立指标体系
  - 2.3.3 确认问题
三、数据清洗
- 3.1 导入数据
- 3.2 选择子集
- 3.2 列名重命名
- 3.3 查找重复值并删除
- 3.4 处理错误值-以类别字段为主-‘行为类型’
- 3.5 查找缺失值
- 3.6 处理与时间相关的问题（一致化处理）
- 3.7 异常值处理（超出目标分析范围的数据）
- 3.8 最终数据范围（维度和数量）
四、指标体系建设及分析问题
- 4.1 用户指标体系
- - 4.1.1 基础指标
  - - 4.1.1.1 UV、PV、浏览深度（PV/UV）的每日变化趋势
    - 4.1.1.2 PV、UV每时变化趋势
    - 4.1.1.3 复购率和跳失率
    - 4.1.1.4用户留存率（按日）统计：
  - 4.1.2 RFM模型分析
  - - 4.1.2.1 R维度分析
    - 4.1.2.2 F维度分析（一定时间内的消费频率）
    - 4.1.2.3整合结果：
    - 4.1.3.4RFM模型整体分析结论：
- 4.2 商品相关指标分析
- - 4.2.1 商品销售情况
  - 4.2.2 商品销量与点击量、收藏量、加购量间的相关性分析
  - 4.2.3 商品四象限划分图
  - 4.2.4 “长尾效应”分析
五、平台指标体系
- 5.1 建立用户各行为转化漏斗模型
- 5.3 建立独立访客漏斗模型
六结论
- 6.1 用户分析
- 6.2 用户精细化运营
- 6.3 商品分析
- 6.4 平台指标分析

一、项目背景和需求

1.项目背景及分析目的

随着互联网和大数据的发展，电商的数量已经呈现井喷式增长，到了一定的瓶颈期，那么通过数据分析挖掘消费者潜在需求、消费偏好成为平台运营过程中的重要环节。
所以本项目基于淘宝平台用户行为数据，在mysql关系型数据库，探索如何对用户行为规律，挖掘隐式反馈信息，寻找高价值用户、高贡献商品，并分析产品功能，优化产品路径。

关于隐式反馈：
推荐系统中用户对物品的反馈分为显式和隐式反馈。
显式反馈（如评分、评级) 用户明确表示对物品喜好的行为。
隐式反馈 (如浏览、点击、加入购物车）不能明确反映用户喜好的行为。
显性反馈数值代表偏好程度，隐性反馈数值代表置信度。

二、数据集摸底并找出问题

2.1数据来源

阿里云天池
[https://tianchi.aliyun.com/dataset/dataDetail?dataId=649&userId=1]

2.2数据理解

User Behavior 是来自淘宝的用户行为数据集，用于隐式反馈的推荐问题。数据集由阿里巴巴提供。随机选取了大约 200 万用户在 2017 年 11 月 25 日至 12 月 3 日期间具有点击、购买、添加商品到购物车和商品偏好等行为。
数据集包含了2017年11月25日至2017年12月3日之间，有行为的约两百万随机用户的所有行为，包括点击、购买、加购、喜欢。

文件名称	说明	包含特征
UserBehavior.csv	包含所有的用户行为数据	用户ID，商品ID，商品类目ID,行为类型，时间戳

数据集的每一行表示一条用户行为，由用户ID、商品ID、商品类目ID、行为类型和时间戳组成，并以逗号分隔。关于数据集中每一列的详细描述如下：

列名称	说明
用户ID	整数类型，序列化后的用户ID
商品ID	整数类型，序列化后的商品ID
商品类目ID	整数类型，序列化后的商品所属类目ID
行为类型	字符串，枚举类型，包括(‘pv’, ‘buy’, ‘cart’, ‘fav’)
时间戳	行为发生的时间戳

用户行为类型共有四种，它们分别是:

行为类型	说明
pv	商品详情页pv，等价于点击
buy	商品购买
cart	商品加入购物车
fav	商品进行收藏

2.3分析思路梳理

2.3.1 分析流程

指标体系的构建设计应该提前设计，本案例指标体系的构建基于“人货场”理论

关于“人货场”三要素：
人货场，是指影响销售的三个重要因素（不是三个指标）
1.人：来自销售人员、顾客的因素
销售人员：人员是否足够，素质是否满意，执行是否到位？
顾客：是否有足够客户到来，是否有成交，成交消费力如何？
2.货：商品因素
商品质量：种类是否丰富、款式是否能够吸引、有没有爆款
商品数量：商品备货是否充足，畅销品是否短缺，滞销品有多少
3.场：卖场/门店/销售渠道因素
卖场数量：线下门店数量/位置，线上引流渠道数量/类型
卖场质量：线下门店装修、面积、陈列，线上引流渠道的转化路径，页面设计

2.3.2使用人货场拆解方式建立指标体系

最终结果：评价“用户、商品、平台”三者质量
人：（用户）是整个运营的核心，所有的举动都围绕着如何让更多的人有购买行为，让他们买的更多、买的更贵，所以对人的洞察是一切行为的基础。目前平台上的主力消费人群有哪些特征，他们对货物有哪些需求，他们活跃在哪一些平台，还有哪些消费力的人目前不在平台上，对这些问题的回答指向了接下来的行动。

指标	细化指标	说明
浏览	PV	(pageview)是页面浏览量
	UV	(Unique Visitor)是一定时间内访问网页的人数，正式名称独立访客数（一个网站或者一个页面），也可以说是终端数
流量质量	PV/UV	浏览深度
	ROI	投资回报率（ROI）=年利润或年均利润/投资总额 *100%
成交用户	新客数	（一般当天的算新用户，当日激活或者新增）
	老客数
	客单价	当日消费总价/顾客数（新+老），客单价应该是稳的，突然多/少，购买力特别强的，疫情影响客单价下降
	DAU	日活跃用户
	MAU	月活跃用户

货：对应供给，涉及到了货品分层，哪一些是红海（指的销量高、利润少、竞争多的商品，属于常规商品），哪一些是蓝海（销量少、利润高、竞争少的商品），如何进行动态调整，是要做自营还是平台，以满足消费者的需求

场：就是消费者在什么场景下，以什么样的方式接触了这个商品。早期导购比较简单，目前场就比较丰富，但也暴露了一些电商平台（eg：淘宝or京东）在导购方面的一些问题，比如内容营销，目前最好的可能是微博KOL生态和小红书，甚至微信，而不在电商自己的场。如何做一个全域的打通，和消费者进行多触点的接触，比如社交和电商的联动，来完成销售转化，这也就是所谓的「全域营销」
平台可以理解为电商网站，但是现在这个场的概念已经前后有所延伸说，往前延伸指的是引流，往后延伸指的是后期的售后、物流等。

2.3.3 确认问题

本次分析的目的是想对用户行为数据分析，为以下问题提供解释和改进建议：

从场的角度：基于漏斗模型的用户购买流程各环节分析指标，确定各个环节的转换率，便于找到需要改进的环节；
从商品角度：商品分析：找出热销商品，研究热销商品特点；
从用户的角度：基于RFM模型找出核心付费用户群，对这部分用户进行精准营销

三、数据清洗

3.1 导入数据

点开Mysql workbench
①新建一个库

DROP DATABASE IF EXISTS `用户行为分析`;
CREATE DATABASE `用户行为分析`;
USE `用户行为分析`;

②导入外部数据，使用Navicat连接Mysql，选择导入200万行数据。
ps:在开始分析一份数据的时候，第一时间先进行备份。（因为吃过一次数据不小心被删的亏，所以养成了拿到一份数据先备份）：

CREATE TABLE USERBEHAVIOR_BACKUPS AS
SELECT *
FROM UserBehavior

③查看数据，对应2.2数据理解，第一列为用户ID，第二列为商品ID，第三列为商品类目ID，第四列为行为类型，第五列为时间戳，从数据面板发现列名和一些字段的数据类型需要修改。

3.2 选择子集

因为导入原始数据共有一亿多条，这里导入了200w条数据，为了查看数据是否已成功导入，查看表结构是否正确：

#查看数据是否为200w条
SELECT COUNT(*) FROM userbehavior;
#查看表结构，只看前20行即可
SELECT * FROM userbehavior  LIMIT 20;

结果：
这里多出60w的数据，所以对200w以后的数据进行删除
但是发现导入的数据中第一个字段有重复值，所以增加一个ID标识列并设置为主键，便于删除：

ALTER TABLE userbehavior ADD COLUMN 
id INT(8) PRIMARY KEY AUTO_INCREMENT;

处理后的表格如下：
可以进行对200w以后的数据进行删除：

DELETE FROM userbehavior WHERE id > 2000000;

3.2 列名重命名

可以直接在类型面板上双击Column直接进行更改字段名

3.3 查找重复值并删除

①检查是否存在重复值

SELECT * FROM userbehavior 
GROUP BY User_ID, Item_ID, Category_ID, Behavior_type, Time_date, id
HAVING COUNT(*)>1;

结果如下：

以上步骤完成后可以将表示id列删掉:

alter table userbehavior drop column id;

②修改数据类型：行为分析原来为枚举值，由于不再进行数据增加，因此设为VARCHAR。

3.4 处理错误值-以类别字段为主-‘行为类型’

select behavior_type, count(behavior_type)
from userbehavior
group by behavior_type with rollup

结果：行为数据和枚举出的四个类型保持一致，该列没有问题

3.5 查找缺失值

SELECT 
COUNT(User_ID),
COUNT(Item_ID),
COUNT(Category_ID),
COUNT(Behavior_type),
COUNT(Time_date)
FROM userbehavior;

结果各字段的数量相等，所以不存在缺失值：

3.6 处理与时间相关的问题（一致化处理）

目前时间列可读性较差，不利于我们要做的时间分析，所以需要进行转化，变成我们常见常用的时间格式。

专门处理时间戳的函数：From_unixtime；
作用：将MYSQL中以INT存储的时间以"YYYY-MM-DD"格式来显示。
语法：FROM_UNIXTIME(时间戳，时间格式)

常见的时间格式：
%Y年，%m月，%d日，eg：2022-01-01
%H时，%I分，%s秒，eg：11:59:30

因此需要将现有的时间列分为日期时间、日期、小时三列

①添加新列Date_time，根据Time_date返回日期时间（%Y年，%m月，%d日 %H时，%I分，%s秒）:

ALTER TABLE userbehavior
add Date_time VARCHAR(255);
UPDATE userbehavior
set Date_time = from_unixtime(Time_date, '%Y-%m-%d %H:%i:%s')

②添加新列Date，根据Time_date返回日期

ALTER TABLE userbehavior
add Date VARCHAR(255);
UPDATE userbehavior
set Date = from_unixtime(Time_date, '%Y-%m-%d')

③添加新列Time，根据Time_date列返回时间

ALTER TABLE userbehavior
add Time VARCHAR(255);
UPDATE userbehavior
set Time = from_unixtime(Time_date, '%H:%i:%s')

根据以上得出的结果如下：

3.7 异常值处理（超出目标分析范围的数据）

需要检查日期是否都在需要分析的时间范围内，即2017年11月25日至2017年12月3日之间

select max(Date), min(Date)
from userbehavior

结果：

最大值日期超过2017-12-3，最小日期超过2017-11-25，因此需要删除2017年11月25日至2017年12月3日之外的数据

DELETE FROM USERBEHAVIOR
WHERE DATE < '2017-11-25' OR DATE > '2017-12-03';

共删除了991条时间异常数据

3.8 最终数据范围（维度和数量）

维度	数量
用户数量	19544
商品数量	628886
商品类目数量	6492
PV	1790224
Buy	40243
Cart	111015
Fav	57526
所有行为数量	1999008

四、指标体系建设及分析问题

基于人-货-场指标体系
使用MySQL进行分析，Excel进行可视化展示

4.1 用户指标体系

基础指标体系（UV/PV/留存率）+RFM模型分析

4.1.1 基础指标

4.1.1.1 UV、PV、浏览深度（PV/UV）的每日变化趋势

UV:独立访客数,统计distinct user_id的数量，需要按日统计（分组）；
PV：页面流量次数,统计behavior_type = 1的记录数，需要按日统计（分组）；
PV/UV：平均一个独立访问者所浏览的页面访问量

代码如下：

select date, count(distinct user_id) 'uv', 
             count(if(behavior_type = 'pv', 1, null)) 'pv'，
             count(if(behavior_type = 'pv', 1, null))/count(distinct user_id) 'pv/uv'
             from userbehavior
             group by date

结果如下：

将以上数据导入excel中，绘制PV、UV每日变化趋势图。

发现在2017年11月25日-2017年12月3日期间，PV与UV随日期的变化趋势相似，11月25日-12月1日较平稳，12月2日开始有明显增长，增长率约为28%，查询日历可以发现这两天为周末，但11.25 ~26同为周末，所以第二个周末的增幅与周末的相关度较小，与淘宝的双十二预热有关，全平台的预热会使的打开淘宝与访客数出现增长。

4.1.1.2 PV、UV每时变化趋势

select substring_index(Time,':', 1) '小时', 
count(distinct user_id) '每时的用户数', 
count(if(behavior_type = 'pv', 1, null)) '点击',
count(if(behavior_type = 'cart', 1, null)) '加购',
count(if(behavior_type = 'fav', 1, null)) '收藏',
count(if(behavior_type = 'buy', 1, null)) '购买'
             from userbehavior
             group by substring_index(Time,':', 1)

结果如下：

将计算出的数据导入Excel中进行可视化分析：

从上图可以看出：
（1）四种行为的分布趋势基本一致。
（2）每天的0点到3点，各项指标都会快速降低，在4点左右降到一天内的最低值，从5点开始用户活跃度快速上升，从10点至18点用户活跃度平稳但是在12点和17点有小幅度下降（符合上班、上学人群作息规律），用户在晚上18点到23点会频繁点击浏览网页，收藏与加入购物车数量也随之增加。
（3）其中购买曲线与收藏曲线趋势更为接近，在一定程度上说明客户对于收藏商品更为偏爱，然而在购物环节中收藏和加入购物车都是确定购物意向的行为，没有先后之分，所以将这两个环节合并为购物环节中的一步，可以关注客户购物车和收藏的商品进行精准推送。

4.1.1.3 复购率和跳失率

复购率 = 购买次数两次及其以上的人数/有购买行为的用户总数
跳失率 = 只有浏览行为的用户数/总用户数

因为后面计算跳失率还会用到以user_id分组的用户行为数据，所以在这里先创建一个视图方便后续查询

CREATE VIEW 用户行为数据汇总 AS
SELECT user_id,
	COUNT(Behavior_type) AS 用户行为总数,
	SUM(CASE WHEN `Behavior_type` = 'pv' THEN 1 ELSE 0 END) AS '点击',
	SUM(CASE WHEN `Behavior_type` = 'buy' THEN 1 ELSE 0 END) AS '购买',
	SUM(CASE WHEN `Behavior_type` = 'cart' THEN 1 ELSE 0 END) AS '加购',
	SUM(CASE WHEN `Behavior_type` = 'fav' THEN 1 ELSE 0 END) AS '收藏'
FROM USERBEHAVIOR_BACKUPsecond
GROUP BY User_ID
ORDER BY COUNT(Behavior_type) DESC;

结果如下：

①复购率计算

在某时间窗口内重复消费用户（消费两次及以上的用户）在总消费用户中占比

select count(if (购买 > 1, 1, null)) as '复购',
       count(if (购买 > 0, 1, null)) as '总消费', 
       concat(round(count(if(购买 > 1, 1, null)) * 100/count(if(购买 > 0, 1, null)),2),'%') as '复购率'
       from 用户行为数据汇总

可看到复购率高达65.98%，得出结论：淘宝用户忠诚度较高

②跳失率计算

简单地说，就是访客只访问一个页面就离开了。一个较高的跳失率是不利于店铺转化率提升以及店铺的发展的，在这里若是‘用户行为总数’的数据是1说明用户只有一个行为，也可以说用户只点击了一个页面就离开了。

select sum(case when 用户行为总数 = 1 then 1 else 0 end) '一个行为',
       sum(case when 用户行为总数 > 0 then 1 else 0 end) '总行为人数',
       concat
       (round(sum(case when 用户行为总数 = 1 then 1 else 0 end)*100/ sum(case when 用户行为总数 > 0 then 1 else 0 end),2),'%') '跳失率'
from 用户行为数据汇总

查询可得在统计区间内（9天）仅访问APP一次的用户数量为1，跳失率为0.01%，说明商品内容、推荐机制等对用户有比较强的吸引力

综合复购率和跳失率来看，淘宝APP的用户忠诚度较高，且内容质量高，可以吸引用户持续使用APP，可以重视用户关系，进一步培养用户忠诚度。
p.s：根据《精益数据分析》中对电子商务模式的总结，用户复购率以90天为统计区间的可靠性更高，当然这次分析根据淘宝APP的用户复购率可以得出淘宝APP目前处于“忠诚度模式”中，所以不要将精力放在获取如何获取更多新用户上，要维护老用户的忠诚度，如提高客服素质，尽可能简化购买流程，鼓励用户使用收藏、撰写评论等。

4.1.1.4用户留存率（按日）统计：

用户留存率即为活跃用户留存率（eg：某天100个用户活跃，过了3天剩下50个，即活跃留存率为50%）

首先先建立一个新表用来计算留存率，并得出以2017-11-25作为第一天的用户总数

--第一天用户数
create table retention_rate 
as select count(distinct user_id) as 第一天新用户数 
from userbehavior
where dates = '2017-11-25';

n日后留存率=(注册后的n日后还登录的用户数)/第一天新增总用户数
这里以2017-11-25作为第一天，计算次日、3日、5日、7日留存率。
先计算第二天留存用户数：

-- 第二天留存用户数
alter table retention_rate add column 第二天留存用户 INT;
update retention_rate set 第二天留存用户=
(select count(distinct user_id) from userbehavior
where date = '2017-11-26' 
and user_id in (SELECT user_id FROM userbehavior WHERE date = '2017-11-25'));

--- 第三天留存用户数
alter table retention_rate add column 第三天留存用户 int;

update retention_rate set 第三天留存用户=
(select count(distinct user_id) from userbehavior
where date = '2017-11-27' 
and user_id in (SELECT user_id FROM userbehavior WHERE date = '2017-11-25'));

--- 第五天留存用户数
alter table retention_rate add column 第五天留存用户 int;

update retention_rate set 第五天留存用户=
(select count(distinct user_id) from userbehavior
where date = '2017-11-29' 
and user_id in (SELECT user_id FROM userbehavior WHERE date = '2017-11-25'));

--- 第七天留存用户数
alter table retention_rate add column 第七天留存用户 int;

update retention_rate set 第七天留存用户=
(select count(distinct user_id) from userbehavior
where date = '2017-12-01' 
and user_id in (SELECT user_id FROM userbehavior WHERE date = '2017-11-25'));

结果如下：

转换成留存率：

SELECT CONCAT(ROUND(第二天留存用户/第一天新用户数*100,2),'%')AS 次日留存率,
CONCAT(ROUND(第三天留存用户/第一天新用户数*100,2),'%')AS 三日留存率,
CONCAT(ROUND(第五天留存用户/第一天新用户数*100,2),'%')AS 五日留存率,
CONCAT(ROUND(第七天留存用户/第一天新用户数*100,2),'%')AS 七日留存率
from retention_rate;

结果如下：

由上表数据，次日、3日、5日、7日留存率均维持在76%左右，数据作为周留存率来看，表现还是非常优秀的，但作为次日留存来看，就不是很理想了，可以结合产品设计和新用户转化路径来分析用户的流失原因，通过不断的修改和调整来降低用户流失，提升次日留存率；另外，12月1日的留存率相较之前有1%-2%的上涨，可能是因为当天12月1日是星期五，正好是客户活跃度上升的一个转折点，也可能是有购物优惠活动，可以考虑促销活动能为提升留存带来一定正向的影响。

4.1.2 RFM模型分析

RFM模型是衡量客户价值和客户创利能力的重要工具和手段，其中由3个要素构成了数据分析最好的指标，分别是：

R-Recency（最近一次购买时间）
F-Frequency（消费频率）
M-Money（消费金额）

由于原数据源没有相关的金额数据，暂且通过 R 和 F 的数据对客户价值进行打分，最终按照综合分数对用户分层。

4.1.2.1 R维度分析

由于数据集包含的时间是2017年11月25日至2017年12月3日之间，这里选取2017年12月4日作为计算日期，统计客户最近发生购买行为的日期距离2017年12月4日间隔几天，由于整个数据集区间为9天，每2天为一个区间:
0~2天设置为3
3~5天设置为2
6~8天设置为1

-- r指标分析：建立r视图，将用户最近一次购买时间，给出相应分数
-- 获取每个用户最近购买时间(创建试图方便后续查询)
drop view if exists user_recency;
create view user_recency as
select user_id, max(date) 'recent_buy_time'
from userbehavior
where behavior_type = 'buy'
group by user_id;
-- 计算每个用户最近购买时间的距离，根据相差的天数给予一定的分数,创建试图，后续会用到 r_value。
drop view if exists r_level;
create view r_level as
select user_id, recent_buy_time, datediff('2017-12-04', recent_buy_time) '间隔',
(case when datediff('2017-12-04', recent_buy_time) <=2 then 3
      when datediff('2017-12-04', recent_buy_time) between 3 and 5 then 2
else 1 end) 'r_value'
from user_recency;

--计算分值分布情况
select a.r_value,COUNT(.r_value)
from (select user_id, recent_buy_time, datediff('2017-12-04', recent_buy_time) '间隔',
(case when datediff('2017-12-04', recent_buy_time) <=2 then 3
      when datediff('2017-12-04', recent_buy_time) between 3 and 5 then 2
else 1 end) 'r_value'
from user_recency) a
group by a.r_value

结果如下：

使用Excel进行可视化以后如图所示：

r_value = 3 表示有超过半数的客户会在购买第二天后就再进行购买，说明淘宝APP现在已经有比较好的用户粘性。

4.1.2.2 F维度分析（一定时间内的消费频率）

F指标计算就是求出每个用户消费次数，拿到具体消费次数以后对消费情况进行评分

-- f指标分析：建立f视图
drop view if exists user_buy_fre;
create view user_buy_fre as
select user_id, count(behavior_type) 'buy_frequency'
from userbehavior
where behavior_type = 'buy'
group by user_id
order by buy_frequency desc;

可以看到最大值为72，将其分为6个区间
1 ~ 9：1分 10 ~ 19：2分 20 ~ 29：3分
30 ~ 39：4分 40 ~ 49：5分 50分以上：6分

-- 进行区间划分,建立视图，后续整合需要用到
drop view if exists f_level;
create view f_level as
select user_id, buy_frequency, (
        case when buy_frequency between 1 and 9 then 1
             when buy_frequency between 10 and 19 then 2
             when buy_frequency between 20 and 29 then 3
             when buy_frequency between 30 and 39 then 4
             when buy_frequency between 40 and 49 then 5
             else 6 end) 'f_value'
    from user_buy_fre;
-- 进行计算分值分布情况
select b.f_value, count(b.f_value)
from (select user_id, buy_frequency, (
        case when buy_frequency between 1 and 9 then 1
             when buy_frequency between 10 and 19 then 2
             when buy_frequency between 20 and 29 then 3
             when buy_frequency between 30 and 39 then 4
             when buy_frequency between 40 and 49 then 5
             else 6 end) 'f_value'
    from user_buy_fre) b
    group by b.f_value

结果如下：
将数据导入Excel中进行可视化:

由此可见，消费1-9次的人占97%

4.1.2.3整合结果：

根据r、f的均值对用户进行分层：
求出R维度的均值（前面已经建立好了视图‘r_level’，在这里可以直接使用）：

select avg(r_value) as 'r_avg' from r_level

求出F维度的均值：

select avg(f_value) from f_levle

结果如下：

本数据通过最近消费（R）和消费频率（F）建立RFM模型，根据用户八大类等级划分，由于数据没有M值，故只建立四个等级，并且按照最近一次消费的均值和消费频率的均值定高低界限：

重要高价值客户：指最近一次消费较近且消费频率较高的客户
重要唤回客户：指最近一次消费较远且消费频率较高的客户
重要深耕客户：指最近一次消费较近且消费频率较低的客户
重要挽留客户：指最近一次消费较远且消费频率较低的客户

代码如下：

--- 拿到每个人的r值和f值（两表关联r_level,f_level），与均值对比
select r.user_id, r.r_value, f.f_value,
     (case when r.r_value > 2.2265 and f.f_value > 1.0383 then '重要高价值用户'
           when r.r_value < 2.2265 and f.f_value > 1.0383 then '重要唤回用户'
           when r.r_value > 2.2265 and f.f_value < 1.0383 then '重要深耕客户'
           when r.r_value < 2.2265 and f.f_value < 1.0383 then '重要挽留客户'
           end
     ) as 用户分层
     
from r_level r join f_level f on r.user_id = f.user_id

结果如下：

对用户分层进行统计结果如下：

4.1.3.4RFM模型整体分析结论：

通过用户分层可以了解每位顾客的特性，从而实现差异化营销。比如对于 user_id = 107932 的用户，为重点用户需要关注；对于重要深耕客户这类忠诚度高而购买能力不足的，可以适当给点折扣或捆绑销售来增加用户的购买频率。对于 user_value = 1008380 这类忠诚度不高而购买能力强的，需要关注他们的购物习性做精准化营销，制定专属的运营策略来进行维护，如专属优惠、专属客服等，保证其较高的用户粘性；而对于重要挽留客户这类忠诚度不高且购买能力不足的，可能是找到了同类的竞品APP或是产品体验不佳，可以对该部分用户进行调研找到其流失原因，及时进行新活动心有会推送，对用户进行召回。

4.2 商品相关指标分析

可以从点击量、收藏量、加购量、浏览量等四个指标来对商品受欢迎程度进行分析。

4.2.1 商品销售情况

统计所有商品的点击量、收藏量、加购量、购买次数以及购买转化(已购买用户占所有用户的比值)，同时找到购买次数、浏览次数、收藏次数和加入购物车次数最多的商品

SELECT COUNT(DISTINCT item_id) FROM userbehavior;
SELECT COUNT(DISTINCT item_id) FROM userbehavior
WHERE behavior_type = 'buy';
select item_id, 
sum(case when behavior_type = 'pv' then 1 else 0 end) as '点击',
sum(case when behavior_type = 'fav' then 1 else 0 end) as '收藏',
sum(case when behavior_type = 'cart' then 1 else 0 end) as '加购',
sum(case when behavior_type = 'buy' then 1 else 0 end) as '购买',
round(count(distinct case when behavior_type = 'buy' then user_id else null end)/count(distinct user_id)*100,2) as '购买转化率' --null值不计入count计算
from userbehavior
group by item_id
order by sum(case when behavior_type = 'buy' then 1 else 0 end) desc

1⃣️ 以购买量排序，得到排名前十的商品编号及其销量：

2⃣️ 以点击量排序，得到排名前十的商品编号及其销量：

3⃣️ 以收藏率排序，得到排名前十的商品编号及其销量：

4⃣️ 以加购量排序，得到排名前十的商品编号及其销量：

4.2.2 商品销量与点击量、收藏量、加购量间的相关性分析

用户从浏览->加购/收藏->购买，在购物环节中收藏和加入购物车都是确定购物意向的行为，没有先后之分，所以将这两个环节合并为购物环节中的一步，是否浏览量影响着加购/收藏呢？所以对加购量和浏览量两个表进行连接查看相关性。

1⃣️ 加购量与浏览量间的相关性分析

select a.item_id,a.浏览量, b.加购量
from
(SELECT item_id,COUNT(behavior_type) AS 浏览量
FROM userbehavior
WHERE behavior_type = 'pv'
GROUP BY item_id
ORDER BY COUNT(behavior_type) DESC
LIMIT 10) a
left join 
(SELECT item_id,COUNT(behavior_type) AS 加购量
FROM userbehavior
WHERE behavior_type = 'cart'
GROUP BY item_id
ORDER BY COUNT(behavior_type) DESC
LIMIT 10) b on a.item_id = b.item_id

结果：
可以看到在加入浏览量次数最多的前10个商品中，有4个加入了购物车， 说明浏览量与加购量的关系更为直接。

2⃣️ 加购量与销售量间的相关性分析

从收藏/加购再到购买，是否可以认为销量与加购有关呢？


select a.item_id,a.购买量,b.浏览量, c.加购量, d.收藏量
from (SELECT item_id,COUNT(behavior_type) AS 购买量
FROM userbehavior
WHERE behavior_type = 'buy'
GROUP BY item_id
ORDER BY COUNT(behavior_type) DESC
LIMIT 10) a left join 
(SELECT item_id,COUNT(behavior_type) AS 浏览量
FROM userbehavior
WHERE behavior_type = 'pv'
GROUP BY item_id
ORDER BY COUNT(behavior_type) DESC
LIMIT 10) b
on a.item_id = b.item_id
left join 
(SELECT item_id,COUNT(behavior_type) AS 加购量
FROM userbehavior
WHERE behavior_type = 'cart'
GROUP BY item_id
ORDER BY COUNT(behavior_type) DESC
LIMIT 10) c on a.item_id = c.item_id
left join (SELECT item_id,COUNT(behavior_type) AS 收藏量
FROM userbehavior
WHERE behavior_type = 'fav'
GROUP BY item_id
ORDER BY COUNT(behavior_type) DESC
LIMIT 10) d on a.item_id = d.item_id

结果如下：

四个表连接可以更直观看到在加入购物车次数最多的前10个商品中，第1、3、7位的商品在销量中排第6、3、9， 说明购买量与加购的关系更为直接。

4.2.3 商品四象限划分图

销量与加购关系更直接，加购与浏览量关系更直接，那么基于浏览量->加购/收藏->销量，可以说明浏览量间接影响购买量，对此以浏览量和销量作为分析维度来对商品进行四象限划分，从而得出更具体的优化方案。因为原始数据有200w，因此各取500行
根据浏览量新建一个浏览量前500的表，代码如下

CREATE TABLE 浏览量表 as
SELECT item_id, COUNT(behavior_type) AS 浏览量
FROM userbehavior
WHERE behavior_type = 'pv'
GROUP BY item_id
ORDER BY COUNT(behavior_type) DESC
LIMIT 500;

然后使用子查询对购买量表进行连接，查询浏览量排行榜前500的商品的销量

SELECT a.item_id, a.浏览量, b.购买量
FROM 浏览量表 a left join (select item_id, COUNT(behavior_type) AS 购买量
FROM usebehavior
WHERE behavior_type = 'buy'
group by item_id) b
on a.item_id = b.item_id
ORDER BY b.购买量 DESC
;

将上述数据导入Excel后，有些商品的购买量为NULL，利用查找替换，将Excel中的null值替换成0，X轴是浏览量，Y轴是购买量，使用Excel散点图可视化后如图：

①处于第Ⅰ象限的商品：此类商品的浏览量与销量都处于较高的水平，属于比较受用户欢迎的商品，可能会成为热销产品。
②处于第Ⅱ象限的商品：此类商品的销量高，但是浏览量低，说明该类商品
③处于第Ⅲ象限的商品：浏览量和销量都比较低，说明用户对商品不感兴趣。
④处于第Ⅳ象限的商品：商品浏览量高，但是销量低，说明商品整体的转化率很低。

4.2.4 “长尾效应”分析

互联网的长尾效应：不在传统需求曲线的头部，而在于需求曲线中那条无穷长的尾巴。

按照商品销量对商品进行分类统计:

#查询商品件数及购买次数
SELECT a.购买次数,COUNT(item_id) AS 商品量
FROM (
	SELECT item_id,COUNT(behavior_type) AS 购买次数
	FROM `userbehavior`
	WHERE behavior_type = 'buy'
	GROUP BY item_id
	ORDER BY COUNT(behavior_type) DESC) a
GROUP BY a.购买次数
ORDER BY a.购买次数;

结果如下：

使用Excel的转化图表可视化如下图（X轴为购买次数, Y轴为商品量）：

发现购买一件商品的比例占用户购买商品数的85%，说明商品售卖主要依靠长尾商品的累积效应，而非爆款商品的带动。

五、平台指标体系

5.1 建立用户各行为转化漏斗模型

行为指标：点击次数、收藏次数、加购次数、购买次数、购买转化率

电商行业常用漏斗模型：APP/网站首页 - 商品详情页 - 添加购物车 - 购物车结算 - 核对订单 - 提交订单 - 选择支付方式 - 支付
但是此次数据集只有商品详情页（pv）、加入购物车（cart）和支付（buy），在购物环节中收藏和加入购物车两个环节没有先后之分，所以将这两个环节可以放在一起作为购物环节的一步。最终得到用户购物行为各环节转化率，如下

# 首先创建用户行为视图,因为在4.1.1.3中已经建立了用户行为总数的视图，这里就不需要再重新建立，直接使用即可
SELECT * FROM 用户行为数据汇总;
# 再计算转化率
SELECT CONCAT(ROUND(SUM(点击)/SUM(点击)*100,2),'%') AS 'pv',
CONCAT(ROUND((SUM(加购)+SUM(收藏))/SUM(点击)*100,2),'%') AS 'pv_to_favcart',
CONCAT(ROUND(SUM(购买)/SUM(点击)*100,2),'%') AS 'pv_to_buy'
FROM 用户行为数据汇总;

结果如下：

将数据导入Excel中形成可视化：

由下图可以看到，点击加购或者收藏的百分比在9.4%左右，最后支付的百分比为2.25%左右，第二步到第三部剩余四分之一左右，但第一步到第二步仅剩9.4%，从浏览到确定购买意向只有9.4%左右的转化率，夹点出现在点击-收藏或加购这一过程中，可能原因是用户花了大量时间寻找合适的产品，可以针对性的优化平台的筛选功能，让用户能够更容易的找到合适产品，并将流程指标再细化后进行分析，找出影响用户流失的关键问题点。

5.3 建立独立访客漏斗模型

-- 用户行为数据汇总是之前创建的以user_id分组的行为数据视图
SELECT * FROM 用户行为数据汇总;
SELECT SUM(CASE WHEN 点击 > 0 THEN 1 ELSE 0 END)AS 点击用户数,
	SUM(CASE WHEN 收藏 > 0 THEN 1 ELSE 0 END)AS 收藏用户数,
	SUM(CASE WHEN 加购 > 0 THEN 1 ELSE 0 END)AS 加购用户数,
	SUM(CASE WHEN 购买 > 0 THEN 1 ELSE 0 END)AS 购买用户数
from 用户行为数据汇总

结果如下

使用Excel进行可视化以后的图表如下：

可以看出以独立用户为分析维度，用户并没有在点击以后大量流失，有75%的用户选择了加购，40%的用户选择了收藏，且到最后有68.5%的用户最后选择了支付，整体的购买转化率较高，说明APP整体生态健康，可以满足大多数用户的需求。

综合上面两个分析来看，造成总体从PV到有购买意向只有9.4%的原因是：用户在产生购买意向之前会对商品进行大量的比对，在进行比对后才会产生购买意向，最后进行购买。所以比对环节是提升重点，APP可以从推荐机制入手，以用户日常行为为依据，尽量精准推荐，并且需要匹配相关度更高的关键词，完善商品关键词设置制度和搜索算法，减少用户寻找商品的时间成本。

六结论

本文分析了淘宝APP用户行为数据共200万条，从三个不同角度提出业务问题，使用RFM模型和漏斗分析数据给出如下结论和建议。

6.1 用户分析

从日期维度来看，用户的各种行为数据在周末或者周中的差异不是很大，但是会收到购物节活动的影响，如第二个周欧模就双十二的影响导致用户点击和加购的行为数量明显增加，可以进一步扩大分析范畴，如以整年为单位进行环比分析，标注出各个比较大的购物节，重点关心购物节前后的用户行为数量变化，同时对每周末进行比较，分析购物节推广活动安排在周末/非周末对用户行为的影响；在一年中对各个月进行同比对比购买行为的趋势，找出整个月中是否有购买行为上升的规律（结合用户年龄数据进行分析，购买行为上升可能与发工资的时段也有关）
从时间维度上来看，用户的各种行为活跃高峰期都在晚间的21点左右，说明安排在这个时间段的活动对用户的触达率是最好的，可以考虑在这个时间做一些力度较大的优惠活动，也可以将转化行为的时间安排在这个时间段，如直播带货等来进行用户的活跃度提升及转化。并且发现用户在晚间的行为更偏向于浏览商品，白天10点左右购买行为的比率较高，可以根据这个特性在晚间对商品进行宣传，然后在白天进行转化。
根据跳失率和复购率来看，淘宝APP中的商品对用户具有足够的吸引力，可以得出淘宝APP目前处于“忠诚度模式”中，重点为维系老用户的忠诚度。**优化方法有：**①提高成交转化率，优化用户推荐系统，或者邀请明星做测评推广；②用户复购率为65.98%，说明这些用户对该平台较为满意，可以通过奖励积分或者优惠券等方式鼓励用户重复购买；③通过分析找出价值用户的购买偏好，产品和类目等，给价值用户制定个性化的产品推荐，从而提高用户体验，进而提高购买率。
在本项目中用户留存率相对稳定，七日留存率略有回升，可能是因为当天12月1日是星期五，正好是客户活跃度上升的一个转折点，可能是有购物优惠活动。为了提高留存，可以让用户养成习惯，在一定程度上增加用户对产品的依赖性。①每日给用户推送可能感兴趣的商品；②一些签到的小游戏或者签到领积分活动，增加用户登录的频率，进而增加用户浏览时长；③对于年购买量比较大的用户，为了增加这些用户的粘性，可以推出vip服务，让这些用户享受折扣和优惠券，进而提高高价值用户的留存率和对平台的忠诚度；④大力推广直播跟用户互动，计算亲密指数并进行排行，可以让用户与店主之间建立信任，进而增加客户的忠诚度。

6.2 用户精细化运营

通过RFM模型中的用户最近一次购买时间、用户消费频次分析，分拆得到以下重要用户。可以在后续精细化运营场景中直接使用细分用户，做差异化运营：

对高价值客户做VIP服务设计，增加用户粘性同时通过设计优惠券提升客户消费；
对深耕客户做广告推送，刺激用户提升消费频次；
对挽留客户做优惠券、签到送礼策略，增加挽留用户粘性；
对唤回客户做定向广告、短信召回策略，尝试召回用户。
对于重要价值用户，消费频率高且最近消费距离现在时间短，需要给其提供VIP服务；

对于占比较大的重要发展用户，其消费频率低，但最近消费距离现在时间较短，想办法提高其消费频率；

对于重要保持用户，最近消费距离现在时间较远，也就是R值低，但是消费频次高，这样的用户，是一段时间没来的忠实客户，可以采取邮件推送、APP推送提醒、促销活动时短信提醒等方式主动和他们保持联系，提高复购率；

对于占比较大的重要挽留用户，最近消费时间距离现在较远、消费频率低，这种用户有即将流失的危险，需要主动联系用户，调查清楚哪里出了问题，并想办法挽回

6.3 商品分析

商品的浏览量和销量的相关性不是很高，所以没有必要一味提高浏览量，销量并不会随之增加。根据四象限划分图的分析，应重点提升第二象限及第三象限的商品，针对第二象限的商品应提高其曝光率，找出它的用户画像，尽量做到精准推送或建立专属社群，提供用户交流平台，提升用户粘性及转化率；第三象限应尝试提升商品的流量，分析销量是否会随之提升。
通过分析发现，商品的销量主要靠的是“长尾效应”而非某款爆款商品，但是这是站在APP的角度来看，对于B端商家来说，也可以打造爆款商品来减少商品种类繁多的运营及库存成本。
针对销量排行榜前面的商品可以增加其曝光率推荐率，在用户搜索时进行优先展现。

6.4 平台指标分析

总体转化率只有 2.25%，用户点击后收藏和加购物车的转化率在 9.4% ，需要提高用户的购买意愿，要考虑为什么用户浏览了那么多商品却只有9.4%的用户加入购物或收藏，可能这中间用户花了太多的时间却没有挑选到满意的商品，那么有一些客户就流失掉了。**优化方法：**建议通过活动、优惠券、产品详情页的改进等提高转化；可以采取问卷调查的方式分析用户行为推送用户可能感兴趣的商品、优化购物界面使界面布局更加人性化等方式更好的满足用户需求，激活更多用户。

你可能感兴趣的:(Mysql,mysql,社交电子)

关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
mysql禁用远程登录 igotyback mysql
去mysql库中的user表里，将host都改成localhost之后刷新权限FLUSHPRIVILEGES;
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
从鸡肉高汤到记忆的魔法再到有效提示的艺术步子哥人工智能
还记得小时候那些天马行空的白日梦吗？也许只要按下键盘上的某个神奇组合，电脑就会发出滴滴的声响，一个隐藏的世界突然在你眼前展开，让你获得超凡的能力，摆脱平凡的生活。这听起来像是玩过太多电子游戏的幻想，但实际上，间隔重复系统给人的感觉惊人地相似。在最佳状态下，这些系统就像魔法一样神奇。本文将以一个看似平凡的鸡肉高汤食谱为例，深入浅出地探讨如何编写有效的间隔重复提示，让你像掌握烹饪技巧一样轻松地掌握记忆
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
福袋生活邀请码在哪里填写，福袋生活app邀请码使用教程小小编007
很多人下载福袋生活后，注册使用时需要填写邀请码。因为福袋生活是注册邀请制，所以首次使用填写邀请码才可以正常登录使用。福袋生活是广州市福袋生活信息科技有限公司旗下一家多元化社交电商导购平台，以APP为载体，社群为媒介，汇集衣食住行、吃喝玩乐生活服务板块，使用福袋生活可以领到淘宝，拼多多等电商平台的商品优惠券和返利，还可以兼职去分享赚钱。我为什么从福袋生活转到果冻宝盒呢？当然是因为福袋生活返利更高，注
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
2019考研 | 西交大软件工程笔者阿蓉
本科背景：某北京211学校电子信息工程互联网开发工作两年录取结果：全日制软件工程学院分数：初试350+复试笔试80+面试85+总排名：100+从五月份开始脱产学习，我主要说一下专业课和复试还有我对非全的一些看法。【数学100+】张宇，张宇，张宇。跟着张宇学习，入门视频刷一遍，真题刷两遍，错题刷三遍。书刷N多遍。从视频开始学习，是最快的学习方法。5-7月份把主要是数学学好，8-9月份开始给自己每个周
视频号买1000个粉多少钱?视频号可以购买粉丝吗？开橱窗需要多少粉？爱吃菠萝的鱼
在视频号的发展初期，很多人都认为，视频号可以通过购买粉丝来提升用户质量。而这个说法，在我们使用视频号的过程中，发现了它是可以购买粉丝的。但是我们要知道，视频号的本质，是一款社交工具。而不是一个私域流量池。而很多人在做私域流量池的时候，就想着怎么通过购买粉丝来提升用户质量。但我觉得你真的是想多了。视频号涨粉咨询号码：1776206920517753965895视频号粉丝1000有什么好处1、视频号粉
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
4 大低成本娱乐方式: 小说, 音乐, 视频, 电子游戏穷人小水滴娱乐音视频低成本小说游戏
穷人如何获得快乐?小说,音乐,视频,游戏,本文简单盘点一下这4大低成本(安全)娱乐方式.这里是穷人小水滴,专注于穷人友好型低成本技术.(本文为58号作品.)目录1娱乐方式1.1小说(网络小说)1.2音乐1.3视频(b站)1.4游戏(电子游戏/计算机软件)2低成本:一只手机即可3总结与展望1娱乐方式这几种,也可以说是艺术的具体形式.更专业的说,(娱乐)是劳动力再生产的重要组成部分.使人放松,获得快乐
计算机网络八股总结 Petrichorzncu 八股总结计算机网络笔记
这里写目录标题网络模型划分（五层和七层）及每一层的功能五层网络模型七层网络模型（OSI模型）==三次握手和四次挥手具体过程及原因==三次握手四次挥手TCP/IP协议组成==UDP协议与TCP/IP协议的区别==Http协议相关知识网络地址，子网掩码等相关计算网络模型划分（五层和七层）及每一层的功能五层网络模型应用层：负责处理网络应用程序，如电子邮件、文件传输和网页浏览。主要协议包括HTTP、FTP
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
性格小测试熹大头
有些人非常肯定自己属于外向型，有些人则发现自己是绝对的内向型。然而，多数人却发现他们似乎介于两者之间，是两种性格的结合。现在我们就来看看你在这种分类中处在何种位置。阅读以下问题，从a、b、c中选出最适合自己的选项。你可能会发现三个选项都不合适，或者合适的不止一项，这种情况下，选出相对来说更适合自己的即可。1人们经常会用下列哪个词语描述你：a善于分析b遵守纪律c有创造力2一连几天参与社交活动（比如，
（缓解抑郁症状）中原焦点团队杨小杰坚持分享第226天2021-4-1 yxjlady
缓解抑郁症状1、不要总待在室内，抑郁严重的人，通常都不想出门2、抑郁性都有诱因或一个导火索，人不能战胜所有东西，要有取舍3、社交，抑郁症的人总是自己脑中不断的自言自语，自我否定等，出去社交就被迫被别的东西点拨了，深度抑郁没法走出自己的世界，思维走不出自己的怪圈4、锻炼让自己轻微出汗最佳，身心是一体时，身体有活力，精神很难不健康5、冥想冥想和社交一样，可以改变你的神经可塑性，一个沉溺在自己世界里的抑
效率神器来了：AI工具手把手教你快速提升工作效能 kkai人工智能人工智能学习媒体 ai chatgpt
随着科技的进步，AI工具已经成为提升工作效率的关键手段。本文将介绍一些实用的AI工具和方法，帮助你自动化繁琐的重复性任务、优化数据管理、促进团队协作与沟通，并提升决策质量。背景：OOPAI-免费问答学习交流-GPT自动化重复性任务Zapier：Zapier可以自动化多个应用程序之间的工作流程。例如，它能自动将Gmail中的附件保存至GoogleDrive，或在你发布新文章时，自动分享至社交媒体平台
You have an error in your SQL syntax； check the manual that corresponds to your MySQL server version 努力的菜鸟~ sql 数据库
YouhaveanerrorinyourSQLsyntax;checkthemanualthatcorrespondstoyourMySQLserverversionfortherightsyntaxtousenear‘IDENTIFIEDBY‘123456’WITHGRANTOPTION’atline1在mysql5.7之前GRANTALLPRIVILEGESON*.*TO'root'@'%'I
程序员架构师主要是做什么_程序员架构师：职责、技能与挑战绿色小猪
免费备考资料（2024年11月软考）：历年试题+视频课合集+电子讲义点击领取>>>免费刷题：2024年11月软考备考刷题点此进入>>>程序员架构师的角色定位在软件开发领域，程序员架构师是一个至关重要的角色。他们不仅需要深入理解业务需求，还要将其转化为技术上的解决方案。程序员架构师是项目中的技术领航者，负责制定和维护软件系统的整体架构，确保系统的可扩展性、可维护性和性能。他们的工作涉及从概念化到实现
mysql学习教程，从入门到精通，TOP 和MySQL LIMIT 子句（15）知识分享小能手大数据数据库 MySQL mysql 学习 oracle 数据库开发语言 adb 大数据
1、TOP和MySQLLIMIT子句内容在SQL中，不同的数据库系统对于限制查询结果的数量有不同的实现方式。TOP关键字主要用于SQLServer和Access数据库中，而LIMIT子句则主要用于MySQL、PostgreSQL（通过LIMIT/OFFSET语法）、SQLite等数据库中。下面将分别详细介绍这两个功能的语法、语句以及案例。1.1、TOP子句（SQLServer和Access）1.1
【Golang】实现 Excel 文件下载功能 RumIV Golang golang excel 开发语言
在当今的网络应用开发中，提供数据导出功能是一项常见的需求。Excel作为一种广泛使用的电子表格格式，通常是数据导出的首选格式之一。在本教程中，我们将学习如何使用Go语言和GinWeb框架来创建一个Excel文件，并允许用户通过HTTP请求下载该文件。准备工作在开始之前，请确保您的开发环境中已经安装了Go语言和相关的开发工具。此外，您还需要安装GinWeb框架和excelize包，这两个包都将用于我
【读书清单】《魔鬼心理学：你确定你是个正常人？》（三）小碗月牙
01心理学家发现，多数社交恐惧症患者都害怕与人聊天，平时他们会尽可能减少说话的内容和频率，而这样就剥夺了沟通的锻炼机会。02真正挽救社交恐惧症患者的方法，绝对不是逃跑，绝对不是回避，而是诚实地接纳和面对这一切。03对于自闭症患儿来说，他们对于社会是缺乏反应能力的，所做出的反应通常不是抗拒就是简单的模仿。04在引导和帮助患者融入社会的时候，一定要注意保持耐性，要懂得尊重和维持他们原有的生活模式，不能
电子技术引领汽车智能新浪潮，尽在AUTO TECH 2025广州国际汽车电子技术盛会 JSZNZZ 汽车
随着科技的持续进步，汽车电子行业正迎来深刻的转型。这一变革的显著特征是从传统的机械控制方式逐渐过渡到智能化和网联化的管理系统。这种转变不仅提升了汽车电子产品的技术复杂性，还极大地丰富了其创新性和功能性。在这个过程中，产品开发的质量和效率变得尤为关键，它们直接决定了企业在激烈竞争环境中的市场地位和商业成功。面对快速变化的市场需求，汽车电子行业在产品开发过程中遇到了多方面的挑战。其中，信息孤岛是一个显
你给予我别人羡慕的一切，我却失去了自己，致敬为家庭付出一切的女神们跃界一
如果嫁的老公家有万贯，两栋6楼高的房子，家公为你们家买的一套商品房写上了你的名字，还为你买了一辆车，你会开心吗？或许一般的人看起来很开心，可实际上拥有这一切的这个人开心吗？这些财产的拥有者叫北冰，在外人看来，家庭和睦，每天不用为生计烦恼，是多么的幸福。未出嫁前，北冰性格开朗且好玩乐观，喜欢社交，聚会和k歌，是个潮流个性的女生。她有消耗不完精力，能到处跑。出嫁之后，她成了一个规规矩矩的家庭妇女。每天
鲲鹏 ARM 架构麒麟 Lylin v10 安装 Nginx (离线) 焚木灵 arm开发架构 nginx 服务器
最近做一个银行的项目，银行的服务器是鲲鹏ARM架构的服务器，并且是麒麟v10的系统，这里记录一下在无法访问外网安装Nginx的方法。其他文章：鲲鹏ARM架构麒麟Lylinv10安装Mysql8.3(离线)-CSDN博客鲲鹏ARM架构麒麟Lylinv10安装Node和NVM(离线)-CSDN博客鲲鹏ARM架构麒麟Lylinv10安装Pm2(离线)-CSDN博客鲲鹏ARM架构麒麟Lylinv10安装P
Maven Array_06 eclipse jdk maven
Maven Maven是基于项目对象模型(POM)，信息来管理项目的构建，报告和文档的软件项目管理工具。 Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法，许多 Apache Jakarta 项目发文时使用 Maven，而且公司
ibatis的queyrForList和queryForMap区别 bijian1013 java ibatis
一.说明 iBatis的返回值参数类型也有种：resultMap与resultClass，这两种类型的选择可以用两句话说明之： 1.当结果集列名和类的属性名完全相对应的时候，则可直接用resultClass直接指定查询结果类
LeetCode[位运算] - #191 计算汉明权重 Cwind java 位运算 LeetCode Algorithm 题解
原题链接：#191 Number of 1 Bits 要求：写一个函数，以一个无符号整数为参数，返回其汉明权重。例如，‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。汉明权重：指一个字符串中非零字符的个数；对于二进制串，即其中‘1’的个数。难度：简单分析：将十进制参数转换为二进制，然后计算其中1的个数即可。 “
浅谈java类与对象 15700786134 java
java是一门面向对象的编程语言，类与对象是其最基本的概念。所谓对象，就是一个个具体的物体，一个人，一台电脑，都是对象。而类，就是对象的一种抽象，是多个对象具有的共性的一种集合，其中包含了属性与方法，就是属于该类的对象所具有的共性。当一个类创建了对象，这个对象就拥有了该类全部的属性，方法。相比于结构化的编程思路，面向对象更适用于人的思维
linux下双网卡同一个IP 被触发 linux
转自： http://q2482696735.blog.163.com/blog/static/250606077201569029441/ 由于需要一台机器有两个网卡，开始时设置在同一个网段的IP，发现数据总是从一个网卡发出，而另一个网卡上没有数据流动。网上找了下，发现相同的问题不少：一、关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
安卓按主页键隐藏程序之后无法再次打开肆无忌惮_ 安卓
遇到一个奇怪的问题，当SplashActivity跳转到MainActivity之后，按主页键，再去打开程序，程序没法再打开（闪一下），结束任务再开也是这样，只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity 本来代码： // 销毁这个Activity fin
通过cookie保存并读取用户登录信息实例知了ing JavaScript html
通过cookie的getCookies()方法可获取所有cookie对象的集合；通过getName()方法可以获取指定的名称的cookie；通过getValue()方法获取到cookie对象的值。另外，将一个cookie对象发送到客户端，使用response对象的addCookie()方法。下面通过cookie保存并读取用户登录信息的例子加深一下理解。（1）创建index.jsp文件。在改
JAVA 对象池矮蛋蛋 java ObjectPool
原文地址： http://www.blogjava.net/baoyaer/articles/218460.html Jakarta对象池 ☆为什么使用对象池恰当地使用对象池化技术，可以有效地减少对象生成和初始化时的消耗，提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
ArrayList根据条件+for循环批量删除的方法 alleni123 java
场景如下： ArrayList<Obj> list Obj-> createTime, sid. 现在要根据obj的createTime来进行定期清理。（释放内存） ------------------------- 首先想到的方法就是 for(Obj o:list){ if(o.createTime-currentT>xxx){
阿里巴巴“耕地宝”大战各种宝百合不是茶平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”，“耕地宝”由阿里巴巴投入一亿，主要是用来进行农业方面，将农民手中的散地集中起来不仅加大农民集体在土地上面的话语权，还增加了土地的流通与利用率，提高了土地的产量，有利于大规模的产业化的高科技农业的发展，阿里在农业上的探索将会引起新一轮的产业调整，但是集体化之后农民的个体的话语权将更少，国家应出台相应的法律法规保护
Spring注入有继承关系的类（1） bijian1013 java spring
一个类一个类的注入 1.AClass类 package com.bijian.spring.test2; public class AClass { String a; String b; public String getA() { return a; } public void setA(Strin
30岁转型期你能否成为成功人士 bijian1013 成功
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
[Velocity三]基于Servlet+Velocity的web应用 bit1129 velocity
什么是VelocityViewServlet 使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中，以Servlet+Velocity的方式实现web应用 Servlet + Velocity的一般步骤 1.自定义Servlet，实现VelocityViewServl
【Kafka十二】关于Kafka是一个Commit Log Service bit1129 service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解？ A message is considered "committed" when all in sync replicas for that partition have applied i
NGINX + LUA实现复杂的控制 ronin47 lua nginx 控制
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-14.输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字 bylijinnan java
public class TwoElementEqualSum { /** * 第 14 题：题目：输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字。要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字，输出任意一对即可。例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder bylijinnan java netty
今天看Netty如何实现一个Http Server org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory： pipeline.addLast("decoder", new HttpRequestDecoder()); pipeline.addLast(&quo
java敏感词过虑-基于多叉树原理 cngolon 违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包，用于java中的敏感词过滤 1、工具包自带敏感词词库，第一次调用时读入词库，故第一次调用时间可能较长，在类加载后普通pc机上html过滤5000字在80毫秒左右，纯文本35毫秒左右。 2、如需自定义词库，将jar包考入WEB-INF工程的lib目录，在WEB-INF/classes目录下建一个 utf-8的words.dict文本文件，
多线程知识 cuishikuan 多线程
T1，T2，T3三个线程工作顺序，按照T1，T2，T3依次进行 public class T1 implements Runnable{ @Override
spring整合activemq dalan_123 java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分： a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
MySQL时间字段究竟使用INT还是DateTime？ dcj3sjt126com mysql
环境：Windows XPPHP Version 5.2.9MySQL Server 5.1 第一步、创建一个表date_test（非定长、int时间） CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
Parcel: unable to marshal value dcj3sjt126com marshal
在两个activity直接传递List<xxInfo>时，出现Parcel: unable to marshal value异常。在MainActivity页面（MainActivity页面向NextActivity页面传递一个List<xxInfo>）： Intent intent = new Intent(this, Next
linux进程的查看上（ps） eksliang linux ps linux ps -l linux ps aux
ps:将某个时间点的进程运行情况选取下来转载请出自出处：http://eksliang.iteye.com/admin/blogs/2119469 http://eksliang.iteye.com ps 这个命令的man page 不是很好查阅，因为很多不同的Unix都使用这儿ps来查阅进程的状态，为了要符合不同版本的需求，所以这个
为什么第三方应用能早于System的app启动 gqdy365 System
Android应用的启动顺序网上有一大堆资料可以查阅了，这里就不细述了，这里不阐述ROM启动还有bootloader，软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来（包括wifi, power, rild, surfaceflinger, mediaserver等等）-> 启动Dalivk中的第一个进程Zygot
App Framework发送JSONP请求(3) hw1287789687 jsonp 跨域请求发送jsonp ajax请求越狱请求
App Framework 中如何发送JSONP请求呢? 使用jsonp,详情请参考:http://json-p.org/ 如何发送Ajax请求呢? (1)登录 /*** * 会员登录 * @param username * @param password */ var user_login=function(username,password){ // aler
发福利，整理了一份关于“资源汇总”的汇总 justjavac 资源
觉得有用的话，可以去github关注：https://github.com/justjavac/awesome-awesomeness-zh_CN 通用 free-programming-books-zh_CN 免费的计算机编程类中文书籍精彩博客集合 hacke2/hacke2.github.io#2 ResumeSample 程序员简历
用 Java 技术创建 RESTful Web 服务 macroli java 编程 Web REST
转载：http://www.ibm.com/developerworks/cn/web/wa-jaxrs/ JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API，可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项超声波 oracle linux
前言：这两天项目要上线了，由我负责往服务器部署整个项目，因此首先要往服务器安装oracle，服务器本身是CentOS6.5的64位系统，安装的数据库版本是11g，在整个的安装过程中碰到很多的坑，不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。安装过程中可能遇到的问题（注
HttpClient 4.3 设置keeplive 和 timeout 的方法 supben httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() { @Override public long getKeepAliveDuration(HttpResponse response, HttpContext context) { long keepAlive
Spring 4.2新特性-@Import注解的升级 wiselyman spring 4
3.1 @Import @Import注解在4.2之前只支持导入配置类在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean 3.2 示例演示java类 package com.wisely.spring4_2.imp; public class DemoService { public void doSomethin

基于mysql的淘宝用户、商品、平台价值分析

文章目录

一、项目背景和需求

1.项目背景及分析目的

二、数据集摸底并找出问题

2.1数据来源

2.2数据理解

2.3分析思路梳理

2.3.1 分析流程

2.3.2使用人货场拆解方式建立指标体系

2.3.3 确认问题

三、数据清洗

3.1 导入数据

3.2 选择子集

3.2 列名重命名

3.3 查找重复值并删除

3.4 处理错误值-以类别字段为主-‘行为类型’

3.5 查找缺失值

3.6 处理与时间相关的问题（一致化处理）

3.7 异常值处理（超出目标分析范围的数据）

3.8 最终数据范围（维度和数量）

四、指标体系建设及分析问题

4.1 用户指标体系

4.1.1 基础指标

4.1.1.1 UV、PV、浏览深度（PV/UV）的每日变化趋势

4.1.1.2 PV、UV每时变化趋势

4.1.1.3 复购率和跳失率

4.1.1.4用户留存率（按日）统计：

4.1.2 RFM模型分析

4.1.2.1 R维度分析

4.1.2.2 F维度分析（一定时间内的消费频率）

4.1.2.3整合结果：

4.1.3.4RFM模型整体分析结论：

4.2 商品相关指标分析

4.2.1 商品销售情况

4.2.2 商品销量与点击量、收藏量、加购量间的相关性分析

4.2.3 商品四象限划分图

4.2.4 “长尾效应”分析

五、平台指标体系

5.1 建立用户各行为转化漏斗模型

5.3 建立独立访客漏斗模型

六 结论

6.1 用户分析

6.2 用户精细化运营

6.3 商品分析

6.4 平台指标分析

你可能感兴趣的:(Mysql,mysql,社交电子)

六结论