数据分析作业5

创建两个数据表 customer_info,consumption_infor 分别用于存放用户数据和消费数据(数据已准备在 精准营销_挑战2.zip 中),根据用户 id 将两个表中的数据进行组合,根据消费金额进行排序,观察单笔消费金额最高的用户作为衡量的指标之一;使用 WINDOW 函数根据城市字段进行聚集,并计算城市的总消费额,以及平均消费水平作为第二个分析指标;按照每个城市和每个客户聚类,观察城市中每个用户的消费总金额,作为第三个分析指标。

1、创建数据表,往数据表中插入客户数据(20分钟)

csv导入数据至mysql

数据分析作业5_第1张图片

customer_info表

数据分析作业5_第2张图片

consumption_info

数据分析作业5_第3张图片

2、将 customer_info 和 consumption_infor 表进行组合操作创建新表

CREATE TABLE IF NOT EXISTS costomer_join_credict_card(
SELECT 1 as group_id,
ci.id as id,
ci2.name as name,
ci2.age as age,
ci2.gender as gender,
ci2.city as city,
ci.brand as brand,
ci.amount as amount,
ci.`date` as posting_date
FROM consumption_infor ci 
JOIN customer_info ci2 
ON ci.customer_id  = ci2.id)

数据分析作业5_第4张图片

3、 按照每个城市和每个客户聚集,分析城市中每个用户的消费总金额数据

select
	name,
	city,
	sum(amount) as amount
from
	zjq.costomer_join_credict_card
group by
	name,
	city
order by
	city,
	amount desc

数据分析作业5_第5张图片

4、使用 WINDOW 函数及其他函数根据城市字段进行聚集,并计算城市的总消费额,以及平均消费水平数据

select 
distinct city,
sum(amount) over(partition by city) as sum_amount,
round((avg(amount) over(partition by city)),0) as avg_amount,
count(name) over(partition by city) as num
from costomer_join_credict_card
order by sum_amount desc

数据分析作业5_第6张图片

结果分析:
北京的平均消费水平最高,达到1832.8元,而上海、深圳和杭州的平均消费水平分别为1126元、1427.67元和1002.75元。北京拥有最多的购买用户,达到5人,而上海、深圳和杭州的用户数量分别为4人、3人和4人。
1.消费金额差异:从数据中可以看出,不同城市之间的购买金额有所差异。北京的购买金额最高,而杭州的购买金额最低。这可能反映了不同城市的消费水平和市场规模的差异。
2.用户数量差异:北京拥有最多的购买用户,比其他城市都多。这可能是由于北京是中国的首都,人口众多,市场规模大,吸引了更多的消费者。

客户消费行为分析项目可以提供深入见解,帮助我了解客户需求、优化营销策略、管理风险以及改善客户关系。这些收获将有助于提高企业的竞争力和业绩。

你可能感兴趣的:(数据分析,数据挖掘)