2021年安徽省大数据与人工智能应用竞赛大数据(网络赛)-高职组赛题第三部分可视化

第三部分:可视化(30分)

这是一份用户消费行为数据,用来分析用户消费情况及品牌情况,可视化消费变化趋势。

数据中中文字符为UTF-8编码,字段分隔符为 @@

列名

说明

montha

购买月份

user_id

用户ID

event_type

行为类别

product_id

产品编号

category_id

产品的类别id

category_code

产品的类别分类法

brand_name

品牌

price

产品价格

  1. 进行用户消费趋势分析(按月)(8分)
按照月份分别对消费金额(price)进行求和,对消费人数(user_id)进行计数运算,对运算的进行双折线图画图操作,要求,消费金额与消费人数 进行不同的坐标展示。
其中对 price求和后显示为 消费金额(万元)
对 user_id计数后的显示为 消费人数
对montha 显示为 月度
  1. 每月的消费总金额(1分)
  2. 每月的消费人数  (1分)
  3. 消费金额 单位换算为 万元(1分)
  4. 两个折线不同的坐标(2分)
  5. 中文显示 (1分)
 
  

2、进行品牌消费情况(10分)

按照品牌(brand_name)分别对消费金额(price)进行求和,对消费人数(user_id)进行计数运算,并按照消费金额排序(降序),取得排序的前10名进行 双坐标,柱状图,画图操作,要求,消费金额与消费人数 进行不同的坐标展示。

其中对 price求和后显示为 消费金额(万元)

对 user_id计数后的显示为 消费人数对

brand_name显示为 品牌要求:

  1. 每个品牌的消费总金额(1分)
  2. 每个品牌的消费人数  (1分)
  3. 消费金额 单位换算为 万元(1分)
  4. 柱状图不同的坐标,不同的颜色(2分)
  5. 中文显示 (1分)
  6. 按照消费金额排序 有大到小(1分)
  7. 只取得 前10条记录(1分)

3 用户个体消费分析(12分)

3.1、用户消费次数、消费金额散点图 4分

1)X轴是消费次数,Y轴是消费金额(1分)
2)画出散点图(1分)
3)中文显示 (1分)

从图中可以得出的结论描述:(2分)

3.2、用户消费金额分布图  4分

按照用户id(user_id)分别对消费金额(price)进行求和,然后按照消费金额,并对消费金额小于5000元的绘制直方图。 
要求:  
1)消费金额汇总(1分)  
2)直方图(1分)  
3)金额小于5000(横轴坐标最大5000元) (1分) 
结果截图:

                 2021年安徽省大数据与人工智能应用竞赛大数据(网络赛)-高职组赛题第三部分可视化_第1张图片

从图中可以得出的结论描述:(2分)

从用户消费金额分布图中可以看出,去除金额大于5000元的极值数据后,用户消费金额的分布符合右偏分布。随着消费金额的增加,消费的用户数减少。

代码截图:

2021年安徽省大数据与人工智能应用竞赛大数据(网络赛)-高职组赛题第三部分可视化_第2张图片

 

3.3、用户消费次数分布图  4分

按照用户id(user_id)分别对消费次数(event_type)进行计数运算,然后按照消费次数,并对消费次数小于20的绘制直方图。
要求:  
1)消费次数计数(1分)  
2)直方图(1分)  
3)次数小于20(横轴坐标最大20) (1分)
结果截图:

                        2021年安徽省大数据与人工智能应用竞赛大数据(网络赛)-高职组赛题第三部分可视化_第3张图片

 

从图中可以得出的结论描述:(2分)

从用户消费次数分布图中可以看出,去除次数大于20元的极值数据后,用户消费次数的分布符合右偏分布。随着消费次数的增加,消费的用户数减少。

代码截图:

2021年安徽省大数据与人工智能应用竞赛大数据(网络赛)-高职组赛题第三部分可视化_第4张图片

 第1题,第3大题的第1小题可参考(数据、题目相同):2021年安徽省大数据与人工智能应用竞赛大数据(网络赛)-本科组赛题第四部分可视化_Steven灬的博客-CSDN博客

你可能感兴趣的:(数据分析与挖掘,big,data,人工智能,网络)