泰迪杯数据分析比赛2018年B题解答-任务3

泰迪杯数据分析比赛2018年B题解答-任务3

任务3-文章目录

  • 泰迪杯数据分析比赛2018年B题解答-任务3
    • 任务3.1
      • 任务3.1全部代码
  • 结尾

泰迪杯数据地址: https://www.tipdm.org/bdrace/jljingsai/20181008/1488.html#sHref.
泰迪杯数据分析2018年B题任务3题目:

任务 3.1 分析各售货机商品销售数据,总结规律,给出每台售货机饮料类商品的标签,结果保存在 CSV 文件中,文件名分别为 “task3-1A.csv”、 “task3-1B.csv”、…、“task3-1E.csv”,格式如下表所示。
泰迪杯数据分析比赛2018年B题解答-任务3_第1张图片
任务 3.2 在任务 3.1 的基础上进行标签拓展,依据标签生成完整的售货机画像,结果保存在 CSV 文件中,文件名分别为“task3-2A.csv”、task3- 2B.csv”、…、“task3-2E.csv”。依据此画像进行总结描述,给出营销意见。


任务3.1

分析各售货机商品销售数据,总结规律,给出每台售货机饮料类商品的标签,结果保存在 CSV 文件中,文件名分别为 “task3-1A.csv”、 “task3-1B.csv”、…、“task3-1E.csv”,格式如下表所示。
泰迪杯数据分析比赛2018年B题解答-任务3_第2张图片

目标:得出各售货机商品销售数据,并对各商品进行分类贴标签。

分析:首先我们得对各售货机的各商品销售量进行统计,然后使用聚类算法对商品进行分类。在此聚类算法中,我将会使用KMeans聚类算法。

首先我们需要对A-E五台售货机进行数据整理,将各商品的总实际金额与销售量制作成表单。
实现代码:

import pandas as pd
data=pd.read_csv(r'D:\大数据学习\数据分析与挖掘\B题\task1-A.csv',encoding='gbk')
dalei=data['商品'].unique().tolist()#提取出商品总列表,方便之后进行分类
dalei
datasum=[]
datasem=[]
for i in dalei:
    data_x=data[data['商品']==i]['实际金额'].sum()
    data_t=data[data['商品']==i]['商品'].size
    datasum.append(data_x)#插入列表中
    datasem.append(data_t)
task1_2 = pd.DataFrame({
   '商品':dalei,'总实际金额':datasum,'销售量':datasem

你可能感兴趣的:(数据分析,python,聚类,数据分析)