餐饮业务数据分析
一、数据描述
> fd <- read.csv(file.choose())
> fd
日期 销量
1 2015/3/1 51.00
2 2015/2/28 2618.20
3 2015/2/27 2608.40
4 2015/2/26 2651.90
5 2015/2/25 3442.10
6 2015/2/24 3393.10
7 2015/2/23 3136.60
8 2015/2/22 3744.10
9 2015/2/21 6607.40
10 2015/2/20 4060.30
数据为每日销售额,时间+销量。
二、数据清洗
1、缺失值处理
> sum(complete.cases(fd))
[1] 200
> sum(!complete.cases(fd))
[1] 1
> mean(!complete.cases(fd))
[1] 0.004975124
> fd[!complete.cases(fd),]
日期 销量
15 2015/2/14 NA
缺失值个数为1,占总量的0.497%,缺失数值位于第15行。
2、箱图异常值处理
> sp <- boxplot(fd$销量,boxwex=0.7)
title("销量")
> xi = 1.1
> sd.s=sd(fd[complete.cases(fd),]$"销量")
> mn.s = mean(fd[complete.cases(fd),]$"销量")
> points(xi,mn.s,col="red",pch=18)
> arrows(xi,mn.s - sd.s,xi,mn.s+sd.s,code=3,col="pink",angle = 75,length = .1)
> text(rep(c(1.05,1.05,0.95,0.95),length=length(sp$out)),labels = sp$out[order(sp$out)],sp$out[order(sp$out)]+rep(c(150,-150,150,-150),length=length(sp$out)),col="red")
可以看出有8个异常值。结合业务,可以把865、4060.3、4065.2归为正常值。
三、 贡献度分析
贡献度分析又称帕累托分析,即20/80定律,例如对一个公司来讲,80%的利润来自于20%最畅销的产品,而其他80%的产品只产生20%的利润。
下面使用帕累托分析法来看看本案例中的提供80%利润的那20%是那些
可知 菜品A1~A7共7个菜品,占菜品种类的70%。盈利额约占总盈利的85%。所以应增加菜品A1~A7的成本投入,减少A8~A10的投入以获得更高的利润。
四、相关性分析
分析这些菜品销售量直接的相关性可以得到不同菜品之间的关系,如替补菜品,互补菜品或者么有关系,为原材料采购,或套菜推广提供参考。
> cor(xg[,2:11])
百合酱蒸凤爪 翡翠蒸香茜饺 金银蒜汁蒸排骨 乐膳真味鸡
百合酱蒸凤爪 1.000000000 0.009205803 0.01679933 0.45563817
翡翠蒸香茜饺 0.009205803 1.000000000 0.30443437 -0.01227936
金银蒜汁蒸排骨 0.016799326 0.304434367 1.00000000 0.03513460
乐膳真味鸡 0.455638166 -0.012279359 0.03513460 1.00000000
蜜汁焗餐包 NA NA NA NA
生炒菜心 0.308495593 -0.180446360 -0.18428973 0.32546172
铁板酸菜豆腐 0.204897840 -0.026908140 0.18727155 0.29769187
香煎韭菜饺 0.127448249 0.062344452 0.12154343 -0.06886643
香煎罗卜糕 -0.090275548 0.270276328 0.07780811 -0.03022205
原汁原味菜心 0.428316260 0.020462147 0.02907437 0.42187795
蜜汁焗餐包 生炒菜心 铁板酸菜豆腐 香煎韭菜饺 香煎罗卜糕
百合酱蒸凤爪 NA 0.30849559 0.20489784 0.12744825 -0.09027555
翡翠蒸香茜饺 NA -0.18044636 -0.02690814 0.06234445 0.27027633
金银蒜汁蒸排骨 NA -0.18428973 0.18727155 0.12154343 0.07780811
乐膳真味鸡 NA 0.32546172 0.29769187 -0.06886643 -0.03022205
蜜汁焗餐包 1 NA NA NA NA
生炒菜心 NA 1.00000000 0.36978749 0.03823316 0.04989806
铁板酸菜豆腐 NA 0.36978749 1.00000000 0.09554300 0.15795755
香煎韭菜饺 NA 0.03823316 0.09554300 1.00000000 0.17833563
香煎罗卜糕 NA 0.04989806 0.15795755 0.17833563 1.00000000
原汁原味菜心 NA 0.12298779 0.56733190 0.04968889 0.08898022
原汁原味菜心
百合酱蒸凤爪 0.42831626
翡翠蒸香茜饺 0.02046215
金银蒜汁蒸排骨 0.02907437
乐膳真味鸡 0.42187795
蜜汁焗餐包 NA
生炒菜心 0.12298779
铁板酸菜豆腐 0.56733190
香煎韭菜饺 0.04968889
香煎罗卜糕 0.08898022
原汁原味菜心 1.00000000
可以看出,如果顾客点了“百合酱蒸凤爪”,点“乐善真味鸡”,“生炒菜心”的相关性比较高。