Python异常值检测——黄牛刷单行为特征分析

将账号的订单数和ip地主数量两个变量进行异常值检测,分析出黄牛恶意下单的行为特征

import pandas as pd

catering_sale = 'C:\python\异常检测.csv' #数据
data = pd.read_csv(catering_sale, index_col = 'ip_cnt') #读取数据,指定“日期”列为索引列
data
import matplotlib.pyplot as plt #导入图像库
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号

plt.figure() #建立图像
p = data.boxplot(return_type='dict') #画箱线图,直接使用DataFrame的方法
x = p['fliers'][0].get_xdata() # 'flies'即为异常值的标签
y = p['fliers'][0].get_ydata()
y.sort() #从小到大排序,该方法直接改变原对象

#用annotate添加注释
#其中有些相近的点,注解会出现重叠,难以看清,需要一些技巧来控制。
#以下参数都是经过调试的,需要具体问题具体调试。
for i in range(len(x)): 
  if i>0:
    plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.05 -0.8/(y[i]-y[i-1]),y[i]))
  else:
    plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.08,y[i]))

plt.show()

Python异常值检测——黄牛刷单行为特征分析_第1张图片

你可能感兴趣的:(python)