叫我小小飞

电商用户数据分析报告

CDNow曾经是一家在线音乐零售平台，后被德国波泰尔斯曼娱乐集团公司出资收购，其资产总价值在最辉煌时曾超过10亿美元。本文主要通过分析CDNow网站的用户购买明细来分析该网站的用户消费行为，使运营部门在营销时更加具有针对性，从而节省成本，提升效率。

数据来源
本次分析数据来源CDNow网站的用户在1997年1月1日至1998年6月30日期间内购买CD交易明细。
数据下载地址
——提取码: va7h
数据集一共有用户ID，购买日期，订单数，订单金额四个字段。

import numpy as np
import pandas as pd
from datetime import datetime
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline

                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    #读取数据
#4列特征，分别为用户id，购买日期，购买数量，购买金额
columns=['user_id','order_dt','order_products','order_amount']
data=pd.read_table('./CDNOW_master.txt',names=columns,sep='\s+')
data.head()

	user_id	order_dt	order_products	order_amount
0	1	19970101	1	11.77
1	2	19970112	1	12.00
2	2	19970112	5	77.00
3	3	19970102	2	20.76
4	3	19970330	2	20.76

data.describe()  # 数据的基本信息

	user_id	order_dt	order_products	order_amount
count	69659.000000	6.965900e+04	69659.000000	69659.000000
mean	11470.854592	1.997228e+07	2.410040	35.893648
std	6819.904848	3.837735e+03	2.333924	36.281942
min	1.000000	1.997010e+07	1.000000	0.000000
25%	5506.000000	1.997022e+07	1.000000	14.490000
50%	11410.000000	1.997042e+07	2.000000	25.980000
75%	17273.000000	1.997111e+07	3.000000	43.700000
max	23570.000000	1.998063e+07	99.000000	1286.010000

从上可知，看数据6关键指标：样本数：69659，最小值：0，最大值：1286，平均值：36，方差36，中位数：26。平均数大于中位数，右偏分布。没有空缺数据，不用清理直接分析，注意到日期数据是整数型，需要转换成时间格式。

#增加两个新时间序列
#将order_dt转化成时间格式
data['order_date']=pd.to_datetime(data.order_dt,format='%Y%m%d')
#将order_date转化成每月起始第一天#将order_date转化成每月起始第一天
data['month']=data.order_date.values.astype('datetime64[M]')

#按用户ID进行分组
user_grouped=data.groupby('user_id').sum()
user_grouped

	order_dt	order_products	order_amount
user_id
1	19970101	1	11.77
2	39940224	6	89.00
3	119833602	16	156.46
4	79882233	7	100.50
5	219686137	29	385.61
6	19970101	1	20.99
7	59921434	18	264.67
8	159775420	18	197.66
9	59921222	6	95.85
10	19970121	3	39.31
11	79890766	4	58.55
12	19970101	4	57.06
13	19970101	4	72.94
14	19970101	2	29.92
15	19970101	4	52.87
16	79882450	8	79.87
17	19970101	5	73.22
18	19970104	1	14.96
19	39940711	11	175.12
20	39940219	46	653.01
21	39940214	4	75.11
22	19970101	1	14.37
23	19970101	2	24.74
24	39950221	4	57.77
25	159804813	12	137.53
26	39940227	6	102.69
27	39940219	10	135.87
28	59910536	7	90.99
29	239656335	28	435.81
30	39940315	2	28.34
...	...	...	...
23541	39940727	2	57.34
23542	19970325	5	77.43
23543	19970325	2	50.76
23544	59920964	12	134.63
23545	19970325	1	24.99
23546	19970325	1	13.97
23547	39940732	2	23.54
23548	19970325	2	23.54
23549	19970325	2	27.13
23550	19970325	2	25.28
23551	119824382	12	264.63
23552	39940728	4	49.38
23553	39940653	8	98.58
23554	39950526	3	36.37
23555	99873685	14	189.18
23556	139814017	15	203.00
23557	19970325	1	14.37
23558	79891692	11	145.60
23559	59911470	8	111.65
23560	19970325	1	18.36
23561	59930982	6	83.46
23562	19970325	2	29.33
23563	39941329	3	58.75
23564	59911976	5	70.01
23565	19970325	1	11.77
23566	19970325	2	36.00
23567	19970325	1	20.97
23568	59911152	6	121.70
23569	19970325	2	25.74
23570	39940651	5	94.08

23570 rows × 3 columns

user_grouped.describe()

	order_dt	order_products	order_amount
count	2.357000e+04	23570.000000	23570.000000
mean	5.902627e+07	7.122656	106.080426
std	9.460684e+07	16.983531	240.925195
min	1.997010e+07	1.000000	0.000000
25%	1.997021e+07	1.000000	19.970000
50%	1.997032e+07	3.000000	43.395000
75%	5.992125e+07	7.000000	106.475000
max	4.334408e+09	1033.000000	13990.930000

原表只按订单来记录，现按用户分组看数据集概述。

从购买数量（单位：PC）角度看，用户数量：23570，平均值购买7张，最多购买1033张，属于狂热用户，中位数3张，平均值大于中位数，是右偏分布，存在小部分购买多张碟的用户。

从消费金额（单位：美元）角度看，平均数106，最高值：13990，属于土豪用户，中位数43，平均值大于中位数，是右偏分布，存在小部分高消费用户。

#设定绘图风格
plt.style.use('ggplot')
plt.rcParams['font.sans-serif']=['SimHei']
ax=data.groupby('month').order_products.sum().plot()
ax.set_xlabel('月份')
ax.set_ylabel('数量(张)')
ax.set_title('不同月份的用户购买数量')
plt.show()

ax=data.groupby('month').order_amount.sum().plot()
ax.set_xlabel('月份')
ax.set_ylabel('消费金额')
ax.set_title('不同月份的用户消费金额')
plt.show()

由图片可知，无论是消费金额还是CD碟数都呈现相同的趋势，而且前三月数据都呈现出异常状态，由于我们不知道原数据到底从何获得，只能做出这三个月有促销活动，抑或是这是新开的店之类的，前三个月大多都是新人之类的假设，我们不得而知，继续往下看。

ax=data.groupby('user_id').sum().plot.scatter('order_amount','order_products')
ax.set_xlabel('消费金额')
ax.set_ylabel('数量')
ax.set_title('每个用户消费金额与购买个数的关系')
plt.show()

每个用户的消费金额跟购买数量呈现一定的线性关系。

plt.figure(figsize=(12,4))
ax=plt.subplot(121)
ax=data.groupby('user_id').order_products.sum().plot.hist(bins=50)
ax.set_xlabel('数量')
ax.set_ylabel('用户数')
ax.set_xlim(0,150)
ax.set_title('用户购买数量分布直方图')

ax1=plt.subplot(122)
ax1=data.groupby('user_id').order_amount.sum().plot.hist(bins=50)
ax1.set_xlabel('消费金额')
ax1.set_ylabel('用户人数')
ax1.set_xlim(0,2000)
ax1.set_title('用户消费金额分布直方图')
plt.show(ax,ax1)

我们可以从直方图看到，大部分用户的消费能力确实不高，整个计算周期里的购买碟数在20张以内，消费金额在250美金以内，再图上几乎看不到高消费用户。

data.groupby('user_id').month.min().value_counts()

1997-02-01    8476
1997-01-01    7846
1997-03-01    7248
Name: month, dtype: int64

data.groupby('user_id').month.max().value_counts()

1997-02-01    4912
1997-03-01    4478
1997-01-01    4192
1998-06-01    1506
1998-05-01    1042
1998-03-01     993
1998-04-01     769
1997-04-01     677
1997-12-01     620
1997-11-01     609
1998-02-01     550
1998-01-01     514
1997-06-01     499
1997-07-01     493
1997-05-01     480
1997-10-01     455
1997-09-01     397
1997-08-01     384
Name: month, dtype: int64

我们可以看到，貌似每个用户的第一次购买记录都是前三个月，最后次购买记录也是前三个月居前三。由此我们可以推测，这份数据集大概是选择了这三个月时间段消费的用户在后面的18个月的追踪记录数据。也能很好的解释我们之前看到的前三个月无论是消费金额还是购买数量的异常。

#创建数据透视表，对每个用户的每月订单数计数
pivoted_count=data.pivot_table(index='user_id',columns='month',values='order_dt',aggfunc='count').fillna(0)
pivoted_count.head()

month	1997-01-01	1997-02-01	1997-03-01	1997-04-01	1997-05-01	1997-06-01	1997-07-01	1997-08-01	1997-09-01	1997-10-01	1997-11-01	1997-12-01	1998-01-01	1998-02-01	1998-03-01	1998-04-01	1998-05-01	1998-06-01
user_id
1	1.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0
2	2.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0	0.0
3	1.0	0.0	1.0	1.0	0.0	0.0	0.0	0.0	0.0	0.0	2.0	0.0	0.0	0.0	0.0	0.0	1.0	0.0
4	2.0	0.0	0.0	0.0	0.0	0.0	0.0	1.0	0.0	0.0	0.0	1.0	0.0	0.0	0.0	0.0	0.0	0.0
5	2.0	1.0	0.0	1.0	1.0	1.0	1.0	0.0	1.0	0.0	0.0	2.0	1.0	0.0	0.0	0.0	0.0	0.0

pivoted_count_transf =pivoted_count.applymap(lambda x:1 if x>1 else np.NAN if x ==0 else 0)
pivoted_count_transf.head()

month	1997-01-01	1997-02-01	1997-03-01	1997-04-01	1997-05-01	1997-06-01	1997-07-01	1997-08-01	1997-09-01	1997-10-01	1997-11-01	1997-12-01	1998-01-01	1998-02-01	1998-03-01	1998-04-01	1998-05-01	1998-06-01
user_id
1	0.0	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
2	1.0	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
3	0.0	NaN	0.0	0.0	NaN	NaN	NaN	NaN	NaN	NaN	1.0	NaN	NaN	NaN	NaN	NaN	0.0	NaN
4	1.0	NaN	NaN	NaN	NaN	NaN	NaN	0.0	NaN	NaN	NaN	0.0	NaN	NaN	NaN	NaN	NaN	NaN
5	1.0	0.0	NaN	0.0	0.0	0.0	0.0	NaN	0.0	NaN	NaN	1.0	0.0	NaN	NaN	NaN	NaN	NaN

消费行为中的复购率和回购率

复购率：复购率的定义是在某时间窗口内消费两次及以上的用户在总消费用户中占比。这里的时间窗口是月，如果一个用户在同一天下了两笔订单，这里也将他算作复购用户。

# 复购率
db=pivoted_count_transf.sum()/pivoted_count_transf.count()
ax=db.plot(figsize=(10,4))
ax.set_xlabel('时间(月)')
ax.set_ylabel('百分比(%)')
ax.set_title('每月用户复购率图')
plt.show()

从图中我们可以看出复购率因为大量新用户加入的关系，不断扩大分母，导致初期的复购率不怎么高，譬如刚开始的97年一月份复购率只有6%左右，而后直线上升，到第四个月后到达最高点，因为这次数据集是前三个月新客跟踪数据，三个月后，没有新客的加入，可以认定是前三个月的客户大浪淘沙剩下的还有购买欲望的老客，这时候的复购率比较稳定，在20%左右徘徊。

fig,ax=plt.subplots(figsize=(10,4))
ax.plot(pivoted_count_transf.sum())
ax.plot(pivoted_count_transf.count())
ax.set_xlabel('时间(月)')
ax.set_ylabel('用户数(人)')
ax.set_title('每月消费和二次消费以上用户数')
legends=['二次消费以上人数','消费人数']
ax.legend(legends,loc='upper right')
plt.show()

如图所示，三个月后，用户迅速沉淀，前三个月的新客大概在1891正负387左右人数继续消费波动，而二次消费的客户则很稳定，曲线也趋近直线，大概在400人左右波动。这部分的客户放到现实中应该是重点维护的优质客户。

回购率：回购率是某一个时间窗口内消费的用户，在下一个时间窗口仍旧消费的占比。我前一月消费用户1000，后一个月他们中仍有200个消费，则回购率是20%。由于牵扯两个时间窗口的计算，所以较之复购率稍稍复杂点。

pivoted_amount=data.pivot_table(index='user_id',columns='month',values='order_dt',aggfunc='count').fillna(0)
#转化数据，有过购买行为的为1，没有购买行为的为0
pivoted_purchase=pivoted_amount.applymap(lambda x:1 if x>0 else 0)
pivoted_purchase.head()

month	1997-01-01	1997-02-01	1997-03-01	1997-04-01	1997-05-01	1997-06-01	1997-07-01	1997-08-01	1997-09-01	1997-10-01	1997-11-01	1997-12-01	1998-01-01	1998-02-01	1998-03-01	1998-04-01	1998-05-01	1998-06-01
user_id
1	1	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0
2	1	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0
3	1	0	1	1	0	0	0	0	0	0	1	0	0	0	0	0	1	0
4	1	0	0	0	0	0	0	1	0	0	0	1	0	0	0	0	0	0
5	1	1	0	1	1	1	1	0	1	0	0	1	1	0	0	0	0	0

#定义函数，每个月都要跟后面一个月对比下，本月有消费且下月也有消费，则本月记为1，
#下月没有消费则为0，本月没有消费则为NaN，由于最后个月没有下月数据，规定全为NaN
def purchase_return(data):
    status = []
    for i in range(17):
        if data[i] == 1:
            if data[i+1] == 1:
                status.append(1)
            if data[i+1] == 0:
                status.append(0)
        else:
            status.append(np.NaN)
    status.append(np.NaN)       
    return pd.Series(status)
#应用并且绘图 
pivoted_purchase_return=pivoted_purchase.apply(purchase_return,axis=1)
pivoted_purchase_return.head()

	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17
user_id
1	0.0	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
2	0.0	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
3	0.0	NaN	1.0	0.0	NaN	NaN	NaN	NaN	NaN	NaN	0.0	NaN	NaN	NaN	NaN	NaN	0.0	NaN
4	0.0	NaN	NaN	NaN	NaN	NaN	NaN	0.0	NaN	NaN	NaN	0.0	NaN	NaN	NaN	NaN	NaN	NaN
5	1.0	0.0	NaN	1.0	1.0	1.0	0.0	NaN	0.0	NaN	NaN	1.0	0.0	NaN	NaN	NaN	NaN	NaN

columns=data.month.sort_values().unique()
pivoted_purchase_return.columns = columns
ax=(pivoted_purchase_return.sum()/pivoted_purchase_return.count()).plot(figsize=(10,4))
ax.set_xlabel('时间（月）')
ax.set_ylabel('百分比（%）')
ax.set_title('十八个月内用户回购率图')
plt.show()

fig,ax=plt.subplots(figsize=(10,4))
ax.plot(pivoted_purchase_return.sum())
ax.plot(pivoted_purchase_return.count())
ax.set_xlabel('时间（月）')
ax.set_ylabel('用户数（人）')
legends = ['每月回购人数','每月消费人数']
ax.legend(legends,loc = 'upper right')
plt.show()

由图可知，用户的回购率大于复购率，约在30%左右正负五个点波动，看人数分布表则发现回购人数趋近稳定，那么波动则是偶尔月份间的消费人数基数的变动，可能有营销者淡旺季，但是这部分回购用户的消费行为大抵稳定，应该跟之前每月复购的用户有一定重合，是属于优质用户。对回购率和复购率进行综合分析，可以得出，新客的整体质量低于老客，老客的忠诚度（回购率）表现较好，消费频次稍次，这是这个网站的用户消费特征

（3）消费行为中的用户分层

我们按照用户的消费行为，简单划分成几个维度：新用户、活跃用户、不活跃用户、回流用户。

新用户（new）：新用户的定义是第一次消费的用户。

活跃用户（active）：即连续两个时间窗口都消费过的用户。

不活跃用户（unactive）：不活跃用户则是时间窗口内没有消费过的活跃用户，即一二月份都消费过，三月份没消费过。

回流用户（return）：回流用户是在上一个窗口中没有消费，而在当前时间窗口内有过消费。

def active_status(date):
    status=[]
    for i in range(18):
        #若本月没有消费
        if date[i]==0:
            if len(status) >0:
                if status[i-1]=='unreg':
                    status.append('unreg')
                else:
                    status.append('unactive')
            else:
                status.append('unreg')
        #若本月有消费
        else:
            if len(status)==0:
                status.append('new')
            else:
                if status[i-1]=='unactive':
                    status.append('return')
                elif status[i-1]=='unreg':
                    status.append('new')
                else:
                    status.append('active')
    return pd.Series(status)
                
pivoted_purchase_status=pivoted_purchase.apply(active_status,axis=1)
pivoted_purchase_status.columns=columns
pivoted_purchase_status.head()

	1997-01-01	1997-02-01	1997-03-01	1997-04-01	1997-05-01	1997-06-01	1997-07-01	1997-08-01	1997-09-01	1997-10-01	1997-11-01	1997-12-01	1998-01-01	1998-02-01	1998-03-01	1998-04-01	1998-05-01	1998-06-01
user_id
1	new	unactive	unactive	unactive	unactive	unactive	unactive	unactive	unactive	unactive	unactive	unactive	unactive	unactive	unactive	unactive	unactive	unactive
2	new	unactive	unactive	unactive	unactive	unactive	unactive	unactive	unactive	unactive	unactive	unactive	unactive	unactive	unactive	unactive	unactive	unactive
3	new	unactive	return	active	unactive	unactive	unactive	unactive	unactive	unactive	return	unactive	unactive	unactive	unactive	unactive	return	unactive
4	new	unactive	unactive	unactive	unactive	unactive	unactive	return	unactive	unactive	unactive	return	unactive	unactive	unactive	unactive	unactive	unactive
5	new	active	unactive	return	active	active	active	unactive	return	unactive	unactive	return	active	unactive	unactive	unactive	unactive	unactive

这个函数主要分为两部分的判断，以本月是否消费为界。本月若没有消费，则判断是不是第一个月，是的话直接返回unreg（不辨别），不是第一个月的话，我们就可以找出前一月标签，前一个月还是不辨别的话，就返回unreg（不辨别），因为这个月还是没消费，如果前一个月是新课还是活跃用户，还是回流用户，因为这个月都没消费，重新定义为unactive（不活跃用户）。

本月若有消费，则需要判断是不是第一次消费，若是第一月的消费，因为没有前一个月数据，所以直接是new（新客）。接下来就是不是第一个月又有消费的情况了，此时可以找出前一个月的标签，如果前一个月是不活跃，则返回return（回流用户），如果是unreg，则是第一次消费，返回new（新客），剩下的就是前一个月是新客或者是活跃用户了，此时都返回active（活跃用户）。

pivoted_status_counts=pivoted_purchase_status.replace('unreg',np.NaN).apply(pd.value_counts)
pivoted_status_counts.head()

	1997-01-01	1997-02-01	1997-03-01	1997-04-01	1997-05-01	1997-06-01	1997-07-01	1997-08-01	1997-09-01	1997-10-01	1997-11-01	1997-12-01	1998-01-01	1998-02-01	1998-03-01	1998-04-01	1998-05-01	1998-06-01
active	NaN	1157.0	1681	1773.0	852.0	747.0	746.0	604.0	528.0	532.0	624.0	632.0	512.0	472.0	571.0	518.0	459.0	446.0
new	7846.0	8476.0	7248	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN	NaN
return	NaN	NaN	595	1049.0	1362.0	1592.0	1434.0	1168.0	1211.0	1307.0	1404.0	1232.0	1025.0	1079.0	1489.0	919.0	1029.0	1060.0
unactive	NaN	6689.0	14046	20748.0	21356.0	21231.0	21390.0	21798.0	21831.0	21731.0	21542.0	21706.0	22033.0	22019.0	21510.0	22133.0	22082.0	22064.0

ax=pivoted_status_counts.fillna(0).T.plot.area(figsize=(12,6))
ax.set_xlabel('时间（月）')
ax.set_ylabel('用户数（人）')
ax.set_title('每月各类用户类型占比面积图')
ax.legend(loc='upper left')
plt.show()

由图可知，黑色的不活跃用户始终是占据大头的，这也跟我们之前的图表结果相符，其次红色代表的活跃用户非常稳定，是属于核心用户，以及紫色的回流用户，这两个分层相加，大抵是当月的消费用户人数的占比，与我们之前的复购率和回购率的表结果一致，这两层的用户大抵接近两千人左右。

回流占比：某个时间窗口内回流用户在总用户中的占比。

活跃占比：某个时间窗口内活跃用户在总用户中的占比。

return_rate=pivoted_status_counts.apply(lambda x:x/x.sum())
ax=return_rate.loc['return'].plot(figsize=(12,6))
ax.set_xlabel('时间(月)')
ax.set_ylabel('百分数(%)')
ax.set_title('每月回流用户占比')
plt.show()

ax = return_rate.loc['active'].plot(figsize = (12,6))
ax.set_xlabel('时间（月）')
ax.set_ylabel('百分数（%）') 
ax.set_title('每月活跃用户占比')
plt.show()

由图可知，用户回流占比在5%～8%之间波动，趋势向下，有客户流失的预警。用户活跃占比在3%～5%间，作为连续消费用户，质量在一定程度上高于回流用户。结合回流用户和活跃用户看，在后期的消费用户中，60%是回流用户，40%是活跃用户，整体质量还好，但是针对这两个分层依旧有改进的空间，可以继续细化数据。

（4）用户质量

因为消费行为有明显的二八倾向，我们需要知道高质量用户为消费贡献了多少份额。

user_amount=data.groupby('user_id').order_amount.sum().sort_values().reset_index()
user_amount['amount_cumsum']=user_amount.order_amount.cumsum()
user_amount.tail()

	user_id	order_amount	amount_cumsum
23565	7931	6497.18	2463822.60
23566	19339	6552.70	2470375.30
23567	7983	6973.07	2477348.37
23568	14048	8976.33	2486324.70
23569	7592	13990.93	2500315.63

#计算出各阶段金额占总金额的百分比
amount_total = user_amount.amount_cumsum.max()
user_amount['prop'] = user_amount.amount_cumsum.apply(lambda x: x / amount_total)
ax = user_amount.prop.plot()
ax.set_xlabel('人数（人）') 
ax.set_ylabel('百分数（%）') 
ax.set_title('用户累计贡献金额百分比')
plt.show()

由图我们可以清晰的看到，金额排名靠后的15000名用户才贡献不到20%的销售量，而此次数据集的总用户人数为23569人，我们可以进一步再看，排名靠后的20000名用户，贡献了接近40%的消费金额，也就是说后面的3569人接近贡献了60%的消费金额，如果我们换算成金额／人单位，这后面的3569名客户相当于签名20000名客户的8.4倍！这也反应了在消费领域中，狠抓高质量用户是万古不变的道理。

(5)用户生命周期

这里我们定义第一次消费至最后一次消费为整个用户生命。我们需要找出每个用户的第一次消费和最后次消费

#用户生命周期
user_purchase = data[['user_id','order_products','order_amount','order_date']]
order_date_min=user_purchase.groupby('user_id').order_date.min()
order_date_max=user_purchase.groupby('user_id').order_date.max()
life_time = (order_date_max-order_date_min).reset_index()
display(life_time.head(),life_time.describe())

	user_id	order_date
0	1	0 days
1	2	0 days
2	3	511 days
3	4	345 days
4	5	367 days

	user_id	order_date
count	23570.000000	23570
mean	11785.500000	134 days 20:55:36.987696
std	6804.217258	180 days 13:46:43.039788
min	1.000000	0 days 00:00:00
25%	5893.250000	0 days 00:00:00
50%	11785.500000	0 days 00:00:00
75%	17677.750000	294 days 00:00:00
max	23570.000000	544 days 00:00:00

由描述可知，所有用户的平均生命周期是134天，中位数是0天，也就是存在一半的用户是第一次消费就是最后次消费，也就是我们前面所说的低质量客户。而最大是544天，相当于我们这个数据集的总天数，说明这用户是从开始到最后都有消费意愿的高质量用户。

因为数据中的用户都是前三个月第一次消费，所以这里的生命周期代表的是1月～3月用户的生命周期。因为这里数据只截取到了18个月为止，这时间过后，用户仍然会持续消费，所以理论上，用户的平均生命周期还会增长。接下来我们看下直方图的分布，更加直观。

life_time['life_time'] = life_time.order_date/np.timedelta64(1,'D')
ax=life_time.life_time.plot.hist(bins =100,figsize = (12,6))
ax.set_xlabel('天数（天）')
ax.set_ylabel('人数（人）')
ax.set_title('二次消费以上用户的生命周期直方图')
plt.show()

life_time['life_time'] = life_time.order_date/np.timedelta64(1,'D')
ax=life_time[life_time.life_time>0].life_time.plot.hist(bins =100,figsize = (12,6))
ax.set_xlabel('天数（天）')
ax.set_ylabel('人数（人）')
ax.set_title('二次消费以上用户的生命周期直方图')
plt.show()

看图我们可以出图像呈双峰结构，部分质量差的用户，虽然消费了两次，但是仍旧无法持续，此时若想提高点用户转化率，应在用户首次消费30天内应该尽量引导，不然就会流失。少部分用户集中在50天～300天，属于普通型的生命周期，有一定忠诚度。高质量用户的生命周期，集中在400天以后，这时候途中人数又逐渐上升，这已经属于高忠诚用户了，尽量维护好这批高质量用户。

消费两次以上用户的生命周期接近消费只有一次用户的两倍，所以如何在用户首次消费后进行有效的引导促使其多次消费，可以有效的提高用户的生命周期和用户质量

len(life_time[life_time.life_time > 400]) #结果：3651

我们同时计算了用户生命周期大于400天的人数，为3651人，跟我们之前的高贡献率人数非常接近，暗示我们这批人应该接近同一批人，也就是说消费金额高的用户往往他们的生命周期也越长，这也符合我们的常规认识。

#链接两表
user_purchase_retention = pd.merge(left = user_purchase, right = order_date_min.reset_index(), how = 'inner', on = 'user_id', suffixes=('', '_min'))
user_purchase_retention['order_date_diff'] = user_purchase_retention.order_date-user_purchase_retention.order_date_min
user_purchase_retention['date_diff'] = user_purchase_retention.order_date_diff.apply(lambda x: x/np.timedelta64(1,'D'))

这里用到merge函数，它和SQL中的join差不多，用来将两个DataFrame进行合并。我们选择了inner 的方式，对标inner join。即只合并能对应得上的数据。这里以on=user_id为对应标准。这里merge的目的是将用户消费行为和第一次消费时间对应上，形成一个新的DataFrame。suffxes参数是如果合并的内容中有重名column，加上后缀。

然后将order_date和order_date_min相减。获得一个新的列，为用户每一次消费距第一次消费的时间差值，然后在整除np.timedelta64(1,‘D’)来获得日期差数值。

user_purchase_retention.head()

	user_id	order_products	order_amount	order_date	order_date_min	order_date_diff	date_diff
0	1	1	11.77	1997-01-01	1997-01-01	0 days	0.0
1	2	1	12.00	1997-01-12	1997-01-12	0 days	0.0
2	2	5	77.00	1997-01-12	1997-01-12	0 days	0.0
3	3	2	20.76	1997-01-02	1997-01-02	0 days	0.0
4	3	2	20.76	1997-03-30	1997-01-02	87 days	87.0

def convert(date):
    if date==0.0:
        return np.NaN
    elif 0<date<=30:
        return '(0,30]'
    elif 30<date<=60:
        return '(30,60]'
    elif 60<date<=90:
        return '(60,90]'
    else:
        return date
user_purchase_retention['date_diff_bin']=user_purchase_retention['date_diff'].apply(convert)

user_purchase_retention.dropna(inplace=True)

然后将时间差值分桶。我这里分成0～30天内，30～60天内，60～90天等，代表用户当前消费时间距第一次消费属于哪个时间段呢。这里date_diff=0并没有被划分入0～30天，因为计算的是留存率，如果用户仅消费了一次，留存率应该是0。另外一方面，如果用户第一天内消费了多次，但是往后没有消费，也算作留存率0。

bin = [0,30,60,90,120,150,180,365]
user_purchase_retention['date_diff_bin'] = pd.cut(user_purchase_retention.date_diff, bins = bin)
pivoted_retention= user_purchase_retention.groupby(['user_id','date_diff_bin']).order_amount.sum().unstack()
pivoted_retention_trans = pivoted_retention.fillna(0).applymap(lambda x: 1 if x >0 else 0)
pivoted_retention_trans.head()

date_diff_bin	(0, 30]	(30, 60]	(60, 90]	(90, 120]	(120, 150]	(150, 180]	(180, 365]
user_id
3	0	0	1	0	0	0	1
4	1	0	0	0	0	0	1
5	1	1	0	1	1	1	1
7	0	0	0	0	0	0	1
8	0	1	0	0	0	1	1

直接用金额表达不出留存率，我们还是按照之前的算法，把消费过的转换成1，未消费过的转换成0，毕竟留存率看的是是否有消费。

ax = (pivoted_retention_trans.sum()/pivoted_retention_trans.count()).plot.bar()
ax.set_xlabel('时间跨度（天）') 
ax.set_ylabel('百分数（%）') 
ax.set_title('各时间段的用户留存率')
plt.show()

如图，第一个月的留存率高达46%，第二个月就下降到35%左右，之后几个月逐渐趋近稳定在25%左右，说明后面的用户逐渐开始稳定下来，说明通过用户在前三个月的使用中，逐渐开始喜爱本店铺的业务或者转换别家的店铺，所以这时候流失率会增大。从运营的角度来看，留存的玩家都是至少消费两次以上的玩家，比起拉新用户来讲，如何提高这些已消费玩家的持续消费是运营的重点，有些活动还是营销，最好放在前三个月，特别是第一个月来进行比较好。为了更好的确定营销的最好时机，我们来看看用户的平均购买周期。

（6）平均购买周期

平均购买周期：用户的两次消费行为的时间间隔。

#创建函数，返回时间差
def diff(group):
    d= abs(group.date_diff - group.date_diff.shift(-1))
    return d
last_diff = user_purchase_retention.groupby('user_id').apply(diff)
ax = last_diff.hist(bins = 20)
ax.set_xlabel('时间跨度（天）') 
ax.set_ylabel('人数（人）') 
ax.set_title('用户平均购买周期直方图')
plt.show()

如图，典型的长尾分布，大部分用户的消费间隔确实比较短。不妨将时间召回点设为消费后立即赠送优惠券，消费后10天询问用户CD怎么样，消费后30天提醒优惠券到期，消费后60天短信推送。

你可能感兴趣的:(电商用户数据分析报告)

抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
网易严选官方旗舰店，优质商品，卓越服务高省_飞智666600
网易严选官方旗舰店是网易旗下的一家电商平台，以提供优质商品和卓越服务而闻名。作为一名SEO优化师，我将为您详细介绍网易严选官方旗舰店，并重点强调其特点和优势。大家好！我是高省APP最大团队&联合创始人飞智导师。相较于其他返利app，高省APP的佣金更高，模式更好，最重要的是，终端用户不会流失！高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几
直返最高等级与直返APP：无需邀请码的返利新体验古楼
随着互联网的普及和电商的兴起，直返模式逐渐成为一种流行的商业模式。在这种模式下，消费者通过购买产品或服务，获得一定的返利，并可以分享给更多的人。其中，直返最高等级和直返APP是直返模式中的重要概念和工具。本文将详细介绍直返最高等级的概念、直返APP的使用以及与邀请码的关系。【高省】APP（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，运行三年，稳定可靠。高省APP，
穷人做什么生意最赚钱？10个适合穷人赚钱的路子？氧惠爱高省
不管在什么地方，一般都是穷人占大量数，而富人只有少数，但是它们却掌握着大量的财富。对于穷人来说，想要买车、买房等奢侈品就难如登天，因为他们只能通过打工来赚取几千元的月薪。➤推荐网购返利app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、外卖红包返利等。（应用市场搜“氧惠”下载，邀请码:521521，全网优惠上氧惠！
闲鱼鱼小铺怎么开通？鱼小铺开通需要哪些流程？高省APP大九
闲鱼鱼小铺是平台推出的一个专业程度的店铺，与普通店铺相比会有更多的权益，比如说发布的商品数量从50增加到500；拥有专业的店铺数据看板与分析的功能，这对于专门在闲鱼做生意的用户来说是非常有帮助的，那么鱼小铺每个人都能开通吗？大家好，我是高省APP联合创始人蓓蓓导师，高省APP是2021年推出的电商导购平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个可省钱佣金高，能
直返APP是什么?直返APP是干嘛的氧惠帮朋友一起省
直返是一种电商购物模式，其核心特点是用户购买商品后可以获得直接返利。具体来说，用户在直返电商平台购买商品时，不仅可以获得商品本身的优惠，还可以获得一定的现金返利或者积分奖励。返利的金额可以提现到用户的账户余额，或者用于下次购物时抵扣。氧惠APP（带货领导者）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（每天出单带货几十万
福袋生活邀请码在哪里填写，福袋生活app邀请码使用教程小小编007
很多人下载福袋生活后，注册使用时需要填写邀请码。因为福袋生活是注册邀请制，所以首次使用填写邀请码才可以正常登录使用。福袋生活是广州市福袋生活信息科技有限公司旗下一家多元化社交电商导购平台，以APP为载体，社群为媒介，汇集衣食住行、吃喝玩乐生活服务板块，使用福袋生活可以领到淘宝，拼多多等电商平台的商品优惠券和返利，还可以兼职去分享赚钱。我为什么从福袋生活转到果冻宝盒呢？当然是因为福袋生活返利更高，注
新私域是什么平台靠谱吗氧惠佣金真的高
新私域指的是借助与互联网电商，随着平台内商家入驻量、用户量相辅相成的全国化平台。是否靠谱取决于平台是否合规。新私域指的是借助与互联网电商，在传统会员体系外新增的锁定用户跨平台、跨界收益，一种随着平台内商家入驻量、用户量相辅相成的全国化平台。关于新私域平台是否靠谱，这个需要看平台的底层逻辑是否合理、合法、合规以及平台的未来的发展方向氧惠APP抖音购物、看电影、点外卖、打车用氧惠APP！佣金更高、更优
果冻宝盒邀请码怎么填好，附6个顶级有效邀请码小小编007
在当今的电商时代，返利app已经成为了很多网购达人的必备工具。其中，果冻宝盒作为一款备受好评的返利软件，吸引了大量用户。而对于一些新手用户来说，填写果冻宝盒的邀请码可能会让他们感到困惑。本文将详细介绍果冻宝盒返利app，并指导用户如何正确填写邀请码。一、果冻宝盒返利app简介果冻宝盒是一款集折扣、返利、分享为一体的购物app。用户在果冻宝盒上购物时，不仅可以享受到商家提供的折扣，还可以获得果冻宝盒
每天赚50零花钱的方法，日赚50元左右的5个正规渠道一起高省
每个人都希望拥有一笔自己的零花钱，但是很多人可能没有太多的时间去赚钱，或者没有太多的机会去赚取收入。但是，你可以通过一些简单的方法来赚取每天50元的零花钱。下面分享一些能每天赚50元的方法门路，总有一个适合你！①电商——高省高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入。拂晓导师高省邀请码989898，注册送双皇
十大适合穷人赚钱门路？普通人如何赚钱？没本钱赚钱快的方法？氧惠好项目
穷人赚钱门路哪个靠谱？生活越苦，就越要学习赚钱方法，赚到钱才能苦尽甘来；本文针对穷人如何赚钱这一问题，盘点了十大赚钱项目，其中有废品收购站、街边小吃、快递员、快递代理点、农村电商、承办酒席、网络主播、电脑维修等，下面跟随小编辑来看看城市和农村赚钱项目！1.废品收购站这个农村赚钱项目虽然名字听起来一般，但发展前景和利润还是很可观的。现在很多农村的基础设施并不够完善，无论大村小村，基本上都没有废品收购
隔离在防晒霜前还是后防晒隔离霜和防晒霜的区别是什么氧惠导师
防晒霜是每天护肤的时候都需要使用的，主要针对的是紫外线，而隔离霜主要是用来隔离彩妆和空气中的脏东西，所以它用在化妆的前一步，即粉底液之前。二者缺一不可，也许很多人会说隔离霜有防晒成分，还要不要涂抹它，事实上，如果长期接触紫外线，只用隔离霜是不够的。➤推荐网购薅羊毛app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、
慢慢买注册一定要邀请码吗?慢慢买APP有没有风险? 高省APP珊珊
慢慢买是一款专注于电商导购优惠券返利的平台，内测上线红利期。在社交电商上提供一些新的玩法，简单一点说，就是提供优惠券给广大用户在各大平台购物，不仅能优惠购物，而且还能返佣金，省钱加赚钱。实则意义上跟慢慢买，慢慢买，慢慢买，慢慢买等等这些是同一类型的网购赚钱app。那么慢慢买相比于其他平台有什么优势呢?在这里，小编给大家分享一下。至于我为何从慢慢买转到高省呢，当然是高省佣金更高，模式更好。【高省】是
如何在电商平台上使用API接口数据优化商品价格 weixin_43841111 api 数据挖掘人工智能 python java 大数据前端爬虫
利用API接口数据来优化电商商品价格是一个涉及数据收集、分析、策略制定以及实时调整价格的过程。这不仅能提高市场竞争力，还能通过精准定价最大化利润。以下是一些关键步骤和策略，用于通过API接口数据优化电商商品价格：1.数据收集竞争对手价格监控：使用API接口（如Scrapy、BeautifulSoup等工具结合Python进行网页数据抓取，或使用专门的API服务如PriceIntelligence、
果冻宝盒官方app邀请码有哪些一览(附邀请码填写指南)省钱又开心！小小编007
果冻宝盒是一款备受瞩目的社交电商软件，其独特的邀请机制和丰富的奖励制度吸引了大量用户。在使用果冻宝盒的过程中，填写正确的邀请码是获取奖励的重要步骤之一。本文将为您详细介绍果冻宝盒官方app的邀请码有哪些，以及如何正确填写邀请码，帮助您更好地参与果冻宝盒的社交电商生态。果冻宝盒直升金牌总裁（最高返利）注册教程：1各大应用市场搜索【果冻宝盒】并下载安装2注册果冻宝盒，根据提示填写邀请码：2233773
自由职业者做什么赚钱？省钱快报能月入三千吗？高省APP珊珊
说起省钱快报，很多人都觉得很耳熟，省钱快报是一个社交电商平台，省钱快报是一个给大家提供优惠券一级购物返佣的优惠平台,整合了京东淘宝拼多多等等各大电商平台的优惠券和佣金，用户领券购买更优惠！所有的售后服务也都还和你之前的平台买东西一样，副业赚钱，可以用省钱快报来增加收入。至于我为何转到高省APP呢？当然是高省佣金更高，模式更好。高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金
「鲸灵」获数千万美元B+轮融资，旗下日日团打造团购电商新时代想想再说可以吗
小编获悉，社交电商鲸灵集团（以下简称鲸灵）已完成数千万美元B+轮融资，由启明创投领投，IDG资本联合领投，老股东跟投。鲸灵刚于7月完成数亿元B轮融资，由腾讯领投，IDG资本、险峰长青、元璟资本跟投。据小编了解，鲸灵旗下的日日团业务单日交易额已突破100万元。鲸灵创始人&CEO邬强强（花名：鬼谷）曾在阿里巴巴任职9年，曾任聚划算事业部总经理、淘宝开放平台创始人。针对本轮融资，邬强强告诉小编：“社交电
抖音返利平台有哪些?值得推荐抖音返利app有哪些? 氧惠超好用
随着抖音电商的崛起，越来越多的用户开始关注抖音返利平台希望通过这些平台在享受购物乐趣的同时，也能获得一定的返利优惠。那么，面对众多的抖音返利平台，哪个返利最高呢？本文将为您深入解析，助您找到最优选择。氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可享受高补贴+0撸+捡漏等带货新
驾校预约学习系统的设计与实现小蒜学长毕业设计学习
摘要伴随着信息技术与互联网技术的不断发展，人们进到了一个新的信息化时代，传统管理技术性没法高效率、容易地管理信息内容。为了实现时代的发展必须，提升管理高效率，各种各样管理管理体系应时而生，各个领域陆续进到信息内容管理时期。驾校预约学习系统管理系统的实现是信息内容时代浪潮时代的产物之一。一切系统都要遵循系统设计的最基本全过程，系统也是如此。它还要通过市场调查、需求分析报告、汇总设计、详尽设计、编号和
2022年淘宝天猫618活动真的便宜吗优惠券高省
马上就要到618年中大促了，各大电商都会推出自己的优惠活动，力度堪比双十一，这时候大家一定会想到双十一，都是优惠活动，难免拿来比较一番，那么2022淘宝618和双11哪个便宜?淘宝618买东西划算吗？下面小编为大家带来相关内容分享，希望对大家有所帮助，一起来看一下吧淘宝618密令红包公布密令：【天降红包61666】5.29日20点准时，大额红包不要错过，具体时间同步更新高省APP佣金更高，模式更好
和大家聊聊跨境电子商务网购保税进口的那些事。万一我爱上你了呢
怎么知道自己购买的商品是否如商家宣传的那样，属于“正规方式”进口的跨境商品？可以通过查询个人跨境电商年度消费额度的方式进行验证：1.登录中国国际贸易单一窗口，进行用户注册或登录。2.找到相应入口，进入“公共服务”页面。如图所示，选择对应年份进行个人额度查询。3.在“已消费金额”一栏中，如果存在消费金额，还可以点击消费金额从而打开消费明细，列出消费者在跨境电商渠道购买，并正式向海关申报的跨境电商零售
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
一部手机就能操作的10种赚钱方式,看看哪种适合你? 氧惠全网优惠
手机已经成为了我们生活中不可或缺的一部分，拿着手机刷分享赚钱已经成为了不少人的日常。今天，我想和大家分享一下手机赚钱的10种好方法。京东密令红包：最爱领红包828红包多多148今天给大家分享我长期在做的副业，也在这里赚到人生第3桶金！氧惠APP佣金高，资质靠谱，各大应用市场均可搜索使用。【氧惠】氧惠app是杭州长孚科技有限公司旗下一款新开发电商导购应用，为用户打造一个集成电商购物优惠佣金平台，公司
京东和唯品会哪个可信？唯品会和京东价格差距大日常购物小技巧
京东和唯品会做为两大电商平台，里面的产品都是有品质保证的，大部份人也都是比较了解，可是京东和唯品会哪个是真正的正品?二者有何不同?现在我们根据下列文章来详细讲解。唯品会和京东哪个正品?京东和唯品会都是正品，京东主打的是他们家的物流，京东自家的物流效率很高，唯品会主营打折的正品，很适合淘货。2个都是正品，看自己的需求来选择，我认为我比较喜欢去京东选购，物流快，今日下单或许明天就可收到货，假如是买些打
亚马逊真的可以赚钱吗？亚马逊怎么做才能赚钱？古楼
1、代购：近年来，随着移动支付和国际物流的发展，代购行业不再像以前那样火爆，但依旧有着不错的利润空间，大家可以兼职亚马逊代购，获得手续费，汇率差价等等，是可以赚到钱的。2、跨境电商：所谓的亚马逊跨境电商，就是通过通过亚马逊跨境平台，把中国的货物卖到全球去，虽然在国内，亚马逊的流量不如京东、淘宝、拼多多，但在国外亚马逊的流量是很高的，其市场空间庞大。一、注册店铺网页搜索“亚马逊全球开店”进入官网。找
大家在哪里买高仿包包，推荐6个最新渠道腕表鞋屋
大家在哪里买高仿包包，推荐6个最新渠道在如今的社会中，有许多人喜欢购买高仿包包。虽然真正的奢侈品价格昂贵，但是高仿包包的外观和品质却能够满足大多数人的需求。那么，大家想知道在哪里买高仿包包吗？下面就为大家推荐6个最新渠道。微信:97870758(下单赠送精美礼品)第一个渠道是线上购物平台。如今，互联网的发展让我们可以方便地在各大电商平台上搜索并购买高仿包包。一些知名的电商平台如淘宝、京东等都有很多
女孩子下班后可以做的兼职是什么，女生下班后可以做的事情有哪些配音就业圈
一、女孩子下班后的兼职推荐女孩子下班后可以考虑一些灵活的兼职方式来增加收入。一种推荐的兼职是线上销售，兼职副业推荐公众号，配音新手圈，声优配音圈，新配音兼职圈，配音就业圈，鼎音副业，有声新手圈，每天更新各种远程工作与在线兼职，职位包括：写手、程序开发、剪辑、设计、翻译、配音、无门槛、插画、翻译、等等。。。每日更新兼职。可以通过社交媒体或电商平台开店，销售自己喜欢的产品。另外，可以考虑做代理，代理一
唯品会的东西是正品吗|唯品会和天猫哪个可靠|唯品会返利平台好项目高省
唯品会的东西是正品吗？目前电商发展较为完善，商品质量保证也逐步健全。一般情况下唯品会的东西都是属于正品的。唯品会买手们会找到全球各地不同的供应商进行报价，再进行供应商之间和同一家供应商历史报价的比价，从中选择价格最有优势的供应商。唯品会所销售的商品均从品牌方、代理商、品牌分支机构、国际品牌驻中国办事处等正规渠道采购，并与之签订战略正品采购协议。唯品会和天猫哪个可靠？其实唯品会和天猫都是比较可靠的购
氧惠风暴来袭！低成本摆摊卖这些，让你日入过万！氧惠好物
在互联网时代，低成本创业已经成为可能。今天，我要给大家介绍一款名为氧惠的APP，它将与你的生活产生重大影响。氧惠，一个全新的抖客+淘客平台，以其独特的带货高补贴模式，正在改变着人们的购物习惯和赚钱方式。氧惠，一个全新的购物体验首先，让我们来看看氧惠的特点。氧惠是一款集购物、省钱、赚钱于一体的APP。它与淘宝、京东、拼多多等主流电商平台合作，为用户提供内部优惠券，涵盖了吃喝玩乐衣食住行的各个方面。这
拼多多返利app叫什么名字?拼多多返利靠前的5个软件大全小小编007
拼多多返利app指的是拼多多购物平台的返现或折扣应用。这些应用通过提供优惠券、折扣、返现等方式吸引消费者，增加购物体验的实惠性。在拼多多平台上，有很多返利软件，其中排名前五的软件分别是：1.果冻宝盒果冻宝盒是一个综合导购返利软件，覆盖了淘宝，拼多多、京东、抖音等各大电商平台的商品优惠券和返利服务。还有话费充值，汽车加油，电影票，外卖红包，视频会员充值等各种低折扣生活娱乐权益。果冻宝盒相比其它同行，
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s