Colorfully_lu

数据分析项目-用户消费行为分析

导入及分析

第一部分：数据清洗

导包

数据加载&分析数据

数据清洗

第二部分：按月数据分析

分析方向：用户、订单、消费趋势

消费趋势的分析

1. 每月的消费总金额

2. 每月的消费次数

3. 每月的产品购买量

4. 每月的消费人数（去重）

5. 将上述趋势分析用透视表展示(pivot_table)

第三部分：用户个体消费数据分析

1. 用户消费金额和消费次数的描述统计

2.用户消费金额和消费次数的散点图

3. 用户消费金额的分布图（二八法则）

4. 用户消费次数的分布图（二八法则）

5. 用户累计消费金额的占比（百分之多少的用户占了百分之多少的消费额）

第四部分：用户消费行为分析

1.用户第一次消费（首购）

2. 用户最后一次消费

3. 新老客户的消费比

4. 用户的购买周期

5. 用户分层（使用透视表）

5.1. 用户分层二：RFM

5.2. 用户分层三：求和

5.3. 用户分层四：计数

5.4. 用户分层五：给不同层次客户用颜色区分设置

5.5. 用户分层六：用户生命周期

5.6. 用户分层七：用户购买周期（按订单）

6. 复购率和回购率的分析

导入及分析

项目名称：CD用户消费行为分析

项目概述：本项目主要利用Numpy，Pandas，matplotlib等三个工具进行数据的处理，来分析用户消费行为。数据来源与CDNow网站的用户购买明细。

分析步骤：

第一部分：数据清洗

　　　　1. 数据类型的转换
　　　　2. 空值处理
　　　　3. 异常值处理

第二部分：按月数据分析

　　　　1. 每月的消费总金额
　　　　2. 每月的消费次数
　　　　3. 每月的产品购买量
　　　　4. 每月的消费人数

第三部分：用户个体消费数据分析

　　　　1. 用户消费金额和消费次数的描述统计
　　　　2. 用户消费金额和消费次数的散点图
　　　　3. 用户消费金额的分布图
　　　　4. 用户消费次数的分布图
　　　　5. 用户累计消费金额的占比

第四部分：用户消费行为分析

　　　　1. 用户第一次消费时间
　　　　2. 用户最后一次消费时间
　　　　3. 新老客户消费比
　　　　4. 用户分层
　　　　5. 用户购买周期
　　　　6. 用户生命周期

第一部分：数据清洗

导包

#导入需要的包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from datetime import  datetime

数据加载&分析数据

字段含义：

user_id：用户ID

order_dt：购买日期

order_product：购买产品的数量

order_amount:购买金额

消费行业或者是电商行业一般是通过订单数、订单额、购买日期，用户ID这四个字段来分析的,基本上这四个字段就能缑进行很丰富的分析。

# 因为原始数据中不包含表头，在这里定义好赋值
columns=['user_id','order_dt','order_products','order_amount']
# 参数 sep='\s+'，用于匹配任意空白符
df=pd.read_csv('./data/CDNOW_master.txt',names=columns,sep='\s+')
print(df.head())
print(df.info())

输出结果

  user_id  order_dt  order_products  order_amount
0        1  19970101               1         11.77
1        2  19970112               1         12.00
2        2  19970112               5         77.00
3        3  19970102               2         20.76
4        3  19970330               2         20.76

RangeIndex: 69659 entries, 0 to 69658
Data columns (total 4 columns):
 #   Column          Non-Null Count  Dtype  
---  ------          --------------  -----  
 0   user_id         69659 non-null  int64  
 1   order_dt        69659 non-null  int64  
 2   order_products  69659 non-null  int64  
 3   order_amount    69659 non-null  float64
dtypes: float64(1), int64(3)
memory usage: 2.1 MB
None

Process finished with exit code 0

分析：

1.数据完整，没有空数据

2.order_dt是int类型，需要将其转换成时间类型

3.用户可能在同一天内重复购买（如：ID为2的顾客在1月12日这一天内购买了两次）

4.因为后面要按月分析，需要添加一列month

数据清洗

#数据清洗
df=date1.copy()
# format='%Y%m%d' 这里要指明格式，否则可能出错
df['order_dt']=pd.to_datetime(df['order_dt'],format='%Y%m%d')
# 增加一列 month
df['month']=df['order_dt'].values.astype('datetime64[M]')
print(df.head())

输出结果

   user_id   order_dt  order_products  order_amount      month
0        1 1997-01-01               1         11.77 1997-01-01
1        2 1997-01-12               1         12.00 1997-01-01
2        2 1997-01-12               5         77.00 1997-01-01
3        3 1997-01-02               2         20.76 1997-01-01
4        3 1997-03-30               2         20.76 1997-03-01

Process finished with exit code 0

分析：

describe()是描述统计：

            user_id  order_products  order_amount
count  69659.000000    69659.000000  69659.000000
mean   11470.854592        2.410040     35.893648
std     6819.904848        2.333924     36.281942
min        1.000000        1.000000      0.000000
25%     5506.000000        1.000000     14.490000
50%    11410.000000        2.000000     25.980000
75%    17273.000000        3.000000     43.700000
max    23570.000000       99.000000   1286.010000

Process finished with exit code 0

分析

1. 大部分的订单只消费了少量的商品（平均2.4），有一定的极值干扰

2. 用户的消费金额比较稳定，平均消费在35.8元，中位数在25.9元，有一定的极值干扰。

3. 用户平均每笔订单购买2.4个商品，标准差在2.3，稍具波动性。中位数2个商品，75分位数3个商品，说明绝大部分订单的购买量都不多。最大值在99个，数字比较高。购买金额的情况差不多，大部分订单集中在小额

4. 一般而言，消费类的数据分布都是长尾形。大部分用户都是小额，然而小部分用户贡献了收入的大头，俗称二八。

第二部分：按月数据分析

分析方向：用户、订单、消费趋势

消费趋势的分析

# 查看一下df的列,方便操作
print(df.columns)

输出结果

Index(['user_id', 'order_dt', 'order_products', 'order_amount', 'month'], dtype='object')

1. 每月的消费总金额

#每月消费总金额
# 根据 month分组统计购买金额总和
order_amt_mon=df.groupby('month')['order_amount'].sum()
print(order_amt_mon.head())

输出结果

month
1997-01-01    299060.17
1997-02-01    379590.03
1997-03-01    393155.27
1997-04-01    142824.49
1997-05-01    107933.30
Name: order_amount, dtype: float64

Process finished with exit code 0

绘图

#绘图
order_amt_mon.plot(c='red')
plt.show()

分析：

可以看到，97年1，2，3月销量很高，每月平局约3.6万，后期销量趋于平稳，每月在1万左右波动

2. 每月的消费次数

#2. 每月的消费次数
order_amt_count=df.groupby('month')['user_id'].count()
#绘图
order_amt_count.plot(c='orange')
plt.show()

分析：

前三个月平均消费订单在1万左右，后续月份趋于平稳，约在2500单每月

3. 每月的产品购买量

#3. 每月的产品购买量
order_products_sum=df.groupby('month')['order_products'].sum()
#绘图
order_products_sum.plot(c='b')
plt.show()

分析：

前3个月产品购买数量平均在24000左右，后期下降趋于平稳，约6000每月。原因猜想：

　　　　1.用户层面，早期用户中有异常值；

　　　　2. 公司层面，在搞促销等。因为只有销售数据，所以暂时无法判断具体原因。

4. 每月的消费人数（去重）

每月的消费人数（去重）去重的原因：一个人可能在一个月内多次消费

nunique表示统计去重后的个数

#4. 每月的消费人数（去重）去重的原因：一个人可能在一个月内多次消费
user_id_count=df.groupby('month')['user_id'].nunique()
user_id_count.plot(c='g')
plt.show()

分析：

每个月的消费人数小于每月的消费次数，但是区别不大。前3个月月均消费人数在9000左右，后续月均2000不到，一样是前期消费人多，后期平稳的趋势。

5. 将上述趋势分析用透视表展示(pivot_table)

#5. 将上述趋势分析用透视表展示(pivot_table)
df_pivot_table=df.pivot_table(index='month',
               values=['user_id',  'order_products', 'order_amount'],
               aggfunc={'user_id':'count','order_amount':'sum','order_products':'sum'})
print(df_pivot_table.head())

输出结果

           order_amount  order_products  user_id
month                                            
1997-01-01     299060.17           19416     8928
1997-02-01     379590.03           24921    11272
1997-03-01     393155.27           26159    11598
1997-04-01     142824.49            9729     3781
1997-05-01     107933.30            7275     2895

Process finished with exit code 0

分析：（解决一个需求可能会有很多种方法，具体看哪个更方便，更简单）

　　数据透视表是更简单的方法，有了透视表，用里面的数据绘图也是狠方便的。

第三部分：用户个体消费数据分析

上面是通过维度月，来看总体趋势。下面对个体进行分析，看消费能力如何。大致分为以下五个方向：

1. 用户消费金额和消费次数的描述统计；

2. 用户消费金额和消费次数的散点图；

3. 用户消费金额的分布图（二八法则）；

4. 用户消费次数的分布图；

5. 用户累计消费金额的占比（百分之多少的用户占了百分之多少的消费额）

1. 用户消费金额和消费次数的描述统计

#1. 用户消费金额和消费次数的描述统计
df.groupby('user_id')['order_amount'].sum() #每一个用户消费的总金额
df.groupby('user_id').count()['order_dt'] #每一个用户消费的总金额
group_user=df.groupby('user_id')
print(group_user.sum().describe())

输出结果

       order_products  order_amount
count    23570.000000  23570.000000
mean         7.122656    106.080426
std         16.983531    240.925195
min          1.000000      0.000000
25%          1.000000     19.970000
50%          3.000000     43.395000
75%          7.000000    106.475000
max       1033.000000  13990.930000

Process finished with exit code 0

分析：

1. 从用户角度看，每位用户平均购买7件商品，最多的用户买了1033件。

2. 用户平均消费额（客单价）100元，标准差是240，结合分位数和最大值看，平均值和75分位接近。

结论：肯定存在小部分高额消费用户，小部分的用户占了消费的大头，符合二八法则。

2.用户消费金额和消费次数的散点图

#2.用户消费金额和消费次数的散点图
user_amount_sum=df.groupby('user_id')['order_amount'].sum() #每一个用户消费的总金额
user_product_sum=df.groupby('user_id')['order_products'].sum() #每一个用户消费的总次数
plt.scatter(user_product_sum,user_amount_sum)
plt.show()
#方法2
group_user.sum().query('order_amount<4000').plot(kind='scatter',x='order_amount',y='order_products')
plt.show()

绘制图形

分析：

　　通过绘制用户的散点图，用户比较健康而且规律性很强。因为这是CD网站的销售数据，商品比较单一，金额和商品质量的关系也呈线性，没几个离群点。

3. 用户消费金额的分布图（二八法则）

#3. 用户消费金额的分布图（二八法则）
group_user.sum().query('order_amount<=1000')['order_amount'].plot(kind='hist',bins=20)
plt.show()

分析：

1. 从直方图可知，大部分用户的消费能力确实不高，绝大部分集中在很低的消费档次。高消费用户在图上几乎看不到。这也确实符合消费行为的行业规律。

2. 虽然有极值干扰了我们的数据，但是大部分用户还是集中在比较低的消费档次。

4. 用户消费次数的分布图（二八法则）

#4. 用户消费次数的分布图（二八法则）
group_user.sum().query('order_products<100')['order_products'].plot(kind='hist',bins=40)
plt.show()

5. 用户累计消费金额的占比（百分之多少的用户占了百分之多少的消费额）

# cumsum() 滚动累加求和
user_cumsum=(group_user.sum().sort_values('order_amount').cumsum()) / (2500315.63)
print(user_cumsum)

输出结果

        order_products  order_amount
user_id                              
10175      3.999495e-07      0.000000
4559       7.998990e-07      0.000000
1948       1.199849e-06      0.000000
925        1.599798e-06      0.000000
10798      1.999748e-06      0.000000
...                 ...           ...
7931       6.599847e-02      0.985405
19339      6.614965e-02      0.988025
7983       6.636402e-02      0.990814
14048      6.677717e-02      0.994404
7592       6.714392e-02      1.000000

[23570 rows x 2 columns]

Process finished with exit code 0

绘图

#绘图
user_cumsum.reset_index().order_amount.plot()
plt.show()

分析：

按用户消费金额进行升序排序，由图可知50%的用户仅贡献了15%的销售额。而排名前5000的用户就贡献了60%的消费额

也就是说，只要维护好这5000个客户，就可以完成业绩KPI的60%，如果能把5000个用户运营的更好就可以占比70%-80%甚至更高。

第四部分：用户消费行为分析

用户第一次消费（首购）

在很多行业中首购是一个很重要的维度，它和渠道信息息息相关，尤其针对客单价比较高客户留存率比较低的行业，第一次客户从哪里来可以拓展出很多运营方式。

用户最后一次消费

新老客户消费比

多少客户仅消费了一次　　每月新客占比

用户分层

RFM 　　新、老、活跃、流失

用户购买周期（按订单）

用户消费周期描述　　用户消费周期分布

用户生命周期（按第一次&最后一次消费）

用户生命周期描述　　用户生命周期分布

1.用户第一次消费（首购）

求月份的最小值，即用户消费行为中的第一次消费时间

#求月份的最小值，即用户消费行为中的第一次消费时间
group_user=df.groupby('user_id')
min_month=group_user['month'].min().value_counts()
print(min_month)

通过统计结果发现：所有用户第一次消费都集中在前3个月 df['user_id'].unique().size---查看用户总数

[23570 rows x 2 columns]
1997-02-01    8476
1997-01-01    7846
1997-03-01    7248
Name: month, dtype: int64

Process finished with exit code 0

2. 用户最后一次消费

#求月份的最大值，即用户消费行为中的最后消费时间
max_month=group_user['month'].max().value_counts()
print(max_month)

输出结果

Name: month, dtype: int64
1997-02-01    4912
1997-03-01    4478
1997-01-01    4192
1998-06-01    1506
1998-05-01    1042
1998-03-01     993
1998-04-01     769
1997-04-01     677
1997-12-01     620
1997-11-01     609
1998-02-01     550
1998-01-01     514
1997-06-01     499
1997-07-01     493
1997-05-01     480
1997-10-01     455
1997-09-01     397
1997-08-01     384
Name: month, dtype: int64

消费者最后一天绘图

#消费者最后一天绘图
group_user['order_dt'].max().value_counts().plot()
plt.show()

将第一次消费与最后一次消费做分析

cha=group_user['order_dt'].agg(['min','max'])
print(cha)

              min        max
user_id                      
1       1997-01-01 1997-01-01
2       1997-01-12 1997-01-12
3       1997-01-02 1998-05-28
4       1997-01-01 1997-12-12
5       1997-01-01 1998-01-03
...            ...        ...
23566   1997-03-25 1997-03-25
23567   1997-03-25 1997-03-25
23568   1997-03-25 1997-04-22
23569   1997-03-25 1997-03-25
23570   1997-03-25 1997-03-26

[23570 rows x 2 columns]

Process finished with exit code 0

分析：

观察用户最后一次购买时间发现，用户最后一次消费比第一次消费分布广，大部分最后一次消费集中在前三个月

说明很多客户购买一次后就不再购买。随着时间的增长，最后一次购买数也在递增，消费呈现流失上升的情况，用户忠诚度在慢慢下降。

3. 新老客户的消费比

消费一次为新用户
消费多次为老用户
判定：如果用户第一次消费时间和最后一次消费时间一样，则该用户只消费了一次
group_user['order_dt'].agg(['min','max'])#agg对分组后的结果进行多种指定聚合

#3. 新老客户的消费比
user_life=group_user['order_dt'].agg(['min','max'])
print(user_life.head())

               min        max
user_id                      
1       1997-01-01 1997-01-01
2       1997-01-12 1997-01-12
3       1997-01-02 1998-05-28
4       1997-01-01 1997-12-12
5       1997-01-01 1998-01-03

Process finished with exit code 0

分析：

user_id为1的用户第一次消费时间和最后一次消费时间相同，说明他只消费了一次

4. 用户的购买周期

#4. 用户的购买周期
print((user_life['min']==user_life['max']).value_counts())

输出结果

True     12054
False    11516
dtype: int64

分析

可以看到，有一半的用户只消费了一次

5. 用户分层（使用透视表）

rfm = df.pivot_table(index='user_id',
                   values=['order_products','order_amount','order_dt'],
                   aggfunc={'order_products':'sum','order_amount':'sum','order_dt':'max'})

print(rfm.head())

 # order_products--求消费产品总数、order_amount---求消费总金额、order_dt--求最近一次消费时间

         order_amount   order_dt  order_products
user_id                                         
1               11.77 1997-01-01               1
2               89.00 1997-01-12               6
3              156.46 1998-05-28              16
4              100.50 1997-12-12               7
5              385.61 1998-01-03              29

Process finished with exit code 0

rfm 距今天数增加一列
-(rfm.order_dt - rfm.order_dt.max())结果为时间类型，将时间格式转化为整数或者浮点数的形式，
# 可以除以单位‘D’，也可以用astype转化

#rfm 距今天数 增加一列
#-(rfm.order_dt - rfm.order_dt.max())结果为时间类型，将时间格式转化为整数或者浮点数的形式，
# 可以除以单位‘D’，也可以用astype转化
rfm['R']=-(rfm['order_dt']-rfm['order_dt'].max())/np.timedelta64(1,'D')
rfm.rename(columns={'order_products':'F','order_amount':'M'},inplace=True)
print(rfm.head())

输出结果

              M   order_dt   F      R
user_id                              
1         11.77 1997-01-01   1  545.0
2         89.00 1997-01-12   6  534.0
3        156.46 1998-05-28  16   33.0
4        100.50 1997-12-12   7  200.0
5        385.61 1998-01-03  29  178.0

分析：

R表示客户最近一次交易的时间间隔，M表示客户在最近一段时间内交易的金额。

F表示客户在最近一段时间内交易的次数。 F值越大，表示客户交易越频繁，反之则表示客户交易不够活跃。

M表示客户在最近一段时间内交易的金额。 M值越大，表示客户价值越高，反之则表示客户价值越低。

5.1. 用户分层二：RFM

def rfm_func(x):
    level=x.apply(lambda x : '1' if x>=0 else '0')
    label=level.R+level.F+level.M
    dict={
        '111':'重要价值客户',
        '011':'重要保持客户',
        '101':'重要挽留客户',
        '001':'重要发展客户',
        '110':'一般价值客户',
        '010':'一般保持客户',
        '100':'一般挽留客户',
        '000':'一般发展客户'
    }
    result = dict[label]
    return result
 # 用户分层，这里使用平均数
rfm['label'] = rfm[['R','F','M']].apply(lambda x : x - x.mean()).apply(rfm_func,axis=1)
print(rfm.head())

输出结果

              M   order_dt   F      R   label
user_id                                      
1         11.77 1997-01-01   1  545.0  一般挽留客户
2         89.00 1997-01-12   6  534.0  一般挽留客户
3        156.46 1998-05-28  16   33.0  重要保持客户
4        100.50 1997-12-12   7  200.0  一般发展客户
5        385.61 1998-01-03  29  178.0  重要保持客户

5.2. 用户分层三：求和

#5. 用户分层三：求和
label_sum=rfm.groupby('label').sum()
print(label_sum)

                 M       F          R
label                                
一般价值客户     7181.28     650    36295.0
一般保持客户    19937.45    1712    29448.0
一般发展客户   196971.23   13977   591108.0
一般挽留客户   438291.81   29346  6951815.0
重要价值客户   167080.83   11121   358363.0
重要保持客户  1592039.62  107789   517267.0
重要发展客户    45785.01    2023    56636.0
重要挽留客户    33028.40    1263   114482.0

Process finished with exit code 0

分析：

M表示不同层次客户累计消费金额，重要保持客户最高

5.3. 用户分层四：计数

#5. 用户分层四：计数
label_count=rfm.groupby('label').count()
print(label_count)

分析：

不同层次用户的消费人数，之前重要保持客户的累计消费金额最高，这里人数排第2，但与一般挽留用户人数差距比较大

5.4. 用户分层五：给不同层次客户用颜色区分设置

rfm.loc[rfm.label == '重要价值客户','color'] = 'g'
# ~:表示求非
rfm.loc[~(rfm.label == '重要价值客户'),'color'] = 'r'
rfm.plot('F','R',kind='scatter',c=rfm.color)
plt.show()

分析：

1. 从RFM分层可知，大部分用户为重要保持客户，但是这是由于极值的影响，所以RFM的划分应该尽量以业务为准。尽量用小部分的用户覆盖大部分的额度，不能为了数据好看划分等级。

2. RFM是人工使用象限法把数据划分为几个立方体，立方体对应相应的标签，我们可以把标签运用到业务层面上。比如重要保持客户贡献金额最多159203.62，我们如何与业务方配合把数据提高或者维护；而重要发展客户和重要挽留客户他们有一段时间没消费了，我们如何把他们拉回来。

5.5. 用户分层六：用户生命周期

pivoted_counts = df.pivot_table(index='user_id',
                                columns='month',
                              values='order_dt',
                              aggfunc='count',
                                fill_value=0)
print(pivoted_counts.head())

month    1997-01-01  1997-02-01  1997-03-01  ...  1998-04-01  1998-05-01  1998-06-01
user_id                                      ...                                    
1                 1           0           0  ...           0           0           0
2                 2           0           0  ...           0           0           0
3                 1           0           1  ...           0           1           0
4                 2           0           0  ...           0           0           0
5                 2           1           0  ...           0           0           0

[5 rows x 18 columns]

Process finished with exit code 0

分析：

用户每个月的消费次数，对于生命周期的划分只需要知道用户本月是否消费，消费次数在这里并不重要,需要将模型进行简化

注：使用数据透视表时，要明确获得什么结果。

# 简化
df_purchase = pivoted_counts.applymap(lambda x: 1 if x>0 else 0)
print(df_purchase.head())

month    1997-01-01  1997-02-01  1997-03-01  ...  1998-04-01  1998-05-01  1998-06-01
user_id                                      ...                                    
1                 1           0           0  ...           0           0           0
2                 1           0           0  ...           0           0           0
3                 1           0           1  ...           0           1           0
4                 1           0           0  ...           0           0           0
5                 1           1           0  ...           0           0           0

[5 rows x 18 columns]

分析：

对于尾部数据，user_id 2w+的数据是有一些问题的，因为从实际业务场景来说，一月二月他们都没有注册，三月份才是第一次消费。这里需要进行判断将第一次消费作为生命周期的起始，不能从一月份开始就粗略的计算。

一下算法为固定算法

# 用户生命周期状态变化

def active_status(data):

    ur = 'unreg'    #未注册
    ua = 'unactive' #不活跃
    n = 'new'       #新用户
    a = 'active'    #活跃
    r = 'return'    #回流用户：上个月不活跃，这个月活跃
    status = []
    for i in range(18):
        #若本月没有消费
        if data[i] == 0:
            if len(status) > 0:
                if n not in status:
                    status.append(ur)
                else:
                    status.append(ua)
            else:
                status.append(ur)

        #若本月消费
        else:
            if len(status) == 0:
                status.append(n)
            else:
                if n not in status:
                    status.append(n)
                elif status[-1] == ua:
                    status.append(r)
                else:
                    status.append(a)
    # 不能直接返回 status，否则会失去表头    ---重点
    return pd.Series(status, index = df_purchase.columns)

pivoted_status = df_purchase.apply(active_status,axis = 1)

pivoted_status.head()

输出结果

month   1997-01-01 1997-02-01 1997-03-01  ... 1998-04-01 1998-05-01 1998-06-01
user_id                                   ...                                 
1              new   unactive   unactive  ...   unactive   unactive   unactive
2              new   unactive   unactive  ...   unactive   unactive   unactive
3              new   unactive     return  ...   unactive     return   unactive
4              new   unactive   unactive  ...   unactive   unactive   unactive
5              new     active   unactive  ...   unactive   unactive   unactive

[5 rows x 18 columns]

Process finished with exit code 0

每月不同活跃用户的计数

#每月不同活跃用户的计数
purchase_status_ct=pivoted_status.replace('unreg',np.NaN).apply(lambda x: pd.value_counts(x))
print(purchase_status_ct)

输出结果：统计每个月客户活跃度的汇总

5 rows x 18 columns]
month     1997-01-01  1997-02-01  ...  1998-05-01  1998-06-01
active           NaN      1157.0  ...       459.0       446.0
new           7846.0      8476.0  ...         NaN         NaN
return           NaN         NaN  ...      1029.0      1060.0
unactive         NaN      6689.0  ...     22082.0     22064.0

purchase_status_ct.fillna(0,inplace=True)
# 浮点数转换为整数
purchase_status_ct.astype(np.int)
# 绘面积图 (purchase_status_ct要求一下转置矩阵)
purchase_status_ct.T.plot(kind='area')
plt.show()

每月不同活跃用户占比

消费用户构成：活跃+新增+回流

#每月不同活跃用户占比
Fdf=purchase_status_ct.T.apply(lambda x:x/x.sum(),axis=1)
print(Fdf.head())

输出结果

             active       new    return  unactive
month                                             
1997-01-01  0.000000  1.000000  0.000000  0.000000
1997-02-01  0.070886  0.519299  0.000000  0.409815
1997-03-01  0.071319  0.307510  0.025244  0.595927
1997-04-01  0.075223  0.000000  0.044506  0.880272
1997-05-01  0.036148  0.000000  0.057785  0.906067

分析

由上表可以看到每月用户的消费状态变化。

1. 活跃用户，持续消费用户对应的是---消费运营质量；

2. 回流用户（上月不消费本月消费）对应的是---唤回运营情况；

3. 不活跃的用户对应的是---用户流失情况。

得出分析：流失用户增加，回流客户正在减少

5.6. 用户分层七：用户购买周期（按订单）

# 将用户分组后，每个用户的订单购买时间进行错位相减  shift()：下一行减上一行的值
order_diff=group_user.apply(lambda x:x.order_dt-x.order_dt.shift())
print(order_diff.head())

输出结果

user_id   
1        0       NaT
2        1       NaT
         2    0 days
3        3       NaT
         4   87 days
Name: order_dt, dtype: timedelta64[ns]

Process finished with exit code 0

分析

1. 可以看到：user_id 1为空值，说明用户只购买过一个订单

2. user_id 2 的用户第一笔订单与第二笔订单在同一天购买

用户消费周期分布

#用户消费周期分布
(order_diff/np.timedelta64(1,'D')).hist(bins=20)
plt.show()

分析

订单周期呈指数分布，用户的平均购买周期是68天，绝大部分用户的购买周期都低于100天。

用户生命周期（第一笔订单时间 & 最后一笔订单时间）

user_life=group_user['order_dt'].agg(['min','max'])
print(user_life.head())

输出结果

               min        max
user_id                      
1       1997-01-01 1997-01-01
2       1997-01-12 1997-01-12
3       1997-01-02 1998-05-28
4       1997-01-01 1997-12-12
5       1997-01-01 1998-01-03

Process finished with exit code 0

相隔天数

user_life['life_period']=user_life['max']-user_life['min']
print(user_life.head())

得出结果

               min        max life_period
user_id                                  
1       1997-01-01 1997-01-01      0 days
2       1997-01-12 1997-01-12      0 days
3       1997-01-02 1998-05-28    511 days
4       1997-01-01 1997-12-12    345 days
5       1997-01-01 1998-01-03    367 days

Process finished with exit code 0

描述一下

print(user_life['life_period'].describe())

输出结果

count                          23570
mean     134 days 20:55:36.987696224
std      180 days 13:46:43.039788104
min                  0 days 00:00:00
25%                  0 days 00:00:00
50%                  0 days 00:00:00
75%                294 days 00:00:00
max                544 days 00:00:00
Name: life_period, dtype: object

Process finished with exit code 0

分析

可以看到，数据偏移较大，中位数是0天，意味着超过50%的用户生命周期是0天，即只购买了1次。

(user_life['life_period'] / np.timedelta64(1,'D')).plot(kind='hist',bins=40)
plt.show()

分析：

可以看出，用户生命周期受只购买一次的用户影响比较大（因此可以排除生命周期为0天的用户再观察）

# 用户生命周期大于0天的分布图
cond=(user_life['life_period'] / np.timedelta64(1,'D'))
cond[cond>0].hist(bins=40)
plt.show()

分析

1. 有不少用户生命周期靠拢在0天，部分质量差的用户虽然消费了两次，但是仍然无法持续，用户首次消费30天以内应该尽量引导；

2. 少部分用户集中在50-300天，属于普通型的生命周期；

3. 高质量用户的生命周期，集中在400天以后，这属于忠诚用户。

6. 复购率和回购率的分析

复购率：自然月内，购买多次的用户占比

回购率：曾经购买过的用户在某一时期内的再次购买占比

applymap()针对DataFrame里的所有数据。使用lambda函数，因为设计了多个结果，所以要用两个if else

user_id                                      ...                                    
1               0.0         NaN         NaN  ...         NaN         NaN         NaN
2               1.0         NaN         NaN  ...         NaN         NaN         NaN
3               0.0         NaN         0.0  ...         NaN         0.0         NaN
4               1.0         NaN         NaN  ...         NaN         NaN         NaN
5               1.0         0.0         NaN  ...         NaN         NaN         NaN

[5 rows x 18 columns]

Process finished with exit code 0

复购率

(purchase_r.sum()/purchase_r.count()).plot(figsize=(10,4))
plt.show()

分析

1. 用sum和count相除即可计算出复购率。这两个函数都会忽略掉NaN，而NaN是没有消费的用户，count不论是0或1都会统计，所以是总的消费用户数。而sum求和计算了消费两次及以上的用户。这里比较巧妙的用了替代法计算复购率。sql中也可以用。

2. 图上可以看出复购率在早期，因为大量新用户加入的关系，新客的复购率并不高，譬如1月新客们的复购率只有6%左右。而在后期，这时的用户都是大浪淘沙剩下的老客户，复购率比较稳定，在20%左右。单看新客和老客，复购率有三倍左右的差距。

回购率：回购率是某一个时间窗口内消费的用户，在下个时间窗口仍旧消费的占比。

# 消费金额进行透视

pivoted_amount = df.pivot_table(index='user_id',
                                columns='month',
                                values='order_amount',
                                aggfunc='mean')
pivoted_amount.fillna(0,inplace=True)
columns_month = df['month'].sort_values().astype('str').unique()
pivoted_amount.columns = columns_month

# pivoted_amount.head()
print(pivoted_amount.head())

         1997-01-01  1997-02-01  1997-03-01  ...  1998-04-01  1998-05-01  1998-06-01
user_id                                      ...                                    
1             11.77         0.0        0.00  ...         0.0        0.00         0.0
2             44.50         0.0        0.00  ...         0.0        0.00         0.0
3             20.76         0.0       20.76  ...         0.0       16.99         0.0
4             29.53         0.0        0.00  ...         0.0        0.00         0.0
5             21.65        38.9        0.00  ...         0.0        0.00         0.0

[5 rows x 18 columns]

Process finished with exit code 0

pivoted_purchase = pivoted_amount.applymap(lambda x : 1 if x>0 else 0)
print(pivoted_purchase.head())

输出结果

         1997-01-01  1997-02-01  1997-03-01  ...  1998-04-01  1998-05-01  1998-06-01
user_id                                      ...                                    
1                 1           0           0  ...           0           0           0
2                 1           0           0  ...           0           0           0
3                 1           0           1  ...           0           1           0
4                 1           0           0  ...           0           0           0
5                 1           1           0  ...           0           0           0

[5 rows x 18 columns]

Process finished with exit code 0

# 0代表当月消费过次月没有消费过，1代表当月消费过次月依然消费

def purchase_return(data):
    status = []
    for i in range(17):
        if data[i] == 1:
            if data[i+1] ==1:
                status.append(1)
            if data[i+1] == 0:
                status.append(0)
        else:
            status.append(np.NaN)
    status.append(np.NaN)
    return pd.Series(status, index = pivoted_purchase.columns)

pivoted_purchase_return = pivoted_purchase.apply(purchase_return,axis = 1)

print(pivoted_purchase_return.head())

         1997-01-01  1997-02-01  1997-03-01  ...  1998-04-01  1998-05-01  1998-06-01
user_id                                      ...                                    
1               0.0         NaN         NaN  ...         NaN         NaN         NaN
2               0.0         NaN         NaN  ...         NaN         NaN         NaN
3               0.0         NaN         1.0  ...         NaN         0.0         NaN
4               0.0         NaN         NaN  ...         NaN         NaN         NaN
5               1.0         0.0         NaN  ...         NaN         NaN         NaN

[5 rows x 18 columns]

Process finished with exit code 0

# 回购率，计算方法和复购率类似，同样的逻辑
(pivoted_purchase_return.sum()/pivoted_purchase_return.count()).plot(figsize=(10,4))
plt.show()

分析：

1. 从上图看出，用户的回购率高于复购率，约在30%左右，和老客户差异不大。

2. 从回购率和复购率综合分析，新客的整体质量低于老客，老客的忠诚度（回购率）很好，消费频次稍次

你可能感兴趣的:(python,开发语言,后端)

【Python】一文详细介绍 py格式文件高斯小哥 Python基础【高质量合集】python 新手入门学习
【Python】一文详细介绍py格式文件个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文章目录一、py格式文件简介二、如何创建和编辑py格式文件三、如何运行py
python抓包与解包_Python—网络抓包与解包（pcap、dpkt） weixin_39691055 python抓包与解包
pcap安装[root@localhost~]#pipinstallpypcap抓包与解包#-*-coding:utf-8-*-importpcap,dpktimportre,threading,requests__black_ip=['103.224.249.123','203.66.1.212']#抓包：param1eth_name网卡名，如：eth0,eth3。param2p_type日志捕
华为OD机试 - 单向链表中间节点（Java & JS & Python & C & C++）华为OD题库华为od 链表 java
须知哈喽，本题库完全免费，收费是为了防止被爬，大家订阅专栏后可以私信联系退款。感谢支持文章目录须知题目描述输出描述解析代码题目描述给定一个单链表L，请编写程序输出L中间结点保存的数据。如果有两个中间结点，则输出第二个中间结点保存的数据。例如：给定L为1→7→5，则输出应该为7；给定L为1→2→3→4，则输出应该为3；输入描述每个输入包含1个测试用例。每个测试用例：第一行给出链表首结点的地址、结点总
python 推导式(派生、衍生) sanduo112 人工智能 python windows 开发语言
python推导式一、推导式(派生、衍生)1.Python推导式是一种独特的数据处理方式，可以从一个数据序列构建另一个新的数据序列的结构体。2.列表(list)推导式3.字典(dict)推导式4.集合(set)推导式5.元组(tuple)推导式二、代码概述一、推导式(派生、衍生)1.Python推导式是一种独特的数据处理方式，可以从一个数据序列构建另一个新的数据序列的结构体。Python支持各种数
数据挖掘|数据预处理|基于Python的数据标准化方法皖山文武数据挖掘数据建模与分析 python 数据挖掘开发语言
基于Python的数据标准化方法1.z-score方法2.极差标准化方法3.最大绝对值标准化方法在数据分析之前，通常需要先将数据标准化（Standardization），利用标准化后的数据进行数据分析，以避免属性之间不同度量和取值范围差异造成数据对分析结果的影响。1.z-score方法Z-score方法是基于原始数据的均值和标准差来进行数据标准化的，处理后的数据均值为0，方差为1，符合标准正态分布
CSV指南：Python程序获取大型CSV文件行数孤独打铁匠Julian 笔记经验分享 python
本指南提供了几种使用Python来获取大型CSV文件行数的方法，并解释了每种方法的适用场景。方法1:使用csv.reader处理复杂CSV文件当你的CSV文件中包含多行字段（即某些字段的值中包含换行符）时，使用csv.reader是一个可靠的选择，因为它能够正确处理这些复杂情况。这个方法适用于大多数大小的CSV文件，但是对于非常大的文件，读取整个文件可能会占用较多的时间和内存。对于极大的文件，考虑
谷歌浏览器驱动Chromedriver（114-120版本）文件以及驱动下载教程 pigerr杨 Python python chrome drivers
ChromeDriver官方网站GitHub||GoogleChromeLabs/chrome-for-testingChromeDriver113-125_JSONChromeforTestingavailability123-125zip白月黑羽Python基础|进阶|Qt图形界面|Django|自动化测试|性能测试|JS语言|JS前端|原理与安装
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
python转码 Desamond python 开发语言
转码在许多场景中都有应用，以下是一些常见的场景：网页开发：当用户在网页上输入文本时，可能需要将特殊字符（如空格、引号、特殊符号等）进行转码，以防止这些字符对URL或HTML代码产生干扰。文件名处理：在处理文件名时，可能需要将特殊字符进行转码，以避免文件名被错误地解析或显示。数据传输：在数据传输过程中，为了确保数据的完整性和正确性，可能需要将数据中的特殊字符进行转码。数据存储：在数据库或数据存储中，
排序算法太多？常用排序都在这了，一篇文章总结和实现所有面试会考的排序算法（基于Python实现）宇宙之一粟不归路之Python #IT面试题收集与总结数据结构与算法算法数据结构排序算法 python java
文章目录排序算法1.常见的排序算法1.1选择排序1.1.1思想1.1.2实现**1.1.3选择排序分析**1.2冒泡排序**1.2.1思想****1.2.2实现****1.2.3冒泡排序分析**1.3插入排序**1.3.1思想****1.3.2实现****1.3.3插入排序分析**1.4归并排序☆☆★**1.4.1思想****1.4.2实现****1.4.3归并排序分析**1.5快速排序☆★★**
27.Python从入门到精通—Python异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为以山河作礼。 #Python基础入门—详解版 python java 服务器
27.从入门到精通：Python异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为异常处理在Python中，异常处理是一种处理程序在执行期间可能遇到的错误的方法。当Python解释器遇到错误时，它会引发异常。异常是一种Python对象，它包含有关错误的信息，例如错误类型和错误位置。为了处理异常，您可以使用try-except语句。在
python清华大学出版社答案_Python机器学习及实践 weixin_39805119 python清华大学出版社答案
第1章机器学习的基础知识1.1何谓机器学习1.1.1传感器和海量数据1.1.2机器学习的重要性1.1.3机器学习的表现1.1.4机器学习的主要任务1.1.5选择合适的算法1.1.6机器学习程序的步骤1.2综合分类1.3推荐系统和深度学习1.3.1推荐系统1.3.2深度学习1.4何为Python1.4.1使用Python软件的由来1.4.2为什么使用Python1.4.3Python设计定位1.4.
Python | Redis工具类 -拟墨画扇- Python redis 数据库缓存 python
一、需求自动连接Redis数据库，通过连接池处理数据对输出结果进行Log打印并保存到文件二、代码Utils.redisUtils.py#!/usr/bin/envpython#-*-coding:utf-8-*-importredisfromUtils.loggerimportlog"""Redis数据格式(1)字符串|存储形式:key-value:str-存储二进制数据:可以存储任意类型的数据，
Python dict字符串转json对象，小数精度丢失问题朝如青丝暮成雪 json python
一前言JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式，dict是Python的一种数据格式。本篇介绍一个float数据转换时精度丢失的案例。二问题描述importjsontest_str1='{"π":3.1415926535897932384626433832795028841971}'test_str2='{"value":10.00000}'print
java实体中返回前端的double类型四舍五入（格式化）婲落ヽ紅顏誶 java
根据业务，需要通过后端给前端返回部分double类型的数值，一般需要保留两位小数，使用jackson转换对象packagecom.ruoyi.common.core.config;importcom.fasterxml.jackson.core.JsonGenerator;importcom.fasterxml.jackson.databind.JsonSerializer;importcom.f
Django forms组件在飞行-米龙 Django django python 后端
【一】引入【1】实现登陆验证功能（1）需求分析登陆验证需要前后端交互，采用form表单提交数据对数据进行校验用户名必须以英文大写字母开头密码必须大于三位数反馈给用户错误的信息除了反馈错误的信息还有保留原始输入内容（2）后端代码使用user_info_dict字典每次刷新存储存储前端发送的信息存储后端进行验证的信息defhome(request):#每次后刷新这个信息字典user_info_dict
Webpack构建优化——区分环境 oWSQo
为什么需要区分环境在开发网页的时候，一般都会有多套运行环境，例如：在开发过程中方便开发调试的环境。发布到线上给用户使用的运行环境。这两套不同的环境虽然都是由同一套源代码编译而来，但是代码内容却不一样，差异包括：线上代码被特殊压缩过。开发用的代码包含一些用于提示开发者的提示日志，这些日志普通用户不可能去看它。开发用的代码所连接的后端数据接口地址也可能和线上环境不同，因为要避免开发过程中造成对线上数据
Python+Requests模拟发送GET请求爱学习的执念自动化测试软件测试技术分享 python 开发语言
模拟发送GET请求前置条件：导入requests库一、发送不带参数的get请求代码如下：以百度首页为例importrequests#发送get请求response=requests.get(url="http://www.baidu.com")print(response.content.decode("utf-8"))#以utf-8的编码输出内容二、发送带参数的get请求发送带参数的get请求有
Python极速入门：五分钟开启实战之旅！知白守黑V Python 编程语言系统运维 python 编程语言 python开发 python学习 python入门 python数据分析
1.Python基础语法和结构：了解Python的基本语法，包括变量、数据类型、运算符、注释等。控制流：掌握条件语句（if-elif-else）、循环（for和while）及其控制（break和continue）。函数：学习如何定义和使用函数，包括参数传递、返回值、作用域和闭包。模块和包：理解如何导入和使用模块，以及如何创建和使用自己的包。2.数据处理列表、元组和集合：学习这些序列类型的操作和方法
Python Flask 使用数据库安果移不动 python flask 开发语言
pipinstallflask_sqlalchemy官方文档：Flask-SQLAlchemy—Flask-SQLAlchemyDocumentation(3.1.x)为了不报错也需要导入另外两个库#pipinstallflask_sqlalchemy#pipinstallmysqlclient完整代码importosfromflaskimportFlaskfromflask_sqlalchemy
Web前端Html的表单任家伟前端 html
表单的关键字：form标签表示一个表单区域action=“后端地址”method=“提交数据方式:get/post”input单行输入框type=“text”文本name=“定义名称名字自定义”向后端提交的键readonly=“readonly”只读，不可修改，但是可以提交disabled=“disabled”禁用组件不可修改，不能提交type=“password”密码框type=“radio”单
PaperWeekly sapienst Papers PaperwithCode General ML
1.Python软件包解决DL在未见过的数据分布下性能差的问题：（1）神经网络和损失分离的模块化设计（2）强大便捷的基准测试能力（3）易于使用但难以修改（4）github:https://github.com/marrlab/domainlabTrainer和Models之间是什么关系Trainer和Models是DomainLab中的两个核心概念。Trainer是一个用于指导数据流向模型并计算S
使用Python读取Excel文件并计算平均分嘻嘻爱编码 Python从入门到放弃 python excel 开发语言
在这篇博客中，我们将探讨如何使用Python的pandas库来读取Excel文件，并计算其中数据的平均分。pandas是一个强大的数据分析工具，它允许我们以简单直观的方式处理表格数据。安装必要的库在开始之前，确保你的环境中安装了pandas和openpyxl库。可以使用以下命令进行安装：pipinstallpandasopenpyxl读取Excel文件首先，我们需要读取Excel文件。假设我们有一
python项目练习——7.网站访问日志分析器 F—— python项目练习 python 信息可视化数据分析数据挖掘开发语言学习
项目功能分析：这个项目可以读取网站的访问日志文件，统计访问量、独立访客数、访问来源等信息，并以图表或表格的形式展示出来。这个项目涉及到文件操作、数据处理、数据可视化等方面的技术。示例代码：importrefromcollectionsimportCounterimportmatplotlib.pyplotaspltdefparse_log_file(log_file):#读取日志文件内容witho
python的while双重循环九九乘法表 Jinm_R python 开发语言
a=1whilea<=9:b=1#乘数每次需要从1开始whileb<=a:print(f"{a}*{b}={a*b}\t",end='')#\t为制表符使乘法表整齐end=''代表用空格代替换行b+=1a+=1print()#乘数每加一换行
【Python】成功解决ModuleNotFoundError: No module named ‘torchinfo‘ 高斯小哥 BUG解决方案合集 python pytorch 新手入门学习 debug
【Python】成功解决ModuleNotFoundError:Nomodulenamed‘torchinfo’个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文
程序员开发技术整理 laizhixue 学习前端框架
前端技术：vue-前端框架element-前端框架bootstrap-前端框架echarts-图标组件C#后端技术：webservice：soap架构：简单的通信协议，用于服务通信ORM框架：对象关系映射，如EF：对象实体模型，是ado.net中的应用技术soap服务通讯：xml通讯ado.net：OAuth2:登录授权认证：Token认证：JWT：jsonwebtokenJava后端技术：便捷工
日精进石淑萍
【早上好#淑萍#20230605日精进335】分享嘉宾：海明教练社群运营架构专家全域流量孵化教练个人品牌超千万利润打造高手基本的创业者，对于商业模式的设计都是有漏洞的。股权架构今天我们讲的商业模式主要是盈利模式。很多社群运营会做裂变，不会做转化，因为没有后端的设计。不断的去积累，思考有哪些模式，需要去如何设计。政策领域：政府补贴➕大学生技术/大学生创业团队盈利模型——赋能板块核心一：长期锁客—资格
Python自动化测试web常见框架汇总自动化测试薰儿软件测试技术分享 python 前端开发语言
1、前言目前，有非常多的Python框架，用来帮助你更轻松的创建web应用。这些框架把相应的模块组织起来，使得构建应用的时候可以更快捷，也不用去关注一些细节（例如socket和协议），所以需要的都在框架里了。接下来我们会介绍不同的选项。经过初期的不起眼，Python已经成为互联网最流行的服务端编程语言之一。根据W3Techs的统计，它被用于很多的大流量的站点很多的大流量的站点很多的大流量的站点，超
python安装jupter在线ide 晚风拂柳颜生活小经验 python3 ide jupter
我在虚拟3.6.8的环境里面安装的，具体用了以下命令；pipinstallipython-ihttps://mirrors.aliyun.com/pypi/simple/pipinstalljupyter-ihttps://mirrors.aliyun.com/pypi/simple/jupyternotebook当然，jupter可以直接通过python环境里script目录下的jupyter-
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu