AvenueCyy

数据挖掘项目：银行信用评分卡建模分析（上篇）

kaggle上的Give Me Some Credit一个8年前的老项目，网上的分析说明有很多，但本人通过阅读后，也发现了很多的问题。比如正常随着月薪越高，违约率会下降。但对于过低的月薪，违约率却为0等。
因此，本人写这个项目的目的是按照自己对数据的理解（可能有的地方是错的，希望大家指正），对网上相关的分析进行改进。（主要集中在数据预处理）

1.理解数据

项目背景

随着人们的消费观念的升级，所谓的“花明天的钱，圆今天的梦”。银行以及私营企业推出了各种各样的消费金融服务，具有代表性的是各大银行的信用卡，支付宝的花呗、京东白条，还有一些专门针对针对学生群体的平台，比如趣分期哈、分期乐之类的，把这些统称为信用卡用户。
只要涉及到金融借贷的，就有可能有坏账的存在。每个公司都在用各种手段来降低坏账的发生，最常见的方法就是根据一定的规则，给每个用户打分进行预测，哪些用户可能会发生坏账，针对预测结果采取相应的措施。

本篇将针对历史坏账用户进行分析，分析坏账用户都有哪些特征，为后续的建模做准备。数据来自kaggle上的Give Me Some Credit根据信用评分建立原理，构建一个简易的信用评分卡模型——申请评分卡(A卡)，对用户自动评分。

数据获取

现在kaggle上获取数据好像要注册手机号，但是国外……所以，把数据的链接贴在这里了。
链接：https://pan.baidu.com/s/1jl9-r3FItlpHX-HP3-7d_A
提取码：mtq0

导入数据

# 需要导入的包
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import datetime
import scipy
%matplotlib inline
sns.set(style="ticks")
pd.set_option("display.max_columns",None)#展示所有列数据
pd.set_option("display.max_rows",None)#展示所有行数据
# 画图显示中文
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus'] = False
from sklearn.ensemble import RandomForestRegressor as rfr
from imblearn.over_sampling import SMOTE
from sklearn.linear_model import LogisticRegression as LR
import scikitplot as skplt

train = pd.read_csv('./cs-training.csv',index_col=0)
test = pd.read_csv('./cs-test.csv',index_col=0)

查看数据基本信息

train.head()

注：对测试数据也做同样的操作，这里只举例训练数据。

train.shape
(150000, 11)
test.shape
(101503, 11)

训练集数据150000个样本，11个特征。
测试集数据101503个样本，11个特征。

数据特征含义

SeriousDlqin2yrs -----出现 90 天或更长时间的逾期行为（即定义好坏客户）
RevolvingUtilizationOfUnsecuredLines ----- 贷款以及信用卡可用额度与总额度比例
age ----- 借款人借款年龄
NumberOfTime30-59DaysPastDueNotWorse----- 过去两年内出现35-59天逾期但是没有发展得更坏的次数
DebtRatio----- 每月偿还债务，赡养费，生活费用除以月总收入
MonthlyIncome -----月收入
NumberOfOpenCreditLinesAndLoans -----开放式贷款和信贷数量
NumberOfTimes90DaysLate -----过去两年内出现90天逾期或更坏的次数
NumberRealEstateLoansOrLines -----抵押贷款和房地产贷款数量，包括房屋净值信贷额度
NumberOfTime60-89DaysPastDueNotWorse -----过去两年内出现60-89天逾期但是没有发展得更坏的次数
NumberOfDependents -----家庭中不包括自身的家属人数（配偶，子女等）

查看描述统计信息

train.describe([0.01,0.03,0.05,0.07,0.1,0.25,.5,.75,.9,.99]).T

通过以上数据描述性信息可以看出：

有多个特征存在异常值。比如贷款额度与总额度比例存在大于1甚至几千的情况最大值为50708。年龄最小值为0，最大值为109的情况等等。这些异常值在数据探索性分析中将逐个进行说明。
多个特征存在有偏分布。比如贷款额度与总额度，月薪，负债率等特征。

train.info()

通过以上数据信息可以看出：

数据类型都为int或float，说明都是数值型的数据。
月薪和家属人数存在空缺值。

2.探索性数据分析

这是之前写的数据探索性分析，在分析时可以当做个参考，提供些思路。

目标特征分析：好坏客户特征

figure,ax = plt.subplots(figsize=(12,4))
train['SeriousDlqin2yrs'].value_counts().plot.pie(autopct='%1.1f%%')
plt.show()

正样本（好客户）占比93.3%，负样本（坏客户）占比6.7%。说明客户一般为好客户。我们需要捕捉的是坏客户，但由于比例太过悬殊，此时样本不平衡，需要后续进行处理。

贷款额度与总额度比例

fig= plt.figure(figsize=(14,4))
ax1=fig.add_subplot(1,2,1)
sns.distplot(train['RevolvingUtilizationOfUnsecuredLines'],kde=True)
ax1=fig.add_subplot(1,2,2)
sns.boxplot(y=train['RevolvingUtilizationOfUnsecuredLines'])
plt.show()

样本分布极度不平衡。大部分的值都在“0左右”，存在大量的异常数据。需要进行进一步的分析。
而这些异常数据可能是由于没有除以总额度造成的，或是别的一些情况。这就需要借助具体的业务进行分析。

一般认为贷款额度与总额度比例小于1是合理的情况。因此先分析比例小于时，贷款额度与总额度比例和好坏客户之间的关系。

cut_num=[0,0.3,0.5,0.7,1,10,100,1000,10000]
get_compare_plot(train,feature_plot="RevolvingUtilizationOfUnsecuredLines",cut_num=cut_num,is_qcut=False)

这里可以看到，当Revol(贷款额度与总额度比例) 小于1时，随着该比例的增加，客户违约率也在增加，符合业务逻辑。正常来说，应该是随着比例的增加，客户违约率也会增加，但是在大于1后，该规律发生了改变，因此对其进行进一步分析。

cut_num=[0,1,10,30,50,70,100,1000,10000,100000]
get_compare_plot(train,feature_plot="RevolvingUtilizationOfUnsecuredLines",cut_num=cut_num,is_qcut=False)

这里主要分析Revol大于10是什么情况。通过图像和数据可以发现，当比例大于10后，客户违约率在10~30达到高峰，然后下降，再往后的比例都差不多，上下浮动。
出现这个情况，此时要做的就是找到阈值，能分割正常值和异常值的阈值。我们可以认定10~30是一个分界点，因为它的违约率非常高，但是要注意，10-30这个区间内，客户数只有8人，随机性太大，因此不做考虑。发现1-10这个区间内的样本数足够，并且违约率也在上升，因此进一步分析。

cut_num=[]
for i in np.arange(-1,11,1):
    cut_num.append(i)
get_compare_plot(train,feature_plot="RevolvingUtilizationOfUnsecuredLines",cut_num=cut_num,is_qcut=False)

对1-10分析后，可以看到，在数据量足够的情况下（大于30），即1-4，违约率是在逐渐下降的，这不符合正常的规律性，应该是Revol越大，违约率越大。
我们发现在1-2时，违约率有了特别大的提升，从0.06到0.4。因此，可以认为阈值在这个区间内。

cut_num=[]
for i in np.arange(0.6,3.2,0.2):
    cut_num.append(i)
get_compare_plot(train,feature_plot="RevolvingUtilizationOfUnsecuredLines",cut_num=cut_num,is_qcut=False)

之间对0-1之间做过分析，因此从0.6开始。
通过和之前的分析对比来看，Revol在0~2内，违约率增加。超过2之后，客户数量迅速下降和违约率也有降低的趋势。因此，可以认为Revol=2，是我们要找的阈值。大于2的为异常值，小于2的为正常值。

print("贷款以及信用卡可用额度与总额度比例大于2的比重为：",100*(train['RevolvingUtilizationOfUnsecuredLines']>2).sum()/len(train),"%")

贷款以及信用卡可用额度与总额度比例大于2的比重为： 0.24733333333333332 %

大于2的异常值，我们可以删除。如下其占比非常低0.247%。也可以融到0~2的数据内。想到的方法有两个：一是对大于2的值统一进行缩放；二是分组，直接把大于2的值分组到0-1内。这里采用第二种分箱的方法，因为分箱的一个特点就是可以用来处理异常值。

cut_num=[-1,0,1,2,100000]
get_compare_plot(train,feature_plot="RevolvingUtilizationOfUnsecuredLines",cut_num=cut_num,is_qcut=False)

大于2的样本有371个。将该组与0-1进行合并。原因有两点：一是0-1数据量大，抗随机性强。不会因为371个样本产生太大的波动。二是因为这371个样本，如果正常计算，归属于0-1的概率最大，因为0-1样本占比最大。因此与0-1组进行合并。

以上是对Revol这个特征的一个比较全面的分析，通过不断分组探索数据的阈值，找出比较适合的切分点。这里最后的数据处理，仍然存在问题，即可能会引入数据噪声，因为不清楚总额度具体值为多少。
以下的特征依旧会这么处理，分析数据的合理性，找出阈值，对异常值进行处理。

年龄

fig= plt.figure(figsize=(14,4))
ax1=fig.add_subplot(1,2,1)
sns.distplot(train['age'],kde=True)
ax1=fig.add_subplot(1,2,2)
sns.boxplot(y=train['age'])
plt.show()

这里年龄的分布比较接近正态分布，因此，先使用四分位差的方法来找寻异常值。（上下四分位数±1.5~3倍的四分位差）

age_mean=train['age'].mean()
age_std=train['age'].std()
age_lowlimit=age_mean-3*age_std
age_uplimit=age_mean+3*age_std
print('异常值下限：',age_lowlimit,'异常值上限：',age_uplimit)
异常值下限： 7.979609077364238 异常值上限： 96.6108042559691

发现年龄的下限为8岁，上限为97岁。应用四分位差的方法来找寻异常值的一个前提条件是，数据最好服从正态分布，否则会有一些偏差。这里计算一下该数据的偏度和峰度。

print('峰度：',train['age'].skew(),'偏度：',train['age'].kurt())
峰度： 0.18899454512676198 偏度： -0.4946688326403583

发现峰度较小，偏度为负数，SK=-0.494，SK接近-0.5，即中度左偏分布。因此，用这个四分位差去判断不是很准确。接下来对图形进行分析，进一步判断异常值。

cut_num=[20,30,40,50,60,70,80,90,100,110]
get_compare_plot(train,feature_plot="age",cut_num=cut_num,is_qcut=False)

把年龄从20-110每10岁分一组。发现随着年龄的增加，客户违约率在逐渐降低。
1.（年龄越大，越不容易违约）但在100-110这个阶段，违约率上升，不符合规律。
2.年龄过大（100岁以上贷款），这种情况也比较少见。
3.之前的97岁，由于数据非正态分布，会出现偏差。如果以100为分界点，数比较整，也好处理。
因此，基于以上3个原因，选择100为异常值的阈值，大于100的删除。

过去两年内出现35-59天|60-89天|90天以上|逾期但是没有发展得更坏的次数

fig,[[ax1,ax2],[ax3,ax4],[ax5,ax6]] = plt.subplots(3,2,figsize=(20,15))
sns.distplot(train['NumberOfTime30-59DaysPastDueNotWorse'],ax=ax1)
sns.boxplot(y=train['NumberOfTime30-59DaysPastDueNotWorse'],ax=ax2)
sns.distplot(train['NumberOfTime60-89DaysPastDueNotWorse'],ax=ax3)
sns.boxplot(y=train['NumberOfTime60-89DaysPastDueNotWorse'],ax=ax4)
sns.distplot(train['NumberOfTimes90DaysLate'],ax=ax5)
sns.boxplot(y=train['NumberOfTimes90DaysLate'],ax=ax6)
plt.show()

通过分析可以发现，绝大多数值都在“0附近”，但也有次数超过80的异常值。

这里找出在限定范围内（两年内2*365），每种情况出现的最多次数。

30~59天24次。
60~89天最多的违规次数为12次。
90天以上最多的违规次数为8次。

print('两年内30~59天违规次数超过24次的样本数为：',(train['NumberOfTime30-59DaysPastDueNotWorse']>24).sum())
print('两年内60-89天违规次数超过12次的样本数为：',(train['NumberOfTime60-89DaysPastDueNotWorse']>12).sum())
print('两年内90天以上违规次数超过8次的样本数为：',(train['NumberOfTimes90DaysLate']>8).sum())
两年内30~59天违规次数超过24次的样本数为： 269
两年内60-89天违规次数超过12次的样本数为： 269
两年内90天以上违规次数超过8次的样本数为： 312

以上是训练集数据中出现的超过限定范围的样本数。将以上数据删除处理。

train["qcut_30-59"], updown = pd.qcut(train["NumberOfTime30-59DaysPastDueNotWorse"], retbins=True, q=20,duplicates='drop')
train["qcut_60-89"], updown = pd.qcut(train["NumberOfTime60-89DaysPastDueNotWorse"], retbins=True, q=20,duplicates='drop')
train["qcut_90"], updown = pd.qcut(train["NumberOfTimes90DaysLate"], retbins=True, q=20,duplicates='drop')

fig = plt.figure(figsize=(18,4))
ax1 = fig.add_subplot(131)
(train.groupby('qcut_30-59')['SeriousDlqin2yrs'].sum()/train.groupby('qcut_30-59')['SeriousDlqin2yrs'].count()).plot()
ax2 = fig.add_subplot(132)
(train.groupby('qcut_60-89')['SeriousDlqin2yrs'].sum()/train.groupby('qcut_60-89')['SeriousDlqin2yrs'].count()).plot()
ax3 = fig.add_subplot(133)
(train.groupby('qcut_90')['SeriousDlqin2yrs'].sum()/train.groupby('qcut_90')['SeriousDlqin2yrs'].count()).plot()
plt.show()

逾期的次数越多，客户违约率就越高，符合正常逻辑。

负债率

fig= plt.figure(figsize=(14,4))
ax1=fig.add_subplot(1,2,1)
sns.distplot(train['DebtRatio'],kde=True)
ax1=fig.add_subplot(1,2,2)
sns.boxplot(y=train['DebtRatio'])
plt.show()

负债率主要集中在“0附近”，正常来说，负债率应该是小于1的。但却有很多的值大于1，甚至上万，即存在异常值。

cut_num=[-1,0,0.3,0.5,0.7,1,10,100,1000,10000]
get_compare_plot(train,feature_plot="DebtRatio",cut_num=cut_num,is_qcut=False)

负债率在0-1之间，随着负债率的增加，违约率也在增加。
当负债率为0时，有着较高的违约率，这点需要从业务上去理解。可能是因为若无负债（每月偿还债务，赡养费，生活费用除以月总收入），比较不靠谱。
当负债率大于1时，随着负债率的增加，违约率无显著的变化规律。这里对大于1继续进行分析。

cut_num=[10,30,50,70,100]
get_compare_plot(train,feature_plot="DebtRatio",cut_num=cut_num,is_qcut=False)

负债率在10-100之间时，没有逻辑规律，虽然从图像上看数据变化较大，但违约率都在0.04左右，很低。

cut_num=[]
for i in np.arange(0,11,1):
    cut_num.append(i)
get_compare_plot(train,feature_plot="DebtRatio",cut_num=cut_num,is_qcut=False)

负债率在0-2时，随着负债率的增加，违约率也在增加。但大于2之后，负债率下降，然后在0.03-0.05上下波动。
可认定2为阈值，大于2的为异常值。但这个异常值的处理却有些问题，跟月薪的关系很大。

月薪

a=(len(train)-len(train_nM))/len(train)*100
print('家属人数缺失值比例为%.2f%%'%(a))
家属人数缺失值比例为19.82%。

之前说过，月薪存在缺失值，这里可看到缺失值的比例为19.82%。数值很大，采用随机森林进行填充。

fig= plt.figure(figsize=(14,4))
ax1=fig.add_subplot(1,2,1)
sns.distplot(train_nM['MonthlyIncome'],kde=True)
ax1=fig.add_subplot(1,2,2)
sns.boxplot(y=train_nM['MonthlyIncome'])
plt.show()

月薪的分布也是极度右偏的。有数额特别大的异常值。

cut_num=[0,1000,5000,10000,15000,20000,100000]
get_compare_plot(train,feature_plot="MonthlyIncome",cut_num=cut_num,is_qcut=False)

随着月薪的增加，客户违约率逐渐下降。当月薪超过20000后，违约率又有上升趋势，说明月薪太大，客户收入不稳定。
注意到0-1000这个月薪范围内跟正常的规律不一样。进行进一步的判断。

train_nM_2=train_nM.loc[(train_nM['MonthlyIncome']>1)&(train_nM['MonthlyIncome']<=3000),:]
sns.scatterplot(x='MonthlyIncome',y='DebtRatio',data=train_nM_2,hue='SeriousDlqin2yrs')

绘制月薪和负债率的散点图，发现500-3000月薪的负债率都很低，有比较稳定的规律性，但是0-500之间却很高。因此对0-500进行进一步分析。

train_nM_2=train_nM.loc[(train_nM['MonthlyIncome']>1)&(train_nM['MonthlyIncome']<700),:]
sns.scatterplot(x='MonthlyIncome',y='DebtRatio',data=train_nM_2,hue='SeriousDlqin2yrs')

月薪在0-100之间，负债率特别高，但是违约率却很低，说明月薪在这里被算小了，可能是客户在输入金额时把自己的年薪输入进去，由于输入金额时，差的都是1000倍。因此，将0-100之间的金额乘1000再除以12，以求出正常的月薪，同时负债率也要跟着一起变化0.012倍。

注：
另外，通过分析还发现了月薪为0,1和NaN值的，负债率也特别高。这里不把1当做金额输入错误的值是因为月薪为1的有605个，因此怀疑其跟0和NaN的含义一样，都是“空值”。
之前有过想法是这些负债率在计算的时候，由于月薪未知，所以计算出来的负债率其实是每个月需要偿还的钱。但这个想法也只是个假设，具体的问题还要跟业务相关联。所以，不对这些月薪进行这个假设处理，而是进行分箱处理。

开放式贷款和信贷数量

fig= plt.figure(figsize=(14,4))
ax1=fig.add_subplot(1,2,1)
sns.distplot(train['NumberOfOpenCreditLinesAndLoans'],kde=True)
ax1=fig.add_subplot(1,2,2)
sns.boxplot(y=train['NumberOfOpenCreditLinesAndLoans'])
plt.show()

通过直方图可以看到，数据是右偏分布，可能存在异常值。
通过箱线图可以看到，存在一些离散值。但由于这些离散值较多且连续，因此需要进一步判断是不是异常值。

cut_num=[-1,0,1,3,5,7,10,20,30,40]
get_compare_plot(train,feature_plot="NumberOfOpenCreditLinesAndLoans",cut_num=cut_num,is_qcut=False)

随着信贷数量增加，客户违约率在不断降低，最后基本保持在0.06左右。即信贷数量越多，说明该客户越值得信赖。
这里可以认定大于30的为异常值，因为30-40的样本量突然下降。
但也可以通过箱线图看出，30-40的值为连续的，没有断点。这里先不按照异常值进行处理。

抵押贷款和房地产贷款数量

fig= plt.figure(figsize=(14,4))
ax1=fig.add_subplot(1,2,1)
sns.distplot(train['NumberRealEstateLoansOrLines'],kde=True)
ax1=fig.add_subplot(1,2,2)
sns.boxplot(y=train['NumberRealEstateLoansOrLines'])
plt.show()

通过直方图能看到数据是极度右偏的分布，另外箱线图上也能明显地看到离群点。

cut_num=[-1,0,1,3,5,7,10,15,20,25,50]
get_compare_plot(train,feature_plot="NumberRealEstateLoansOrLines",cut_num=cut_num,is_qcut=False)

当抵押贷款和房地产贷款数量为0时，客户有一定的违约率，跟之前的负债率一样。
当抵押贷款和房地产贷款数量大于0，小于20时，随着数量的增加，客户违约率也在不断增加。
由于10-20内有84个样本，大于20的一共有9个样本。因此，从样本数量和违约规律上，可以认定大于20的为异常，将其删除。

家属人数（配偶，子女等）

b=(len(train)-len(train_nN))/len(train)*100
print('家属人数缺失值比例为%.2f%%'%(b))
家属人数缺失值比例为2.62%

之前说过，家属人数存在缺失值，这里可看到缺失值的比例为2.62%。数值不大，可以使用众数填充。

fig= plt.figure(figsize=(14,4))
ax1=fig.add_subplot(1,2,1)
sns.distplot(train_nN['NumberOfDependents'],kde=True)
ax1=fig.add_subplot(1,2,2)
sns.boxplot(y=train_nN['NumberOfDependents'])
plt.show()

从箱线图可以很明显地看到存在异常值。那个20特别醒目。。。

cut_num=[-1,0,1,3,5,7,9,15,20]
get_compare_plot(train,feature_plot="NumberOfDependents",cut_num=cut_num,is_qcut=False)

随着家属人数增加，客户违约率增加。因为家属人数增加，家庭开销增加，需要的开销也就增加。当单身时（家属人数为0）客户违约率最小为0.058。
异常值20需删除。
将大于5的可分为一箱处理。

3.数据预处理

数据预处理，这里包含一些之前整理过的异常值处理，填补缺失值和数据不平衡处理的方法。

去除重复值

train.duplicated(keep='first').sum()
609
train.drop_duplicates(keep='first',inplace=True)
train.duplicated(keep='first').sum()
0
train.index = range(train.shape[0])

异常值处理

def data_deal(data):
    #data=data[data['RevolvingUtilizationOfUnsecuredLines']<=2]
    data=data[(data['age']>=18)&(data['age']<=100)]
    data=data[data['NumberOfTime30-59DaysPastDueNotWorse']<24]
    data=data[data['NumberOfTime60-89DaysPastDueNotWorse']<12]
    data=data[data['NumberOfTimes90DaysLate']<8]
    data=data[data['DebtRatio']<=1]
    #data=data[data['NumberOfOpenCreditLinesAndLoans']<50]
    data=data[data['NumberRealEstateLoansOrLines']<20]
    data=data[data['NumberOfDependents']<20]
    return data
    
train_data = data_deal(train)
test_data = data_deal(test)

填补缺失值

众数填补缺失值

train_data.loc[:,"NumberOfDependents"] = train_data.loc[:,"NumberOfDependents"].fillna(train_data.loc[:,"NumberOfDependents"].median())

随机森林填补缺失值

def fill_missing_rf(X,y,to_fill):

    df = X.copy()
    fill = df.loc[:,to_fill]
    df = pd.concat([df.loc[:,df.columns != to_fill],pd.DataFrame(y)],axis=1)

    Ytrain = fill[fill.notnull()]
    Ytest = fill[fill.isnull()]

    Xtrain = df.loc[Ytrain.index,:]
    Xtest = df.loc[Ytest.index,:]
    
    rfr = rfr(n_estimators=200)
    rfr = rfr.fit(Xtrain,Ytrain)
    Ypredict = rfr.predict(Xtest)
    
    return Ypredict

X = train_data.iloc[:,1:]
y = train_data["SeriousDlqin2yrs"]

y_pred = fill_missing_rf(X,y,"MonthlyIncome")
train_data.loc[train_data.loc[:,"MonthlyIncome"].isnull(),"MonthlyIncome"] = y_pred

数据不平衡处理

之前提到过数据中正负样本比例不均衡，为了尽可能捕捉坏样本。这里采用SMOTE算法对数据进行上采样。

X = train_data.iloc[:,1:]
y = train_data.iloc[:,0]
 
n_sample = X.shape[0]
n_1_sample = y.value_counts()[1]
n_0_sample = y.value_counts()[0]
print('样本个数：{}; 坏样本(1)占{:.2%}; 好样本(0)占{:.2%}'.format(n_sample,n_1_sample/n_sample,n_0_sample/n_sample))
样本个数：149101; 坏样本(1)占6.59%; 好样本(0)占93.41%

sm = SMOTE(random_state=42)
X,y = sm.fit_sample(X,y)

n_sample_ = X.shape[0]
n_1_sample = pd.Series(y).value_counts()[1]
n_0_sample = pd.Series(y).value_counts()[0]
 
print('样本个数：{}; 坏样本(1)占{:.2%}; 好样本(0)占{:.2%}'.format(n_sample_,n_1_sample/n_sample_,n_0_sample/n_sample_))
样本个数：278540; 坏样本(1)占50.00%; 好样本(0)占50.00%

小结

通过对数据进行探索性分析，更加了解数据，从中观察出数据的一些规律和问题，这样在后续的预处理过程中，也能有些思路。

以上是对数据分析和处理的过程，但其中还有很多的不足，比如对月薪和负债率的分析处理，数据预处理的方式等，大家有好的建议可以多多指正，感谢！

接下来是对数据进行特征工程，如特征衍生，数据分箱等。构建逻辑回归模型来进行预测，并利用ROC-AUC和KS进行评估。最后建立评分卡。

数据挖掘项目：银行信用评分卡建模分析（下篇）

你可能感兴趣的:(数据挖掘项目)

关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
git - Webhook让部署自动化大猪大猪
我们现在有一个需求，将项目打包上传到gitlab或者github后，程序能自动部署，不用手动地去服务器中进行项目更新并运行，如何做到？这里我们可以使用gitlab与github的挂钩，挂钩的原理就是，每当我们有请求到gitlab与github服务器时，这时他俩会根据我们配置的挂钩地扯进行访问，webhook挂钩程序会一直监听着某个端口请求，一但收到他们发过来的请求，这时就知道用户有请求提交了，这时
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
冬天短期的暴利小生意有哪些？那些小生意适合新手做？一起高省
短期生意不失为创业的一个商机，不过短期生意的商机是转瞬即逝的，而且这类生意也很难作为长期的生意去做，那冬天短期暴利小生意查看更多关于短期暴利小生意的文章有哪些呢?给大家先推荐一个2023年风口项目吧，真很不错的项目，全程零投资，当做副业来做真的很稳定，不管你什么阶层的人，或多或少都网购吧？你们知道网购是可以拿提成，拿返利，拿分佣的吗？你们知道很多优惠券群里面，天天群主和管理发一些商品吗？他们其实在
高级 ECharts 技巧：自定义图表主题与样式 SnowMan1993 echarts 信息可视化数据分析
ECharts是一个强大的数据可视化库，提供了多种内置主题和样式，但你也可以根据项目的设计需求，自定义图表的主题与样式。本文将介绍如何使用ECharts自定义图表主题，以提升数据可视化的吸引力和一致性。1.什么是ECharts主题？ECharts的主题是指定义图表样式的配置项，包括颜色、字体、线条样式等。通过预设主题，你可以快速更改图表的整体风格，而自定义主题则允许你在此基础上进行个性化设置。2.
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
果然只有离职的时候，才有人敢说真话！ return2ok
今天公司出了神贴。今天中午吃饭，同事问我看了论坛上的神贴了吗？什么帖子？我问。同事显得很惊讶，你居然没看，现在那个帖子可能会成为年度最佳帖子。这么厉害？我等不及了，饭没吃完就快速的奔向办公室，打开公司论坛，我要一睹这个帖子的神奇。写这帖子的童鞋胆儿真肥。这哪里是一个帖子，这是很多个帖子，组成了一个系列。某人从公司文化、管理、人事、项目管理等多个方面分析了公司的概况，并抨击了公司的各种弊端，并提出了
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
如何选择最适合你的项目研发管理软件？TAPD卓越版全面解析北京云巴巴信息技术有限公司产品经理需求分析
在当今快速发展的科技时代，项目研发管理软件已成为企业不可或缺的重要工具。面对市场上琳琅满目的产品，如何选择一款适合自己团队的项目研发管理软件呢？本文将围绕项目研发管理软件的选择标准，重点介绍TAPD卓越版的特点、优势以及使用体验，让你更好地理解和选择适合自己的项目研发管理软件。项目研发管理软件的选择标准在选择项目研发管理软件时，我们需要考虑以下几个方面的因素：功能全面性：软件是否覆盖了从需求管理、
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
快乐春节 Lilywo
春节肯定是大多小朋友都喜欢的节日吧，因为春节的娱乐项目可多啦，下面我就带大家去看一看某些娱乐项目吧！第一件肯定就是穿新衣啦！因为辞旧迎新，一年过去了，要迎来新的一年。所以过年穿新衣也是一项习俗吧；第二件，收压岁钱。压岁钱大家都知道吧，过年的时候，小朋友们肯定都会受到大人们的压岁钱吧，对啦！大家知道为什么亲人们会给我们压岁钱呢？答案是因为亲人们希望我们在新的一年里可以健健康康、平平安安，幸福福的生活
spring如何整合druid连接池？惜.己 spring spring junit 数据库 java idea 后端 xml
目录spring整合druid连接池1.新建maven项目2.新建mavenModule3.导入相关依赖4.配置log4j2.xml5.配置druid.xml1)xml中如何引入properties2)下面是配置文件6.准备jdbc.propertiesJDBC配置项解释7.配置druid8.测试spring整合druid连接池1.新建maven项目打开IDE（比如IntelliJIDEA,Ecl
vue项目element-ui的table表格单元格合并酋长哈哈 vue.js elementui javascript 前端
一、合并效果二全部代码exportdefault{name:'CellMerge',data(){return{tableData:[{id:'1',name:'王小虎',amount1:'165',amount2:'3.2',amount3:10},{id:'1',name:'王小虎',amount1:'162',amount2:'4.43',amount3:12},{id:'1',name:'
android 更改窗口的层次,浮窗开发之窗口层级 Ms.Bu android 更改窗口的层次
最近在项目中遇到了这样的需求：需要在特定的其他应用之上悬浮自己的UI交互(拖动、输入等复杂的UI交互)，和九游的浮窗类似，不过我们的比九游的体验更好，我们越过了很多授权的限制。浮窗效果很多人都知道如何去实现一个简单的浮窗，但是却很少有人去深入的研究背后的流程机制，由于项目中浮窗交互比较复杂，遇到了些坑查看了很多资料，故总结浮窗涉及到的知识点：窗口层级关系(浮窗是如何“浮”的)？浮窗有哪些限制，如何
springboot+vue项目实战一-创建SpringBoot简单项目苹果酱0567 面试题汇总与解析 spring boot 后端 java 中间件开发语言
这段时间抽空给女朋友搭建一个个人博客，想着记录一下建站的过程，就当做笔记吧。虽然复制zjblog只要一个小时就可以搞定一个网站，或者用cms系统，三四个小时就可以做出一个前后台都有的网站，而且想做成啥样也都行。但是就是要从新做，自己做的意义不一样，更何况，俺就是专门干这个的，嘿嘿嘿要做一个网站，而且从零开始，首先呢就是技术选型了，经过一番思量决定选择-SpringBoot做后端，前端使用Vue做一
react-intl——react国际化使用方案苹果酱0567 面试题汇总与解析 java 开发语言中间件 spring boot 后端
国际化介绍i18n：internationalization国家化简称，首字母+首尾字母间隔的字母个数+尾字母，类似的还有k8s(Kubernetes)React-intl是React中最受欢迎的库。使用步骤安装#usenpmnpminstallreact-intl-D#useyarn项目入口文件配置//index.tsximportReactfrom"react";importReactDOMf
基于STM32与Qt的自动平衡机器人：从控制到人机交互的的详细设计流程极客小张 stm32 qt 机器人物联网人机交互毕业设计 c语言
一、项目概述目标和用途本项目旨在开发一款基于STM32控制的自动平衡机器人，结合步进电机和陀螺仪传感器，实现对平衡机器人的精确控制。该机器人可以用于教育、科研、娱乐等多个领域，帮助用户了解自动控制、机器人运动学等相关知识。技术栈关键词STM32单片机步进电机陀螺仪传感器AD采集电路Qt人机界面实时数据监控二、系统架构系统架构设计本项目的系统架构设计包括以下主要组件：控制单元:STM32单片机传感器
基于STM32的汽车仪表显示系统：集成CAN、UART与I2C总线设计流程极客小张 stm32 汽车嵌入式硬件物联网单片机 c语言
一、项目概述项目目标与用途本项目旨在设计和实现一个基于STM32微控制器的汽车仪表显示系统。该系统能够实时显示汽车的速度、转速、油量等关键信息，并通过CAN总线与其他汽车控制单元进行通信。这种仪表显示系统不仅提高了驾驶的安全性和便捷性，还能为汽车提供更智能的用户体验。技术栈关键词微控制器：STM32显示技术：TFTLCD/OLED传感器：速度传感器、温度传感器、油量传感器通信协议：CAN总线、UA
JAVA·一个简单的登录窗口 MortalTom java 开发语言学习
文章目录概要整体架构流程技术名词解释技术细节资源概要JavaSwing是Java基础类库的一部分，主要用于开发图形用户界面（GUI）程序整体架构流程新建项目，导入sql.jar包（链接放在了文末），编译项目并运行技术名词解释一、特点丰富的组件提供了多种可视化组件，如按钮（JButton）、文本框（JTextField）、标签（JLabel）、下拉列表（JComboBox）等，可以满足不同的界面设计
Python实现下载当前年份的谷歌影像 sand&wich python 开发语言
在GIS项目和地图应用中，获取最新的地理影像数据是非常重要的。本文将介绍如何使用Python代码从Google地图自动下载当前年份的影像数据，并将其保存为高分辨率的TIFF格式文件。这个过程涉及地理坐标转换、多线程下载和图像处理。关键功能该脚本的核心功能包括：坐标转换：支持WGS-84与WebMercator投影之间转换，以及处理中国GCJ-02偏移。自动化下载：多线程下载地图瓦片，提高效率。图像
项目：事半功倍的法宝小小效能
行动的三大流程：记录、排程和执行，也讲了易效能的4D原则以及T-step标签法。这些流程和方法能够解决我们眼前的一地鸡毛，让我们有更多时间和精力去关注更为长远的事情，完成工作、生活和人生中重要的项目。项目管理能够让我们围绕结果去做事情，达成事半功倍的效果，也就是做更少的事情，但达成更好的效果。如果我们能够不断地达成一个又一个的项目，那么我们的人生无疑会像滚雪球一样，在长坡道上面不断积累。一、项目的
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，