littleadams

基于逻辑回归模型的信用卡欺诈检测

1. 项目概况

某银行为提升信用卡反欺诈检测能力，提供了脱敏后的一份个人交易记录。考虑数据本身的隐私性，数据提供之初已经进行了类似PCA的处理，并得到了若干数据特征。在不需要做额外特征提取工作的情况下，本项目意在通过逻辑回归模型的调优，得到较为准确可靠的反欺诈检测方法，分析过程中使用到了Python Pandas, Numpy, Matplotlib, Seaborn以及机器学习库Scikit-Learn等。

2. 数据前处理

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns

data = pd.read_csv('creditcard.csv')

信用卡数据预览

data.head()

.dataframe tbody tr th:only-of-type { vertical-align: middle; } .dataframe tbody tr th { vertical-align: top; } .dataframe thead th { text-align: right; }

	Time	V1	V2	V3	V4	V5	V6	V7	V8	V9	…	V21	V22	V23	V24	V25	V26	V27	V28	Amount
0	0.0	-1.359807	-0.072781	2.536347	1.378155	-0.338321	0.462388	0.239599	0.098698	0.363787	…	-0.018307	0.277838	-0.110474	0.066928	0.128539	-0.189115	0.133558	-0.021053	149.62
1	0.0	1.191857	0.266151	0.166480	0.448154	0.060018	-0.082361	-0.078803	0.085102	-0.255425	…	-0.225775	-0.638672	0.101288	-0.339846	0.167170	0.125895	-0.008983	0.014724	2.69
2	1.0	-1.358354	-1.340163	1.773209	0.379780	-0.503198	1.800499	0.791461	0.247676	-1.514654	…	0.247998	0.771679	0.909412	-0.689281	-0.327642	-0.139097	-0.055353	-0.059752	378.66
3	1.0	-0.966272	-0.185226	1.792993	-0.863291	-0.010309	1.247203	0.237609	0.377436	-1.387024	…	-0.108300	0.005274	-0.190321	-1.175575	0.647376	-0.221929	0.062723	0.061458	123.50
4	2.0	-1.158233	0.877737	1.548718	0.403034	-0.407193	0.095921	0.592941	-0.270533	0.817739	…	-0.009431	0.798278	-0.137458	0.141267	-0.206010	0.502292	0.219422	0.215153	69.99

5 rows × 31 columns

查看各字段统计值

data.describe()

	Time	V1	V2	V3	V4	V5	V6	V7	V8	V9	…	V21	V22	V23	V24	V25	V26	V27	V28	Amount	Class
count	284807.000000	2.848070e+05	2.848070e+05	2.848070e+05	2.848070e+05	2.848070e+05	2.848070e+05	2.848070e+05	2.848070e+05	2.848070e+05	…	2.848070e+05	2.848070e+05	2.848070e+05	2.848070e+05	2.848070e+05	2.848070e+05	2.848070e+05	2.848070e+05	284807.000000	284807.000000
mean	94813.859575	3.919560e-15	5.688174e-16	-8.769071e-15	2.782312e-15	-1.552563e-15	2.010663e-15	-1.694249e-15	-1.927028e-16	-3.137024e-15	…	1.537294e-16	7.959909e-16	5.367590e-16	4.458112e-15	1.453003e-15	1.699104e-15	-3.660161e-16	-1.206049e-16	88.349619	0.001727
std	47488.145955	1.958696e+00	1.651309e+00	1.516255e+00	1.415869e+00	1.380247e+00	1.332271e+00	1.237094e+00	1.194353e+00	1.098632e+00	…	7.345240e-01	7.257016e-01	6.244603e-01	6.056471e-01	5.212781e-01	4.822270e-01	4.036325e-01	3.300833e-01	250.120109	0.041527
min	0.000000	-5.640751e+01	-7.271573e+01	-4.832559e+01	-5.683171e+00	-1.137433e+02	-2.616051e+01	-4.355724e+01	-7.321672e+01	-1.343407e+01	…	-3.483038e+01	-1.093314e+01	-4.480774e+01	-2.836627e+00	-1.029540e+01	-2.604551e+00	-2.256568e+01	-1.543008e+01	0.000000	0.000000
25%	54201.500000	-9.203734e-01	-5.985499e-01	-8.903648e-01	-8.486401e-01	-6.915971e-01	-7.682956e-01	-5.540759e-01	-2.086297e-01	-6.430976e-01	…	-2.283949e-01	-5.423504e-01	-1.618463e-01	-3.545861e-01	-3.171451e-01	-3.269839e-01	-7.083953e-02	-5.295979e-02	5.600000	0.000000
50%	84692.000000	1.810880e-02	6.548556e-02	1.798463e-01	-1.984653e-02	-5.433583e-02	-2.741871e-01	4.010308e-02	2.235804e-02	-5.142873e-02	…	-2.945017e-02	6.781943e-03	-1.119293e-02	4.097606e-02	1.659350e-02	-5.213911e-02	1.342146e-03	1.124383e-02	22.000000	0.000000
75%	139320.500000	1.315642e+00	8.037239e-01	1.027196e+00	7.433413e-01	6.119264e-01	3.985649e-01	5.704361e-01	3.273459e-01	5.971390e-01	…	1.863772e-01	5.285536e-01	1.476421e-01	4.395266e-01	3.507156e-01	2.409522e-01	9.104512e-02	7.827995e-02	77.165000	0.000000
max	172792.000000	2.454930e+00	2.205773e+01	9.382558e+00	1.687534e+01	3.480167e+01	7.330163e+01	1.205895e+02	2.000721e+01	1.559499e+01	…	2.720284e+01	1.050309e+01	2.252841e+01	4.584549e+00	7.519589e+00	3.517346e+00	3.161220e+01	3.384781e+01	25691.160000	1.000000

8 rows × 31 columns

查看欺诈类别的具体分布

plt.figure(figsize=(7,5))

sns.countplot(x='Class', data=data)
plt.title('Fraud Class Histogram')
plt.xlabel('Class')
plt.ylabel('Frequency')

print('正常用户数 ：', data.Class.value_counts()[0])
print('欺诈用户数 ：', data.Class.value_counts()[1])

    正常用户数 ： 284315
    欺诈用户数 ： 492

可以看到样本数据存在很大的不均衡性，欺诈用户数明显少于正常用户。样本的不均衡对后续的模型评估效果存在较大影响，因此将会采用下采样及上采样两种方式调整样本的均衡

样本特征归一化

data1 = data.copy()

from sklearn.preprocessing import StandardScaler

data1['NormAmount'] = StandardScaler().fit_transform(data1['Amount'].reshape(-1,1))
data1.drop(['Time', 'Amount'], axis=1, inplace=True)
data1.head()

	V1	V2	V3	V4	V5	V6	V7	V8	V9	V10	…	V21	V22	V23	V24	V25	V26	V27	V28	NormAmount
0	-1.359807	-0.072781	2.536347	1.378155	-0.338321	0.462388	0.239599	0.098698	0.363787	0.090794	…	-0.018307	0.277838	-0.110474	0.066928	0.128539	-0.189115	0.133558	-0.021053	0.244964
1	1.191857	0.266151	0.166480	0.448154	0.060018	-0.082361	-0.078803	0.085102	-0.255425	-0.166974	…	-0.225775	-0.638672	0.101288	-0.339846	0.167170	0.125895	-0.008983	0.014724	-0.342475
2	-1.358354	-1.340163	1.773209	0.379780	-0.503198	1.800499	0.791461	0.247676	-1.514654	0.207643	…	0.247998	0.771679	0.909412	-0.689281	-0.327642	-0.139097	-0.055353	-0.059752	1.160686
3	-0.966272	-0.185226	1.792993	-0.863291	-0.010309	1.247203	0.237609	0.377436	-1.387024	-0.054952	…	-0.108300	0.005274	-0.190321	-1.175575	0.647376	-0.221929	0.062723	0.061458	0.140534
4	-1.158233	0.877737	1.548718	0.403034	-0.407193	0.095921	0.592941	-0.270533	0.817739	0.753074	…	-0.009431	0.798278	-0.137458	0.141267	-0.206010	0.502292	0.219422	0.215153	-0.073403

5 rows × 30 columns

3. 下采样

获取未经采样的特征与类别标签

X = data1.loc[:, data1.columns!='Class']
y = data1.loc[:, data1.columns=='Class']

获取下采样后的特征与类别标签

num_fraud_class = data1[data1.Class == 1].shape[0] # 欺诈用户数
fraud_indices = np.array(data1[data1.Class == 1].index) # 欺诈用户的index
normal_indices = np.array(data1[data1.Class == 0].index) # 正常用户的index

# 从正常用户中随机抽取与欺诈用户数相等的正常用户
random_normal_indices = np.random.choice(normal_indices, num_fraud_class, replace=False)
random_normal_indices = np.array(random_normal_indices)

# 将随机抽取的正常用户与欺诈用户结合，形成均衡的下采样数据集
undersampled_indices = np.concatenate([random_normal_indices, fraud_indices])
X_undersampled = X.loc[undersampled_indices, :]
y_undersampled = y.loc[undersampled_indices, :]

# 显示下采样后用户类别占比
print('Percentage of normal transaction : ', len(random_normal_indices) / X_undersampled.shape[0])
print('Percentage of fraud transaction : ', len(fraud_indices) / X_undersampled.shape[0])
print('Total number of transactions in undersampled dataset : ',X_undersampled.shape[0])

Percentage of normal transaction :  0.5
Percentage of fraud transaction :  0.5
Total number of transactions in undersampled dataset :  984

划分训练集和测试集

from sklearn.model_selection import train_test_split

# 原始数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=1)

print('Number of transactions in training dataset : ', X_train.shape[0])
print('Number of transactions in test dataset : ', X_test.shape[0])

print('Percentage of fraud transactions in the whole dataset : ', y[y.Class == 1].shape[0] / y.shape[0])
print('Percentage of fraud transactions in the training dataset : ', y_train[y_train.Class == 1].shape[0] / y_train.shape[0])

Number of transactions in training dataset :  199364
Number of transactions in test dataset :  85443
Percentage of fraud transactions in the whole dataset :  0.001727485630620034
Percentage of fraud transactions in the training dataset :  0.0017906944082181336

# 原始数据集
X_train_undersampled, X_test_undersampled, y_train_undersampled, y_test_undersampled = train_test_split(X_undersampled, y_undersampled, test_size=0.3, random_state=1)

print('Number of transactions in training dataset : ', X_train_undersampled.shape[0])
print('Number of transactions in test dataset : ', X_test_undersampled.shape[0])

print('Percentage of fraud transactions in the undersampled dataset : ', y_undersampled[y_undersampled.Class == 1].shape[0] / y_undersampled.shape[0])
print('Percentage of fraud transactions in the undersampled training dataset : ', y_train_undersampled[y_train_undersampled.Class == 1].shape[0] / y_train_undersampled.shape[0])

Number of transactions in training dataset :  688
Number of transactions in test dataset :  296
Percentage of fraud transactions in the undersampled dataset :  0.5
Percentage of fraud transactions in the undersampled training dataset :  0.49127906976744184

交叉验证与参数调优

from sklearn.linear_model import LogisticRegression
from sklearn.cross_validation import KFold, cross_val_score
from sklearn.metrics import recall_score, confusion_matrix, classification_report

def print_KFold_scores(X_train, y_train):

    fold = KFold(y_train.shape[0], n_folds=5, random_state=1, shuffle=False)

    # 尝试不同的c parameter
    c_params = [0.01, 0.1, 1, 10, 100]

    df_results = pd.DataFrame(columns=['C_parameters','Mean_Recall_Score'])

    # KFold会返回两个list，train_indices = indices[0], test_indices = indices[1]
    j = 0
    for c_param in c_params:
        print('----------------------------------------')
        print('C parameter : ', c_param)
        print('----------------------------------------')
        print('')

        recallScores = []

        for i, indices in enumerate(fold, start=1):

            lr = LogisticRegression(C=c_param, penalty='l1')
            lr.fit(X_train.iloc[indices[0],:].values, y_train.iloc[indices[0],:].values.reshape(-1,1))

            y_pred = lr.predict(X_train.iloc[indices[1],:].values)

            recallScore = recall_score(y_train.iloc[indices[1],:].values, y_pred)
            recallScores.append(recallScore)

            print("Iteration ", i, ": recall score = ", recallScore)

        df_results.loc[j, 'C_parameters'] = c_param
        df_results.loc[j, 'Mean_Recall_Score'] = np.mean(recallScores)
        j += 1
        print("Mean Recall Score = ", np.mean(recallScores))

    best_c_param = df_results[df_results.Mean_Recall_Score == np.max(df_results.Mean_Recall_Score)]['C_parameters'].values[0]

    print('*****************************************************')
    print('Best C parameter chosen by cross validation = ', best_c_param)
    print('*****************************************************')

    return best_c_param

best_c = print_KFold_scores(X_train_undersampled, y_train_undersampled)

----------------------------------------
C parameter :  0.01
----------------------------------------

Iteration  1 : recall score =  0.9538461538461539
Iteration  2 : recall score =  0.9558823529411765
Iteration  3 : recall score =  0.9402985074626866
Iteration  4 : recall score =  0.9710144927536232
Iteration  5 : recall score =  0.927536231884058
Mean Recall Score =  0.9497155477775395
----------------------------------------
C parameter :  0.1
----------------------------------------

Iteration  1 : recall score =  0.8
Iteration  2 : recall score =  0.9411764705882353
Iteration  3 : recall score =  0.8955223880597015
Iteration  4 : recall score =  0.9565217391304348
Iteration  5 : recall score =  0.8115942028985508
Mean Recall Score =  0.8809629601353844
----------------------------------------
C parameter :  1
----------------------------------------

Iteration  1 : recall score =  0.8307692307692308
Iteration  2 : recall score =  0.9411764705882353
Iteration  3 : recall score =  0.9104477611940298
Iteration  4 : recall score =  0.9710144927536232
Iteration  5 : recall score =  0.7971014492753623
Mean Recall Score =  0.8901018809160963
----------------------------------------
C parameter :  10
----------------------------------------

Iteration  1 : recall score =  0.8461538461538461
Iteration  2 : recall score =  0.9411764705882353
Iteration  3 : recall score =  0.9104477611940298
Iteration  4 : recall score =  0.9855072463768116
Iteration  5 : recall score =  0.8115942028985508
Mean Recall Score =  0.8989759054422948
----------------------------------------
C parameter :  100
----------------------------------------



C:\Users\user\Anaconda3\lib\site-packages\sklearn\utils\validation.py:578: DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples, ), for example using ravel().
  y = column_or_1d(y, warn=True)


Iteration  1 : recall score =  0.8307692307692308
Iteration  2 : recall score =  0.9411764705882353
Iteration  3 : recall score =  0.9104477611940298
Iteration  4 : recall score =  0.9855072463768116
Iteration  5 : recall score =  0.8115942028985508
Mean Recall Score =  0.8958989823653717
*****************************************************
Best C parameter chosen by cross validation =  0.01
*****************************************************

定义混淆矩阵绘制函数

import itertools

def plot_confusion_matrix(conf_mat, classes, title='Confusion Matrix', cmap=plt.cm.Blues):

    plt.imshow(conf_mat, interpolation='nearest', cmap=cmap)
    plt.title(title)
    plt.colorbar()
    tick_marks = np.arange(len(classes))
    plt.xticks(tick_marks, classes, rotation=0)
    plt.yticks(tick_marks, classes)

    thresh = conf_mat.max() / 2
    for i, j in itertools.product(range(conf_mat.shape[0]), range(conf_mat.shape[1])):
        plt.text(j, i, conf_mat[i,j], horizontalalignment='center', color='white' if conf_mat[i,j] > thresh else 'black')

    plt.tight_layout()
    plt.xlabel('Predicted Label')
    plt.ylabel('True Label')

基于下采样数据创建LR，并对下采样测试集进行预测

lr = LogisticRegression(C=best_c, penalty='l1')
lr.fit(X_train_undersampled, y_train_undersampled)
y_pred_undesampled = lr.predict(X_test_undersampled)

# 绘制混淆矩阵

cnf_matrix = confusion_matrix(y_test_undersampled, y_pred_undesampled)
np.set_printoptions(precision=2)

print('Recall score in the undersampled test dataset : ', cnf_matrix[1,1] / (cnf_matrix[1,0] + cnf_matrix[1,1]))

classes = [0,1]
plt.figure()
plot_confusion_matrix(cnf_matrix, classes)

Recall score in the undersampled test dataset :  0.922077922077922

基于下采样数据创建LR，并对总测试集进行预测

lr = LogisticRegression(C=best_c, penalty='l1')
lr.fit(X_train_undersampled, y_train_undersampled)
y_pred = lr.predict(X_test)

cnf_matrix = confusion_matrix(y_test, y_pred)
np.set_printoptions(precision=2)

print('Recall score in the whole test dataset : ', cnf_matrix[1,1] / (cnf_matrix[1,0] + cnf_matrix[1,1]))

classes = [0,1]
plt.figure()
plot_confusion_matrix(cnf_matrix, classes)

C:\Users\user\Anaconda3\lib\site-packages\sklearn\utils\validation.py:578: DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples, ), for example using ravel().
  y = column_or_1d(y, warn=True)


Recall score in the whole test dataset :  0.9185185185185185

基于原始总数据集建立LR,并对总测试集进行预测

best_c = print_KFold_scores(X_train, y_train)

----------------------------------------
C parameter :  0.01
----------------------------------------



C:\Users\user\Anaconda3\lib\site-packages\sklearn\utils\validation.py:578: DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples, ), for example using ravel().
  y = column_or_1d(y, warn=True)


Iteration  1 : recall score =  0.5342465753424658
Iteration  2 : recall score =  0.625
Iteration  3 : recall score =  0.5897435897435898
Iteration  4 : recall score =  0.5588235294117647
Iteration  5 : recall score =  0.5
Mean Recall Score =  0.5615627388995641
----------------------------------------
C parameter :  0.1
----------------------------------------

Iteration  1 : recall score =  0.589041095890411
Iteration  2 : recall score =  0.6805555555555556
Iteration  3 : recall score =  0.6153846153846154
Iteration  4 : recall score =  0.6323529411764706
Iteration  5 : recall score =  0.5454545454545454
Mean Recall Score =  0.6125577506923195
----------------------------------------
C parameter :  1
----------------------------------------

Iteration  1 : recall score =  0.6164383561643836
Iteration  2 : recall score =  0.6805555555555556
Iteration  3 : recall score =  0.6410256410256411
Iteration  4 : recall score =  0.6617647058823529
Iteration  5 : recall score =  0.5606060606060606
Mean Recall Score =  0.6320780638467987
----------------------------------------
C parameter :  10
----------------------------------------

Iteration  1 : recall score =  0.6301369863013698
Iteration  2 : recall score =  0.6666666666666666
Iteration  3 : recall score =  0.6538461538461539
Iteration  4 : recall score =  0.6617647058823529
Iteration  5 : recall score =  0.5606060606060606
Mean Recall Score =  0.6346041146605208
----------------------------------------
C parameter :  100
----------------------------------------

Iteration  1 : recall score =  0.6301369863013698
Iteration  2 : recall score =  0.6666666666666666
Iteration  3 : recall score =  0.6538461538461539
Iteration  4 : recall score =  0.6617647058823529
Iteration  5 : recall score =  0.5606060606060606
Mean Recall Score =  0.6346041146605208
*****************************************************
Best C parameter chosen by cross validation =  10
*****************************************************

lr = LogisticRegression(C=best_c, penalty='l1')
lr.fit(X_train, y_train)
y_pred = lr.predict(X_test)

cnf_matrix = confusion_matrix(y_test, y_pred)
np.set_printoptions(precision=2)

print('Recall score in the whole test dataset : ', cnf_matrix[1,1] / (cnf_matrix[1,0] + cnf_matrix[1,1]))

classes = [0,1]
plt.figure()
plot_confusion_matrix(cnf_matrix, classes)

Recall score in the whole test dataset :  0.5777777777777777

基于下采样数据集建立LR,并分析threshold对于recall_score的影响

lr = LogisticRegression(C=0.01, penalty='l1')
lr.fit(X_train_undersampled, y_train_undersampled)
y_pred_undersampled_proba = lr.predict_proba(X_test_undersampled)

thresholds = [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]

plt.figure(figsize=[10,10])

j = 1
for threshold in thresholds:
    y_pred_undersampled_high_recall = y_pred_undersampled_proba[:,1] > threshold

    plt.subplot(3,3,j)
    j += 1

    cnf_matrix = confusion_matrix(y_test_undersampled, y_pred_undersampled_high_recall)
    np.set_printoptions(precision=2)

    print('Recall score : %.3f, Precision score : %.3f' % (cnf_matrix[1,1] / (cnf_matrix[1,0] + cnf_matrix[1,1]), 
                                                           cnf_matrix[1,1] / (cnf_matrix[0,1] + cnf_matrix[1,1])))

    classes = [0,1]

    plot_confusion_matrix(cnf_matrix, classes, title='Threshold >= %f' % threshold)

Recall score : 1.000, Precision score : 0.520
Recall score : 1.000, Precision score : 0.520
Recall score : 1.000, Precision score : 0.520
Recall score : 0.994, Precision score : 0.635
Recall score : 0.922, Precision score : 0.953
Recall score : 0.883, Precision score : 0.993
Recall score : 0.851, Precision score : 1.000
Recall score : 0.747, Precision score : 1.000
Recall score : 0.513, Precision score : 1.000

4. 上采样

from imblearn.over_sampling import SMOTE

oversampler = SMOTE(random_state=1)

利用SOMTE对训练集数据进行上采样

X_train_oversampled, y_train_oversampled = oversampler.fit_sample(X_train, y_train)

C:\Users\user\Anaconda3\lib\site-packages\sklearn\utils\validation.py:578: DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples, ), for example using ravel().
  y = column_or_1d(y, warn=True)

X_train_oversampled = pd.DataFrame(X_train_oversampled, columns=X_train.columns)
y_train_oversampled = pd.DataFrame(y_train_oversampled, columns=y_train.columns)

print('No. of fraud transactions in oversampled training dataset : ', y_train_oversampled[y_train_oversampled.Class == 1].shape[0])
print('No. of normal transactions in oversampled training dataset : ', y_train_oversampled[y_train_oversampled.Class == 0].shape[0])

No. of fraud transactions in oversampled training dataset :  199007
No. of normal transactions in oversampled training dataset :  199007

利用之前定义的print_KFold_scores函数得到最优C parameter值

best_c = print_KFold_scores(X_train_oversampled, y_train_oversampled)

----------------------------------------
C parameter :  0.01
----------------------------------------



C:\Users\user\Anaconda3\lib\site-packages\sklearn\utils\validation.py:578: DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples, ), for example using ravel().
  y = column_or_1d(y, warn=True)


Iteration  1 : recall score =  0.9103448275862069
Iteration  2 : recall score =  0.9655172413793104
Iteration  3 : recall score =  0.9215934399676048
Iteration  4 : recall score =  0.9044633996206173
Iteration  5 : recall score =  0.9036707620411547
Mean Recall Score =  0.9211179341189789
----------------------------------------
C parameter :  0.1
----------------------------------------

Iteration  1 : recall score =  0.9172413793103448
Iteration  2 : recall score =  0.9655172413793104
Iteration  3 : recall score =  0.923744685158939
Iteration  4 : recall score =  0.9061341909224526
Iteration  5 : recall score =  0.9055048868118891
Mean Recall Score =  0.9236284767165872
----------------------------------------
C parameter :  1
----------------------------------------

Iteration  1 : recall score =  0.9172413793103448
Iteration  2 : recall score =  0.9655172413793104
Iteration  3 : recall score =  0.9236687588580684
Iteration  4 : recall score =  0.9061844402849139
Iteration  5 : recall score =  0.9055802618024673
Mean Recall Score =  0.9236384163270209
----------------------------------------
C parameter :  10
----------------------------------------

Iteration  1 : recall score =  0.9172413793103448
Iteration  2 : recall score =  0.9655172413793104
Iteration  3 : recall score =  0.9237193763919822
Iteration  4 : recall score =  0.9061718779442985
Iteration  5 : recall score =  0.9058063867742017
Mean Recall Score =  0.9236912523600275
----------------------------------------
C parameter :  100
----------------------------------------

Iteration  1 : recall score =  0.9172413793103448
Iteration  2 : recall score =  0.9655172413793104
Iteration  3 : recall score =  0.923744685158939
Iteration  4 : recall score =  0.9062346896473751
Iteration  5 : recall score =  0.905831511771061
Mean Recall Score =  0.923713901453406
*****************************************************
Best C parameter chosen by cross validation =  100
*****************************************************

基于上采样训练集数据建立LR模型，并对原始测试集进行预测

lr = LogisticRegression(C=best_c, penalty='l1')
lr.fit(X_train_oversampled, y_train_oversampled)
y_pred = lr.predict(X_test)

cnf_matrix = confusion_matrix(y_test, y_pred)
np.set_printoptions(precision=2)

print('Recall score in the whole test dataset : ', cnf_matrix[1,1] / (cnf_matrix[1,0] + cnf_matrix[1,1]))

classes = [0,1]
plt.figure()
plot_confusion_matrix(cnf_matrix, classes)

Recall score in the whole test dataset :  0.8962962962962963

你可能感兴趣的:(数据分析,机器学习)

【机器学习】逻辑回归(LogisticRegression)原理与实战 GentleCP 机器学习(深度学习)逻辑回归 logistic regression 原理与实战机器学习
文章目录前言一、什么是逻辑回归1.1逻辑回归基础概念1.2逻辑回归核心概念二、逻辑回归Demo2.1数据准备2.2创建逻辑回归分类器2.3分类器预测三、逻辑回归实战3.1数据准备3.2数据划分与模型创建3.3预测数据评估模型四、参数选择五、总结六、参考资料本文属于我的机器学习/深度学习系列文章，点此查看系列文章目录前言本文主要通过文字和代码样例讲述逻辑回归的原理（包含逻辑回归的基础概念与推导）和实
机器学习里的逻辑回归Logistic Regression基本原理与应用硅基创想家 AI-人工智能与大模型机器学习逻辑回归人工智能
LogisticRegression即逻辑回归，是一种广泛应用于机器学习和数据挖掘领域的有监督学习算法，以下从原理、应用、算法优缺点等方面进行介绍：基本原理线性回归基础：逻辑回归基于线性回归模型，其基本形式为：z=w1x1+w2x2+⋯+wnxn+bz=w_1x_1+w_2x_2+\cdots+w_nx_n+bz=w1x1+w2x2+⋯+wnxn+b其中xix_ixi是特征变量，wiw_iwi是对
FutureWarning: The pandas.core.datetools module is deprecated and will be removed in a future versio byteyoung 错误调试
一直用pandas做数据分析，不过一直用的是老版本，还是0.20，今天做平稳性分析，出现了一个警告信息FutureWarning:Thepandas.core.datetoolsmoduleisdeprecatedandwillberemovedinafutureversion.Pleaseusethepandas.tseriesmoduleinstead.frompandas.coreimpor
《小区综合管理服务平台设计与实现》任务书 zp8126 毕业设计任务书论文
任务书项目名称小区综合管理服务平台设计与实现项目背景随着信息技术的发展，社区服务逐渐向数字化、智能化方向转型。为了提高居民生活质量，增强物业管理效率，减少人力成本，构建一个高效便捷的小区综合管理服务平台显得尤为重要。本项目旨在通过结合云计算、大数据分析等技术手段，为用户提供包括但不限于物业报修、费用缴纳、公告通知、安防监控等功能在内的全方位服务体验。一、课题主要内容1.需求分析目标用户群体：明确平
深度学习基础知识 namelijink 深度学习人工智能
cuda简介：CUDA（ComputeUnifiedDeviceArchitecture）是由NVIDIA开发的一种并行计算平台和应用程序编程接口（API）。它允许开发人员利用NVIDIA的GPU（图形处理器）来加速各种计算任务，包括科学计算、机器学习、深度学习、数据分析等。NVIDIA是一个全球领先的计算技术公司，专注于设计和制造高性能计算设备。除了生产强大的GPU，NVIDIA还提供与其GPU
【python语言应用】最新全流程Python编程、机器学习与深度学习实践技术应用（帮助你快速了解和入门 Python）赵钰老师 python 机器学习深度学习 python 机器学习深度学习数据分析人工智能
近年来，人工智能领域的飞速发展极大地改变了各个行业的面貌。当前最新的技术动态，如大型语言模型和深度学习技术的发展，展示了深度学习和机器学习技术的强大潜力，成为推动创新和提升竞争力的关键。特别是PyTorch，凭借其灵活性和高效性，成为科研人员和工程师的首选工具。理解和掌握深度学习的基础知识，深入了解其与经典机器学习算法的区别与联系，并系统掌握包括迁移学习、循环神经网络（RNN）、长短时记忆网络（L
ML.NET库学习006：成人人口普查数据分析与分类预测 North_D ML.NET库机器学习人工智能深度学习数据挖掘目标检测自然语言处理神经网络
文章目录ML.NET库学习006：成人人口普查数据分析与分类预测概述数据集数据字段解释为何数据准备很重要主要功能与模块数据准备机器学习工作流代码结构说明数据准备模块机器学习工作流数据加载与分割特征工程与模型训练模型评估与预测实现细节与注意事项数据准备模块机器学习工作流性能优化项目优势LightGBM分类器原理说明总结ML.NET库学习006：成人人口普查数据分析与分类预测概述本项目使用C#和ML.
数字化转型三大核心要素：数据、技术、人才千千标寻大数据云计算人工智能 ai
数字化转型的三大核心要素——数据、技术和人才，是推动企业在数字经济时代取得成功的关键。数据数据是数字化转型的基础。高质量的数据能够为企业提供深刻的市场洞察和客户行为分析，帮助做出更明智的决策。通过有效管理和利用数据，企业可以优化运营流程，提升产品和服务质量，从而实现更高的效率和客户满意度。技术先进的技术支持是实现数字化转型的关键驱动力。无论是云计算、人工智能、大数据分析还是物联网，这些前沿技术的应
【Java】已解决：java.util.concurrent.ExecutionException 屿小夏 java 开发语言 android
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
强化学习在机器人控制中的应用：从理论到实践 Echo_Wish 前沿技术人工智能机器人
强化学习在机器人控制中的应用：从理论到实践大家好，我是你们熟悉的人工智能与Python领域自媒体创作者Echo_Wish。今天我们来聊聊一个炙手可热的话题——强化学习在机器人控制中的应用。近年来，随着人工智能技术的飞速发展，机器人在各个领域的应用越来越广泛。而强化学习作为一种重要的机器学习方法，为机器人控制提供了强有力的技术支持。接下来，让我们一起探讨强化学习在机器人控制中的原理和实践，并通过具体
python判断数据和excel中是否相等_对比Excel学习python数据分析-学习笔记4 re1key
一对一替换多对一替换多对多替换参考一列数值进行排序参照有缺失值的列排序参考多数值列排序数值排名删除列删除行删除特定列行数值计数唯一值获取数值查找区间切分插入新的行或列行列互换索引重塑长宽表转换apply()和applymap()函数1.数值替换一对一替换replace(A,B)-用B替换A；replace(A,B,inplace=True)-用B替换A，元数据也将被替换掉；replace(np.N
Apache Iceberg 与 Apache Hudi：数据湖领域的双雄对决夜里慢慢行456 大数据大数据
在数据存储和处理不断发展的领域中，数据湖仓的概念已经崭露头角，成为了一种变革性的力量。数据湖仓结合了数据仓库和数据湖的最佳元素，提供了一个统一的平台，支持数据科学、商业智能、人工智能/机器学习以及临时报告等多种关键功能。这种创新的方法不仅促进了实时分析，还显著降低了平台成本，增强了数据治理，并加速了用例的实现。数据存储和处理的演变催生了被称为数据湖仓的现代分析平台。这些平台旨在解决传统架构的局限性
探索数据云的无缝桥梁：Apache Spark 与 Snowflake 的完美结合窦育培
探索数据云的无缝桥梁：ApacheSpark与Snowflake的完美结合spark-snowflakeSnowflakeDataSourceforApacheSpark.项目地址:https://gitcode.com/gh_mirrors/sp/spark-snowflake项目介绍在大数据处理的浩瀚宇宙中，Snowflake以其独特的云数据仓库能力闪耀，而ApacheSpark则是数据分析和
如何学BI大数据想做富婆大数据相关大数据 BI大数据
职业规划建议1.短期目标（1-2年）积累经验：通过实习或初级岗位（如数据分析师、商业分析师）积累经验。提升技能：深入学习SQL、Python、BI工具，掌握数据分析和可视化技能。建立作品集：完成个人项目或参与开源项目，展示数据分析能力。2.中期目标（3-5年）专业化发展：根据兴趣选择细分方向，如数据可视化、BI开发或数据运营。提升软技能：加强沟通、项目管理能力，提升商业敏感度。行业深耕：选择感兴趣
AI大模型（如GPT、BERT等）可以通过自然语言处理（NLP）和机器学习技术，显著提升测试效率小赖同学啊 python 人工智能自动化测试(app pc API)人工智能自然语言处理 gpt
在软件测试中，AI大模型（如GPT、BERT等）可以通过自然语言处理（NLP）和机器学习技术，显著提升测试效率。以下是几个具体的应用场景及对应的代码实现示例：1.自动生成测试用例AI大模型可以根据需求文档或用户故事自动生成测试用例。代码示例（使用OpenAIGPTAPI）：importopenai#设置OpenAIAPI密钥openai.api_key="your-openai-api-key"#
优化算法全景解析：从梯度下降到群体智能 welcome_123_ 算法 python 人工智能
一、引言：为什么需要优化算法？在AlphaGo击败人类围棋冠军的背后，在特斯拉自动驾驶系统实时决策的瞬间，在推荐系统精准推送内容的过程中，优化算法始终是推动这些技术落地的核心引擎。无论是机器学习模型的训练，还是复杂系统的参数调优，优化算法的本质是：在给定的约束条件下，找到使目标函数最优的解。本文将深入解析优化算法的核心原理、经典方法、现代进展及实战应用，助你全面掌握这一技术利器。二、优化算法分类图
Redis Sentinel（哨兵）模式介绍 WeiLai1112 Redis redis sentinel bootstrap
Redis哨兵模式：详解高可用性解决方案引言随着互联网应用的快速发展，系统对可靠性和高性能的要求越来越高。作为内存数据库的代表，Redis以其快速响应和灵活的数据结构，广泛应用于缓存、消息队列、实时数据分析等场景。然而，在实际生产环境中，硬件故障、网络中断等问题不可避免。为了保证Redis的高可用性（HighAvailability,HA），Redis提供了哨兵模式（SentinelMode）。本
微信小程序邂逅Echarts：从入门到避坑全攻略 Jiaberrr javascript 前端微信小程序小程序 vue.js
一、引言在当今数字化时代，数据可视化对于数据分析和展示至关重要。微信小程序作为一种轻量级应用，在各类场景中广泛应用，而在小程序中实现数据可视化，能让用户更直观地理解数据。Echarts是一款由百度开源的强大的数据可视化图表库，提供了丰富的图表类型，如折线图、柱状图、饼图、地图等，满足各种数据展示需求。将Echarts集成到微信小程序中，能为小程序增添强大的数据可视化能力，提升用户体验。无论是展示业
# 解析Excel文件：处理Excel xlsx file not supported错误 [特殊字符] AI航海家(Ethan) python excel python 开发语言
解析Excel文件：处理Excelxlsxfilenotsupported错误嘿，数据分析的小伙伴们！我知道在处理Excel文件的时候，很多人可能会遇到这样一个错误：Excelxlsxfilenotsupported。别担心，这篇文章会帮你理清这个错误产生的原因，并教你如何避免掉进这个坑！让我们开始吧！问题原因这个错误通常与xlrd库的版本有关。从xlrd1.2.0版本开始，这个库不再支持xlsx
Chrome将网页保存为PDF的实战教程爱编程的喵喵 Python基础课程 Windows实用技巧 windows chrome 网页保存为PDF 实战教程
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了Chrome将网页保存为PDF的实战
汽车行业汽车召回数据爬虫：抓取汽车召回数据，分析产品质量和安全问题西攻城狮北汽车爬虫安全 python 实战案例
目录一、搭建开发环境1.依赖库安装2.配置虚拟环境（可选）二、目标网站分析1.网页结构分析2.动态内容识别三、编写爬虫代码1.从静态页面抓取数据1.1获取页面内容1.2解析HTML1.3完整示例2.抓取动态加载内容2.1配置Selenium和ChromeDriver2.2模拟浏览器抓取3.处理分页四、数据清洗与存储1.数据清洗2.数据存储五、数据分析与可视化1.数据分析2.数据可视化六、项目优化1
Python机器学习舆情分析项目案例分享数澜悠客数字化转型 python 机器学习开发语言
数据收集与准备1.数据收集多样化数据源：从社交媒体平台（如微博、Twitter）、新闻网站、论坛等多渠道收集数据，以获取更全面的舆情信息。可以使用Python的requests库和网页解析库（如BeautifulSoup）进行网页数据爬取，使用Tweepy库获取Twitter数据。数据标注：对于监督学习，需要对收集到的数据进行标注，标记为积极、消极或中性等类别。可以使用人工标注的方式，也可以利用半
2月第五讲：深度剖析 Python 编程中的数据处理与机器学习应用 2501_90442144 python 机器学习开发语言
一、引言在当今数字化时代，编程已经成为推动各个领域发展的关键力量。Python作为一种高级编程语言，以其简洁、易读、功能强大等特点，在数据处理、机器学习、人工智能等众多领域得到了广泛的应用。本文将深入探讨Python在数据处理和机器学习方面的应用，通过实际案例展示其强大的功能和灵活性，帮助读者更好地理解和掌握Python编程在这些领域的应用技巧。二、Python基础概述2.1Python的特点与优
共享设备管理难？MDM助力Kiosk模式一键部署 EasyControl移动设备管理 MDM功能介绍 kiosk 霸屏模式移动设备管理运维
目录1.简化设备部署与配置：实现一键式部署2.自动化应用更新与内容推送：确保设备始终保持最新状态3.权限控制与设备安全：防止滥用与数据泄露4.远程管理与故障诊断：保障设备长期稳定运行5.数据分析与报告：优化设备管理决策6.降低管理成本，提高运营效率随着零售行业和餐饮行业自助服务模式的普及，Kiosk模式（自助终端、单一应用模式）逐渐成为提升客户体验和运营效率的关键工具。无论是零售店的自助结账机、餐
64个数据分析常用术语详解【数分必备干货】扫地僧009 数据分析人工智能数据挖掘
目录一、基础统计指标1.绝对数2.相对数3.百分比和百分点百分比百分点4.频数和频率频数频率5.比例与比率比例比率6.倍数和番数倍数番数7.同比和环比同比环比二、变量相关概念1.变量2.连续变量3.离散变量4.定性变量三、数据集中趋势与离散程度指标1.均值2.中位数3.缺失值4.异常值5.方差6.标准差7.皮尔森相关系数四、网站分析指标1.PV（PageView）页面浏览量2.UV（UniqueV
零基础入门机器学习 -- 第四章分类问题与逻辑回归山海青风 #机器学习机器学习分类逻辑回归 python 人工智能
4.1分类vs回归在机器学习中，任务通常分为两大类：回归（Regression）：用于预测连续数值，如房价、温度、工资等。例如：预测明天的气温（28.5°C）。预测一辆二手车的价格（30,000元）。分类（Classification）：用于预测离散类别，如垃圾邮件vs正常邮件。例如：判断一封邮件是否是垃圾邮件（“垃圾邮件”or“正常邮件”）。预测一个贷款申请是否会被批准（“批准”or“拒绝”）。
Python爬虫技术：挖掘淘宝店铺详情小爬虫程序猿 API python 爬虫开发语言
在数字化时代，数据已成为企业最宝贵的资产之一。对于电商平台，尤其是淘宝这样的大型电商平台，店铺详情数据的获取和分析对于商家来说至关重要。它不仅可以帮助商家了解市场趋势，还可以优化营销策略，提升销售业绩。本文将介绍如何利用Python爬虫技术获取淘宝店铺详情，并进行初步的数据分析。一、Python爬虫技术简介Python作为一种强大的编程语言，拥有丰富的库支持，使其在爬虫领域备受青睐。通过Pytho
利用 Python 爬虫获取按关键字搜索淘宝商品的完整指南数据小小爬虫 python 爬虫开发语言
在电商数据分析和市场研究中，获取商品的详细信息是至关重要的一步。淘宝作为中国最大的电商平台之一，提供了丰富的商品数据。通过Python爬虫技术，我们可以高效地获取按关键字搜索的淘宝商品信息。本文将详细介绍如何利用Python爬虫技术获取淘宝商品信息，并提供详细的代码示例。一、项目背景与目标淘宝平台上的商品信息对于商家、市场研究人员以及消费者都具有重要价值。通过分析这些数据，可以了解市场趋势、消费者
利用Python爬虫获取淘宝店铺详情数据小小爬虫 python python 爬虫开发语言
在数字化时代，数据已成为企业最宝贵的资产之一。对于电商平台，尤其是淘宝这样的大型电商平台，店铺详情数据的获取和分析对于商家来说至关重要。它不仅可以帮助商家了解市场趋势，还可以优化营销策略，提升销售业绩。本文将详细介绍如何利用Python爬虫技术获取淘宝店铺详情，并进行初步的数据分析。一、Python爬虫技术简介Python作为一种强大的编程语言，拥有丰富的库支持，使其在爬虫领域备受青睐。通过Pyt
利用Blackbox AI让编程更轻松人工智能ai开发图像处理
引言随着人工智能技术的发展，AI已经成为工作中不可缺少的工具之一。俗话讲“术业有专攻”，对AI来说当然也是如此。由于训练集、调教等方面的差别，不同的AI适用的工作也不尽相同。在编程辅助方面，已经有一系列比较成熟的平台，但它们一方面价格昂贵，另一方面功能比较单一。Blackbox.ai是一个新出现的人工智能平台，它主要针对的是编程和机器学习方面的AI技术落地。和其他AI平台相比，它提供了简洁美观的界
异常的核心类Throwable 无量 java 源码异常处理 exception
java异常的核心是Throwable，其他的如Error和Exception都是继承的这个类里面有个核心参数是detailMessage，记录异常信息，getMessage核心方法，获取这个参数的值，我们可以自己定义自己的异常类，去继承这个Exception就可以了，方法基本上，用父类的构造方法就OK，所以这么看异常是不是很easy package com.natsu;
mongoDB 游标（cursor）实现分页迭代开窍的石头 mongodb
上篇中我们讲了mongoDB 中的查询函数，现在我们讲mongo中如何做分页查询如何声明一个游标 var mycursor = db.user.find({_id:{$lte:5}}); 迭代显示游标数
MySQL数据库INNODB 表损坏修复处理过程 0624chenhong tomcat mysql
最近mysql数据库经常死掉，用命令net stop mysql命令也无法停掉，关闭Tomcat的时候，出现Waiting for N instance(s) to be deallocated 信息。查了下，大概就是程序没有对数据库连接释放，导致Connection泄露了。因为用的是开元集成的平台，内部程序也不可能一下子给改掉的，就验证一下咯。启动Tomcat,用户登录系统，用netstat -
剖析如何与设计人员沟通不懂事的小屁孩工作
最近做图烦死了，不停的改图，改图……。烦，倒不是因为改，而是反反复复的改，人都会死。很多需求人员不知该如何与设计人员沟通，不明白如何使设计人员知道他所要的效果，结果只能是沟通变成了扯淡，改图变成了应付。那应该如何与设计人员沟通呢？我认为设计人员与需求人员先天就存在语言障碍。对一个合格的设计人员来说，整天玩的都是点、线、面、配色，哪种构图看起来协调；哪种配色看起来合理心里跟明镜似的，
qq空间刷评论工具换个号韩国红果果 JavaScript
var a=document.getElementsByClassName('textinput'); var b=[]; for(var m=0;m<a.length;m++){ if(a[m].getAttribute('placeholder')!=null) b.push(a[m]) } var l
S2SH整合之session 灵静志远 spring AOP struts session
错误信息： Caused by: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'cartService': Scope 'session' is not active for the current thread; consider defining a scoped
xmp标签 a-john 标签
今天在处理数据的显示上遇到一个问题： var html = '<li><div class="pl-nr"><span class="user-name">' + user + '</span>' + text + '</div></li>'; ulComme
Ajax的常用技巧（2）---实现Web页面中的级联菜单 aijuans Ajax
在网络上显示数据，往往只显示数据中的一部分信息，如文章标题，产品名称等。如果浏览器要查看所有信息，只需点击相关链接即可。在web技术中，可以采用级联菜单完成上述操作。根据用户的选择，动态展开，并显示出对应选项子菜单的内容。在传统的web实现方式中，一般是在页面初始化时动态获取到服务端数据库中对应的所有子菜单中的信息，放置到页面中对应的位置，然后再结合CSS层叠样式表动态控制对应子菜单的显示或者隐
天-安-门，好高 atongyeye 情感
我是85后，北漂一族，之前房租1100，因为租房合同到期，再续，房租就要涨150。最近网上新闻，地铁也要涨价。算了一下，涨价之后，每次坐地铁由原来2块变成6块。仅坐地铁费用，一个月就要涨200。内心苦痛。晚上躺在床上一个人想了很久，很久。我生在农
android 动画百合不是茶 android 透明度平移缩放旋转
android的动画有两种 tween动画和Frame动画 tween动画;,透明度,缩放,旋转,平移效果 Animation 动画 AlphaAnimation 渐变透明度 RotateAnimation 画面旋转 ScaleAnimation 渐变尺寸缩放 TranslateAnimation 位置移动 Animation
查看本机网络信息的cmd脚本 bijian1013 cmd
@echo 您的用户名是：%USERDOMAIN%\%username%>"%userprofile%\网络参数.txt" @echo 您的机器名是：%COMPUTERNAME%>>"%userprofile%\网络参数.txt" @echo ___________________>>"%userprofile%\
plsql 清除登录过的用户征客丶 plsql
tools---preferences----logon history---history 把你想要删除的删除 -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一起进步。 email ： binary_spac
【Pig一】Pig入门 bit1129 pig
Pig安装 1.下载pig wget http://mirror.bit.edu.cn/apache/pig/pig-0.14.0/pig-0.14.0.tar.gz 2. 解压配置环境变量如果Pig使用Map/Reduce模式，那么需要在环境变量中，配置HADOOP_HOME环境变量 expor
Java 线程同步几种方式 BlueSkator volatile synchronized ThredLocal ReenTranLock Concurrent
为何要使用同步？ java允许多线程并发控制，当多个线程同时操作一个可共享的资源变量时（如数据的增删改查），将会导致数据不准确，相互之间产生冲突，因此加入同步锁以避免在该线程没有完成操作之前，被其他线程的调用，从而保证了该变量的唯一性和准确性。 1.同步方法&
StringUtils判断字符串是否为空的方法（转帖） BreakingBad null StringUtils “”
转帖地址：http://www.cnblogs.com/shangxiaofei/p/4313111.html public static boolean isEmpty(String str) 　　判断某字符串是否为空，为空的标准是 str== null 或 str.length()== 0
编程之美-分层遍历二叉树 bylijinnan java 数据结构算法编程之美
import java.util.ArrayList; import java.util.LinkedList; import java.util.List; public class LevelTraverseBinaryTree { /** * 编程之美分层遍历二叉树 * 之前已经用队列实现过二叉树的层次遍历，但这次要求输出换行，因此要
jquery取值和ajax提交复习记录 chengxuyuancsdn jquery取值 ajax提交
// 取值 // alert($("input[name='username']").val()); // alert($("input[name='password']").val()); // alert($("input[name='sex']:checked").val()); // alert($("
推荐国产工作流引擎嵌入式公式语法解析器-IK Expression comsci java 应用服务器工作 Excel 嵌入式
这个开源软件包是国内的一位高手自行研制开发的，正如他所说的一样，我觉得它可以使一个工作流引擎上一个台阶。。。。。。欢迎大家使用，并提出意见和建议。。。 ----------转帖--------------------------------------------------- IK Expression是一个开源的（OpenSource），可扩展的（Extensible），基于java语言
关于系统中使用多个PropertyPlaceholderConfigurer的配置及PropertyOverrideConfigurer daizj spring
1、PropertyPlaceholderConfigurer Spring中PropertyPlaceholderConfigurer这个类，它是用来解析Java Properties属性文件值，并提供在spring配置期间替换使用属性值。接下来让我们逐渐的深入其配置。基本的使用方法是：(1) <bean id="propertyConfigurerForWZ&q
二叉树:二叉搜索树 dieslrae 二叉树
所谓二叉树,就是一个节点最多只能有两个子节点,而二叉搜索树就是一个经典并简单的二叉树.规则是一个节点的左子节点一定比自己小,右子节点一定大于等于自己(当然也可以反过来).在树基本平衡的时候插入,搜索和删除速度都很快,时间复杂度为O(logN).但是,如果插入的是有序的数据,那效率就会变成O(N),在这个时候,树其实变成了一个链表. tree代码:
C语言字符串函数大全 dcj3sjt126com c function
C语言字符串函数大全函数名: stpcpy 功能: 拷贝一个字符串到另一个用法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main
友盟统计页面技巧 dcj3sjt126com 技巧
在基类调用就可以了, 基类ViewController示例代码 -(void)viewWillAppear:(BOOL)animated { [super viewWillAppear:animated]; [MobClick beginLogPageView:[NSString stringWithFormat:@"%@",self.class]];
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法 flyvszhb java jdk
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法本机已经安装了jdk1.7，而比较早期的项目需要依赖jdk1.6，于是同时在本机安装了jdk1.6和jdk1.7. 安装jdk1.6前，执行java -version得到 C:\Users\liuxiang2>java -version java version "1.7.0_21&quo
Java在创建子类对象的同时会不会创建父类对象 happyqing java 创建子类对象父类对象
1.在thingking in java 的第四版第六章中明确的说了，子类对象中封装了父类对象， 2."When you create an object of the derived class, it contains within it a subobject of the base class. This subobject is the sam
跟我学spring3 目录贴及电子书下载 jinnianshilongnian spring
一、《跟我学spring3》电子书下载地址：《跟我学spring3》（1-7 和 8-13） http://jinnianshilongnian.iteye.com/blog/pdf 跟我学spring3系列 word原版下载二、源代码下载最新依
第12章 Ajax（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BI and EIM 4.0 at a glance blueoxygen BO
http://www.sap.com/corporate-en/press.epx?PressID=14787 有机会研究下EIM家族的两个新产品~~~~ New features of the 4.0 releases of BI and EIM solutions include: Real-time in-memory computing –
Java线程中yield与join方法的区别 tomcat_oracle java
长期以来，多线程问题颇为受到面试官的青睐。虽然我个人认为我们当中很少有人能真正获得机会开发复杂的多线程应用(在过去的七年中，我得到了一个机会)，但是理解多线程对增加你的信心很有用。之前，我讨论了一个wait()和sleep()方法区别的问题，这一次，我将会讨论join()和yield()方法的区别。坦白的说，实际上我并没有用过其中任何一个方法，所以，如果你感觉有不恰当的地方，请提出讨论。 &nb
android Manifest.xml选项阿尔萨斯 Manifest
结构继承关系 public final class Manifest extends Objectjava.lang.Objectandroid.Manifest 内部类 class Manifest.permission权限 class Manifest.permission_group权限组构造函数 public Manifest () 详细 androi
Oracle实现类split函数的方 zhaoshijie oracle
关键字：Oracle实现类split函数的方项目里需要保存结构数据，批量传到后他进行保存，为了减小数据量，子集拼装的格式，使用存储过程进行保存。保存的过程中需要对数据解析。但是oracle没有Java中split类似的函数。从网上找了一个，也补全了一下。 CREATE OR REPLACE TYPE t_split_100 IS TABLE OF VARCHAR2(100); cr