春有百花巨小蟹

基于Python的信用卡欺诈检测机器学习案例报告

本报告借助Python语言探究了在机器学习中，面对一个大型的人与人之间交易的数据集，如何尽快处理大量数据并区分某交易记录是正常的用户行为还是潜在的信用卡欺诈行为，最终通过构建分类模型来对欺诈交易进行分类区分，并通过恰当的方式对构建的模型进行评估，来解决上述问题。

一、背景介绍

1.1 研究问题

当今时代，在线支付已成为一种高效便捷的支付方式，我们可以突破时间和空间的限制，输入我们的信用卡各项信息就可以完成在线支付。但随之而来的是这种支付方式也具备一定的风险性，我们无法辨别对方是否是恶意套取我们资金的非法分子。当信用卡信息数据泄露导致金钱失窃并最终失去客户忠诚度和公司声誉时，组织、消费者、银行和商家都会面临风险。

2017 年，未经授权的信用卡操作达到了惊人的 1670 万受害者。此外，据美国联邦贸易委员会 (FTC) 报告，2017 年信用卡欺诈索赔数量比上一年高出 40%。加利福尼亚州报告了大约 13,000 起案件，佛罗里达州报告了 8,000 起案件，这两个州是此类犯罪人均最多的州。由此可以看出，信用卡欺诈检测已变得十分必要。为鉴别信用卡交易中的欺诈性行为，并采用合适的模型对非欺诈行为和欺诈行为进行分类，本报告以Kaggle网站上的信用卡欺诈案例数据集为例进行信用卡欺诈检测。

1.2 研究意义

当今时代，在线支付已经越来越普及，随之而来的电信诈骗案件也越来越频繁，给受害者的生活和心理造成了严重的影响，我们的资金安全问题亟待解决，刻不容缓。拥有一种好的信用卡欺诈检测服务，能够在很大程度上减少资金失窃的问题，对维护社会和平稳定安定有序，具有重大意义。

二、数据介绍及说明

本报告的数据来源于Kaggle这一网站，Kaggle是由联合创始人、首席执行官安东尼·高德布卢姆（Anthony Goldbloom）2010年在墨尔本创立的，主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台，该平台已经吸引了80万名数据科学家的关注。

数据内容为2017年Kaggle网站上的案例Credit Card Fraud Detection这一部分的数据集，数据集文件名称为creditcard.csv。该数据集中收集的是2013年9月欧洲人使用信用卡在两天内产生的交易数据，其中284807笔交易中有492笔被盗刷。这个文件中包含特征 V1 到 V28，是我们分析数据所需要的主要成分，银行为了保密，并没有提供具体代表的内容。在该数据集中，忽略了对构建模型没有用的时间Time特征。其余的特征是当前交易总金额的“金额”特征Amount和当前交易是否为欺诈案件的“类别”特征Class，如果发生被盗刷，则取值1，否则为0。

三、信用卡欺诈检测的解决方案

3.1 项目总体规划

该信用卡欺诈检测案例项目有两个文件组成，分别是main.py和creditcard.csv。

其中creditcard.csv是我们项目所测试和训练的数据集，该数据集中的数据质量高，正负样本比例非常悬殊，很典型的异常检测数据集，在这个数据集上来测试各种异常检测手段的效果。main.py用来导入数据，对数据进行预处理，并进行建模对数据进行分类，最后对模型进行正确性评估。

3.2 导入相关模块

在该信用卡欺诈检测案例中，所需要用到的主要模块是处理数据的Pandas、处理数组的 NumPy、用于数据拆分、构建和评估分类模型的 scikit-learn，最后是用于 xgboost 分类器模型算法的 xgboost 包。其中scikit-learn包安装有要求，需要是Python3.5以上版本，且需要NumPy、SciPy、Pandas工具包的支持，部分内容需要使用Matplotlib。包安装指令如下：

1.pip install pandas
2.pip install numpy
3.pip install scipy
4.pip install matplotlib
5.pip3 install -U scikit-learn -i https://pypi.douban.com/simple
6.pip install xgboost

在main.py中导入相关模块

1.import pandas as pd
2.import numpy as np
3.import matplotlib.pyplot as plt
4.from termcolor import colored as cl
5.import itertools
6.from sklearn.preprocessing import StandardScaler
7.from sklearn.model_selection import train_test_split
8.from sklearn.tree import DecisionTreeClassifier
9.from sklearn.neighbors import KNeighborsClassifier
10.from sklearn.linear_model import LogisticRegression
11.from sklearn.svm import SVC
12.from sklearn.ensemble import RandomForestClassifier
13.from xgboost import XGBClassifier
14.from sklearn.metrics import confusion_matrix
15.from sklearn.metrics import accuracy_score
16.from sklearn.metrics import f1_score

3.3 导入数据

使用pd.read_csv方法导入数据，并查看部分数据样例。

1.df = pd.read_csv('creditcard.csv')
2.df.drop('Time', axis = 1, inplace = True)
3.print(df.head())

部分数据如下：

可以看到，该数据集包含V1~V28的特征，以及总金额Amount和类别Class。V1~V28的特征是我们分析的主要数据；Amount是当前交易记录涉及总金额；Class是当前交易记录的类别，非欺诈案件类别为0，欺诈案件类别为1。

3.4 数据预处理和数据分析

接下来进行一些数据预处理和探索性数据分析，看看数据集中有多少欺诈案件和非欺诈案件。此外，还计算整个记录交易中欺诈案件的百分比。

3.4.1 案件类别分析统计

非欺诈案件即Class特征量为0的记录，则计算Class为0的记录的数量即为非欺诈案件的数量；欺诈案件即Class特征量为1的记录，则计算Class为1的记录的数量即为欺诈案件的数量；欺诈案件比例是：欺诈案件数目/非欺诈案件数目*100，并保留两位小数。

1.cases = len(df)
2.nonfraud_count = len(df[df.Class == 0])
3.fraud_count = len(df[df.Class == 1])
4.fraud_percentage = round(fraud_count/nonfraud_count*100, 2)
5.print(cl('案件统计', attrs = ['bold']))
6.print(cl('---------------------------------', attrs = ['bold']))
7.print(cl('总案件数量 {}'.format(cases), attrs = ['bold']))
8.print(cl('非欺诈案件数 {}'.format(nonfraud_count), attrs = ['bold']))
9.print(cl('欺诈案件数 {}'.format(fraud_count), attrs = ['bold']))
10.print(cl('欺诈案件比例 {}'.format(fraud_percentage), attrs = ['bold']))
11.print(cl('---------------------------------', attrs = ['bold']))

之后对计算所得进行输出：

可以看到，总案件条数为284807，即共有284807条交易记录；非欺诈案件数即Class为0的有284315条记录；欺诈案件数即Class为1的有492条记录，两者比例超过500，欺诈案件比例为0.17，表明数据集非常不平衡，欺诈案件数占所有交易的0.17％。

接下来分别统计欺诈案件和非欺诈案件，使用 Python 中的describe方法获取欺诈和非欺诈交易金额数据的统计视图。

1.nonfraud_cases = df[df.Class == 0]
2.fraud_cases = df[df.Class == 1]
3.print(cl('案件统计：', attrs = ['bold']))
4.print(cl('------------------------------', attrs = ['bold']))
5.print(cl('非欺诈案件统计', attrs = ['bold']))
6.print(nonfraud_cases.Amount.describe())
7.print(cl('------------------------------', attrs = ['bold']))
8.print(cl('欺诈案件统计', attrs = ['bold']))
9.print(fraud_cases.Amount.describe())
10.print(cl('------------------------------', attrs = ['bold']))

对计算结果进行输出：

在上述的输出结果中，count行统计了此列共有多少行没有缺失值；mean平均值，即是算术平均值，反应此列特征的一般水平；std标准差，反应此列数据的离散程度，一个较大的标准差，代表大部分数值和其平均值之间差异较大，一个较小的标准差，代表这些数值较接近平均值；min、25%、50%、75%、max，其中min max分别是最小值和最大值，而25%、50%、75%为四分位数，分位数是将总体的全部数据按大小顺序排列后，处于各等分位置的变量值。如果将全部数据分成相等的两部分，它就是中位数；如果分成四等分，就是四分位数， 50%的值就是中位数。通过四分位数，可以看出一个变量的分布情况是左偏、右偏或对称分布。

3.4.2 数据标准化处理

根据上述的统计数据，可以看到与其余变量相比，Amount变量中的值变化很大。我们需要对数据进行常规的预处理，将可能的特征属性进行标准化处理，因为算法都假设所有数据集的所有特征集中在0附近，并且有相同的方差，如果某个特征方差远大于其他特征方差，那么该特征可能在目标函数中占得权重更大，而且差距太大的话，这会对收敛速度产生很大的影响，甚至可能不收敛，这里采用sk-learn自带的StandardScaler()来对其进行标准化处理。

1.print('标准化之前')
2.print(cl(df['Amount'].head(10), attrs = ['bold']))
3.sc = StandardScaler()
4.amount = df['Amount'].values
5.df['Amount'] = sc.fit_transform(amount.reshape(-1, 1))
6.print('标准化之后')
7.print(cl(df['Amount'].head(10), attrs = ['bold']))

标准化处理后该列数据会变成均值为0，方差为1的一列数据。

3.4.3 特征选择和数据集拆分

在这个过程中，定义自变量 (X) 和因变量 (y)。使用定义的变量将数据分成训练集和测试集，进一步用于建模和评估。可以使用python中的train_test_split方法轻松拆分数据。

train_test_split方法中的第一个参数X，是所要划分的样本特征集；第二个参数y，是所要划分的样本结果；第三个参数test_size是样本占比，如果是整数的话就是样本的数量；第四个参数random_state是随机数种子，即该组随机数的编号，在需要重复试验的时候，保证得到一组一样的随机数。比如你每次都填1，其他参数一样的情况下你得到的随机数组是一样的。但填0或不填，每次都会不一样。

1.X = df.drop('Class', axis = 1).values
2.y = df['Class'].values
3.X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 0)
4.print(cl('X_train 样本 : ', attrs = ['bold']),X_train[:1])
5.print(cl('X_test 样本 : ', attrs = ['bold']),X_test[0:1])
6.print(cl('y_train 样本 : ', attrs = ['bold']),y_train[0:20])
7.print(cl('y_test 样本 : ', attrs = ['bold']),y_test[0:20])

拆分结果如下：

到目前为止，已经做好了构建分类模型所需的所有准备。

3.5构建模型及模型评估

构建六种不同类型的分类模型，即决策树、K-最近邻 (KNN)、逻辑回归、支持向量机 (SVM)、随机森林和XGBoost。所有这些模型构建均比较方便，都可以使用scikit-learn包提供的算法来构建。仅对于XGBoost模型，将使用 xgboost包。接下来在 Python 中实现这些模型，所使用的算法可能需要花费一定的时间来实现。

将使用scikit-learn包提供的评估指标来评估我们构建的模型。在此过程中的主要目标是为给定案例找到最佳模型。这里将使用的评估指标是准确度评分指标、f1-score评分指标及混淆矩阵。

准确率：准确率是最基本的评价指标之一，广泛用于评价分类模型。准确率分数的计算方法很简单，就是将模型做出的正确预测的数量除以模型做出的预测总数（可以乘以 100 将结果转换为百分比）。一般可以表示为：

准确度分数 = 正确预测数 / 总预测数

所构建的六种不同分类模型的准确率分数要在python中完成，我们可以使用scikit-learn包提供的accuracy_score方法。

F1-score 或 F-score：是用于评估分类模型的最流行的评估指标之一，它可以简单地定义为模型的准确率和召回率的调和平均值。它的计算方法是将模型的精度和召回率的乘积除以模型的精度和召回率相加得到的值，最后乘以 2 得到的值。可以表示为：

F1-score = 2( (精度 * 召回率) / (精度 + 召回率) )

可以使用scikit-learn包提供的f1_score方法轻松计算F1-score。

混淆矩阵：是分类模型的可视化，显示模型与原始结果相比预测结果的程度。通常，预测结果存储在一个变量中，然后将其转换为相关表。使用相关表，以热图的形式绘制混淆矩阵。尽管有多种内置方法可以可视化混淆矩阵，但我们将从零开始定义和可视化它，以便更好地理解。

混淆矩阵的定义如下：

1.def plot_confusion_matrix(cm, classes, title, normalize=False, cmap=plt.cm.Blues):
2.    title = 'Confusion Matrix--{}'.format(title)
3.    if normalize:
4.        cm = cm.astype(float) / cm.sum(axis=1)[:, np.newaxis]
5.    plt.imshow(cm, interpolation='nearest', cmap=cmap)
6.    plt.title(title)
7.    plt.colorbar()
8.    tick_marks = np.arange(len(classes))
9.    plt.xticks(tick_marks, classes, rotation=45)
10.    plt.yticks(tick_marks, classes)
11.    fmt = '.2f' if normalize else 'd'
12.    thresh = cm.max() / 2.
13.    for i, j in itertools.product(range(cm.shape[0]), range(cm.shape[1])):
14.        plt.text(j, i, format(cm[i, j], fmt),
15.                 horizontalalignment='center',
16.                 color='white' if cm[i, j] > thresh else 'black')
17.    plt.tight_layout()
18.    plt.ylabel('true label')
19.    plt.xlabel('predicted label')

3.5.1决策树模型及评估

在决策树模型中，使用DecisionTreeClassifier算法来构建模型。在算法中，设置max_depth=4，意味着允许树最大分裂四次，criterion = 'entropy'，与max_depth最相似，但决定何时停止分裂树。最后拟合模型后将预测值存储到tree_yhat变量中。

1.tree_model = DecisionTreeClassifier(max_depth = 4, criterion = 'entropy')
2.tree_model.fit(X_train, y_train)
3.tree_yhat = tree_model.predict(X_test)

决策树模型的准确率代码：

1.print(cl('决策树模型的准确率： {}'.format(accuracy_score(y_test, tree_yhat)),attrs = ['bold']))

决策树模型的准确率：

决策树模型的F1-score代码：

1.print(cl('决策树模型的F1-score: {}'.format(f1_score(y_test, tree_yhat)),attrs = ['bold']))

决策树模型的F1-score：

决策树模型的混淆矩阵代码：

1.# 计算模型的混淆矩阵
2.tree_matrix = confusion_matrix(y_test, tree_yhat,labels=[0, 1])
3.# figure.figsize：图像显示大小
4.plt.rcParams['figure.figsize'] = (6, 6)
5.# 具体调用函数绘制混淆矩阵热图
6.tree_cm_plot = plot_confusion_matrix(tree_matrix,classes = ['no-default(0)','default(1)'],normalize = False, title = 'decision tree')
7.plt.savefig('decision tree.png')
8.plt.show()

决策树混淆矩阵：

从该混淆矩阵中可以看出来的信息是：实际上，非欺诈案件数目为56849+12；欺诈案件数目为24+77。而在模型的预测结果中，非欺诈案件数目为56849+24；欺诈案件数目为12+77。由此可以得出，在预测结果中，将12件欺诈案件预测为了非欺诈案件，预测失误；有56849个案件预测准确。

3.5.2 K-近邻模型及评估

在K-近邻模型中，使用KNeighborsClassifier算法构建了模型，并设置n_neighbors=5。n_neighbors的值是随机选择的，其实可以通过迭代一系列值来有目的地选择，然后拟合模型后将预测值存储到knn_yhat变量中。

1.n = 5
2.knn = KNeighborsClassifier(n_neighbors = n)
3.knn.fit(X_train, y_train)
4.knn_yhat = knn.predict(X_test)

K-近邻模型的准确率代码：

print(cl('K近邻模型的准确率： {}'.format(accuracy_score(y_test, knn_yhat)),attrs = ['bold']))

K-近邻模型的准确率：

K-近邻模型的F1-score代码：

1.print(cl('K近邻模型的F1-score: {}'.format(f1_score(y_test, knn_yhat)),attrs = ['bold']))

K-近邻模型的F1-score：

K-近邻模型的混淆矩阵代码：

1.# 计算模型的混淆矩阵
2.knn_matrix = confusion_matrix(y_test, knn_yhat, labels = [0, 1]) # K-Nearest Neighbors
3.# 绘制混淆矩阵 figure.figsize：图像显示大小
4.plt.rcParams['figure.figsize'] = (6, 6)
5.knn_cm_plot = plot_confusion_matrix(knn_matrix, classes = ['Non-Default(0)','Default(1)'], normalize = False, title = 'KNN')
6.plt.savefig('knn_cm_plot.png')
7.plt.show()

K-近邻混淆矩阵：

从该混淆矩阵中可以看出来的信息是：实际上，非欺诈案件数目为56854+7；欺诈案件数目为20+81。而在模型的预测结果中，非欺诈案件数目为56854+20；欺诈案件数目为81+7。由此可以得出，在预测结果中，将13件欺诈案件预测为了非欺诈案件，预测失误；有56854个案件预测准确。

然而KNN算法的时间复杂度为O(D*N*N)。其中D为维度数，N为样本总数。从时间复杂度上我们可以很清楚的就知道KNN非常不适合高维度的数据集，容易发生维度爆炸的情况。在此案例中我们有V1~V28个特征值，计算速度相较决策树而言变慢。

3.5.3逻辑回归模型及评估

逻辑回归模型中使用LogisticRegression算法并全部使用默认值，并拟合模型后将预测值存储到lr_yhat变量中。

1.lr = LogisticRegression()
2.lr.fit(X_train, y_train)
3.lr_yhat = lr.predict(X_test)

逻辑回归模型的准确率代码：

1.print(cl('Accuracy score of the Logistic Regression model is {}'.format(accuracy_score(y_test, lr_yhat)),attrs = ['bold'], color = 'red'))

逻辑回归模型的准确率：

逻辑回归模型的F1-score代码：

1.print(cl('K近邻模型的F1-score: {}'.format(f1_score(y_test, lr_yhat)),attrs = ['bold']))

逻辑回归模型的F1-score：

逻辑回归模型的混淆矩阵代码：

1.# 计算模型的混淆矩阵
2.lr_matrix = confusion_matrix(y_test, lr_yhat, labels = [0, 1])
3.# 绘制混淆矩阵 figure.figsize：图像显示大小
4.plt.rcParams['figure.figsize'] = (6, 6)
5.lr_cm_plot = plot_confusion_matrix(lr_matrix, classes = ['Non-Default(0)','Default(1)'], normalize = False, title = 'Logistic Regression')
6.plt.savefig('lr_cm_plot.png')
7.plt.show()

逻辑回归模型混淆矩阵：

从该混淆矩阵中可以看出来的信息是：实际上，非欺诈案件数目为56852+9；欺诈案件数目为37+64。而在模型的预测结果中，非欺诈案件数目为56852+37；欺诈案件数目为9+64。由此可以得出，在预测结果中，将28件欺诈案件预测为了非欺诈案件，预测失误；有56854个案件预测准确。

3.5.4支持向量机模型及评估

使用SVC算法构建了支持向量机模型，并且同样使用默认值，并且默认内核就是我们所希望用到的模型，即"rbf"内核。之后，我们在拟合模型后将预测值存储到svm_yhat中。

1.svm = SVC()
2.svm.fit(X_train, y_train)
3.svm_yhat = svm.predict(X_test)

支持向量机模型的准确率代码：

1.print(cl('支持向量机模型的准确度为 {}'.format(accuracy_score(y_test, svm_yhat)),attrs = ['bold'], color = 'red'))

支持向量机模型的准确率：

支持向量机模型的F1-score代码：

1.print(cl('支持向量机模型的F1-score: {}'.format(f1_score(y_test, svm_yhat)),attrs = ['bold']))

支持向量机模型的F1-score：

支持向量机模型的混淆矩阵代码：

1.# 计算模型的混淆矩阵
2.svm_matrix = confusion_matrix(y_test, svm_yhat, labels = [0, 1])
3.# 绘制混淆矩阵 figure.figsize：图像显示大小
4.plt.rcParams['figure.figsize'] = (6, 6)
5.svm_cm_plot = plot_confusion_matrix(svm_matrix, classes = ['Non-Default(0)','Default(1)'], normalize = False, title = 'SVM')
6.plt.savefig('svm_cm_plot.png')
7.plt.show()

支持向量机模型混淆矩阵：

从该混淆矩阵中可以看出来的信息是：实际上，非欺诈案件数目为56855+6；欺诈案件数目为33+68。而在模型的预测结果中，非欺诈案件数目为56855+33；欺诈案件数目为6+68。由此可以得出，在预测结果中，将27件欺诈案件预测为了非欺诈案件，预测失误；有56855个案件预测准确。

在支持向量机模型中，如果数据特征（维度）大于样本量，支持向量机表现很差，表现在计算速度慢方面。

3.5.5随机森林模型及评估

使用RandomForestClassifier算法构建的随机森林模型，设置参数max_depth=4，就像构建决策树模型的方式一样。最后在拟合模型后将预测值存储到rf_yhat中。决策树和随机森林之间的主要区别在于，决策树使用整个数据集来构建单个模型，而随机森林使用随机选择的特征来构建多个模型。这就是为什么很多情况下选择使用随机森林模型而不是决策树的原因。

1.rf = RandomForestClassifier(max_depth = 4)
2.rf.fit(X_train, y_train)
3.rf_yhat = rf.predict(X_test)

随机森林模型的准确率代码：

1.print(cl('随机森林模型的准确度为 {}'.format(accuracy_score(y_test, rf_yhat)),attrs = ['bold'], color = 'red'))

随机森林模型的准确率：

随机森林模型的F1-score代码：

1.print(cl('随机森林模型的F1-score: {}'.format(f1_score(y_test, rf_yhat)),attrs = ['bold']))

随机森林模型的F1-score：

随机森林模型的混淆矩阵代码：

1.# 计算模型的混淆矩阵
2.rf_matrix = confusion_matrix(y_test, rf_yhat, labels = [0, 1])
3.# 绘制混淆矩阵 figure.figsize：图像显示大小
4.plt.rcParams['figure.figsize'] = (6, 6)
5.rf_cm_plot = plot_confusion_matrix(rf_matrix, classes = ['Non-Default(0)','Default(1)'], normalize = False, title = 'Random Forest Tree')
6.plt.savefig('rf_cm_plot.png')
plt.show()

随机森林模型混淆矩阵：

从该混淆矩阵中可以看出来的信息是：实际上，非欺诈案件数目为56853+8；欺诈案件数目为31+70。而在模型的预测结果中，非欺诈案件数目为56853+31；欺诈案件数目为8+70。由此可以得出，在预测结果中，将23件欺诈案件预测为了非欺诈案件，预测失误；有56853个案件预测准确。

3.5.6 XGBoost模型及评估

使用xgboost包提供的XGBClassifier算法构建模型。设置max_depth=4，最后在拟合模型后将预测值存储到xgb_yhat中

1.xgb = XGBClassifier(max_depth = 4)
2.xgb.fit(X_train, y_train)
3.xgb_yhat = xgb.predict(X_test)

XGBoost模型的准确率代码：

1.print(cl('XGBoost模型的准确度为 {}'.format(accuracy_score(y_test, xgb_yhat)),attrs = ['bold'], color = 'red'))

XGBoost模型的准确率：

XGBoost模型的F1-score代码：

1.print(cl('XGBoost模型的F1-score: {}'.format(f1_score(y_test, xgb_yhat)),attrs = ['bold']))

XGBoost模型的F1-score：

XGBoost模型的混淆矩阵代码：

1.# 计算模型的混淆矩阵
2.xgb_matrix = confusion_matrix(y_test, xgb_yhat, labels = [0, 1])
3.# 绘制混淆矩阵 figure.figsize：图像显示大小
4.plt.rcParams['figure.figsize'] = (6, 6)
5.xgb_cm_plot = plot_confusion_matrix(xgb_matrix, classes = ['Non-Default(0)','Default(1)'], normalize = False, title = 'XGBoost')
6.plt.savefig('xgb_cm_plot.png')
7.plt.show()

XGBoost模型混淆矩阵：

从该混淆矩阵中可以看出来的信息是：实际上，非欺诈案件数目为56854+7；欺诈案件数目为22+79。而在模型的预测结果中，非欺诈案件数目为56855+22；欺诈案件数目为7+79。由此可以得出，在预测结果中，将15件欺诈案件预测为了非欺诈案件，预测失误；有56854个案件预测准确。

到此，我们完成了6种模型对我们数据集的预测。

四、信用卡欺诈检测模型数据分析

4.1模型准确度对比

决策树模型的准确率:0.9993679997191109

K近邻模型的准确率:0.9995259997893332

逻辑回归模型的准确度为0.9991924440855307

支持向量机模型的准确度为0.9993153330290369

随机森林模型的准确度为0.9993153330290369

XGBoost模型的准确度为0.9994908886626171

根据准确性评分评估指标来看，K-近邻模型为最准确的模型，而逻辑回归模型最不准确。然而，当我们对每个模型的结果进行四舍五入时，得到 99% 的准确性，这看是一个非常好的分数。

4.2模型F1-score对比

决策树模型的F1-score: 0.8105263157894738

K近邻模型的F1-score: 0.8571428571428572

逻辑回归模型的F1-score : 0.7356321839080459

支持向量机模型的F1-score: 0.7771428571428572

随机森林模型的F1-score: 0.7821229050279329

XGBoost模型的准确度为0.9994908886626171

模型的排名几乎与之前的评估指标相似。在 F1-score 评估指标的基础上，K-近邻模型再次夺得第一，逻辑回归模型仍然是最不准确的模型。

4.3模型混淆矩阵对比

在比较所有模型的混淆矩阵时可以看出，K-近邻模型在从非欺诈交易中分类欺诈交易方面做得非常好，其次是 XGBoost 模型。所以可以得出结论，最适合本次案例的模型是K-近邻模型，可以忽略的模型是逻辑回归模型。

五、总结

欺诈是整个信用卡行业的一个主要问题，随着电子货币转账的日益普及，该行业变得越来越大。为有效防范导致银行账户信息泄露、盗刷、伪造信用卡、每年数十亿美元被盗以及声誉和客户忠诚度损失的犯罪行为，信用卡发卡机构应考虑实施高级信用信用卡欺诈预防和欺诈检测方法。基于机器学习的方法可以根据每个持卡人的行为信息不断提高欺诈预防的准确性。

你可能感兴趣的:(python,机器学习,人工智能)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python编译器鹿鹿~ Python编译器 Python python 开发语言后端
嘿嘿嘿我又来了啊有些小盆友可能不知道Python其实是有编译器的，也就是PyCharm。你们可能会问到这个是干嘛的又不可以吃也不可以穿好像没有什么用，其实你还说对了这个还真的不可以吃也不可以穿，但是它用来干嘛的呢。用来编译你所打出的代码进行运行（可能这里说的有点不对但是只是个人认为）现在我们来说说PyCharm是用来干嘛的。PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Pyt
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分