sanyiji

机器学习之分类算法，mnist手写体识别的python实战（一）

今天我们来学习机器学习之分类算法，MNIST手写体识别的python实战。

一、MNIST数据集

首先来介绍一下什么是MNIST。
这是一组由美国高中生和人口调查局员工手写的70000个数字的图片。每张图像都用其代表的数字标记。这个数据集被广为使用，因此也被称作是机器学习领域的“Hello World”:但凡有人想到了一个新的分类算法，都会想看看在MNIST上的执行结果。因此只要是学习机器学习的人，早晚都要面对MNIST。

二、python代码实战

1.查看MNIST数据

首先导入库

# 使用sklearn的函数来获取MNIST数据集
from sklearn.datasets import fetch_openml
import numpy as np
import os
# to make this notebook's output stable across runs
np.random.seed(42)
# To plot pretty figures
%matplotlib inline
import matplotlib as mpl
import matplotlib.pyplot as plt
mpl.rc('axes', labelsize=14)
mpl.rc('xtick', labelsize=12)
mpl.rc('ytick', labelsize=12)
# 为了显示中文
mpl.rcParams['font.sans-serif'] = [u'SimHei']
mpl.rcParams['axes.unicode_minus'] = False

通过sklearn函数获取MNIST数据

# 耗时巨大
def sort_by_target(mnist):
    reorder_train=np.array(sorted([(target,i) for i, target in enumerate(mnist.target[:60000])]))[:,1]
    reorder_test=np.array(sorted([(target,i) for i, target in enumerate(mnist.target[60000:])]))[:,1]
    mnist.data[:60000]=mnist.data[reorder_train]
    mnist.target[:60000]=mnist.target[reorder_train]
    mnist.data[60000:]=mnist.data[reorder_test+60000]
    mnist.target[60000:]=mnist.target[reorder_test+60000]

mnist=fetch_openml('mnist_784',version=1,cache=True)
mnist.target=mnist.target.astype(np.int8)
sort_by_target(mnist)

然后对数据进行排序

mnist["data"], mnist["target"]

查看MNIST数据集的特征

展示单张图片

# 展示图片
def plot_digit(data):
    image = data.reshape(28, 28)
    plt.imshow(image, cmap = mpl.cm.binary,
               interpolation="nearest")
    plt.axis("off")
some_digit = X[38000]
plot_digit(X[38000].reshape(28,28))

通过修改图片上所指的值修改想要展示的图片位置。

展示10x10的图片集合
代码如下：

# 更好看的图片展示
def plot_digits(instances,images_per_row=10,**options):
    size=28
    # 每一行有一个
    image_pre_row=min(len(instances),images_per_row)
    images=[instances.reshape(size,size) for instances in instances]
#     有几行
    n_rows=(len(instances)-1) // image_pre_row+1
    row_images=[]
    n_empty=n_rows*image_pre_row-len(instances)
    images.append(np.zeros((size,size*n_empty)))
    for row in range(n_rows):
        # 每一次添加一行
        rimages=images[row*image_pre_row:(row+1)*image_pre_row]
        # 对添加的每一行的额图片左右连接
        row_images.append(np.concatenate(rimages,axis=1))
    # 对添加的每一列图片 上下连接
    image=np.concatenate(row_images,axis=0)
    plt.imshow(image,cmap=mpl.cm.binary,**options)
    plt.axis("off")

plt.figure(figsize=(9,9))
example_images=np.r_[X[:12000:600],X[13000:30600:600],X[30600:60000:590]]
plot_digits(example_images,images_per_row=10)
plt.show()

这些代码都不是很重要，能够理解其中的含义最好，不能理解也可以当做一个工具来使用。
前面的一些代码只是让我们进一步了解MNIST，接下来开始使用MNIST数据集进行分类实战。

2.分类算法

首先创建一个测试集，并把其放在一边。

X_train, X_test, y_train, y_test = X[:60000], X[60000:], y[:60000], y[60000:]

同样，我们还需要对训练集进行洗牌，这样可以保证交叉验证的时候，所有的折叠都差不多。此外，有些机器学习算法对训练示例的循序敏感，如果连续输入许多相似的实例，可能导致执行的性能不佳。给数据洗牌，正是为了确保这种情况不会发生。

import numpy as np

shuffer_index=np.random.permutation(60000)
X_train,y_train=X_train[shuffer_index],y_train[shuffer_index]

2.1训练一个二分类器

现在，我们先简化问题，只尝试识别一个数字，比如数字5，那么这个"数字5检测器",就是一个二分类器的例子，它只能区分两个类别：5和非5。先为此分类任务创建目录标量。

y_train_5=(y_train==5)
y_test_5=(y_test==5)

接着挑选一个分类器并开始训练。一个好的选择是随机梯度下降(SGD)分类器，使用sklearn的SGDClassifier类即可。这个分类器的优势是：能够有效处理非常大型的数据集。这部分是因为SGD独立处理训练实例，一次一个(这也使得SGD非常适合在线学习任务)。

from sklearn.linear_model import SGDClassifier

sgd_clf=SGDClassifier(max_iter=5,tol=-np.infty,random_state=42)
sgd_clf.fit(X_train,y_train_5)

运行结果：

2.2评估分类器

使用交叉验证测量精度

随机交叉验证和分层交叉验证效果对比。
使用cross_vla_score函数，进行三折对比

from sklearn.model_selection import cross_val_score
cross_val_score(sgd_clf, X_train, y_train_5, cv=3, scoring="accuracy")

我们采用分层，因为如果使用随机采样的话，可能会导致每一折的数据量不一致。

# 类似于分层采样，每一折的分布类似
from sklearn.model_selection import StratifiedKFold
from sklearn.base import clone

skfolds = StratifiedKFold(n_splits=3, random_state=42)

for train_index, test_index in skfolds.split(X_train, y_train_5):
    clone_clf = clone(sgd_clf)
    X_train_folds = X_train[train_index]
    y_train_folds = (y_train_5[train_index])
    X_test_fold = X_train[test_index]
    y_test_fold = (y_train_5[test_index])

    clone_clf.fit(X_train_folds, y_train_folds)
    y_pred = clone_clf.predict(X_test_fold)
    n_correct = sum(y_pred == y_test_fold)
    print(n_correct / len(y_pred))

我们可以看到两种交叉验证的准确率都达到了95%上下，看起来很神奇，不过在开始激动之前，让我们来看一个蠢笨的分类器，将所有图片都预测为‘非5’。

from sklearn.base import BaseEstimator
# 随机预测模型
class Never5Classifier(BaseEstimator):
    def fit(self, X, y=None):
        pass
    def predict(self, X):
        return np.zeros((len(X), 1), dtype=bool)
never_5_clf = Never5Classifier()
cross_val_score(never_5_clf, X_train, y_train_5, cv=3, scoring="accuracy")

我们可以看到，准确率也超过了90%！这是因为我们只有大约10%的图像是数字5，所以只要猜一张图片不是5,那么有90%的时间都是正确的，简直超过了大预言家。
这说明，准确率通常无法成为分类器的首要性能指标，特别是当我们处理偏斜数据集的时候(也就是某些类别比其他类更加频繁的时候)。

混淆矩阵

评估分类器性能的更好的方法是混淆矩阵。总体思路就是统计A类别实例被分成B类别的次数。例如，要想知道分类器将数字3和数字5混淆多少次，只需要通过混淆矩阵的第5行第3列来查看。
要计算混淆矩阵，需要一组预测才能将其与实际目标进行比较。当然可以通过测试集来进行预测，但是现在我们不动它(测试集最好保留到项目的最后,准备启动分类器时再使用)。最为代替，可以使用cross_val_predict()函数:。
cross_val_predict 和 cross_val_score 不同的是，前者返回预测值，并且是每一次训练的时候，用模型没有见过的数据来预测，
首先获取预测值

from sklearn.model_selection import cross_val_predict

y_train_pred = cross_val_predict(sgd_clf, X_train, y_train_5, cv=3)

然后使用预测值和训练值进行比较，形成混淆矩阵，
这篇博客有对预测值，AUC,ROC非常详细的介绍。

from sklearn.metrics import confusion_matrix

confusion_matrix(y_train_5, y_train_pred)

上面的结果表明：第一行所有’非5’(负类)的图片中,有53417被正确分类(真负类)，1162，错误分类成了5(假负类)；第二行表示所有’5’（正类）的图片中，有1350错误分类成了非5(假正类)，有4071被正确分类成5(真正类). 所以这个混淆矩阵是不合格的。
一个完美的分类器只有真正类和真负类，所以其混淆矩阵只会在其对角线(左上到右下)上有非零值。

2.3精度和召回率

混淆矩阵能提供大量信息，但有时我们可能会希望指标简洁一些。正类预测的准确率是一个有意思的指标,它也称为分类器的精度(如下)。
$P r e c i s i o n (精度) = T P / (T P + F P)$

其中TP是真正类的数量，FP是假正类的数量。做一个简单的正类预测，并保证它是正确的，就可以得到完美的精度(精度=1/1=100%)

这并没有什么意义，因为分类器会忽略这个正实例之外的所有内容。因此，精度通常会与另一个指标一起使用，这就是召回率，又称为灵敏度或者真正类率(TPR)：它是分类器正确检测到正类实例的比率(如下):
$R e c a l l (召回率) = T P / (T P + F N)$
FN是假负类的数量
关于真正类，假正类，真负类，假负类也可以通过上面那个博客了解。

计算的过程

对比上面得到的混淆矩阵，我们可以知道精度是竖着看的，召回率是横着看的，要想了解这两者的计算方法，要自己多思考一下。我自己也弄了好久才分清楚什么是什么。
我们可以看到，这个5-检测器，并不是那么好用，大多时候，它说一张图片为5时，只有77%的概率是准确的，并且也只有75%的5被检测出来了。
下面，我们可以将精度和召回率组合成单一的指标，称为F1分数。
1=21+1=2∗∗+=++2
$F1=\frac{2}{\frac{1}{Precision}+\frac{1}{Recall}}=2*\frac{Pre*Rec}{Pre+Rec}=\frac{TP}{TP+\frac{FN+FP}{2}}$
要计算F1分数，只需要调用f1_score()即可

F1分数对那些具有相近的精度和召回率的分类器更为有利。这不一定一直符合预期，因为在某些情况下，我们更关心精度，而另一些情况下，我们可能真正关系的是召回率。
例如：假设训练一个分类器来检测儿童可以放心观看的视频，那么我们可能更青睐那种拦截了好多好视频(低召回率),但是保留下来的视频都是安全(高精度)的分类器，而不是召回率虽高，但是在产品中可能会出现一些非常糟糕的视频分类器(这种情况下，你甚至可能会添加一个人工流水线来检查分类器选出来的视频)。
反过来说，如果你训练一个分类器通过图像监控来检测小偷:你大概可以接受精度只有30%，只要召回率能达到99%。(当然，安保人员会接收到一些错误的警报，但是几乎所有的窃贼都在劫难逃)
遗憾的是，鱼和熊掌不可兼得：我们不能同时增加精度并减少召回率，反之亦然，这称为精度/召回率权衡

精度和召回率权衡

在分类中，对于每个实例，都会计算出一个分值，同时也有一个阈值，大于为正例，小于为负例。通过调节这个阈值，可以调整精度和召回率。
通过decision_function这个函数得到一个分值，也就是概率值

y_scores = sgd_clf.decision_function([some_digit])
y_scores

我们分别拿0和200000的阈值和这个概率值进行比较分别得到不同的结果

然后通过cross_val_predict 做交叉验证，返回决策分数

# 返回决策分数，而不是预测结果
y_scores = cross_val_predict(sgd_clf, X_train, y_train_5, cv=3,
                             method="decision_function")
y_scores.shape

接下来我们通过一个图来看一下阈值对精度和召回率的影响
通过以下代码形成图

from sklearn.metrics import precision_recall_curve

precisions, recalls, thresholds = precision_recall_curve(y_train_5, y_scores)
def plot_precision_recall_vs_threshold(precisions, recalls, thresholds):
    plt.plot(thresholds, precisions[:-1], "b--", label="Precision", linewidth=2)
    plt.plot(thresholds, recalls[:-1], "g-", label="Recall", linewidth=2)
    plt.xlabel("Threshold", fontsize=16)
    plt.title("精度和召回率VS决策阈值", fontsize=16)
    plt.legend(loc="upper left", fontsize=16)
    plt.ylim([0, 1])

plt.figure(figsize=(8, 4))
plot_precision_recall_vs_threshold(precisions, recalls, thresholds)
plt.xlim([-700000, 700000])
plt.show()

我们把阈值的范围规定在-700000-700000之间。

绿色的是召回率，蓝色的是精度。
可以看见，随着阈值提高，召回率下降了，也就是说，有真例被判负了，精度上升，也就是说，有部分原本被误判的负例，被丢出去了。

你可以会好奇，为什么精度曲线会比召回率曲线要崎岖一些，原因在于，随着阈值提高，精度也有可能会下降 4/5 => 3/4(虽然总体上升)。另一方面，阈值上升，召回率只会下降。因为分母是不会改变的，分值减小，概率肯定降低。

现在就可以轻松通过选择阈值来实现最佳的精度/召回率权衡了。还有一种找到最好的精度/召回率权衡的方法是直接绘制精度和召回率的函数图。

def plot_precision_vs_recall(precisions, recalls):
    plt.plot(recalls, precisions, "b-", linewidth=2)
    plt.xlabel("Recall", fontsize=16)
    plt.title("精度VS召回率", fontsize=16)
    plt.ylabel("Precision", fontsize=16)
    plt.axis([0, 1, 0, 1])

plt.figure(figsize=(8, 6))
plot_precision_vs_recall(precisions, recalls)
plt.show()

以召回率为x轴，以精度为y轴

可以看见，从80%的召回率往右，精度开始急剧下降。我们可能会尽量在这个陡降之前选择一个精度/召回率权衡–比如召回率60%以上。当然，如何选择取决于你的项目。

假设我们决定瞄准90%的精度目标。通过绘制的第一张图(放大一点)，得出需要使用的阈值大概是70000.要进行预测(现在是在训练集上),除了调用分类器的predict方法，也可以使用这段代码：

y_train_pred_90 = (y_scores > 70000)
precision_score(y_train_5, y_train_pred_90)

recall_score(y_train_5, y_train_pred_90)

现在我们就有了一个精度接近90%的分类器了，如果有人说，“我们需要99%的精度。”，那么我就要问：“召回率是多少？”

2.4ROC曲线

还有一种经常与二元分类器一起使用的工具，叫做受试者工作特征曲线(简称ROC)。它与精度/召回率曲线非常相似，但绘制的不是精度和召回率，而是真正类率(召回率的另一种称呼)和假正类率(FPR)。FPR是被错误分为正类的负类实例比率。它等于1-真负类率(TNR)，后者正是被正确分类为负类的负类实例比率，也称为奇异度。因此ROC曲线绘制的是灵敏度和(1-奇异度)的关系

·	1	0
1	TP	FN
0	FP	TN

$FPR=\frac{FP}{FP+TN}$
$Recall=\frac{TP}{TP+FN}$
通过以下代码形成ROC曲线

# 使用 roc_curve()函数计算多种阈值的TPR和FPR
from sklearn.metrics import roc_curve

fpr, tpr, thresholds = roc_curve(y_train_5, y_scores)
def plot_roc_curve(fpr, tpr, label=None):
    plt.plot(fpr, tpr, linewidth=2, label=label)
    plt.plot([0, 1], [0, 1], 'k--')
    plt.axis([0, 1, 0, 1])
    plt.xlabel('False Positive Rate', fontsize=16)
    plt.ylabel('True Positive Rate', fontsize=16)

plt.figure(figsize=(8, 6))
plot_roc_curve(fpr, tpr)
plt.show()

横轴是负正类率，竖轴是真正类率，图中的数据为ROC值
计算ROC值得代码如下

from sklearn.metrics import roc_auc_score

roc_auc_score(y_train_5, y_scores)

这里同样面对一个折中权衡:召回率(TPR)很高,分类器产生的假正类(FPR)就越多。虚线表示纯随机的ROC曲线；一个优秀的分类器(向左上角)。
有一种比较分类器的方式是测量曲线下面积(AUC)。完美的ROC AUC等于1，纯随机分类的ROC AUC等于0.5

ROC曲线和精度/召回率(或PR)曲线非常相似，因此，你可能会问，如何决定使用哪种曲线。
一个经验法则是，当正类非常少见或者你更关注假正类而不是假负类时，应该选择PR曲线，反之选择ROC曲线。
例如，看前面的ROC曲线图时，以及ROC AUC分数时，你可能会觉得分类器真不错。但这主要是应为跟负类(非5)相比，正类(数字5)的数量真的很少。相比之下，PR曲线清楚地说明分类器还有改进的空间(曲线还可以更接近右上角)

2.5随机森林分类器

这里我们再训练一个随机森林分类器，并计算ROC和ROC AUC分数。随机森林会在后面的课程学到，这里暂时不管它。
代码如下：

# 具体RF的原理，第七章介绍
from sklearn.ensemble import RandomForestClassifier
forest_clf = RandomForestClassifier(n_estimators=10, random_state=42)
y_probas_forest = cross_val_predict(forest_clf, X_train, y_train_5, cv=3,
                                    method="predict_proba")
y_scores_forest = y_probas_forest[:, 1] # score = proba of positive class
fpr_forest, tpr_forest, thresholds_forest = roc_curve(y_train_5,y_scores_forest)

plt.figure(figsize=(8, 6))
plt.plot(fpr, tpr, "b:", linewidth=2, label="SGD")
plot_roc_curve(fpr_forest, tpr_forest, "Random Forest")
plt.title("SGD和RL的ROC曲线对比")
plt.legend(loc="lower right", fontsize=16)
plt.show()

和前面的ROC曲线做对比，我们可以发现随机森林的效果要更好

ROC的值比前面的ROC曲线也要高的多。
再看一下精度和召回率

同样的效果也比前面的分类器好。

2.6多元分类器

二元分类器在两个类别中区分，而多类别分类器(也称为多项分类器),可以区分两个以上的类别。

例如：我们可以训练0-9的10个二元分类器组合，那个分类器给的高，就分为哪一类，这称为一对多(OvA)策略

我这里因为之前换了some_digit的位置，所以是6

我们可以看到 sgd对输入的结果输出了10个预测分数，而不是1个

其中最大的一个就为预测分数

训练分类器的时候，目标类别的列表会存储在classes_这个属性中，按值的大小进行排序

另一种方法，是为每一对数字训练一个二元分类器:一个用来区分0-1，一个区分0-2，一个区分1-2，依次类推。这称为一对一(OvO)策略，解决N分类，需要(N)*(N-1)/2分类器，比如MNIST问题，需要45个分类器。OvO的主要优点在于每个分类器只需要用到部分训练集对其必须区分的两个类别进行训练。
代码如下，我们通过OneVsOneClassifier这个函数强制使用OvO策略。

from sklearn.multiclass import OneVsOneClassifier
ovo_clf = OneVsOneClassifier(SGDClassifier(max_iter=5, tol=-np.infty, random_state=42))
ovo_clf.fit(X_train, y_train)
ovo_clf.predict([some_digit])

可以看到它的概率值有45个，也就是通过(N)*(N-1)/2计算得到的45.

有些算法(例如支持向量机算法)，在数据规模增大时，表现糟糕，因此对于这类算法，OvO是一个优秀的选择，由于在较小的训练集上分别训练多个分类器比在大型数据集上训练少数分类器要快得多。但对于大多数二元分类器，OvA策略还是更好的选择。
随机森林的多分类，不需要OvA或者OVO策略，因为随机森林算法和朴素贝叶斯分类器可以直接处理多个类别。也有一些严格的二元分类器，比如支持向量分类器或线性分类器。但有多种策略，可以让我们用几个二元二类器实现多类别分类的目的。

发现对6的预测是最高的。

这里只是展示一下，后面才会学到随机森林分类器。
评测结果大概都为80%以上，如果是随机分类器，准确率大概是10%左右，所以这个结果不是太糟糕，但是依然有提升的空间，比如使用标准化，进行简单的缩放。
通过StandardScaler函数进行标准化。
代码如下：

from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train.astype(np.float64))
cross_val_score(sgd_clf, X_train_scaled, y_train, cv=3, scoring="accuracy")

可以看到都提升到了90%以上。

错误分析

如果这是一个真正的项目，我们将遵循第二章机器学习项目清单的步骤:探索数据准备的选项，尝试多个模型，列出最佳模型并使用GridSearchCV对超参数进行微调，尽可能自动化，等等。在这里，假设我们已经找到一个有潜力的模型，现在希望找到一些方法，对其进一步改进。方法之一就是分析其类型错误。
首先，看一下一个十分类的混淆矩阵。

这里都是数字，不太好看到他们的关系，所以我们再画一张图
代码如下：

def plot_confusion_matrix(matrix):
    """If you prefer color and a colorbar"""
    fig = plt.figure(figsize=(8,8))
    ax = fig.add_subplot(111)
    cax = ax.matshow(matrix)
    fig.colorbar(cax)

plt.matshow(conf_mx, cmap=plt.cm.gray)
plt.show()

可以看到5稍微暗一点，可能意味着数据集中5的图片少，也可能是分类器在5上的执行效果不行。实际上，这二者都属实。但是其实也看不出来什么东西。

让我们把焦点都放在错误上。首先，我们需要将混淆矩阵中的每个值都除以相应类别中的图片数，这样比较的而是错误率，而不是错误的绝对值(后者对图片数量较多的类别不公平)

row_sums = conf_mx.sum(axis=1, keepdims=True)
norm_conf_mx = conf_mx / row_sums

np.fill_diagonal(norm_conf_mx, 0) # 填充主对称轴
plt.matshow(norm_conf_mx, cmap=plt.cm.gray)
plt.show()

行表示实际类别，列表示预测的类别，可以看到 8 9 列比较亮，容易其他数字容易被分错为8 9， 8 9 行业比较亮，说明 8 9 容易被错误分为其他数字。此外3 容易被错分为 5，5也容易被错分为4

分析混淆矩阵，通常可以帮助我们深入了解如何改进分类器。通过上面的图，我们可以花费更多时间来改进8 9的分类，以及修正 3 5 的混淆上。
例如，可以试着收集更多这些数字的训练集，
或者开发新特征来改进分类器–举个例子，写一个算法来计算闭环的数量，比如(8有两个，6有一个，5没有)。
再或者，对图片进行预处理，让某些模式更加突出，比如闭环之类的。

分析单个错误也可以为分类器提供洞察：它在做什么？为什么失败？但这通常更加困难和耗时。例如，我们来看看数字3和数字5的例子：
我们打印50个3和50个5的图片
代码如下：

cl_a, cl_b = 3, 5
X_aa = X_train[(y_train == cl_a) & (y_train_pred == cl_a)]
X_ab = X_train[(y_train == cl_a) & (y_train_pred == cl_b)]
X_ba = X_train[(y_train == cl_b) & (y_train_pred == cl_a)]
X_bb = X_train[(y_train == cl_b) & (y_train_pred == cl_b)]

plt.figure(figsize=(8,8))
plt.subplot(221); plot_digits(X_aa[:25], images_per_row=5)
plt.subplot(222); plot_digits(X_ab[:25], images_per_row=5)
plt.subplot(223); plot_digits(X_ba[:25], images_per_row=5)
plt.subplot(224); plot_digits(X_bb[:25], images_per_row=5)
plt.show()

我们可以看到，虽然有一些数字容易混淆，但大多数，还是比较好分类的，但算法还是会分错。因为SGD模型是一个线性模型，它所做的就是为每一个像素分配一个各个类别的权重，当它看到新的图像时，将加权后的像素强度汇总，从而得到一个分数进行分类。而数字3和5只在一部分像素位上有区别，所以分类器很容易将其搞混.

数字3和5之间的主要区别在于连接顶线和下方弧线中间的小线条的位置。如果我们写的数字3将连续点略往左移，分类器就可能将其分类为5，反之亦然。换言之，这个分类器对图像位移和旋转非常敏感，因此，减少3 5混淆的方法之一是对数字进行预处理，确保他们位于中心位置，并且没有旋转。这也有助于减少其他错误。

你可能感兴趣的:(人工智能与机器学习)

未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
人工智能与机器学习原理精解【18】叶绿先锋基础数学与应用数学人工智能机器学习
文章目录决策树基础决策树的定义决策树的计算决策树的例子决策树的例题决策树算法一、决策树的算法过程二、决策树的性质Julia中实现框架使用`DecisionTree.jl`使用`MLJ.jl`Julia包的教程一、了解Julia包生态系统二、安装Julia包1.打开JuliaREPL2.使用Pkg包管理器三、使用Julia包四、查找和了解Julia包1.Julia官方文档2.JuliaHub3.Gi
人工智能与机器学习原理精解【1】叶绿先锋基础数学与应用数学神经网络人工智能深度学习
文章目录Rosenblatt感知器感知器基础收敛算法算法概述算法步骤关键点说明总结C++实现要点代码参考文献Rosenblatt感知器感知器基础感知器，也可翻译为感知机，是一种人工神经网络。它可以被视为一种最简单形式的前馈式人工神经网络，是一种二元线性分类器。Rosenblatt感知器建立在一个非线性神经元上，但是它只能完成线性分类硬限幅与超平面局部诱导域v=∑i=1mwixi+b从上面公式看来，
人工智能与机器学习原理精解【16】叶绿先锋基础数学与应用数学人工智能机器学习
文章目录因果推理概率空间模型一、定义二、性质三、构建步骤四、示例五、应用联合分布概述联合分布函数和概率密度函数之间的主要关系离散型联合分布连续型联合分布联合分布函数一、定义二、性质三、计算四、例子五、例题Reichenbach的共同原因原则定义与背景主要内容数学原理概述应用与推断应用领域注意事项Reichenbach共同原因原则（赖兴巴赫共同原因原理）的实例1.自然科学领域实例一：地震与海啸的相关
人工智能与机器学习原理精解【17】叶绿先锋基础数学与应用数学人工智能机器学习概率论
文章目录贝叶斯贝叶斯定理的公式推导一、条件概率的定义二、联合概率的分解三、贝叶斯定理的推导四、全概率公式的应用五、总结全概率公式推导一、全概率公式的定义二、全概率公式的推导三、全概率公式的应用贝叶斯定理的原理一、基本原理二、核心概念三、数学表达式四、原理应用五、原理特点朴素贝叶斯定理一、贝叶斯定理基础二、朴素贝叶斯的原理三、朴素贝叶斯的特点朴素贝叶斯公式一、贝叶斯定理二、特征独立性假设三、朴素贝叶
未来行业走向：探索变革与机遇安西宁
引言随着科技的迅猛发展和社会的不断变迁，未来的行业走向将会面临新的挑战和机遇。本文将对未来行业的几个关键领域进行分析，并探讨相关变革所带来的影响和可能的机遇。一、人工智能与机器学习人工智能（AI）和机器学习（ML）将成为未来行业发展的关键驱动力。AI技术的广泛应用将改变许多行业的工作方式和商业模式。例如，在医疗领域，AI可以帮助医生进行更准确的诊断和治疗方案选择；在交通领域，自动驾驶技术的发展将彻
政安晨：【完全零基础】认知人工智能（一）【超级简单】的【机器学习神经网络】 —— 预测机政安晨政安晨的机器学习笔记政安晨的人工智能笔记人工智能神经网络深度学习机器学习原理超级简单零基础
开个头很多小伙伴们很想亲近人工智能与机器学习领域，然而这个领域里的核心理论、算法、工具给人感觉都太过“高冷”，让很多小伙伴们望而却步，导致一直无法入门。如何捅破这层窗户纸？让高冷的不再高冷，让神秘的不再神秘！不要怕它，伙计们，咱们以这个小系列文章零基础入门。（这个系列的文章仅需要您稍微听说过一点点编程语言即可，比如Python）如果是对IT这个产业了解不深的小伙伴，可以先快速浏览一下我的这两篇文章
探索嵌入式系统的未来发展趋势迷璃学妹人工智能
嵌入式系统是一种专门设计用于特定应用领域的计算机系统，它通常被嵌入到更大的设备中，以执行特定的任务。随着科技的不断发展，嵌入式系统的未来发展趋势将受到多方面的影响，包括技术进步、市场需求和应用场景的拓展等。以下将从多个角度对嵌入式系统未来的发展趋势进行分点论述。1.人工智能与机器学习的融合随着人工智能和机器学习技术的快速发展，嵌入式系统将更多地融合这些先进技术。未来的嵌入式系统将具备更强大的智能和
大数据思考：面对海量数据时，选择哪种模式才是更适合自己的？ Akamai中国云计算大数据云计算 Akamai Linode 数据仓库
如果您从事科技行业或者您不在这个行业，也许您已经听说过很多关于AI的信息。我所说的不仅仅是多年来我们都喜欢的科幻小说中“天网正在接管地球”式的人工智能，而是人工智能和机器学习已经逐渐成为我们日常生活中的实际应用.大数据是人工智能与机器学习的生命线和支柱。庞大的数据，或者说海量数据，一直驱动着当今的人工智能与机器学习的发展。虽然我们总是希望数据量越大越好，但近年来组织已经开始从追求大数据转向选择小而
ChatGPT学习大纲冷暖从容 ChatGPT chatgpt 学习人工智能
引言在2023年2月份左右开始使用ChatGPT时，就被它强大的理解能力和应答效果所折服，这期间一直在断断续续的学习和使用，也没形成一个完整的学习过程，最近刚好有空，就寻思着好好再学习总结一下，故写出了ChatGPT学习系列的文章，供与大家学习交流。第1周-ChatGPT基础知识ChatGPT简介了解ChatGPT的基本功能和应用场景。人工智能与机器学习基础学习AI和机器学习的基本概念，为理解
人工智能与机器学习——开启智能时代的里程碑洁洁！人工智能机器学习
写在前面前言人工智能与机器学习的概述监督学习、无监督学习和强化学习的基本原理监督学习：无监督学习：强化学习：机器学习的算法和方法常见的机器学习算法和方法线性回归：决策树：支持向量机：神经网络：人工智能与机器学习的应用领域人工智能与机器学习的未来发展结论：图书推荐主要内容作者简介推荐语前言人工智能是指使计算机系统表现出类似于人类智能的能力。其目标是实现机器具备感知、理解、学习、推理和决策等智能行为。
【网络安全|信息泄露】谷歌容器云曝“严重风险”：上千 Kubernetes 集群可能暴露，涉某上市公司网安老伯 web安全 kubernetes 安全网络安全 xss 开发语言 googlecloud
有消息称：谷歌刚刚修复了一个影响重要云服务的漏洞。此前研究人员发现，多家组织（包括一家上市公司）的系统容易受到该漏洞影响。该问题影响了谷歌Kubernetes引擎（GKE），这是一种用于部署、扩展和管理应用程序“容器化”的系统。GKE是谷歌针对Kubernetes开源项目的商用服务，广泛用于医疗保健、教育、零售和金融服务，以及数据处理和人工智能与机器学习操作。云安全厂商OrcaSecurity的研
人工智能与机器学习在工业质量检测中的融合发展 matlabgoodboy 人工智能机器学习
人工智能与机器学习在工业质量检测中的融合发展随着科技的进步，人工智能和机器学习已经成为引领工业质量检测变革的重要力量。它们在工业领域的应用，不仅提高了检测的准确性和效率，也为企业带来了前所未有的发展机遇。一、机器学习在工业质量检测中的优势机器学习技术可以通过训练模型，让机器自动识别和检测产品的缺陷和异常，大大提高了检测的效率和准确性。相比传统的人工检测方式，机器学习能够处理大量数据，快速准确地定位
2023年全球软件质量&效能大会（QECon深圳站）：核心内容与学习收获（附大会核心PPT下载）百家峰会软件质量效能 QECon 程序人生软件开发 QECon
随着科技的快速发展，软件行业面临着越来越多的挑战和机遇。为了更好地应对这些挑战，不断提升软件的质量和效能，大会将汇聚全球的软件开发者、架构师和项目经理，共同探讨和分享关于软件质量保证、测试、性能优化、用户体验设计、人工智能与机器学习、安全与隐私保护等方面的最佳实践和技术趋势。通过本次大会，深入了解行业动态和前沿技术，从中汲取灵感和知识。一、大会核心内容1、软件质量保证和测试：这一板块将重点关注软件
2023年全球软件开发大会（QCon北京站2023）9月：核心内容与学习收获（附大会核心PPT下载）百家峰会程序人生软件开发 QCon 软件开发大会 QCon 软件人生
随着科技的飞速发展，全球软件开发大会（QCon）作为行业领先的技术盛会，为世界各地的专业人士提供了交流与学习的平台。本次大会汇集了全球的软件开发者、架构师、项目经理等，共同探讨软件开发的最新趋势、技术与实践。本文将深入解析大会的核心内容，并探讨从中可以学到的东西。一、核心内容1、人工智能与机器学习在本次大会上，人工智能与机器学习成为核心议题之一。专家们深入探讨了如何运用机器学习技术优化软件开发流程
人机对话：程序设计，学哪种语言好？明月看潮生码农视角少年软件工程师少年工程师编程语言职业发展前景未来
人机对话：程序设计，学哪种语言好？程序设计，学哪种语言好？学习目的：职业发展：个人兴趣：go语言怎么样？优点：缺点：要开发手机APP，还需要学习哪些技术？编程语言：前端开发技术：后端开发技术：移动网络技术：本地存储与数据管理：性能优化：安全开发实践：测试技术：那是学的范围广一些好呢，还是专门钻研一种技术呢？就目前来说，哪种技术更好价值？人工智能与机器学习：前端Web全栈技术：移动开发：区块链技术：
基于Java的人工智能与机器学习初探 naer_chongya 人工智能 java 机器学习
随着人工智能和机器学习的快速发展，Java作为一种流行的编程语言，被广泛应用于许多AI和机器学习应用程序的开发中。本文将介绍Java在AI和机器学习开发中的基本概念和技术。Java在AI和机器学习中的应用Java可以广泛应用于人工智能和机器学习应用程序的开发中，包括数据预处理、特征选择、模型训练和评估等。Java还具备跨平台的能力，能够在各种操作系统上运行，这使得Java成为机器学习和AI领域的重
图像识别的技术前沿：人工智能与机器学习的融合 matlabgoodboy 人工智能机器学习
图像识别的技术前沿在于人工智能（AI）与机器学习（ML）的融合。这种融合使得图像识别系统能够从大量数据中自动学习并识别出各种模式，从而在复杂和动态的环境中实现更高的准确性和鲁棒性。机器学习在图像识别中发挥着越来越重要的作用。传统的图像识别方法通常依赖于手工制作的特征提取和特征匹配，而机器学习则通过训练神经网络自动学习图像中的特征，并做出准确的分类或识别。深度学习，特别是卷积神经网络（CNN），已经
搜索与人工智能码海串游人工智能
前言第一：通过博弈树搜索和启发式搜索的例子了解基于搜索的通用问题求解方法第二：了解人工智能发展的历程和社会影响第三：了解机器学习的基本思想和典型应用第四：了解人工智能应用开发的基本模式内容1.博弈树与剪纸、零和博弈，极大极小策略博弈树与搜索，α与β剪枝以及著名的计算机博弈的例子2.启发式搜索启发式函数，启发式搜索过程，3.人工智能与机器学习人工智能发展历程，专家系统，机器学习，神经网络与深度学习。
图像识别的技术前沿：人工智能与机器学习的融合 matlabgoodboy 人工智能机器学习
图像识别的技术前沿在于人工智能（AI）与机器学习（ML）的融合。这种融合使得图像识别系统能够从大量数据中自动学习并识别出各种模式，从而在复杂和动态的环境中实现更高的准确性和鲁棒性。机器学习在图像识别中发挥着越来越重要的作用。传统的图像识别方法通常依赖于手工制作的特征提取和特征匹配，而机器学习则通过训练神经网络自动学习图像中的特征，并做出准确的分类或识别。深度学习，特别是卷积神经网络（CNN），已经
斯坦福AI百年报告2017：人工智能与机器学习全景式概览智能交通技术人工智能游戏大数据机器学习深度学习
“AIIndex”（AI指数）近日重磅发布，这是斯坦福大学AI百年研究（AI100）的一个项目，旨在追踪人工智能的活动和进展。该报告列出了2017年人工智能在计算机视觉、自然语言理解等方向上的最新进展，分学术、产业多个角度盘点人工智能进度。报告还综合学术论文数量、招生数量和VC投资数量，得出AI发展活力指数，数据显示，最新一波AI浪潮在2015年活力最高，自那以后其实活力开始有小幅减弱。报告全文：
AI和人工智能与机器学习全景报告人工智能学派人工智能
今天分享的是AI系列深度研究报告：《AI和人工智能与机器学习全景报告》。（报告出品方：appen）报告共计：30页获取数据获取仍是AI应用构建团队的主要瓶颈。原因各不相同。例如，特定用例的数据可能不足，新的机器学习技术需要更多的数据，或者并未建立轻松高效获取所需数据的适当流程。受访者对AI生命周期数据管理的看法有着强烈的共识，即企业领导者了解AI生命周期数据管理的价值(90%同意)，AI生命周期数
SQL on Hadoop在快手大数据平台的实践与优化 | 分享实录 weixin_34292959 大数据面试后端
快手大数据架构工程师钟靓本文是根据快手大数据架构工程师钟靓于5月18-19日在A2M人工智能与机器学习创新峰会《SQLonHadoop在快手大数据平台的实践与优化》演讲中的分享内容整理而成。内容简介：本文主要从SQLonHadoop介绍、快手SQLonHadoop平台概述、SQLonHadoop在快手的使用经验和改进分析、快手SQLonHadoop的未来计划四方面介绍了SQLonHadoop架构。
Python实现游戏人工智能与机器学习心梓知识人工智能 python 游戏
一、前言人工智能（AI）与机器学习（ML）已逐渐渗透到游戏开发领域，游戏玩法、画面效果、物理模拟等都得到了极大的提升。本文将介绍Python在游戏人工智能与机器学习方面的应用，主要涉及以下几个方面：游戏AI基础知识游戏AI示例：独立行动游戏（IndependentActionGame，IAG）监督学习与无监督学习遗传算法强化学习深度学习二、游戏AI基础知识游戏AI分为两类：基于规则的游戏AI和机器
1000+常用Python库 TimeBomb2021 python库 python
目录Python常用库文件处理图像处理游戏和多媒体大数据与科学计算人工智能与机器学习系统与命令行数据库网络Web框架安全构建封装代码调试Python常用库Chardet字符编码探测器，可以自动检测文本、网页、xml的编码。colorama主要用来给文本添加各种颜色，并且非常简单易用。Prettytable主要用于在终端或浏览器端构建格式化的输出。difflib，[Python]标准库，计算文本差异
架构师必知必会系列：人工智能与机器学习架构禅与计算机程序设计艺术 AI大模型应用实战架构师必知必会系列大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.背景介绍人工智能（ArtificialIntelligence，AI）、机器学习（MachineLearning，ML）、深度学习（DeepLearning，DL）和计算机视觉（ComputerVision，CV），经历了从新兴到昙花一现的发展过程，目前已成为人类社会发展的不可或缺的一部分。随着科技的不断进步，人工智能在各个领域都已经取得重大突破，将迎来深刻的变革。
第三章:人工智能深度学习教程-人工智能与机器学习与深度学习之间的区别 geeks老师人工智能深度学习人工智能深度学习机器学习图搜索算法生成对抗网络视觉检测自动驾驶
人工智能基本上是通过一组规则（算法）将人类智能融入机器的机制。人工智能是两个词的组合：“人工”是指由人类或非自然物体制造的东西，“智能”是指相应地理解或思考的能力。另一个定义可能是“人工智能基本上是训练机器（计算机）模仿人脑及其思维能力的研究”。人工智能侧重于3个主要方面（技能）：学习、推理和自我纠正，以获得尽可能最大的效率。机器学习：机器学习基本上是一种研究/过程，它使系统（计算机）能够通过其拥
人工智能与机器学习 Kali与编程～未来科技人工智能机器学习
人工智能和机器学习是目前科技领域最热门的话题之一，它们正在改变着我们的生活和工作方式。本文将从多个角度探讨人工智能和机器学习的应用和发展，以期为读者提供更全面的了解。一、人工智能和机器学习的定义人工智能（ArtificialIntelligence，简称AI）是模拟人类智能的机器系统，这种机器系统可以在某些任务上比人类表现得更好。人工智能的应用领域非常广泛，例如自然语言处理、计算机视觉、智能机器人
人工智能与机器学习---梯度下降法鄧丫丫机器学习
一、梯度下降法1、概述梯度下降（gradientdescent）在机器学习中应用十分的广泛，不论是在线性回归还是Logistic回归中，它的主要目的是通过迭代找到目标函数的最小值，或者收敛到最小值。2、原理梯度下降算法的基本原理就是通过多次迭代，求得与精度值匹配的最后结果：二、牛顿法1、牛顿法的概述牛顿法是机器学习中用的比较多的一种优化算法。牛顿法的基本思想是利用迭代点处的一阶导数(梯度)和二阶导
python常见库类型就叫飞六吧 1024程序员节
python常见库类型：文本处理文件处理图像处理大数据与科学计算人工智能与机器学习网络Web框架安全GUI构建封装程序代码调试详细可查如下blog。著：转发如下https://blog.csdn.net/Python_0011/article/details/125945725?ops_request_misc=%257B%2522request%255Fid%2522%253A%25221698
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&