lingan_Hong

机器学习之AdaBoost元算法（七）

主要内容：
● 组合相似的分类器来提高分类器性能
● 应用AdaBoost算法
● 处理非均衡问题分类问题

打个比方，做重要决定的时候，大家可能会汲取多个专家而不是一个人的意见。机器学习处理处理问题的时候，也是如此，这就是元算法的思路。
元算法是对其他算法进行组合的一种方式。

7.1 基于数据集多重抽样的分类器
前面介绍了五种不同的算法，各有优缺点。我们可以将不同的分类器组合起来，这种组合结果被称之为集成方法或者元算法。使用集成方法可以有很多形式，可以是不同算法的集成，也可以是同一算法在不同的设置下的集成，还可以是数据集不同部分分配给不同分类器之后的集成。

AdaBoost
优点：泛化错误率低，可以应用到大部分分类器上，无参数调整。
缺点：对离群点敏感
适用数据类型：数值型和标称型数据。

7.1.1 bagging：基于数据随机抽样的分类器的构建方法

自举汇聚法，或称bagging方法。是在原始数据集中选择S次后得到S个新数据集的一种技术。新数据集和原始数据集的大小相等。

7.1.2 boosting
boosting是通过集中关注被已有的分类器错分的那些数据来获得新的分类器。
boosting有多个版本，我们现在只讨论AdaBoost。

AdaBoost的一般流程：
（1）收集数据：可以使用任意方法
（2）准备数据：依赖于所使用的弱分类器类型，本次使用的是单层决策树，这种分类器可以处理任何数据类型。还可以使用任意分类器作为弱分类器。其中，kNN，决策树，朴素贝叶斯，logistic回归，支持向量机任一分类器都可以充当分类器。作为弱分类器，简单分类器的效果会更好。
（3）分析数据：可以使用任意方法
（4）训练算法：AdaBoost的大部分时间都在训练上，分类器将多次在同一数据集上训练弱分类器。
（5）测试算法：计算分类的错误率
（6）使用算法：同SVM一样，AdaBoost预测两个类别中的一个。如果想把它应用到多个类别的场合，那么就要像多类SVM中的做法一样，对AdaBoost代码进行修改。

7.2 训练算法：基于错误提升分类器的性能
能不能用弱分类器和多个实例来构建一个强分类器。
在二分类的情况下弱分类的错误率会高于50% ，而强分类器的错误率会低很多。

AdaBoost（adaptive boosting ：自适应）的缩写。运行过程如下：
1. 训练数据中的每个样本，赋予一个权重，这些权重构成了向量D。
2. 一开始，这些权重都初始化成相等值，首先在训练数据上训练出一个弱分类器的并计算该分类器的错误率，然后在同一数据集上再次训练弱分类器。
3.在分类器第二次训练当中，将会重新调整每个样本的权重，其中第一次分对的样本的权重会降低，而第一次分错的样本的权重将会提高。
4.为了从所有弱分类器中得到最终的分类结果，AdaBoost为每个分类器都配了一个权重值alpha，这些alpha值是基于每个弱分类器的错误率进行计算的。
其中，错误率 ε 定义为：

ε = 未正确分类的样本数目 / 所有的样本数目

其中，alpha的公式如下

a = ln(1-ε\ε) * 1\2

AdaBoost算法的流程图如下：

计算出alpha 之后，可以对权重向量D进行更新，使得正确分类的样本权重降低而错分样本的权重升高。
如果某个样本被正确分类，那么该样本的权重更改为：

计算出D之后，AdaBoost算法会进行下一次迭代。算法不断重复训练和调整权重的过程，直到训练错误率为0或者弱分类的数目达到用户的指定值为止。

7.3 基于单层决策树构建弱分类器

单层决策树（decision stump，也称之为决策树桩）是一种简单的决策树。这个单层决策树仅基于单个特征的来做决策。

我们将使用多套代码来构建单层决策树：
1.第一个函数将用于测试是否有某个值小于或者大于我们正在测试的阈值。
2.第二个函数在一个加权平均数据集中循环，并找到具有最低错误率的单层决策树。

import numpy as np

def loadSimpData():
    datMat = np.matrix(
            [[ 1. , 2.1],
             [ 2. , 1.1],
             [ 1.3, 1. ],
             [ 1. , 1. ],
             [ 2. , 1. ]])
    classLabels = [1.0 , 1.0, -1.0, -1.0, 1.0]
    return datMat, classLabels

第二个函数的伪代码如下：

""" 将最小错误率minError设为 +inf 大 对数据集中的每一个特征(第一层循环)： 对每个步长(第二层循环)： 对每个不等号(第三层循环)： 建立一棵单层决策树并利用加权数据集对它进行测试 如果错误率地域minError，则将当前的单层决策树设为最佳单位决策树 返回最佳单层决策树 """

#=========================================================================
# 单层决策树生成函数
def stumpClassify(dataMatrix, dimen, threshVal, threshIneq):
    retArray = np.ones((np.shape(dataMatrix)[0],1))
    if threshIneq == 'lt':
        retArray[dataMatrix[:, dimen] <= threshVal] = -1.0
    else:
        retArray[dataMatrix[:, dimen] > threshVal] = 1.0
    return retArray

def buildStump(dataArr, classLabels, D):
    dataMatrix = np.mat(dataArr); labelMat = np.mat(classLabels).T
    m, n = np.shape(dataMatrix)                    
    numSteps = 10.0; bestStump = {}; bestClasEst = np.mat(np.zeros((m, 1)))
    minError = inf
    for i in range(n):
        rangeMin = dataMatrix[:, i].min();rangeMax = dataMatrix[:, 1].max()
        stepSize = (rangeMax - rangeMin)/numSteps
        for j in range(-1, int(numSteps) + 1):
            for inequal in ['lt', 'gt']:
                threshVal = (rangeMin + float(j) * stepSize)
                predictedVals = stumpClassify(dataMatrix, i, threshVal, inequal)
                errArr = np.mat(np.ones((m, 1)))
                errArr[predictedVals == labelMat] = 0
                weightedError = D.T * errArr
                print "split: dim %d, thresh %.2f, thresh inequal: %s, the weighted error is %.3f" %(i ,threshVal, inequal,weightedError)
                if weightedError < minError:
                    minError = weightedError
                    bestClasEst = predictedVals.copy()
                    bestStump['dim'] = i
                    bestStump['thresh'] = threshVal
                    bestStump['ineq'] = inequal
    return bestStump, minError, bestClasEst

至此，我们构架了一个基于加权输入值进行决策的分类器。

1。第一个函数stumpClassify()是通过阈值比较对数据进行分类的。所有在阈值一边的数据会分到类别-1，而在另一边的数据会分到类别+1 ，。该函数可以通过数组过滤来实现，，将返回的数组的全部元素设置为+1，然后将所有不满足不等式要求的元素设置为-1 。
2.第二个函数buildStump() 将遍历buildStump()函数所有可能输入的值，并找到数据集上最佳的单层决策树。（“最佳”是基于权重向量D来定义的），bestStump这个空字典集用于存储给定权重向量D所得到的最佳单层决策树的相关信息。minError 正无穷大，用于寻找可能的最小概率。
3.三层嵌套的for循环是程序的最主要的部分。第一层for循环在数据集的所有特征上遍历。通过计算最小值和最大值来了解需要最大的步长。第二层for循环在这些特征的值上进行遍历。最后一个for循环是在大于和小于之间切换不等式。
4.在三层的for循环之内，我们在数据集及三个循环变量上调用stumpClassify()函数。构建的列向量errArr，若predictedVals中的值不等于labelMat中的真正类别的标签值，errArr = 1。
errArr 和权重向量D乘积相应元素求和，得到weightedError。
5.我们是基于权重向量D而不是其他错误计算指标来评价分类器的。

In [7]: import adaboost

In [8]: reload(adaboost)
Out[8]: <module 'adaboost' from 'adaboost.py'>

In [9]: datMat, classLabels = adaboost.loadSimpData()
    ...:
In [15]: D = np.mat(np.ones((5,1))/5)

In [16]: D
Out[16]:
matrix([[ 0.2], [ 0.2], [ 0.2], [ 0.2], [ 0.2]])

In [17]: adaboost.buildStump(datMat,classLabels,D)
split: dim 0, thresh 0.89, thresh inequal: lt, the weighted error is 0.400
split: dim 0, thresh 0.89, thresh inequal: gt, the weighted error is 0.400
split: dim 0, thresh 1.00, thresh inequal: lt, the weighted error is 0.400
split: dim 0, thresh 1.00, thresh inequal: gt, the weighted error is 0.400
......
split: dim 1, thresh 1.88, thresh inequal: gt, the weighted error is 0.400
split: dim 1, thresh 1.99, thresh inequal: lt, the weighted error is 0.400
split: dim 1, thresh 1.99, thresh inequal: gt, the weighted error is 0.400
split: dim 1, thresh 2.10, thresh inequal: lt, the weighted error is 0.600
split: dim 1, thresh 2.10, thresh inequal: gt, the weighted error is 0.400
Out[17]:
({'dim': 0, 'ineq': 'lt', 'thresh': 1.3300000000000001},
matrix([[ 0.2]]),
array([[-1.], [ 1.], [-1.], [-1.], [ 1.]]))

上述的单层决策树的生成函数是决策树的一个简化版本。也就是弱分类算法。

7.4 完整的AdaBoos 算法实现
我们将利用构建的单层决策树来实现这个完整算法。

伪代码：

""" 对每次迭代： 利用buildStump()函数找到最佳的单层决策树 将最佳单层决策树加入到单层决策树数组 计算alpha 计算新的权重向量D 更新累计类别估计值 如果错误率为0.0 ， 则退出循环 """

#基于单层决策树的AdaBoost训练过程
def adaboostTrainDS(dataArr, classLabels, numIt = 40):
    """ 数据集，类别标签，迭代次数 """
    weakClassArr = []
    m = np.shape(dataArr)[0]
    D = np.mat(np.ones((m, 1))/m)
    aggClassEst = np.mat(np.zeros((m, 1)))
    for i in range(numIt):
        bestStump, error, classEst = buildStump(dataArr, classLabels, D)
        print "D:", D.T
        alpha = float(0.5*np.log((1.0-error)/max(error, 1e-16)))
        bestStump['alphas'] = alpha
        weakClassArr.append(bestStump)
        print "classEst:",classEst.T
        expon = np.multiply(-1*alpha*np.mat(classLabels).T, classEst)
        D = np.multiply(D,np.exp(expon))
        D = D/D.sum()
        aggClassEst += alpha*classEst
        print "aggClassEst: ",aggClassEst.T
        aggErrors = np.multiply(np.sign(aggClassEst) != np.mat(classLabels).T, np.ones((m, 1)))
        ErrorRate = aggErrors.sum()/m
        print "total error:",ErrorRate,"\n"
        if ErrorRate ==0.0:
            break
    return weakClassArr

1.函数名称尾部的DS代表的就是单层决策树，是adaboost中最流行的弱分类器。
2.向量D非常重要，包含了每个数据点的权重。这些权重都赋予了相等的值，后续的迭代中，adaboost算法会增加错分数据的权重同时，降低正确分类的数据的权重。
3.adaboost 算法的核心在于for循环，该循环运行numTt次或者直到训练错误率为0为止。
4.alpha值会告诉分类器本次单层决策树输出结果的权重。其中max(error, 1e-16)用于确保没有错误的时候不会发生除零溢出。

In [52]: import adaboost

In [53]: reload(adaboost)
Out[53]: <module 'adaboost' from 'adaboost.pyc'>
In [55]: classifierArray = adaboost.adaboostTrainDS(datMat,classLabels,9)
split: dim 0, thresh 0.89, thresh inequal: lt, the weighted error is 0.400
split: dim 0, thresh 0.89, thresh inequal: gt, the weighted error is 0.400
......
split: dim 1, thresh 2.10, thresh inequal: lt, the weighted error is 0.600
split: dim 1, thresh 2.10, thresh inequal: gt, the weighted error is 0.400
D: [[ 0.2 0.2 0.2 0.2 0.2]]
classEst: [[-1. 1. -1. -1. 1.]]
aggClassEst: [[-0.69314718 0.69314718 -0.69314718 -0.69314718 0.69314718]]
total error: 0.2
......
split: dim 0, thresh 0.89, thresh inequal: gt, the weighted error is 0.143
split: dim 0, thresh 1.00, thresh inequal: lt, the weighted error is 0.357
......
split: dim 1, thresh 2.10, thresh inequal: lt, the weighted error is 0.857
split: dim 1, thresh 2.10, thresh inequal: gt, the weighted error is 0.143
D: [[ 0.28571429 0.07142857 0.07142857 0.07142857 0.5 ]]
classEst: [[ 1. 1. 1. 1. 1.]]
aggClassEst: [[ 1.17568763 2.56198199 -0.77022252 -0.77022252 0.61607184]]
total error: 0.0

观察classifierArray 的值,字典中包含了分类需要的所有信息。

In [58]: classifierArray Out[58]: [{'alphas': 0.6931471805599453, 'dim': 0, 'ineq': 'lt', 'thresh': 1.3300000000000001}, {'alphas': 0.9729550745276565, 'dim': 1, 'ineq': 'lt', 'thresh': 1.0}, {'alphas': 0.8958797346140273, 'dim': 0, 'ineq': 'lt', 'thresh': 0.89000000000000001}]

7.5 测试算法：基于AdaBoost 的分类
每个弱分类器的结果以其对应的alpha值作为权重，所有的弱分类器的结果加权求和就得到了最后的结果。

# AdaBoost分类函数
def adaClassify(datToClass, classifierArr):
    dataMatrix =np.mat(datToClass)
    m = np.shape(dataMatrix)[0]
    aggClassEst = np.mat(np.zeros((m, 1)))
    for i in range(len(classifierArr)):
        classEst = stumpClassify(dataMatrix,classifierArr[i]['dim'],classifierArr[i]['thresh'],classifierArr[i]['ineq'])
        aggClassEst += classifierArr[i]['alphas']*classEst
        print aggClassEst
    return np.sign(aggClassEst)

adaClassify()函数就是利用训练出的多个弱分类器进行分类的函数。

In [4]: import adaboost

In [5]: reload(adaboost)
Out[5]: <module 'adaboost' from 'adaboost.pyc'>

In [6]: dataArr, labelArr = adaboost.loadSimpData()

In [7]: classifierArr = adaboost.adaboostTrainDS(dataArr,labelArr,30)

In [13]: adaboost.adaClassify([0,0],classifierArr)
[[-0.69314718]]
[[-1.66610226]]
[[-2.56198199]]
Out[13]: matrix([[-1.]])

随着迭代的进行，数据点[0,0]的分类结果越来越强。

In [14: adaboost.adaClassify(([5,5],[0,0]),classifierArr)
[[ 0.69314718] [-0.69314718]]
[[ 1.66610226] [-1.66610226]]
[[ 2.56198199] [-2.56198199]]
Out[14]:
matrix([[ 1.], [-1.]])

这两个点的分类结果也会随着迭代的进行而越来越强。

7.6 示例：在一个难数据集上应用AdaBoost

我们现在想利用多个单层决策树和AdaBoost来预测马疝病死亡率。

示例：在一个难数据集上的AdaBoost应用
1.收集数据：提供的文本文件
2.准备数据：确保类别标签是+1和-1 而不是0和1
3.分析数据：手工检查数据
4.训练算法：在数据上，利用adaBoostTrain() 函数训练出一系列的分类器
5.测试算法：我们拥有两个数据集。在不采用随机抽样的方法下，我们就会对AdaBoost和Logistic回归的结果进行完全对等的比较。
6.使用算法：观察该例子上的错误率。不过，也可构建一个Web网站，让驯马师输入马的病症然后预测马是否会死去。

我们给出一个向文件中加载数据的方法。

# 自适应数据加载函数
def loadDataSet(fileName):
""" 函数能够自检出特征的数目 """
    numFeat = len(open(fileName).readline().split('\t'))
    dataMat = []; labelMat = []
    fr = open(fileName)
    for line in fr.readlines():
        lineArr = []
        curLine = line.strip().split('\t')
        for i in range(numFeat - 1):
            lineArr.append(float(curLine[i]))
        dataMat.append(lineArr)
        labelMat.append(float(curLine[-1]))
    return dataMat, labelMat

上述函数能够自检出特征的数目，函数还能假定最后一个特征是类别标签。

In [26]: dataArr, labelArr = adaboost.loadDataSet(r"E:\ML\ML_source_code\mlia\Ch05\horseColicTraining.txt")

In [29]: classifierArray = adaboost.adaboostTrainDS(dataArr, labelArr,10)
error is 0.986
split: dim 20, thresh 6.30, thresh inequal: gt, the weighted error is 0.500
split: dim 20, thresh 7.20, thresh inequal: lt, the weighted error is 0.997
......
split: dim 20, thresh 9.00, thresh inequal: lt, the weighted error is 1.000
split: dim 20, thresh 9.00, thresh inequal: gt, the weighted error is 0.500
D: [[ 0.00413067 0.00413067 0.00281005 ..., 0.00413067 0.00281005 0.00413067]]
classEst: [[ 1. 1. 1. ..., 1. 1. 1.]]
aggClassEst: [[ 0.38561606 0.38561606 0.38561606 ..., 0.38561606 0.38561606 0.38561606]]
total error: 0.404682274247

In [29]: testArr, testlabelArr = adaboost.loadDataSet(r"E:\ML\ML_source_code\mlia\Ch05\horseColicTest.txt")

In [44]: prediction10 = adaboost.adaClassify(testArr,classifierArray)
[[ 0.1929965] [ 0.1929965] [ 0.1929965] ..., [ 0.38561606] [ 0.38561606] [ 0.38561606]]

In [45]: errArr = np.mat(np.ones((67,1)))

In [46]: errArr[prediction10 != np.mat(testlabelArr).T].sum()
Out[46]: 20.0

将弱分类器的数目设定为1到10000之间的几个不同的数字，运行上述过程。

观察上表，我们发现错率达到一个最小值后又开始上升，这称之为过拟合(overfitting，也称过学习)，

7.7 非均衡分类问题

在前几张的分类器构造里面，我们最终讨论的都是错误率。如果有人牵过来一匹马，让我们预测他是否会生存，我们说马会死，可能马很可能被实施安乐死。我们的预测也许是错误的，马也许本来可以继续活着。但是坦白的说，大多数情况下不同类别的分类代价并不相等。

7.7.1 其他分类器性能度量指标：正确率、召回率、以及ROC曲线

在之前的讨论中，我们都是基于错误率来衡量分类器任务的成功程度的。错误率指的是在所有的测试样本样例中错分的样本的比例。实际上这样的度量错误的掩饰了样例如何被分错误的事实。
在机器学习中的，有一个普遍称之为混淆矩阵的工具，可以帮助人们更好的了解分类中的错误，

在下面这个二类问题中，如果将一个正例判别为正例，那么就认为产生了一个真正例(True , Positive ，TP , 也称之为真阳)；若对一个反例正确的判为反例，就认为产生了一个真反例(True ， Negitive，也称之为真阴)，另外两只情况分别称伪反例(FN ，假阴)和伪正例(FP ，假阳)。

在分类中，当某个指标的重要性高于其他类别时候，我们就可以利用上述定义来定义出多个比错误率更好的新指标。
第一个指标是正确率（precision），它等于 TP/( TP + FP ) ，给出的是预测能力为正例的样本中的真正正例的比例。
第二个是召回率（Recall），它等于 TP/( TP + FN ) ，给出的是预测能力为正例的真实比例占所有真实比例的比例。
在召回率很大的f分类器中，真正判错正例的数目并不多。
另一个用于度量分类中的非均衡性的工具是ROC曲线(ROC curce)，ROC代表接收者操作特征（receiver operating characterristic）。

上图的RCO曲线中，给出了一条虚线和一条实线。虚线给出的是随机猜测的结果曲线。
横坐标轴是伪正例的比例（假阳率=FP/(FP + TN)），而纵轴是真正例的比例（真阳率 = TP/(TP + FN)）。ROC曲线给出了当阈值变化时假阳率和真阳率的变化情况。
左下角的点所对应的是将所有的样例判为反例的情况，右上角的点对应的则是将所有样例判别为正例的情况。

ROC曲线可以用于比较分类器，还可以基于成本效益分析来做出决策。

在理想的情况下，最佳的分类器应该尽可能的处于左下角，这也意味着分类器在假阳率很低的同时也获得了很高的真阳率。例如，在垃圾邮件过滤中，这相当于过滤了所有的垃圾邮件，但是没有将任何的合法邮件表示为垃圾邮件。

对于不同ROC曲线进行比较的一个指标是曲线下的面积（area unser curve ，AUC）。AUC给出的是分类器的平均性能值，并不能完全代替对整条曲线的观察。一个完美分类器的AUC为1.0 ，随机猜测的AUC为0.5 。

# ROC曲线的绘制以及AUC计算函数
def plotROC(predStrengths,classLabels):
    cur = (1.0, 1.0)
    ySum = 0.0
    numPosClas = sum(np.array(classLabels) == 1.0)
    yStep = 1/float(numPosClas)
    xStep = 1/float(len(classLabels) - numPosClas)
    sortedIndicies = predStrengths.argsort()
    fig = plt.figure()
    fig.clf()
    ax = plt.subplot(111)
    for index in sortedIndicies.tolist()[0]:
        if classLabels[index] == 1.0:
            delX = 0; delY = yStep
        else:
            delX = xStep; delY = yStep; ySum += cur[1]
        ax.plot([cur[0], cur[0]-delX], [cur[1], cur[1]-delY], c = 'b')
        cur = (cur[0] - delX, cur[1] - delY)
    ax.plot([0,1], [0,1], 'b--')
    plt.xlabel('False Positive Rate'); plt.ylabel('True positive Rate')
    plt.title('ROC curve for AdaBoost Horse colic Detection System')
    ax.axis([0, 1, 0, 1])
    plt.show()
    print "the Area Under the Curve is:",ySum*xStep

1.参数predStrengths 是numpy数组或行向量矩阵参数代表分类器的预测强度。
2.为了计算AUC，我们对多个小矩形的面积进行累加。这些矩形的宽度都是xStep，我们对所有的矩形的高度进行累加，最后乘以xStep得到总面积。

In [8]:dataArr, labelArr = adaboost.loadDataSet(r"E:\ML\ML_source_code\mlia\Ch05\horseColicTraining.txt")

In [9]:classifierArray,aggClassEst = adaboost.adaboostTrainDS(dataArr, labelArr,10)

In [10]:adaboost.plotROC(aggClassEst.T,labelArr)
split: dim 20, thresh 7.20, thresh inequal: lt, the weighted error is 0.997
split: dim 20, thresh 7.20, thresh inequal: gt, the weighted error is 0.500
......
split: dim 20, thresh 9.00, thresh inequal: lt, the weighted error is 1.000
split: dim 20, thresh 9.00, thresh inequal: gt, the weighted error is 0.500
D: [[ 0.00413067 0.00413067 0.00281005 ..., 0.00413067 0.00281005 0.00413067]]
classEst: [[ 1. 1. 1. ..., 1. 1. 1.]]
aggClassEst: [[ 0.38561606 0.38561606 0.38561606 ..., 0.38561606 0.38561606 0.38561606]]
total error: 0.404682274247

the Area Under the Curve is: 0.146392422695

7.7.2 基于代价函数的分类器决策控制

除了调节分类器的阈值之外，还有可用于处理非均衡分类的代价方法，其中一种称之为，代价敏感学习。
下表一的代价矩阵，给出了目前为止分类器的代价矩阵（代价不是0就是1），基于该代价算计总代价：

TP * 0 + FN * 1 + FP * 1 + TN * 0

下表二该代价矩阵的分类代价计算公式为：

TP * (-5) + FN * 1 + FP * 50 + TN * 0

若在构建分类器时，挚爱这些代价之，那么就可以选择付出最小代价的分类器。

在分类算法中，我们有很多方法可以来引入代价信息。
在adaboost中，可以基于代价函数来调整错误权重向量D；
在朴素贝叶斯中，可以选择具有最小期望代价而不是最大概率的类别作为最后的结果；
在SVM中，可以在代价函数中对于不同的类别选择不同的参数C 。

7.7.3 处理非均衡问题的数据抽样方法

另一种针对非均衡问题调节分类器的方法，就是对分类器的训练数据进行改造，这样就可以通过欠抽样或者过抽样来实现。
过抽样意味着复制样例，欠抽样意味着删除样例。
无论采取哪种形式，数据都会从原始形式改造为新形式。
抽样过程可以用随机方式或者某个预定的方式来实现。

7.8小结
集成方法通过组合多个分类器的分类结果，获得较简单的单分类器更好的分类结果。
本章以单层决策树作为弱分类器构建了adaboost分类器。adaboost函数可以应用于任意的分类器，只要该分类器可以处理加权数据即可。

Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring 论文阅读钟屿论文阅读计算机视觉人工智能
用于动态场景去模糊的深度多尺度卷积神经网络摘要针对一般动态场景的非均匀盲去模糊是一个具有挑战性的计算机视觉问题，因为模糊不仅来源于多个物体运动，还来源于相机抖动和场景深度变化。为了去除这些复杂的运动模糊，传统的基于能量优化的方法依赖于简单的假设，例如模糊核是部分均匀或局部线性的。此外，最近的基于机器学习的方法也依赖于在这些假设下生成的合成模糊数据集。这使得传统的去模糊方法在模糊核难以近似或参数化的
基于Paillier同态加密算法的金融数据安全共享机制研究【附数据】
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
吴恩达机器学习cs229-学习笔记-更新中是娜个二叉树！机器学习学习笔记
吴恩达机器学习cs22901基础概念语言：Matlab/python监督学习定义：获取一组数据集拟合数据从X到Y的映射回归问题：预测的Y是连续的，Y是实数分类问题：分类指的是Y取离散值，输出是离散的两组，正示例和负示例，把所有样本推到这条直线上，用0，1，标识逻辑回归算法，拟合直线区分正，负示例处理相对大量特征的回归算法或者分类算法支持向量机算法：它使用的不是1,2,3,10个输入特征，而是使用无
「日拱一码」033 机器学习——严格划分胖达不服输「日拱一码」机器学习人工智能严格划分组划分
目录简单随机划分（train_test_split）分组划分（GroupSplitting）简单分组划分(GroupSplitting)分层分组划分(StratifiedGroupSplitting)交叉验证法（Cross-Validation）分组K折交叉验证（GroupKFold）留一组法（LeaveOneGroupOut）简单随机划分（train_test_split）简单随机分组通过随机分
从零开始：搭建你的人工智能开发环境人工智能教程人工智能 YOLO 机器学习 transformer 线性回归动态规划排序算法
前言在人工智能和机器学习的旅程中，一个稳定且高效的开发环境是成功的关键第一步。无论是初学者还是经验丰富的开发者，一个配置良好的开发环境都能大大提高工作效率，减少遇到的问题。本文将从零开始，逐步指导你如何搭建一个完整的人工智能开发环境，包括操作系统选择、Python安装、常用库的配置以及开发工具的选择。一、选择合适的操作系统（一）主流操作系统介绍在搭建人工智能开发环境时，首先需要选择一个合适的操作系
基于机器学习的加密货币资金费率预测与套利策略云梦量化科技 python
一、资金费率机制解析永续合约的资金费率是加密货币衍生品市场独有的机制，旨在使永续合约价格锚定现货价格。资金费率每8小时结算一次，结算时多空双方互相支付资金费用：费率为正时，多头支付给空头；费率为负时，空头支付给多头。此机制既促使永续合约价格回归现货价格，也反映市场多空情绪。某安永续合约资金费率计算公式通常为：资金费率 F = 平均溢价指数 P + Clamp(综合利率 I − 溢价指数 P, +0
机器人-组成结构-感知 - 决策 - 执行具身智能-查布嘎具身智能机器人人工智能
目录一、感知系统内部传感器：外部传感器：二、智能决策系统机器学习家族1.1机器学习2.1深度学习2.2深度学习模型(主要属于监督/强化学习范畴，但结构通用)：3.1监督学习3.2监督学习模型4.1半监督学习4.2无/半监督学习模型：5.1无监督学习5.2生成模型(可属于监督/无监督)：6.1强化学习7.1其他学习三、控制系统（运控）①对应小脑和脊柱一、感知系统①对应人体的五官。由具有不同功能的各种
机器学习入门（五）：线性回归—从模型函数到目标函数米饭超人
从数据反推公式假设我们获得了这样一张表格，上面列举了美国纽约若干程序员职位的年薪：enterimagedescriptionhere大家可以看到，表格中列举了职位、经验、技能、国家和城市几项特征。除了经验一项，其他都是一样的。不同的经验（工作年限），薪水不同。而且看起来，工作年头越多，工资也就越高。那么我们把Experience与Salary抽取出来，用x和y来分别指代它们。enterimaged
Python深度学习实践：LSTM与GRU在序列数据预测中的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：LSTM与GRU在序列数据预测中的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来序列数据预测是机器学习领域的一个重要研究方向，涉及时间序列分析、自然语言处理、语音识别等多个领域。序列数据具有时间依赖性，即序列中每个元素都受到前面元素的影响。传统的机器学习算法难以捕捉这种时间依赖性，而深度学习
一个例子带你入门机器学习
目录1.为建模选择数据2.选择预测目标3.选择“特征”4.构建您的模型（这篇文章将使用经典墨尔本房价数据集作为例子，引导机器学习的流程，数据集为melb_data.csv，请在csdn的下载区自行下载，运行代码时需要将数据集下载在同个目录下）1.为建模选择数据数据集有太多的变量，多到难以理解，甚至无法很好地打印出来。如何将这海量的数据削减为能够理解的内容？我们将首先凭借直觉选择几个变量。后续将介绍
初探机器学习与力学研究的交叉领域 faderbic 机器学习人工智能深度学习
目录关于如何踏入机器学习领域机器学习与力学研究的交叉方向1.使用机器学习加速有限元求解2.结合有限元计算和机器学习预测复杂材料结构与力学性能的关系3.结构健康检测4.疲劳寿命预测总结关于如何踏入机器学习领域因为我本科的专业是力学，所以当我开始关注机器学习领域时，首先考虑的是机器学习和力学的交叉领域。对于很多对人工智能感兴趣的朋友，想加入人工智能的潮流却不知道从何学起，我提供一个思路，我认为将自己学
[NIPST AI]对抗性机器学习攻击和缓解的分类和术语 Anooyman 人工智能网络安全人工智能大语言模型网络安全安全
原文link：https://nvlpubs.nist.gov/nistpubs/ai/NIST.AI.100-2e2025.pdfIntroduction人工智能（AI）系统在过去几年中持续全球扩展。这些系统正在被众多国家开发并广泛部署于各自的经济体系中，人们在生活的许多领域都获得了更多使用AI系统的机会。本报告区分了两大类AI系统：预测型AI（PredictiveAI，PredAI）和生成型A
通俗易懂：什么是决策树？淦暴尼算法 python 决策树算法机器学习
1.引言：决策树就像“选择题”你是否曾经在生活中做过“选择题”？比如：今天要不要带伞？晚饭吃什么？该不该买那件心仪已久的商品？其实，我们的大脑经常会像“决策树”一样，通过一连串问题和判断，逐步缩小选择范围，最终做出决定。**决策树（DecisionTree）**就是这样一种模拟人类决策过程的机器学习模型。它通过“提问-分支-决策”的方式，把复杂问题拆解成一系列简单的判断，广泛应用于分类（如判断邮件
java毕业设计-基于Javaweb的家常小菜烹饪学习管理系统的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等) 程序猿刘 vue spring boot 毕业设计 java 课程设计学习
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费开题报告、任务书、全bao定制+
java毕业设计源码案例-基于ssm+协同过滤的个性化小说推荐系统设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等) 项目帮 springboot java 计算机毕设 java 课程设计开发语言
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计，开题报告、任务书、全b
机器学习中的数据预处理：从入门到实践耐思nice～机器学习由浅入深-吴恩达机器学习人工智能
在当今的智能时代，机器学习已经渗透到我们生活的方方面面。比如我们常用的推荐系统，它能根据我们的浏览记录精准推送喜欢的商品或视频，这背后就离不开机器学习的支撑。而一个优秀的机器学习模型，离不开高质量的数据，数据预处理正是保证数据质量的关键环节，它就像烹饪前的食材处理，直接影响着最终“菜品”的口感，也就是模型的性能。今天，我们就来全面学习机器学习中数据预处理的关键步骤。一、数据预处理的重要性数据预处理
计算机专业大数据毕业设计-基于 Spark 的音乐数据分析项目(源码+LW+部署文档+全bao+远程调试+代码讲解等) 程序猿八哥数据可视化计算机毕设 spark 大数据课程设计 spark
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计，开题报告、任务书、全b
Protein FID：AI蛋白质结构生成模型评估新指标
一、引言：蛋白质生成模型面临的评估挑战近年来，AI驱动的蛋白质结构生成模型取得了令人瞩目的进展，但如何有效评估这些模型的质量却一直是一个悬而未决的问题。虽然实验验证仍然是金标准，但计算机模拟评估对于快速开发和比较机器学习模型至关重要。然而，尽管最先进的模型在当前评估指标上表现卓越，但它们在实际设计应用中的成功率仍然相对有限。例如，有研究报告显示生成结构的实验成功率仅为3%，而计算机模拟评分却远高于
在 Conda 中删除环境及所有安装的库 Studying 开龙wu conda
注意事项1.删除环境前确保你没有在该环境中运行任何程序。2.删除操作是不可逆的，所有该环境中的包和配置都会被永久删除。3.如果你想保留环境的配置信息，可以在删除前使用condaenvexport>environment.yml导出环境配置。关于requirements.txt和environment.yaml文件使用介绍详情可参考以往文章，争对机器学习和深度学习里Python项目开发管理项目依赖的
TensorFlow GPU 2.10.1 for Python 3.9快速安装指南疑样
本文还有配套的精品资源，点击获取简介：TensorFlowGPU2.10.1是专为Windowsx64和Python3.9设计的TensorFlow版本，它集成了GPU支持以加快深度学习模型的训练。本指南提供了该版本的概述、安装步骤及注意事项，旨在帮助开发者利用其性能优势提升机器学习项目的效率。1.TensorFlowGPU介绍1.1TensorFlow的起源与功能TensorFlow是由Goog
进阶向:基于Python的智能客服系统设计与实现
智能客服系统开发指南系统概述智能客服系统是人工智能领域的重要应用，它通过自然语言处理(NLP)和机器学习技术自动化处理用户查询，显著提升客户服务效率和响应速度。基于Python的实现方案因其丰富的生态系统（如NLTK、spaCy、Transformers等库）、跨平台兼容性以及易于集成的特点，成为开发智能客服系统的首选。系统架构系统核心包括两个主要功能模块：1.API集成模块负责连接各类外部服务，
机器学习专栏（62）：手把手实现工业级ResNet-34及调优全攻略
目录一、ResNet革命性突破解析1.1残差学习核心思想1.2ResNet-34结构详解二、工业级Keras实现详解2.1数据预处理流水线2.2完整模型实现三、模型训练调优策略3.1学习率动态调整3.2混合精度训练四、性能优化技巧4.1分布式训练配置4.2TensorRT推理加速五、实战应用案例5.1医疗影像分类5.2工业质检系统六、模型可视化分析6.1特征热力图6.2参数量分析七、常见问题解决方
模式识别与机器学习课程笔记（1）：数学基础 Ro Jace 学习笔记机器学习笔记人工智能
模式识别与机器学习课程笔记（1）：数学基础特征矢量和特征空间随机矢量的描述随机矢量的分布函数随机矢量的数字特征随机变量、随机矢量间的统计关系随机矢量的变换正态分布正态分布的定义正态分布随机矢量的性质离散随机矢量及其分布信息论矩阵微分法基本知识矢量或矩阵对于数量变量的微分二、数量函数对于矢量的微分三、矢量函数对于矢量的微分特征矢量和特征空间特征量的类型：物理量、次序量、名义量物理量：直接反映特征的实
6+，基于免疫原性细胞死亡的非肿瘤分型文章，投稿到接收仅一个多月，肿瘤的热点已经传导至非肿瘤生信文章中！生信小课堂
影响因子：6.147本文从投稿到接收仅一个多月关于非肿瘤生信，我们也解读过很多，主要有以下类型1单个疾病WGCNA+PPI分析筛选hub基因。2单个疾病结合免疫浸润，热点基因集，机器学习，分子分型等。3两种相关疾病联合分析，包括非肿瘤结合非肿瘤，非肿瘤结合肿瘤或者非肿瘤结合泛癌分析目前非肿瘤生信发文的门槛较低，有需要的朋友欢迎交流！研究概述：脑卒中是世界上死亡和残疾的主要原因之一，缺血性中风占80
VSCode使用Jupyter完整指南配置机器学习环境 z日火校招学习日记 vscode jupyter 机器学习
接下来开始机器学习部分第一步配置环境：VSCode使用Jupyter完整指南1.安装必要的扩展打开VSCode，按Ctrl+Shift+X打开扩展市场，搜索并安装以下扩展：必装扩展：Python(Microsoft官方)-Python语言支持Jupyter(Microsoft官方)-Jupyternotebook支持Pylance(Microsoft官方)-Python智能提示和语法检查推荐扩展：
养老院管理系统基于SpringBoot的养老院管理系统系统设计与实现（源码+论文+部署讲解等）
博主介绍：✌全网粉丝60W+,csdn特邀作者、Java领域优质创作者、csdn/掘金/哔哩哔哩/知乎/道客/小红书等平台优质作者，计算机毕设实战导师，目前专注于大学生项目实战开发,讲解,毕业答疑辅导，欢迎高校老师/同行前辈交流合作✌技术栈范围：SpringBoot、Vue、SSM、Jsp、HLMT、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习、单片机
AI产品经理成长记《零号列车》第一集邂逅0XAI列车黑客思维者 AI产品经理养成人工智能 AI产品经理大模型智能体
《零号列车》绝非传统意义上的AI产品经理教程——它是我沉淀二十多年跨行业数字化转型与工业4.0实战经验后，首创的100集大型小说体培养指南。那些曾在千行百业验证过的知识与经验，不再是枯燥的文字堆砌，而是化作一场沉浸式的学习旅程。这里没有生硬的理论灌输，而是用跌宕起伏的故事情节，串联起AI技术的底层逻辑。你会跟着角色的脚步推进剧情，在不知不觉中吃透机器学习、大模型应用等专业概念；更有深入浅出的技术拆
人工智能时代下的数据新职业：新兴工作岗位版图研究司南锤 economics 人工智能
目录摘要第一章：AI驱动的数据价值链重构1.1从“沉睡金矿”到“流动的血液”：数据作为核心经济资产的激活1.2知识的新经济学：零边际成本革命1.3AI作为新的“操作系统”：重塑产业竞争格局第二章：基石层：数据准备与质量保障中的角色2.1数据标注与标签领导力：数据标注经理/主管2.2“地面真实”的守护者：AI数据质量专家第三章：技术核心层：构建AI与机器学习全生命周期的工程角色3.1AI生产线架构师
Python领域制造业的Python应用 Python编程之道 Python编程之道 python 开发语言 ai
Python在制造业中的应用：从自动化到智能制造关键词：Python、制造业、工业自动化、数据分析、机器学习、物联网、智能制造摘要：本文深入探讨Python编程语言在制造业中的广泛应用。从基础的自动化脚本到复杂的智能制造系统，Python凭借其丰富的库生态系统和易用性，正在重塑现代制造业。我们将分析Python在制造业中的核心应用场景，包括设备监控、质量控制、预测性维护和供应链优化等，并通过实际案
【机器学习】探索未来科技的前沿：人工智能、机器学习与大模型 AIGC零基础入门小白 AI大模型大模型教程人工智能机器学习科技 AI大模型 AIGC AI教程大模型教程
文章目录引言一、人工智能：从概念到现实1.1人工智能的定义1.2人工智能的发展历史1.3人工智能的分类1.4人工智能的应用二、机器学习：人工智能的核心技术2.1机器学习的定义2.2机器学习的分类2.3机器学习的实现原理2.4机器学习的应用2.5机器学习的示例代码2.6解释代码三、大模型：推动AI前沿发展的关键技术3.1大模型的定义3.2大模型的发展历程3.3深度学习与神经网络3.4大模型的优势与挑
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文

机器学习之AdaBoost元算法（七）

你可能感兴趣的:(机器学习)