cccccccczh

《机器学习实战》python3学习笔记——决策树

决策树理论部分

前言

1.1 信息熵

1.1.1 代码实现

1.2 信息增益

1.2.1 代码实现

1.3 创建决策树

2.1 决策树的可视化
3.1 测试和存储决策树

存储及读取

4 课本隐形眼镜实战代码
参考文献

前言

决策树（decsision tree）是一类常见的机器学习算法。以周志华老师《机器学习》中西瓜数据集为例，我们希望从给定训练集中学得一个模型用于对测试集分类。本文将详细解读书中代码，并使用sklearn库实现管道泄漏信号四分类。

编号	色泽	根蒂	敲声	纹理	脐部	触感	好瓜
1	青绿	蜷缩	浊响	清晰	凹陷	硬滑	是
2	乌黑	蜷缩	沉闷	清晰	凹陷	硬滑	是
3	乌黑	蜷缩	浊响	清晰	凹陷	硬滑	是
4	青绿	蜷缩	沉闷	清晰	凹陷	硬滑	是
5	浅白	蜷缩	浊响	清晰	凹陷	硬滑	是
6	青绿	稍蜷	浊响	清晰	稍凹	软粘	是
7	乌黑	稍蜷	浊响	稍糊	稍凹	软粘	是
8	乌黑	稍蜷	浊响	清晰	稍凹	硬滑	是
9	乌黑	稍蜷	沉闷	稍糊	稍凹	硬滑	否
10	青绿	硬挺	清脆	清晰	平坦	软粘	否
11	浅白	硬挺	清脆	模糊	平坦	硬滑	否
12	浅白	蜷缩	浊响	模糊	平坦	软粘	否
13	青绿	稍蜷	浊响	稍糊	凹陷	硬滑	否
14	浅白	稍蜷	沉闷	模糊	凹陷	硬滑	否
15	乌黑	稍蜷	浊响	清晰	稍凹	软粘	否
16	浅白	蜷缩	浊响	模糊	平坦	硬滑	否
17	青绿	蜷缩	沉闷	稍糊	稍凹	硬滑	否

1.1 信息熵

“信息熵”是度量样本集合纯度最常用的一种指标。假定当前样本集合D中第k类样本所占的比例是p_k,则D的信息熵定义为
$Ent\left( D\right) =-\sum ^{\left| y\right| }_{k=1}p_{k}\log _{2}p_{k}$
以表中数据集为例，共有17个训练样例，用于学习一颗能预测没剖开的西瓜是不是好瓜的决策树。显然|y|=2，在决策树开始学习时，根结点包含D中的所有样例，其中正例p₁=8/17，反例p₂=9/17，根据公式可算出信息熵为
$\begin{aligned}Ent\left( D\right) =-\sum ^{2}_{k=1}p_{k}\log _{2}p_{k} =-\left( \dfrac {8}{17}\log _{2}\dfrac {8}{17}+\dfrac {9}{17}\log _{2}\dfrac {9}{17}\right) =0.998\end{aligned}$

1.1.1 代码实现

在编写代码之前，先对数据集进行标签化
色泽：0代表浅白 1代表青绿 2代表乌黑
根蒂：0代表蜷缩 1代表稍蜷 2代表硬挺
敲声：0代表沉闷 1代表浊响 2代表清脆
纹理：0代表清晰 1代表稍糊 2代表模糊
脐部：0代表凹陷 1代表稍凹 2代表平坦
触感：0代表硬滑 1代表软粘
好瓜：‘yes’代表好瓜，‘no’代表坏瓜
确定好这些之后，我们创建数据集并计算信息熵

from math import log
import operator

def createDataSet():
    dataSet = [[1,0,1,0,0,0,'yes'],
               [2,0,0,0,0,0,'yes'],
               [2,0,1,0,0,0,'yes'],
               [1,0,1,0,0,0,'yes'],
               [0,0,1,0,0,0,'yes'],
               [1,1,1,0,1,1,'yes'],
               [2,1,1,1,1,1,'yes'],
               [2,1,1,0,1,0,'yes'],
               [2,1,0,1,1,0,'no'],
               [1,2,2,0,2,1,'no'],
               [0,2,2,2,2,1,'no'],
               [0,0,1,2,2,1,'no'],
               [1,1,1,1,0,0,'no'],
               [0,1,0,1,0,0,'no'],
               [2,1,1,0,1,1,'no'],
               [0,0,1,1,1,1,'no'],
               [1,0,0,1,1,0,'no']]
    labels = ['色泽','根蒂','敲声','纹理','脐部','触感']
    return dataSet,labels

def calcShannonEnt(dataSet):
    numEntries = len(dataSet)  #数据集的行数
    labelCounts = {}   #生成字典
    for featVec in dataSet:
        currentLabel = featVec[-1] #提取标签
        if currentLabel not in labelCounts.keys():
            labelCounts[currentLabel] = 0 #标签不在字典中，就生成这个标签的键值对
        labelCounts[currentLabel] += 1 #每次for循环就+1
    shannonEnt = 0.0 #信息熵
    for key in labelCounts: #遍历字典中的键
        prob = float(labelCounts[key])/numEntries #选择该label的概率
        shannonEnt -= prob*log(prob,2) #香农熵计算公式
    return shannonEnt

if __name__=='__main__':
    a,b = createDataSet()
    c = calcShannonEnt(a)
    print(c)

c是我们用程序计算出来的信息熵0.9975025463691153，约等于我们手工计算结果0.998。

1.2 信息增益

假定离散数据集a上有V个可能的取值{a¹,a²，……，a^V},若使用a来对样本集D进行划分，将会产生V个分支结点。那么第v个分支结点包含了D中所有在a属性上取值为a^v的样本。我们根据前文提到的信息熵计算公式可得D^v数据集的信息熵，再考虑不同分支结点所包含的样本数不同，给分支结点赋予权重|D^v|/|D|,最后再用样本集D的信息熵减去D^V的信息熵得到该离散属性的信息增益。
$Gain\left( D,a\right) =Ent\left( D\right) -\sum ^{v}_{v=1}\dfrac {D^{v}}{D}Ent\left( D^{v}\right)$
可能单纯看文字有些难以理解，我们来看一个例子。以西瓜数据集中的{色泽}属性为例，它可能有三个取值，根据这三个取值将数据集划分为三个子集：D¹代表浅白，D²代表青绿，D³代表乌黑，子集D¹中包含编号{5,11,12,14,16}五个样例，子集D²中包含编号{1,4,6,10,13,17}六个样例，子集D³中包含编号{2,3,7,8,9,15}六个样例。根据信息熵计算公式，我们可以计算出用{色泽}进行划分后所得的三个分支结点的信息熵：
$Ent\left( D^{1}\right) =-\left( \dfrac {1}{5}\log _{2}\dfrac {1}{5}+\dfrac {4}{5}\log _{2}\dfrac {4}{5}\right) = 0.722$
$Ent\left( D^{2}\right) =-\left( \dfrac {3}{6}\log _{2}\dfrac {3}{6}+\dfrac {3}{6}\log _{2}\dfrac {3}{6}\right) = 1.000$
$Ent\left( D^{3}\right) =-\left( \dfrac {4}{6}\log _{2}\dfrac {4}{6}+\dfrac {4}{6}\log _{2}\dfrac {4}{6}\right) = 0.918$
$Gain\left( D,色泽\right) =Ent\left( D\right) -\sum ^{3}_{v=1}\dfrac {D^{v}}{D}Ent\left( D^{v}\right)\\ =\ 0,988-\left( \dfrac {5}{17}\times 0.722+\dfrac {6}{17}\times 1+\dfrac {6}{17}\times 0.918\right) = 0.109$
由此我们计算得到色泽属性的信息增益为0.109

1.2.1 代码实现

from math import log

def createDataSet():
    dataSet = [[1,0,1,0,0,0,'yes'],
               [2,0,0,0,0,0,'yes'],
               [2,0,1,0,0,0,'yes'],
               [1,0,1,0,0,0,'yes'],
               [0,0,1,0,0,0,'yes'],
               [1,1,1,0,1,1,'yes'],
               [2,1,1,1,1,1,'yes'],
               [2,1,1,0,1,0,'yes'],
               [2,1,0,1,1,0,'no'],
               [1,2,2,0,2,1,'no'],
               [0,2,2,2,2,1,'no'],
               [0,0,1,2,2,1,'no'],
               [1,1,1,1,0,0,'no'],
               [0,1,0,1,0,0,'no'],
               [2,1,1,0,1,1,'no'],
               [0,0,1,1,1,1,'no'],
               [1,0,0,1,1,0,'no']]
    labels = ['色泽','根蒂','敲声','纹理','脐部','触感']
    return dataSet,labels

def calcShannonEnt(dataSet):
    numEntries = len(dataSet)  #数据集的行数
    labelCounts = {}   #生成字典
    for featVec in dataSet:
        currentLabel = featVec[-1] #提取标签
        if currentLabel not in labelCounts.keys():
            labelCounts[currentLabel] = 0 #标签不在字典中，就生成这个标签的键值对
        labelCounts[currentLabel] += 1 #每次for循环就+1
    shannonEnt = 0.0 #信息熵
    for key in labelCounts: #遍历字典中的键
        prob = float(labelCounts[key])/numEntries #选择该label的概率
        shannonEnt -= prob*log(prob,2) #香农熵计算公式
    return shannonEnt

def splitDataSet(dataSet,axis,value): #数据集、划分数据集的特征、需要返回的特征的值
    retDataSet = []  #生成列表
    for featVec in dataSet:
        if featVec[axis] == value:
            reducedFeatVec = featVec[:axis]
            reducedFeatVec.extend(featVec[axis+1:])
            retDataSet.append(reducedFeatVec)
    return retDataSet

def chooseBestFeatureToSpilt(dataSet):
    numFeature = len(dataSet[0]) - 1     #特征数量
    baseEntropy = calcShannonEnt(dataSet)  #计算原始训练集的香农熵
    bestInfoGain = 0 #信息增益
    bestFeature = -1 #最优特征索引，这里只是先行赋值
    for i in range(numFeature):
        featList = [example[i] for example in dataSet]  #提取第训练集中的第（i-1）个特征
        uniqueVals = set(featList) #去除重复的元素
        newEntropy = 0 #经验条件熵
        for value in uniqueVals:
            subDataSet = splitDataSet(dataSet,i,value) #划分成子集
            prob = len(subDataSet)/float(len(dataSet)) #占比例，可看作概率
            newEntropy += prob*calcShannonEnt(subDataSet) #计算该子集的经验熵
        infoGain = baseEntropy - newEntropy #信息增益
        print("第{}个特征的信息增益{}".format(i+1,infoGain))
        if (infoGain > bestInfoGain): #if语句更新信息增益，并返回最大信息增益特征的索引值
            bestInfoGain = infoGain
            bestFeature = i
    return bestFeature

if __name__=='__main__':
    data,label = createDataSet()
    chooseBestFeatureToSpilt(data)

1.3 创建决策树

运用ID3算法创建决策树，具体操作如下：计算所有结点的信息增益，从中选择最大的信息增益作为该结点的特征，按照属性数量的多少建立不同的子结点，再使用子结点递归的方式创建决策树，直到没有特征可选择或无法再创建新的子结点为止。将其保存为trees.py

from math import log

def createDataSet():
    dataSet = [[1,0,1,0,0,0,'yes'],
               [2,0,0,0,0,0,'yes'],
               [2,0,1,0,0,0,'yes'],
               [1,0,1,0,0,0,'yes'],
               [0,0,1,0,0,0,'yes'],
               [1,1,1,0,1,1,'yes'],
               [2,1,1,1,1,1,'yes'],
               [2,1,1,0,1,0,'yes'],
               [2,1,0,1,1,0,'no'],
               [1,2,2,0,2,1,'no'],
               [0,2,2,2,2,1,'no'],
               [0,0,1,2,2,1,'no'],
               [1,1,1,1,0,0,'no'],
               [0,1,0,1,0,0,'no'],
               [2,1,1,0,1,1,'no'],
               [0,0,1,1,1,1,'no'],
               [1,0,0,1,1,0,'no']]
    labels = ['色泽','根蒂','敲声','纹理','脐部','触感']
    return dataSet,labels

def calcShannonEnt(dataSet):
    numEntries = len(dataSet)  #数据集的行数
    labelCounts = {}   #生成字典
    for featVec in dataSet:
        currentLabel = featVec[-1] #提取标签
        if currentLabel not in labelCounts.keys():
            labelCounts[currentLabel] = 0 #标签不在字典中，就生成这个标签的键值对
        labelCounts[currentLabel] += 1 #每次for循环就+1
    shannonEnt = 0.0 #信息熵
    for key in labelCounts: #遍历字典中的键
        prob = float(labelCounts[key])/numEntries #选择该label的概率
        shannonEnt -= prob*log(prob,2) #香农熵计算公式
    return shannonEnt

def splitDataSet(dataSet,axis,value): #数据集、划分数据集的特征、需要返回的特征的值
    retDataSet = []  #生成列表
    for featVec in dataSet:
        if featVec[axis] == value:
            reducedFeatVec = featVec[:axis]
            reducedFeatVec.extend(featVec[axis+1:])
            retDataSet.append(reducedFeatVec)
    return retDataSet

def chooseBestFeatureToSpilt(dataSet):
    numFeature = len(dataSet[0]) - 1     #特征数量
    baseEntropy = calcShannonEnt(dataSet)  #计算原始训练集的香农熵
    bestInfoGain = 0 #信息增益
    bestFeature = -1 #最优特征索引，这里只是先行赋值
    for i in range(numFeature):
        featList = [example[i] for example in dataSet]  #提取第训练集中的第（i-1）个特征
        uniqueVals = set(featList) #去除重复的元素
        newEntropy = 0 #经验条件熵
        for value in uniqueVals:
            subDataSet = splitDataSet(dataSet,i,value) #划分成子集
            prob = len(subDataSet)/float(len(dataSet)) #占比例，可看作概率
            newEntropy += prob*calcShannonEnt(subDataSet) #计算该子集的经验熵
        infoGain = baseEntropy - newEntropy #信息增益
        #print("第{}个特征的信息增益{}".format(i+1,infoGain))
        if (infoGain > bestInfoGain): #if语句更新信息增益，并返回最大信息增益特征的索引值
            bestInfoGain = infoGain
            bestFeature = i
    return bestFeature

def majorityCnt(classList):
    classCount = {}
    for vote in classList:
        if vote not in classList.keys():
            classCount[vote] = 0
        classCount[vote] += 1
        sortedClassCount = sorted(classCount.items(),key=operator.itemgetter(1),reverse=True)
        return sortedClassCount[0][0]

#创建决策树
def createTree(dataSet,labels):
    classList = [example[-1] for example in dataSet] #取分类标签
    if classList.count(classList[0]) == len(classList): #类别完全相同，停止划分
        return classList[0]
    if len(dataSet[0]) == 1: #遍历所有特征 停止划分
        return majorityCnt(classList)
    bestFeat = chooseBestFeatureToSpilt(dataSet) #选择最优特征
    bestFeatLabel = labels[bestFeat] #最优特征标签
    myTree = {bestFeatLabel:{}} #最优标签生成树
    del(labels[bestFeat]) #删除已使用的特征标签
    featValues = [example[bestFeat] for example in dataSet] #得训练集中最优标签的特征属性
    uniqueVals = set(featValues) #除掉重复
    for value in uniqueVals: #遍历 创建树
        subLabels = labels[:]
        myTree[bestFeatLabel][value] = createTree(splitDataSet(dataSet,bestFeat,value),subLabels)
    return myTree

if __name__=='__main__':
    data,label = createDataSet()
    tree = createTree(data,label)
    print(tree)

2.1 决策树的可视化

运行完上述代码，我们得到用于描述决策树的字典。为了使决策树看上去更加直观，我们引入matplotlib库进行决策树的可视化。保存为treePlot.py

import matplotlib.pyplot as plt
from trees import *
from matplotlib.font_manager import FontProperties

decisionNode = dict(boxstyle = 'sawtooth',fc='0.8')
leafNode = dict(boxstyle='round4',fc='0.8')
arrow_args = dict(arrowstyle='<-')

def plotNode(nodeTxt,centerPt,parentPt,nodeType):
    arrow_args = dict(arrowstyle="<-")  # 定义箭头格式
    font = FontProperties(fname=r"c:\windows\fonts\simsun.ttc", size=14)

    createPlot.ax1.annotate(nodeTxt,xy=parentPt,xycoords='axes fraction',
                            xytext=centerPt,textcoords='axes fraction',
                            va='center',ha='center',bbox=nodeType,arrowprops=arrow_args,
                            FontProperties=font)


def getNumLeafs(myTree):
    numLeafs = 0
    firstStr = next(iter(myTree))
    secondDict = myTree[firstStr]
    for key in secondDict.keys():
        if type(secondDict[key]).__name__=='dict':
            numLeafs += getNumLeafs(secondDict[key])
        else:
            numLeafs += 1
    return numLeafs

def getTreeDepth(myTree):
    maxDepth = 0
    firstStr = next(iter(myTree))
    secondDict = myTree[firstStr]
    for key in secondDict.keys():
        if type(secondDict[key]).__name__=='dict':
            thisDepth = 1+getTreeDepth(secondDict[key])
        else:
            thisDepth = 1
        if thisDepth > maxDepth:
            maxDepth = thisDepth
    return maxDepth

def plotMidText(cntrPt,parentPt,txtString):
    xMid = (parentPt[0]-cntrPt[0])/2 + cntrPt[0]
    yMid = (parentPt[1]-cntrPt[1])/2 + cntrPt[1]
    createPlot.ax1.text(xMid,yMid,txtString)

def plotTree(myTree, parentPt, nodeTxt):
    decisionNode = dict(boxstyle="sawtooth", fc="0.8")                                        #设置结点格式
    leafNode = dict(boxstyle="round4", fc="0.8")                                            #设置叶结点格式
    numLeafs = getNumLeafs(myTree)                                                          #获取决策树叶结点数目，决定了树的宽度
    depth = getTreeDepth(myTree)                                                            #获取决策树层数
    firstStr = next(iter(myTree))                                                            #下个字典
    cntrPt = (plotTree.xOff + (1.0 + float(numLeafs))/2.0/plotTree.totalW, plotTree.yOff)    #中心位置
    plotMidText(cntrPt, parentPt, nodeTxt)                                                    #标注有向边属性值
    plotNode(firstStr, cntrPt, parentPt, decisionNode)                                        #绘制结点
    secondDict = myTree[firstStr]                                                            #下一个字典，也就是继续绘制子结点
    plotTree.yOff = plotTree.yOff - 1.0/plotTree.totalD                                        #y偏移
    for key in secondDict.keys():
        if type(secondDict[key]).__name__=='dict':                                            #测试该结点是否为字典，如果不是字典，代表此结点为叶子结点
            plotTree(secondDict[key],cntrPt,str(key))                                        #不是叶结点，递归调用继续绘制
        else:                                                                                #如果是叶结点，绘制叶结点，并标注有向边属性值
            plotTree.xOff = plotTree.xOff + 1.0/plotTree.totalW
            plotNode(secondDict[key], (plotTree.xOff, plotTree.yOff), cntrPt, leafNode)
            plotMidText((plotTree.xOff, plotTree.yOff), cntrPt, str(key))
    plotTree.yOff = plotTree.yOff + 1.0/plotTree.totalD

def createPlot(inTree):
    fig = plt.figure(1, facecolor='white')                                                    #创建fig
    fig.clf()                                                                                #清空fig
    axprops = dict(xticks=[], yticks=[])
    createPlot.ax1 = plt.subplot(111, frameon=False, **axprops)                                #去掉x、y轴
    plotTree.totalW = float(getNumLeafs(inTree))                                            #获取决策树叶结点数目
    plotTree.totalD = float(getTreeDepth(inTree))                                            #获取决策树层数
    plotTree.xOff = -0.5/plotTree.totalW; plotTree.yOff = 1.0;                                #x偏移
    plotTree(inTree, (0.5,1.0), '')                                                            #绘制决策树
    plt.show()

if __name__ == '__main__':
    dataSet, labels = createDataSet()
    featLabels = []
    myTree = createTree(dataSet, labels)
    print(myTree)
    createPlot(myTree)

3.1 测试和存储决策树

依靠训练数据构造了决策树后，我们可以用于实际数据的分类。在进行数据分类时，需要构造树的标签向量。注意因为creatree函数中会删除信息增益最大的属性，所以在进行测试时，要在主函数中重新定义数据标签，否则会提示list out of range。这里为了节省篇幅，仅贴出测试代码和主函数，可以接着tree.py下面使用

def classify(inputTree,featLabels,testVec):
    firstStr = next(iter(inputTree))
    secondDict = inputTree[firstStr]
    featIndex = featLabels.index(firstStr)
    for key in secondDict.keys():
        if testVec[featIndex] == key:
            if type(secondDict[key]).__name__== 'dict':
                classLabel = classify(secondDict[key],featLabels,testVec)
            else:
                classLabel = secondDict[key]
    return classLabel

if __name__=='__main__':
    data,labels = createDataSet()
    print(labels)
    featlabel = ['色泽','根蒂','敲声','纹理','脐部','触感']
    tree = createTree(data,labels)
    print(tree)
    result = classify(tree,featlabel,[0,0,1,0,0,0])
    print(result)

存储及读取

def storeTree(inputTree,filename):
    import pickle
    fw = open(filename,'wb')
    pickle.dump(inputTree,fw)
    fw.close()

def grabTree(filename):
    import pickle
    fr = open(filename,'rb')
    return pickle.load(fr)

if __name__=='__main__':
    data,labels = createDataSet()
    tree = createTree(data,labels)
    print(tree)
    storeTree(tree,'xigua.txt')
    mytree = grabTree('xigua.txt')
    print(mytree)

4 课本隐形眼镜实战代码

import pandas as pd
from sklearn.preprocessing import LabelEncoder,OneHotEncoder
import pydotplus
from sklearn.externals.six import StringIO
from sklearn import tree
import numpy as np

if __name__ == '__main__':
    with open('lenses.txt', 'r') as fr:                                        #加载文件
        lenses = [inst.strip().split('\t') for inst in fr.readlines()]        #处理文件
    lenses_target = []                                                        #提取每组数据的类别，保存在列表里
    for each in lenses:
        lenses_target.append(each[-1])

    lensesLabels = ['age', 'prescript', 'astigmatic', 'tearRate']            #特征标签
    lenses_list = []                                                        #保存lenses数据的临时列表
    lenses_dict = {}                                                        #保存lenses数据的字典，用于生成pandas
    for each_label in lensesLabels:                                            #提取信息，生成字典
        for each in lenses:
            lenses_list.append(each[lensesLabels.index(each_label)])
        lenses_dict[each_label] = lenses_list
        lenses_list = []
    #print(lenses_dict)                                                        #打印字典信息
    lenses_pd = pd.DataFrame(lenses_dict)                                    #生成pandas.DataFrame
    #print(lenses_pd)
    le = LabelEncoder()
    for col in lenses_pd.columns:
        lenses_pd[col] = le.fit_transform(lenses_pd[col])
    #print(lenses_pd)

    clf = tree.DecisionTreeClassifier(max_depth=4)
    clf = clf.fit(lenses_pd.values.tolist(),lenses_target)
    dot_data = StringIO()
    tree.export_graphviz(clf,out_file=dot_data,feature_names=lenses_pd.keys(),
                         class_names=clf.classes_,filled=True,rounded=True,special_characters=True)
    graph = pydotplus.graph_from_dot_data(dot_data.getvalue())
    graph.write_pdf('tree.pdf')

参考文献

周志华《机器学习》
Peter Harrington 《机器学习实战》

ps:本博文代码均在pycharm成功运行过，有任何问题欢迎评论或私信我。

机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
梯度提升机 (Gradient Boosting Machines, GBM) ALGORITHM LOL boosting 集成学习机器学习
梯度提升机(GradientBoostingMachines,GBM)通俗易懂算法梯度提升机（GradientBoostingMachines，GBM）是一种集成学习算法，主要用于回归和分类问题。GBM本质上是通过训练一系列简单的模型（通常是决策树），然后将这些模型组合起来，从而提高整体预测性能。基本步骤初始模型：首先，我们用一个简单的模型（如一个常数值）作为预测模型，记为F0(x)F_0(x)F
分类算法可视化方法 dundunmm 数据挖掘分类数据挖掘人工智能可视化
可视化方法可以用于帮助理解分类算法的决策边界、性能和在不同数据集上的行为。下面列举几个常见的可视化方法。1.决策边界可视化这种方法用于可视化不同分类算法在二维特征空间中如何分隔不同类别。对于理解决策树、支持向量机（SVM）、逻辑回归和k近邻（k-NN）等模型的行为非常有用。importnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.datasets
机器学习实战笔记5——线性判别分析绍少阿机器学习笔记可视化机器学习 python 人工智能
任务安排1、机器学习导论8、核方法2、KNN及其实现9、稀疏表示3、K-means聚类10、高斯混合模型4、主成分分析11、嵌入学习5、线性判别分析12、强化学习6、贝叶斯方法13、PageRank7、逻辑回归14、深度学习线性判别分析（LDA）Ⅰ核心思想对于同样一件事，站在不同的角度，我们往往会有不同的看法，而降维思想，亦是如此。同上节课一样，我们还是学习降维的算法，只是提供了一种新的角度，由上
十大机器学习算法-梯度提升决策树（GBDT） zjwreal 机器学习 GBDT 机器学习梯度提升提升树梯度提升决策树
简介梯度提升决策树（GBDT）由于准确率高、训练快速等优点，被广泛应用到分类、回归合排序问题中。该算法是一种additive树模型，每棵树学习之前additive树模型的残差。许多研究者相继提出XGBoost、LightGBM等，又进一步提升了GBDT的性能。基本思想提升树-BoostingTree以决策树为基函数的提升方法称为提升树，其决策树可以是分类树或者回归树。决策树模型可以表示为决策树的加
决策树基础概论 Hello.Reader 算法算法决策树
1.概述在机器学习领域，决策树（DecisionTree）是一种高度直观且广泛应用的算法。它通过一系列简单的是/否问题，将复杂的决策过程分解为一棵树状结构，使得分类或回归问题的解决过程直观明了。决策树的最大特点在于可解释性强，每个决策节点都代表对特定特征的判断，最终根据这些判断得出结论。决策树适用于多种任务，例如：垃圾邮件分类、病症诊断、股票价格预测等。不仅如此，它还可以处理连续变量和离散变量，并
人工智能与机器学习原理精解【18】叶绿先锋基础数学与应用数学人工智能机器学习
文章目录决策树基础决策树的定义决策树的计算决策树的例子决策树的例题决策树算法一、决策树的算法过程二、决策树的性质Julia中实现框架使用`DecisionTree.jl`使用`MLJ.jl`Julia包的教程一、了解Julia包生态系统二、安装Julia包1.打开JuliaREPL2.使用Pkg包管理器三、使用Julia包四、查找和了解Julia包1.Julia官方文档2.JuliaHub3.Gi
《机器学习》—— XGBoost（xgb.XGBClassifier）分类器张小生180 机器学习人工智能
文章目录一、XGBoost分类器的介绍二、XGBoost（xgb.XGBClassifier）分类器与随机森林分类器（RandomForestClassifier）的区别三、XGBoost（xgb.XGBClassifier）分类器代码使用示例一、XGBoost分类器的介绍XGBoost分类器是一种基于梯度提升决策树（GradientBoostingDecisionTree，GBDT）的集成学习算
机器学习案例-决策树实现鸢尾花分类 Ausgelebt 机器学习相关 python 分类
机器学习案例-决策树实现鸢尾花分类目录机器学习案例-决策树实现鸢尾花分类1.选题目的和意义2.主要研究内容2.1决策树算法分类（区别于树的结构和构造算法）2.2决策树算法详解2.3决策树的应用3.算法设计3.1数据分析3.1.1Iris数据集基本介绍3.1.2样本标签值分布3.1.3样本特征值分布3.1.4相关性热力图3.2建立决策树3.3模型调优3.3.1决策树深度（预剪枝）3.3.2选取部分特
【人工智能】大话什么是神经网络路上阳光
什么是人工智能？通俗来讲，就是让机器能像人一样思考。这个无需解释太多，因为通过各种科幻电影我们已经对人工智能很熟悉了。大家现在感兴趣的应该是——如何实现人工智能？从1956年夏季首次提出“人工智能”这一术语开始，科学家们尝试了各种方法来实现它。这些方法包括专家系统，决策树、归纳逻辑、聚类等等，但这些都是假智能。直到人工神经网络技术的出现，才让机器拥有了“真智能”。为什么说之前的方法都是假智能呢？因
python 连续比较_python实现连续变量最优分箱详解--CART算法 weixin_39834788 python 连续比较
关于变量分箱主要分为两大类：有监督型和无监督型对应的分箱方法：A.无监督：(1)等宽(2)等频(3)聚类B.有监督：(1)卡方分箱法(ChiMerge)(2)ID3、C4.5、CART等单变量决策树算法(3)信用评分建模的IV最大化分箱等本篇使用python，基于CART算法对连续变量进行最优分箱由于CART是决策树分类算法，所以相当于是单变量决策树分类。简单介绍下理论：CART是二叉树，每次仅进
每天一个数据分析题（五百一十四）- 决策树算法跟着紫枫学姐学CDA 数据分析题库算法数据分析决策树
决策树由节点和边两种元素组成的结构，决策树中不包含一下哪种结点？A.根结点（rootnode)B.内部结点（internalnode）C.外部结点（externalnode）D.叶结点（leafnode）数据分析认证考试介绍：点击进入题目来源于CDA模拟题库点击此处获取答案数据分析专项练习题库内容涵盖Python，SQL，统计学，数据分析理论，深度学习，可视化，机器学习，Spark八个方向的专项练
力扣-N皇后问题坚持拒绝熬夜 leetcode 算法职场和发展
.-力扣（LeetCode）开始的思路由于n=4情况太多我们先画一下n=3的决策树可以知道皇后不能在同一行,因为我的思路是每一行每一行的填写皇后,所以不考虑行的皇后会重叠,主要考虑列的皇后会不会重叠,还有斜线的列皇后可以直接用一个数组col来标记一列中有皇后标记为true而斜线的需要一点数学功底如图可以转化成截距相等,当斜线斜率为1时,可能会有负数的情况,两边同时加上n,因为我想使用下标来标记截距
AI模型：追求全能还是专精？ Lill_bin 杂谈人工智能分布式 zookeeper 机器学习游戏
AI模型简介人工智能（AI）模型是人工智能系统的核心，它们是经过训练的算法，能够执行特定的任务，如图像识别、自然语言处理、游戏玩法、预测分析等。AI模型的类型很多，可以根据其功能和应用场景进行分类。常见的AI模型类型包括：监督学习模型：这些模型通过训练数据集学习，数据集中包含了输入和对应的输出标签。例子包括决策树、支持向量机（SVM）、神经网络等。无监督学习模型：这些模型处理没有标签的数据，目的是
机器学习实战----波士顿房价预测模型永远偷渡不了的非洲人机器学习机器学习 sklearn python
波士顿房价模型预测是一个回归问题，可以采用r2_score方法来作为评价指标。importnumpyasnpimportpandasaspdfromsklearn.metricsimportr2_score#从sklearn的数据库中导入波士顿房产数据fromsklearn.datasetsimportload_bostonfromsklearn.model_selectionimporttrai
Python知识点：如何使用Python进行时间序列预测杰哥在此 Python系列 python 开发语言编程面试
使用Python进行时间序列预测是一个非常常见的任务，可以应用于各种领域，如金融市场预测、销售量预测、天气预报等。时间序列预测的方法有很多，包括统计方法（如ARIMA模型）、机器学习方法（如支持向量机、决策树）、以及深度学习方法（如LSTM网络）。下面是一个简单的时间序列预测流程示例，使用Python和pandas、numpy、以及statsmodels库来实现ARIMA模型的时间序列预测。1.导
加州房价--决策树与随机森林一把年纪学编程五决策树随机森林机器学习
需要新装包'''decisionTree写在前面要安装http://www.graphviz.org/download/测试是否安装成功dot-version修改环境变量pipinstallgraphviz提示：Successfullyinstalledgraphviz-0.20pipinstallpydotplus'''#===================================im
CART算法 ziworeborn
CART算法就是分类回归树，它只支持二叉树，既可以作分类树，又可以作回归树。那什么是分类树，什么是回归树呢？假如有个数据集，分别给出了，不同年龄、职业、性别的不同学习时间。如果我构造了一棵决策树，想要基于数据判断这个人的职业身份，这个就属于分类树，因为是从几个分类中来做选择。如果是给定了数据，想要预测这个人的年龄，那就属于回归树。分类树可以处理离散数据，也就是数据种类有限的数据，它输出的是样本的类
回溯算法入门小泽爱刷题算法
回溯算法三要素抽象地说，解决一个回溯问题，实际上就是遍历一棵决策树的过程，树的每个叶子节点存放着一个合法答案。你把整棵树遍历一遍，把叶子节点上的答案都收集起来，就能得到所有的合法答案。站在回溯树的一个节点上，你只需要思考3个问题：1、路径：也就是已经做出的选择。#记录下已经走过的路2、选择列表：也就是你当前可以做的选择。3、结束条件：也就是到达决策树底层，无法再做选择的条件例如**[2]就是「路径
python logistic模型_Python实践之逻辑回归（Logistic Regression） weixin_39922394 python logistic模型
机器学习算法与Python实践这个系列主要是参考《机器学习实战》这本书。因为自己想学习Python，然后也想对一些机器学习算法加深下了解，所以就想通过Python来实现几个比较常用的机器学习算法。恰好遇见这本同样定位的书籍，所以就参考这本书的过程来学习了。这节学习的是逻辑回归(LogisticRegression)，也算进入了比较正统的机器学习算法。啥叫正统呢？我概念里面机器学习算法一般是这样一个
Spark MLlib模型训练—回归算法 Random forest regression 不二人生 Spark ML 实战 spark-ml 回归随机森林
SparkMLlib模型训练—回归算法Randomforestregression随机森林回归(RandomForestRegression)是一种集成学习方法，通过结合多个决策树的预测结果来提升模型的准确性和稳健性。相较于单一的决策树模型，随机森林通过随机采样和多棵树的集成，减少了模型的方差，从而在处理复杂数据集时展现出更好的性能。本文将详细介绍随机森林回归的原理、实现方法、应用场景，并通过Sc
R语言使用rpart包构建决策树模型实战、使用prune函数按照指定复杂度对决策树剪枝、使用rpart.plot包中的prp函数可视化训练、剪枝好的决策树 statistics.insight r语言决策树数据挖掘机器学习
R语言使用rpart包构建决策树模型实战、使用prune函数按照指定复杂度对决策树剪枝、使用rpart.plot包中的prp函数可视化训练、剪枝好的决策树、type参数、extra参数、fallen.leaves参数控制决策树精细化显示目录R语言使用rpart包构建决策树模型、使用prune函数按照指定复杂度对决策树剪枝、使用rpart.plot包中的prp函数可视化训练、剪枝好的决策树、type
周工作计划2019-03-25 MikeShine
很久没有写工作计划了。之前一个星期生了病，很难受。上个星期基本上什么都没有干。但是好的一点是，西瓜书基本都看完了。本周工作计划：机器学习分享活动（关于决策树的分享）回看一下西瓜书的东西，每一章把开头总结写一下。老师没有给具体的任务，留了再说吧。
决策树(decision tree) a15957199647 机器学习数据
决策树就是像树结构一样的分类下去，最后来预测输入样本的属于那类标签。本文是本人的学习笔记，所以有些地方也不是很清楚。大概流程就是1.查看子类是否属于同一个类2.如果是，返回类标签，如果不是，找到最佳的分类子集的特征3.划分数据集4.创建分支节点5.对每一个节点重复上述步骤6.返回树首先我们要像一个办法，怎么来确定最佳的分类特征就是为什么要这么划分子集。一般有三种方法：1.Gini不纯度2.信息熵3
深度学习100问13:什么是二分类问题不断持续学习ing 人工智能机器学习自然语言处理
嘿，你知道二分类问题不？这就像是一个“超级裁判”，要把东西分成两大类。一、定义及举例想象一下，生活中有很多时候我们得决定一个东西到底属于哪一边。就像判断一封邮件，是“垃圾邮件”呢，还是“正常邮件”；或者看看一个病人，是“得了某种病”呢，还是“没得病”。二、解决方法要解决二分类问题呀，我们可以找来一些“魔法工具”，也就是机器学习算法。像逻辑回归啦、支持向量机啦、决策树啦等等。这些算法就像聪明的小助手
每天一个数据分析题（五百一十二）- 数据标准化跟着紫枫学姐学CDA 数据分析题库数据分析数据挖掘
在完整的机器学习流程中，数据标准化（DataStandardization）一直是一项重要的处理流程。不同模型对于数据是否标准化的敏感程度不同，以下哪个模型对变量是否标准化不敏感？A.决策树B.KNNC.K-MeansD.SVM数据分析认证考试介绍：点击进入题目来源于CDA模拟题库点击此处获取答案数据分析专项练习题库内容涵盖Python，SQL，统计学，数据分析理论，深度学习，可视化，机器学习，S
机器学习基础（四）——决策树与随机森林 Bayesian小孙机器学习基础决策树机器学习随机森林
决策树与随机森林文章目录决策树与随机森林一、知识概要（一）二、决策树使用的算法三、sklearn决策树API四、决策树的案例1.数据清洗2.特征工程3.调用决策树API五、集成学习方法-随机森林1.知识概要（二）2.集成学习API3.随机森林的案例importpandasaspdfromsklearn.feature_extractionimportDictVectorizerfromsklear
机器学习之决策树与随机森林的实现 SEVEN-YEARS 机器学习决策树随机森林
引言随着互联网技术的发展，垃圾邮件过滤已成为一项重要的任务。机器学习技术，尤其是决策树和随机森林，在解决这类问题时表现出色。本文将介绍随机森林的基本概念，并通过一个具体的案例——筛选垃圾电子邮件——来展示随机森林的实际应用。随机森林简介随机森林是一种基于决策树的集成学习方法，它通过构建多个决策树并综合它们的预测结果来提高准确性和防止过拟合。随机森林的工作原理主要包括以下几个步骤：自助采样：从原始数
AI大模型副业变现之路，有技术就有收入！ AI大模型-王哥人工智能 AI大模型大模型大模型学习大模型教程大模型入门
在当今时代，AI大模型的应用越来越广泛，利用这些技术开展副业赚钱已成为可能。以下是一份详细的指南，帮助你了解需要学习的内容以及如何操作。一、需要学习的内容基础知识储备（1）数学知识：线性代数、概率论与数理统计、微积分等，这些是理解AI算法的基础。（2）编程技能：掌握Python编程语言，因为Python在AI领域有丰富的库和框架支持。（3）机器学习原理：了解常见的机器学习算法，如线性回归、决策树、
(二十一)Seaborn知识学习8-python数据分析与机器学习实战(学习笔记) 努力奋斗的durian
文章原创,最近更新：2018-05-17课程来源:python数据分析与机器学习实战-唐宇迪引言:介绍seaborn热度图绘制学习参考链接:1、Seaborn官方0.8.1版本首先介绍以下热度图的作用,拿出离散群数据,离散群数据可能会发生波动变化.看一下哪个点的值比较高,看一下哪个点的值比较低?通过值的变化,用颜色表现出来,这个是我们要做的一件事.热度图是由不同的颜色构成的,这个颜色由可能是由浅入
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交