小鸡吃石子

基于R的数据挖掘方法与实践（3）——决策树分析

决策树构建的目的有两个——探索与预测。探索方面，参与决策树声场的数据为训练数据，待树长成后即可探索数据所隐含的信息。预测方面，可以借助决策树推导出的规则预测未来数据。由于需要考虑未来数据进入该模型的分类表现，因此在基于训练数据构建决策树之后，可以用测试数据来衡量该模型的稳健性和分类表现。通过一连串的验证过程，最后得到最佳的分类规则，用作未来数据的预测。

1决策树构建理论

决策树的建立步骤包括数据准备、决策树生长、决策树修剪及规则提取。

1.1数据准备

决策树的分析数据包括两类变量：一是根据问题所决定的目标变量；二是根据问题背景与环境所选择的各种属性变量作为分支变量。分支变量是否容易理解与解释将决定决策树分析结果。

（1）二元属性：其测试条件可以产生两种结果。

（2）名目属性：名目属性结果的多少可以用不同属性值来表示，如血型可以分为A、B、AB、O四种类别。

（3）顺序属性：可以生成二元或二元以上的分割，其属性可以是群组，但群组必须符合属性值顺序特征。如年龄可以分为青年、中年、老年，

（4）连续属性：连续属性的条件可以表示成x=a的关系。决策树必须考虑到所有可能的分割点y，再从中选出最好的分割。

取得数据后，将所搜集的数据分为训练数据集和测试数据集，数据分割可参照如下方法：

数据分割是将数据分成训练数据集、测试数据集和验证数据集。训练数据集用来建立模型，测试数据集用来评估模型是否过度复杂及其通用性，验证数据集则用以衡量模型的好坏，例如分类错误率、均方误差。一个好的训练模式应该对于未知的数据仍有很好的适配度，若当模式复杂程度越来越高，而测试数据的误差却越来越大，表示该训练模型有过度配适的问题。

数据分割的比例有不同的定义，均应代表原来的数据。一种方法是抽取80%的数据作为训练数据集构建模型，剩下的20%用于模型的效度检验。另一种方法是k-fold交互验证。该方法首先将数据分为k等份，每次抽取k-1份数据进行模式训练，剩下的1份数据用于测试模型，如此重复k次，使每笔数据都能成为训练数据集与测试数据集，最后的平均结果则用来代表模型的效度。该方法适合于样本数较少的情况，可以有效涵盖整个数据，但缺点是计算时间很长。

在决策树构建过程中，如果一个决策树模型仅在训练数据中有很低的错误率，但在测试数据集中有很高的错误率，则说明该决策树模型过度配适，造成模型无法用于估计其他数据。因此建立决策树模型后，应根据估计测试数据的分类表现，适当地修剪决策树，增加其分类或预测的争取性，避免过度配适。

1.2决策树分支准则

决策树的分支准则决定了树的规模大小，包括宽度和深度。常见的分支准则有：信息增益、Gini系数、卡方统计量、信息增益比等。

假设训练数据集有k个类别，分别为C1、C2、……、Ck，属性A有l中不同的数值，A1、A2、……、Al。

属性	类别
属性	C1	C2	…	Ck	总和
A1	x11	x12	…	x1k	x1.
A2	x21	x22	…	x2k	x2.
…	…	…	…	…	…
Al	xl1	xl2	…	xlk	xl.
总和	x.1	x.2	…	x.k	N

（1）信息增益

信息增益是根据不同信息的似然值或概率衡量不同条件下的信息量。

若每个类别的数据个数定义为x.j，N为数据集合中所有数据的个数，类别出现的概率为pj = x.j/N，根据信息论可以知道，各类别的信息为-log2(pj)，因此各类别C1、C2、……、Ck所带来的信息总和Info(D)为：

Info(D)= - (x.1/N)*log2(x.1/N) - (x.2/N)*log2(x.2/N) - … - (x.k/N)*log2(x.k/N)

Info(D)又称为熵，常用以衡量数据离散程度。当各类别出现的概率相等，则Info(D)=1，表示该分类的信息复杂程度最高。

假设该数据集D要根据属性A进行分割，产生共L各数据分割集Di，其中xi.为各属性值Ai下的分割数据总个数xij为属性值Ai下且为类别Cj的个数，因此可计算属性Ai下的信息Info(Ai)：

Info(Ai)= - (xi1/ xi.)*log2(xi1/ xi.) - (xi2/ xi.)*log2(xi2/ xi.) - … - (xik/ xi.)*log2(xik/xi.)

属性A的信息则根据各属性值下数据个数多寡决定：

InfoA(D)= (x1./N)*Info(A1) + (x2./N)*Info(A2) + … + (xl./N)*Info(Al)

信息增益可以表示为原始数据的总信息量减去分之后的总信息量，以表示属性A作为分支属性对信息的贡献程度。以此类推可以计算出各个属性作为分支变量能带来的信息贡献度，比较后可找出具有最佳信息增益的信息属性。

（2）Gini系数

Gini系数是衡量数据集合对于所有类别的不纯度。

Gini(D)= 1 – sum(j = 1, ….,k, pj^2)

各属性值Ai下数据集合的不纯度Gini(Ai)为：

Gini(Ai)= 1 – (xi1/xi.)^2 – (xi2/xi.)^2 - ……, – (xik/xi.)^2

属性A的总数据不纯度为：

GiniA(D)= (x1./N)*Gini(A1) + (x2./N)*Gini(A2) + … + (xl./N)*Gini(Al)

属性A对不纯度减少的贡献：

deltaGini(A)= Gini(D) –GiniA(D)

（3）卡方统计量

卡方统计量是用列联表来计算两列变量之间的相依程度，当计算出的样本卡方统计值越大，表示两变量之间的相依程度越高。

（4）信息增益比

信息增益比是考虑候选属性本身所携带的信息，在将这些信息转移至决策树，经由计算增益与分支属性的信息量的比值来找出最适合的分支属性。

（5）方差缩减

当目标变量为连续时，可采用放假缩减作为分支依据。

1.3 决策树修剪

决策树的修剪方式包括事前修剪和事后修剪。事前修剪应用于一开始决策树的生长过程中，实现设定停止决策树生长的门槛值，常见的设定门槛如分割的评估值没达到此门槛值时，就会停止决策树的生长，例如信息增益值要大于0.1或是节点中包含足够的样本数目。事前修剪的优点在于具有执行效率，但可能会有过度修剪的缺点。事后修剪法虽然效率较低，但对于解决决策树的过度配适问题相当具有正面效益。

1.4 规则提取

完成决策树的生长及修剪之后，即可利用决策树提取数据中隐含的信息。

2、决策树算法

算法		CART	C4.5/C5.0	CHAID
处理数据形态		离散、连续	离散、连续	离散
连续型数据分支方式		只分2支	无限制	无法处理
分支准则	类别型相依变数	Gini分散度指标	信息增益比	卡方检验
分支准则	连续型相依变数	方差缩减	方差缩减	卡方检定或F检定（需先转化为类别变量）
分支方法	类别型独立变量	二元分支	多元分支	多元分支
分支方法	连续型独立变量	二元分支	二元分支	多元分支（需转化为类别变量）
修剪方法		成本复杂性修剪	基于错误的修剪	无

3、模型评估

决策树分类模型可以从两个方面评估其分类及预测表现：（1）以测试组数据的结果来客观评估较佳的决策树模型，例如分类错误率；（2）由于分类规则的提取随着问题而异，因此在客观评估后，通常均需由该领域专家根据问题背景选出最适合的决策树模型。

4、决策树应用

4.1 CART决策树

载入包和数据集

> library(MASS)
> data("Pima.tr")
> str(Pima.tr)
'data.frame':	200 obs. of  8 variables:
 $ npreg: int  5 7 5 0 0 5 3 1 3 2 ...
 $ glu  : int  86 195 77 165 107 97 83 193 142 128 ...
 $ bp   : int  68 70 82 76 60 76 58 50 80 78 ...
 $ skin : int  28 33 41 43 25 27 31 16 15 37 ...
 $ bmi  : num  30.2 25.1 35.8 47.9 26.4 35.6 34.3 25.9 32.4 43.3 ...
 $ ped  : num  0.364 0.163 0.156 0.259 0.133 ...
 $ age  : int  24 55 35 26 23 52 25 24 63 31 ...
 $ type : Factor w/ 2 levels "No","Yes": 1 2 1 1 1 2 1 1 1 2 ...

其中，Pima数据已经被分为两部分，Pima.tr为训练集、Pima.te为测试集。

> #首先以不修剪的方法进行决策树的构建，因而将复杂系数cp设置为0
> cart_tree1 = rpart(type~., Pima.tr, control = rpart.control(cp = 0))
> summary(cart_tree1)
Call:
rpart(formula = type ~ ., data = Pima.tr, control = rpart.control(cp = 0))
  n= 200 

          CP nsplit rel error    xerror       xstd
1 0.22058824      0 1.0000000 1.0000000 0.09851844
2 0.16176471      1 0.7794118 0.9852941 0.09816108
3 0.07352941      2 0.6176471 0.8235294 0.09337946
4 0.05882353      3 0.5441176 0.7941176 0.09233140
5 0.01470588      4 0.4852941 0.6176471 0.08470895
6 0.00000000      7 0.4411765 0.7500000 0.09064718

Node number 1: 200 observations,    complexity param=0.2205882
  predicted class=No   expected loss=0.34  P(node) =1
    class counts:   132    68
   probabilities: 0.660 0.340 
  left son=2 (109 obs) right son=3 (91 obs)
  Primary splits:
      glu   < 123.5  to the left,  improve=19.624700, (0 missing)
      age   < 28.5   to the left,  improve=15.016410, (0 missing)
      npreg < 6.5    to the left,  improve=10.465630, (0 missing)
      bmi   < 27.35  to the left,  improve= 9.727105, (0 missing)
      skin  < 22.5   to the left,  improve= 8.201159, (0 missing)
  Surrogate splits:
      age   < 30.5   to the left,  agree=0.685, adj=0.308, (0 split)
      bp    < 77     to the left,  agree=0.650, adj=0.231, (0 split)
      npreg < 6.5    to the left,  agree=0.640, adj=0.209, (0 split)
      skin  < 32.5   to the left,  agree=0.635, adj=0.198, (0 split)
      bmi   < 30.85  to the left,  agree=0.575, adj=0.066, (0 split)

Node number 2: 109 observations,    complexity param=0.01470588
  predicted class=No   expected loss=0.1376147  P(node) =0.545
    class counts:    94    15
   probabilities: 0.862 0.138 
  left son=4 (74 obs) right son=5 (35 obs)
  Primary splits:
      age   < 28.5   to the left,  improve=3.2182780, (0 missing)
      npreg < 6.5    to the left,  improve=2.4578310, (0 missing)
      bmi   < 33.5   to the left,  improve=1.6403660, (0 missing)
      bp    < 59     to the left,  improve=0.9851960, (0 missing)
      skin  < 24     to the left,  improve=0.8342926, (0 missing)
  Surrogate splits:
      npreg < 4.5    to the left,  agree=0.798, adj=0.371, (0 split)
      bp    < 77     to the left,  agree=0.734, adj=0.171, (0 split)
      skin  < 36.5   to the left,  agree=0.725, adj=0.143, (0 split)
      bmi   < 38.85  to the left,  agree=0.716, adj=0.114, (0 split)
      glu   < 66     to the right, agree=0.688, adj=0.029, (0 split)

Node number 3: 91 observations,    complexity param=0.1617647
  predicted class=Yes  expected loss=0.4175824  P(node) =0.455
    class counts:    38    53
   probabilities: 0.418 0.582 
  left son=6 (35 obs) right son=7 (56 obs)
  Primary splits:
      ped  < 0.3095 to the left,  improve=6.528022, (0 missing)
      bmi  < 28.65  to the left,  improve=6.473260, (0 missing)
      skin < 19.5   to the left,  improve=4.778504, (0 missing)
      glu  < 166    to the left,  improve=4.104532, (0 missing)
      age  < 39.5   to the left,  improve=3.607390, (0 missing)
  Surrogate splits:
      glu   < 126.5  to the left,  agree=0.670, adj=0.143, (0 split)
      bp    < 93     to the right, agree=0.659, adj=0.114, (0 split)
      bmi   < 27.45  to the left,  agree=0.659, adj=0.114, (0 split)
      npreg < 9.5    to the right, agree=0.648, adj=0.086, (0 split)
      skin  < 20.5   to the left,  agree=0.637, adj=0.057, (0 split)

Node number 4: 74 observations
  predicted class=No   expected loss=0.05405405  P(node) =0.37
    class counts:    70     4
   probabilities: 0.946 0.054 

Node number 5: 35 observations,    complexity param=0.01470588
  predicted class=No   expected loss=0.3142857  P(node) =0.175
    class counts:    24    11
   probabilities: 0.686 0.314 
  left son=10 (9 obs) right son=11 (26 obs)
  Primary splits:
      glu  < 90     to the left,  improve=2.3934070, (0 missing)
      bmi  < 33.4   to the left,  improve=1.3714290, (0 missing)
      bp   < 68     to the right, improve=0.9657143, (0 missing)
      ped  < 0.334  to the left,  improve=0.9475564, (0 missing)
      skin < 39.5   to the right, improve=0.7958592, (0 missing)
  Surrogate splits:
      ped < 0.1795 to the left,  agree=0.8, adj=0.222, (0 split)

Node number 6: 35 observations,    complexity param=0.05882353
  predicted class=No   expected loss=0.3428571  P(node) =0.175
    class counts:    23    12
   probabilities: 0.657 0.343 
  left son=12 (27 obs) right son=13 (8 obs)
  Primary splits:
      glu   < 166    to the left,  improve=3.438095, (0 missing)
      ped   < 0.2545 to the right, improve=1.651429, (0 missing)
      skin  < 25.5   to the left,  improve=1.651429, (0 missing)
      npreg < 3.5    to the left,  improve=1.078618, (0 missing)
      bp    < 73     to the right, improve=1.078618, (0 missing)
  Surrogate splits:
      bp < 94.5   to the left,  agree=0.8, adj=0.125, (0 split)

Node number 7: 56 observations,    complexity param=0.07352941
  predicted class=Yes  expected loss=0.2678571  P(node) =0.28
    class counts:    15    41
   probabilities: 0.268 0.732 
  left son=14 (11 obs) right son=15 (45 obs)
  Primary splits:
      bmi   < 28.65  to the left,  improve=5.778427, (0 missing)
      age   < 39.5   to the left,  improve=3.259524, (0 missing)
      npreg < 6.5    to the left,  improve=2.133215, (0 missing)
      ped   < 0.8295 to the left,  improve=1.746894, (0 missing)
      skin  < 22     to the left,  improve=1.474490, (0 missing)
  Surrogate splits:
      skin < 19.5   to the left,  agree=0.839, adj=0.182, (0 split)

Node number 10: 9 observations
  predicted class=No   expected loss=0  P(node) =0.045
    class counts:     9     0
   probabilities: 1.000 0.000 

Node number 11: 26 observations,    complexity param=0.01470588
  predicted class=No   expected loss=0.4230769  P(node) =0.13
    class counts:    15    11
   probabilities: 0.577 0.423 
  left son=22 (19 obs) right son=23 (7 obs)
  Primary splits:
      bp    < 68     to the right, improve=1.6246390, (0 missing)
      bmi   < 33.4   to the left,  improve=1.6173080, (0 missing)
      npreg < 6.5    to the left,  improve=0.9423077, (0 missing)
      skin  < 39.5   to the right, improve=0.6923077, (0 missing)
      ped   < 0.334  to the left,  improve=0.4923077, (0 missing)
  Surrogate splits:
      glu < 94.5   to the right, agree=0.808, adj=0.286, (0 split)
      ped < 0.2105 to the right, agree=0.808, adj=0.286, (0 split)

Node number 12: 27 observations
  predicted class=No   expected loss=0.2222222  P(node) =0.135
    class counts:    21     6
   probabilities: 0.778 0.222 

Node number 13: 8 observations
  predicted class=Yes  expected loss=0.25  P(node) =0.04
    class counts:     2     6
   probabilities: 0.250 0.750 

Node number 14: 11 observations
  predicted class=No   expected loss=0.2727273  P(node) =0.055
    class counts:     8     3
   probabilities: 0.727 0.273 

Node number 15: 45 observations
  predicted class=Yes  expected loss=0.1555556  P(node) =0.225
    class counts:     7    38
   probabilities: 0.156 0.844 

Node number 22: 19 observations
  predicted class=No   expected loss=0.3157895  P(node) =0.095
    class counts:    13     6
   probabilities: 0.684 0.316 

Node number 23: 7 observations
  predicted class=Yes  expected loss=0.2857143  P(node) =0.035
    class counts:     2     5
   probabilities: 0.286 0.714 
> par(xpd = TRUE); plot(cart_tree1); text(cart_tree1)

> #对测试集进行预测分析，并得到预测精度
> pre_cart_tree1 = predict(cart_tree1, Pima.te, type = "class")
> matrix1 = table(Type = Pima.te$type, predict = pre_cart_tree1)
> matrix1
     predict
Type   No Yes
  No  223   0
  Yes 109   0
> accuracy_tree1 = sum(diag(matrix1))/sum(matrix1)
> accuracy_tree1
[1] 0.6716867
> #对建成的决策树模型进行剪枝，将cp设为0.03
> cart_tree2 = prune(cart_tree1, cp = 0.03)
> par(xpd = TRUE); plot(cart_tree2); text(cart_tree2)

> #基于剪枝后的模型对测试集进行预测分析，并得到预测精度
> pre_cart_tree2 = predict(cart_tree2, Pima.te, type = "class")
> matrix2 = table(Type = Pima.te$type, predict = pre_cart_tree2)
> matrix2
     predict
Type   No Yes
  No  223   0
  Yes 109   0
> accuracy_tree2 = sum(diag(matrix2))/sum(matrix2)
> accuracy_tree2
[1] 0.6716867
> #对建成的决策树模型进行进一步剪枝，将cp设为0.1
> cart_tree3 = prune(cart_tree2, cp = 0.1)
> par(xpd = TRUE); plot(cart_tree3); text(cart_tree3)

> #基于剪枝后的模型对测试集进行预测分析，并得到预测精度
> pre_cart_tree3 = predict(cart_tree3, Pima.te, type = "class")
> matrix3 = table(Type = Pima.te$type, predict = pre_cart_tree3)
> matrix3
     predict
Type   No Yes
  No  223   0
  Yes 109   0
> accuracy_tree3 = sum(diag(matrix3))/sum(matrix3)
> accuracy_tree3
[1] 0.6716867

显然当cp为0.03时可以获得较高的准确率，而cp设为0.1时，模型二道了极大的简化且准确率基本并未过多损失。

4.2 C5.0决策树

> #C5.0决策树分析
> library(C50)
> library(MASS)
> data("Pima.tr")
> str(Pima.tr)
'data.frame':	200 obs. of  8 variables:
 $ npreg: int  5 7 5 0 0 5 3 1 3 2 ...
 $ glu  : int  86 195 77 165 107 97 83 193 142 128 ...
 $ bp   : int  68 70 82 76 60 76 58 50 80 78 ...
 $ skin : int  28 33 41 43 25 27 31 16 15 37 ...
 $ bmi  : num  30.2 25.1 35.8 47.9 26.4 35.6 34.3 25.9 32.4 43.3 ...
 $ ped  : num  0.364 0.163 0.156 0.259 0.133 ...
 $ age  : int  24 55 35 26 23 52 25 24 63 31 ...
 $ type : Factor w/ 2 levels "No","Yes": 1 2 1 1 1 2 1 1 1 2 ...
> C50_tree2 = C5.0(type~., Pima.tr, control=C5.0Control(noGlobalPruning = TRUE)) #不对树进行剪枝
> summary(C50_tree2)

Call:
C5.0.formula(formula = type ~ ., data = Pima.tr, control = C5.0Control(noGlobalPruning = TRUE))


C5.0 [Release 2.07 GPL Edition]  	Sat Sep 16 12:12:54 2017
-------------------------------

Class specified by attribute `outcome'

Read 200 cases (8 attributes) from undefined.data

Decision tree:

glu <= 123: No (109/15)
glu > 123:
:...bmi > 28.6:
    :...ped <= 0.344: No (29/12)
    :   ped > 0.344: Yes (41/5)
    bmi <= 28.6:
    :...age <= 32: No (11)
        age > 32:
        :...bp > 80: No (3)
            bp <= 80:
            :...ped <= 0.162: No (2)
                ped > 0.162: Yes (5)


Evaluation on training data (200 cases):

	    Decision Tree   
	  ----------------  
	  Size      Errors  

	     7   32(16.0%)   <<


	   (a)   (b)    <-classified as
	  ----  ----
	   127     5    (a): class No
	    27    41    (b): class Yes


	Attribute usage:

	100.00%	glu
	 45.50%	bmi
	 38.50%	ped
	 10.50%	age
	  5.00%	bp


Time: 0.0 secs
> plot(C50_tree2)

> C50_tree3 = C5.0(type~., Pima.tr, control=C5.0Control(noGlobalPruning = FALSE)) #对树进行剪枝
> summary(C50_tree3)

Call:
C5.0.formula(formula = type ~ ., data = Pima.tr, control = C5.0Control(noGlobalPruning = FALSE))


C5.0 [Release 2.07 GPL Edition]  	Sat Sep 16 12:14:14 2017
-------------------------------

Class specified by attribute `outcome'

Read 200 cases (8 attributes) from undefined.data

Decision tree:

glu <= 123: No (109/15)
glu > 123:
:...bmi <= 28.6: No (21/5)
    bmi > 28.6:
    :...ped <= 0.344: No (29/12)
        ped > 0.344: Yes (41/5)


Evaluation on training data (200 cases):

	    Decision Tree   
	  ----------------  
	  Size      Errors  

	     4   37(18.5%)   <<


	   (a)   (b)    <-classified as
	  ----  ----
	   127     5    (a): class No
	    32    36    (b): class Yes


	Attribute usage:

	100.00%	glu
	 45.50%	bmi
	 35.00%	ped


Time: 0.0 secs
> plot(C50_tree3)

> pre_C50_Cla2 = predict(C50_tree2, Pima.te, type = "class")
> matrix2 = table(Type = Pima.te$type, predict = pre_C50_Cla2)
> matrix2
     predict
Type   No Yes
  No  193  30
  Yes  58  51
> accuracy_tree2 = sum(diag(matrix2))/sum(matrix2)
> accuracy_tree2
[1] 0.7349398
> pre_C50_Cla3 = predict(C50_tree3, Pima.te, type = "class")
> matrix3 = table(Type = Pima.te$type, predict = pre_C50_Cla3)
> matrix3
     predict
Type   No Yes
  No  195  28
  Yes  60  49
> accuracy_tree3 = sum(diag(matrix3))/sum(matrix3)
> accuracy_tree3
[1] 0.7349398

我们发现修剪和不修剪对模型正确率没有影响，但修剪之后的模型显然更容易解释。

4.3 CHAID决策树

> #CHAID决策树分析
> #CHAID决策树只能对离散型属性进行处理，因此需要将数据中的连续型数据都转化为离散型，不用考虑时候修剪的问题。
> install.packages("CHAID")#如果找不到，则可以从https://r-forge.r-project.org/R/?group_id=343下载后安装
> library(CHAID)
> #加载训练和测试数据集
> data("Pima.tr")
> data("Pima.te")
> #将数据集合并
> Pima = rbind(Pima.tr, Pima.te)
> #对数据进行离散化处理，并输出离散化的属性
> level_name = {}
> for(i in 1:7)
+ {
+   Pima[,i] = cut(Pima[,i], breaks = 3, ordered_result = TRUE, include.lowest = TRUE)
+   level_name <- rbind(level_name, levels(Pima[,i]))
+ }
> level_name = data.frame(level_name)
> row.names(level_name) = colnames(Pima)[1:7]
> colnames(level_name) = paste("L",1:3,sep="")
> level_name
                  L1           L2          L3
npreg  [-0.017,5.67]  (5.67,11.3]   (11.3,17]
glu       [55.9,104]    (104,151]   (151,199]
bp       [23.9,52.7]  (52.7,81.3]  (81.3,110]
skin     [6.91,37.7]  (37.7,68.3] (68.3,99.1]
bmi      [18.2,34.5]  (34.5,50.8] (50.8,67.1]
ped   [0.0827,0.863] (0.863,1.64] (1.64,2.42]
age        [20.9,41]      (41,61]   (61,81.1]
> #以前200个数据为训练集，剩下的332个数据为测试集
> Pima.tr = Pima[1:200,]
> Pima.te = Pima[201:nrow(Pima),]
> CHAID_tree = chaid(type~., Pima.tr)
> CHAID_tree

Model formula:
type ~ npreg + glu + bp + skin + bmi + ped + age

Fitted party:
[1] root
|   [2] glu in [55.9,104]
|   |   [3] age in [20.9,41]: No (n = 50, err = 6.0%)
|   |   [4] age in (41,61], (61,81.1]: No (n = 10, err = 40.0%)
|   [5] glu in (104,151]
|   |   [6] age in [20.9,41]: No (n = 86, err = 27.9%)
|   |   [7] age in (41,61], (61,81.1]: Yes (n = 15, err = 26.7%)
|   [8] glu in (151,199]: Yes (n = 39, err = 33.3%)

Number of inner nodes:    3
Number of terminal nodes: 5
> plot(CHAID_tree)

> #对测试集分别进行预测分析，并得到预测精度
> pre_CHAID_tree = predict(CHAID_tree, Pima.te)
> matrix = table(Type = Pima.te$type, predict = pre_CHAID_tree)
> matrix
     predict
Type   No Yes
  No  199  24
  Yes  47  62
> accuracy_tree = sum(diag(matrix))/sum(matrix)
> accuracy_tree
[1] 0.7861446

你可能感兴趣的:(R)

容器化检索增强框架（R2R） deepdata_cn RAG RAG
R2RbySciPhi-AI是一个专门的RAG框架，专注于通过迭代细化来改进检索过程。主要特点包括实现新颖的检索算法，支持多步检索过程，与各种嵌入模型和向量存储集成，以及用于分析和可视化检索性能的工具。适合有兴趣突破检索技术界限的开发人员和研究人员，特别是在需要创新检索方法的场景。具有RESTfulAPI的容器化检索增强一代（RAG）。具有生产就绪型功能，包括多模式内容摄取、混合搜索功能、可配置的
R语言数据分析基础（一）- 使用R语言读取Excel 司南锤 R语言 excel r语言
在R中，读取和操作Excel文件最常用的readxl包，可以读取Excel文件，writexl包可以写入Excel文件。以下是常见的操作：安装和加载包首先，需要安装和加载readxl和writexl包。install.packages("readxl")install.packages("writexl")library(readxl)library(writexl)读取Excel文件使用read
在计算机上本地运行 Deepseek R1 itmanll linux
DownloadOllamaonLinuxDownloadOllamaonWindowsDownloadOllamaonmacOSDeepseekR1是一个强大的人工智能模型，在科技界掀起了波澜。它是一个开源语言模型，可以与GPT-4等大玩家展开竞争。但更重要的是，与其他一些模型不同，您可以在自己的计算机上本地运行DeepseekR1。linux步骤第1步：下载Ollama并安装curl-fsSL
机器视觉python+opencv函数库：一二师弟_k opencv python
对此图片进行操作：代码部分：第一步：importcv2#导入opencv函数库img_test=cv2.imread(r"C:\Users\12044\Desktop\test.png")#读取图像，img_test为原图名称cv2.imshow("image",img_test)#显示图像，引号中的内容为图像显示窗口的名称，即“image”cv2.waitKey(0)#等待事件触发，参数0表示永
探索 OpenAir：R 语言中的空气质量数据分析利器 xyt556_CUMT Big Data r语言数据分析
探索OpenAir：R语言中的空气质量数据分析利器在环境科学和空气质量管理中，数据的收集和分析是至关重要的。对于研究人员和数据科学家而言，拥有一个高效且强大的工具来处理和分析空气质量数据可以大大提高工作效率。OpenAir是一个为此目的而设计的R语言软件包，它提供了一系列功能强大的工具，能够帮助用户处理、分析和可视化空气质量数据。本文将深入探讨OpenAir包的主要功能，并通过一些示例展示如何使用
自定义数据集使用scikit-learn中的包实现线性回归方法对其进行拟合灵封～ scikit-learn 线性回归 python
一、导入必要的库importpandasaspdfromsklearn.model_selectionimporttrain_test_splitfromsklearn.linear_modelimportLinearRegressionfromsklearn.metricsimportmean_squared_error,r2_score二、加载自定义数据集#创建自定义数据集#假设我们有一个简单
基于R-CNN深度学习的无人机目标检测系统：数据集、模型和UI界面的完整实现 2025年数学建模美赛 R-CNN检测系统深度学习 cnn 无人机计算机视觉目标检测人工智能
摘要随着无人机技术的迅猛发展，无人机在军事、农业、环境监测等多个领域的应用日益广泛。无人机目标检测系统的建设成为提升无人机自主飞行和环境感知能力的重要环节。本文将详细介绍如何构建一个基于深度学习的无人机目标检测系统，采用R-CNN（区域卷积神经网络）算法，通过用户界面设计和数据集处理，实现高效的目标检测功能。通过本项目，旨在为无人机目标检测提供一种可行的解决方案，并提高其在复杂环境下的工作效率。目
dp题目总结（1）——基础 _So_Far_Away 算法动态规划
例题1数字三角形题目描述观察下面的数字金字塔。写一个程序来查找从最高点到底部任意处结束的路径，使路径经过数字的和最大。每一步可以走到左下方的点也可以到达右下方的点。738810274445265在上面的样例中,从7到3到8到7到5的路径产生了最大输入格式第一个行包含R(1usingnamespacestd;inta[1010][1010],ans=0;intn;//输入数塔层数nvoiddfs(i
DeepSeek R1模型基于ollama部署 &Dirac 机器学习笔记 python 语言模型 nlp
DeepSeekR1模型基于ollama部署1、安装部署ollama(windows)2、在ollama中使用deepseekr13、问答示例4、python调用接口5、ollama常用命令1、安装部署ollama(windows)Ollama是一个专为本地机器设计的开源框架，旨在简化大型语言模型（LLM）的部署和运行过程。它提供了一套工具和命令，使用户能够轻松地下载、管理和运行各种语言模型，包括
Python 录音转文字 @小张不嚣张 python 开发语言
在Python中,可以使用第三方库来实现录音文件转文字的功能。一个常用的库是speech_recognition。importspeech_recognitionassr#创建语音识别器r=sr.Recognizer()#从录音文件读取音频withsr.AudioFile('audio_file.wav')assource:audio_data=r.record(source)#使用GoogleS
使用shell脚本修改linux静态网络IP、网关和hosts文件二十一克阳光！网络 linux tcp/ip
#!/bin/bash#检查参数数量if["$#"-ne2];thenecho"Usage:$0"exit1fi#获取参数NEW_IPADDR=$1#提取新的子网部分（前24位）#IFS='.'read-r-aip_parts<<<"$NEW_IPADDR":使用点号.作为分隔符，将NEW_IPADDR分割成数组ip_parts。#NEW_SUBNET="${ip_parts[0]}.${ip_p
Linux权限命令-修改文件的所属组李乾星 Liunx自学笔记 linux 服务器运维
Linux权限命令-修改文件的所属组在Linux系统中，可以通过chgrp命令来修改文件或目录的所属组。本文将介绍chgrp命令的语法、实操以及各种方法之间的区别，以帮助读者更加深入地掌握这个命令。语法chgrp命令的基本语法如下：chgrp[-R]groupnamefilename其中，-R为可选参数，表示递归修改指定目录下所有文件的所属组；groupname为要修改成的新的用户组名称；file
嵌入式工程师必学（99）：直流电路定理芯片-嵌入式嵌入式硬件
线性度属性LinearityProperty线性是描述因果之间线性关系的元素的属性。它是均匀性和可加性特性的组合。齐次性属性要求，如果输入（激励）乘以一个常数，则输出（响应）乘以相同的常数。例如，对于电阻，欧姆定律将输入i与输出v相关联：v=iR。如果i增加一个常数k，则v相应地增加k；那是可加性属性要求对输入之和的响应是对单独应用的每个输入的响应之和。因此，对于电阻，如果V1=i1R
导入R包或者安装R包时遇到报错：shared object‘XXXX.so’ not found 生信碱移经验分享 r语言
报错示例：Error:packageornamespaceloadfailedfor‘Seurat’inlibrary.dynam(lib,package,package.lib):sharedobject‘uwot.so’notfound解决方案：安装XXXX.so中对应的R包名称XXXX，对于这个报错示例来说就是uwot:install.packages("uwot")随后重启以后即可正常使用
r语言调用python_小众做法，通过python调用R语言的第三方包 weixin_39926040 r语言调用python
原本的意思只想在anaconda上把所有代码一股脑的写好，实在不想转战不同的平台。为此无意间发现python可以调用R，于是饶有兴致的挖了个坑。网上的教程基本都很老，下载的费官方whl包都已经没地方下啦。所以自己开始作死，甚至把anaconda都重装了一遍。。。网上的教程开始无非是：1、python调用R使用的是rpy2包首先安装R或者Rstudio其次anaconda中condainstallr
数据挖掘r语言和python知乎_同时用R语言和Python爬取知乎美图 weixin_39932344
作者:杜雨，EasyCharts团队成员，R语言中文社区专栏作者，兴趣方向为：Excel商务图表，R语言数据可视化，地理信息数据可视化。学习Python已有两月有余，是时候检验下学习效果了，之前练习了不少R语言数据爬取，Python的爬虫模块还没有来得及认真入门，乱拼乱凑就匆忙的开始了，今天就尝试着使用R+Python来进行图片爬取，完成一个简单得小爬虫。目标网址在这里：https://www.z
r语言调用python_R语言与Python协同工作 weixin_39868034 r语言调用python
R（又称R语言）是一款开源的跨平台的数值统计和数值图形化展现工具。通俗点说，R是用来做统计和画图的。R拥有自己的脚本语言和大量的统计、图形库（得益于开源社区），这让她看起来既美又实用。与其他同类软件（如SPSS）相比，R的特点是纯命令行的，这倒也好，我们更应该把注意力放在数据本身，而非统计工具的UI。R虽说有一套自己的语言，还挺完备，但她最专业的还是做统计和画图，而像连接数据库、文本处理、文件操作
r语言调用python_如何在Rstudio中使用python 语言（图文详解） weixin_39640372 r语言调用python
一直以来我们学习、测试python都会提到Pycharm，不仅好用，还支持使用R语言。这是pycharm的界面↑↑↑那经典的Rstudio呢？之前看到Y叔提到好用的PythonIDE是Rstudio，顺势搜索一番发现，有点意思。熟悉的界面熟悉的界面，直接在新建中选择PythonScript即可。直接运行一段测试代码，如果是从来没有进行过操作的，Rstudio会默认下载Miniconda进行环境搭建
R语言运行Python包解决Error: Error creating conda environment 问题 wang_jiezeng Numpy conda环境设置 python r语言深度学习
RSTudio成功安装并加载reticulate、Rcpp两个先行包后，运行np<-import("numpy")出现死机，运行repl_python()出现发生错误的提示：Error:Errorcreatingcondaenvironment'C:/Users/Administrator/AppData/Local/r-miniconda/envs/r-reticulate'[exitcode1
R语言和Python交互 dltan R语言 Python
交互原理借助了reticulate这个包，其中两个工具的模块包加载方式在R中是import(“math”);在Python中是importmath调用模块包后执行结果，执行方式：R中是math$sqrt(20)；python中是math.sqrt(20)python执行结果R语言执行结果整体codelibrary(reticulate)py_available()#检查python是否存在os<-
在R中运行Python：使用reticulate包实现Python和R的无缝集成心之向往！ r语言 python 开发语言 R语言
在R中运行Python：使用reticulate包实现Python和R的无缝集成介绍Python和R是两种功能强大且广泛使用的数据分析和统计建模语言。有时候，在一个项目中需要同时使用这两种语言的特性和库。为了实现Python和R的无缝集成，可以使用R的reticulate包。reticulate包允许在R环境中调用Python代码、导入Python库，并且在R中使用Python对象。本文将介绍如何
R语言和Python的协同工作数据科学引擎 R语言
R语言和Python的协同工作在数据科学和统计分析领域，R语言和Python是两个非常流行的编程语言。R语言以其强大的统计分析和数据可视化功能而闻名，而Python则因其广泛的应用范围和灵活性而备受青睐。虽然R语言和Python有各自的优势，但在某些情况下，将它们结合起来可以实现更强大的数据分析和建模。在本文中，我们将探讨如何在R语言和Python之间进行协同工作，以及如何在项目中有效地使用它们。
OpenAI掀桌子！免费版ChatGPT，提供o3-mini模型！ TGITCIC AI-大模型的落地之道 chatgpt 人工智能
逆天免费用今天凌晨，OpenAI联合创始人兼首席执行官SamAltman宣布了一个大消息——免费版ChatGPT，将提供o3-mini模型！网页们纷纷不淡定了看来OpenAI，这o3-mini还没正式上线呢，就免费开放使用了。不过还是要感谢一下中国大模型界的开源英雄DeepSeek。正是R1的开源才让OpenAI有了危机感，开始放大福利了。有网友就直接问Altman怎么看待DeepSeek的R1模
最好的线段树总结 QYitong 数据结构 c语言 ACM 数据结构线段树
线段树详解By岩之痕目录：一：综述二：原理三：递归实现四：非递归原理五：非递归实现六：线段树解题模型七：扫描线八：可持久化(主席树)九：练习题一：综述假设有编号从1到n的n个点，每个点都存了一些信息，用[L,R]表示下标从L到R的这些点。线段树的用处就是，对编号连续的一些点进行修改或者统计操作，修改和统计的复杂度都是O(log2(n)).线段树的原理，就是，将[1,n]分解成若干特定的子区间(数量
手把手教学之Vim练级攻略---以思维的速度写代码(day02) *星之卡比* Vim vim 编辑器 linux
文章目录Vim---day0201Vim的模式1.普通模式（NormalMode）2.插入模式（InsertMode）①.基本插入模式命令(i和I)②.追加插入模式命令(a和A)③.换行插入命令(o和O)④.替换插入模式(R和r)⑤.从外部命令进入插入模式3.可视模式（VisualMode）①进入可视模式的三种方法1)字符选择模式：2)行选择模式：3)块选择模式（列模式）：4)可视模式和norma
质数的和与积背刺你未遗憾算法数据结构
题目介绍：两个质数的和是S，它们的积最大是多少？输入格式一个不大于10000的正整数S，为两个质数的和。输出格式一个整数，为两个质数的最大乘积。数据保证有解。输入数据150Copy输出数据1589代码示例：#include#includeusingnamespacestd;boolisprime(intx){if(x(sqrt(x));for(inti=2;i>s;for(inti=2;ir)r=
正则表达式中常见的贪婪词叩叮ING 正则表达式 java 服务器
1.*含义：匹配前面的元素零次或者多次。示例：对于正则表达式a*，在字符串"aaaa"中，它会匹配整个"aaaa"，因为它会尽可能多地匹配a字符。代码示例（Python）：importretext="aaaa"pattern=re.compile(r'a*')result=pattern.search(text)print(result.group())#输出:aaaa2.+含义：匹配前面的元素一
R语言学习笔记5-数据结构-多维数组 Colin♛ R语言 r语言学习笔记开发语言数据结构
R语言学习笔记5-数据结构-多维数组多维数组(array)介绍特点和用途创建多维数组多维数组的索引和切片多维数组的运算获取多维数组的维度和属性多维数组的合并和拆分多维数组的逻辑操作多维数组的转置和重塑多维数组的元素操作多维数组的统计函数多维数组的循环操作使用reshape2包的melt()和dcast()函数利用purrr包对多维数组进行函数应用对多维数组进行条件筛选和替换多维数组的子集选择使用d
R语言学习笔记6-数据框 Colin♛ r语言学习笔记开发语言信息可视化
R语言学习笔记6-数据框数据框(DataFrame)介绍数据框用途创建数据框从矩阵创建数据框索引和切片添加和修改列数据框的预处理数据框的排序数据框的筛选处理缺失值应用函数处理数据重塑数据框使用dplyr进行数据框的管道操作数据框的时间序列操作大数据框的处理数据框的绘图数据框的文本处理数据框的连接与关联按行或列连接数据框按键值关联数据框数据框的条件处理与逻辑操作条件筛选逻辑操作数据框的汇总与统计分析
利用MetaNeighbor验证重复性和跨物种分群木与长清单细胞空间整合工具学习 r语言数据分析矩阵
进行跨物种研究时，我们经常需要进行注释结果的比较和归类，或者同一物种不同样本之间的注释验证。R语言中有一个包就可以利用直观的热图展示这一需求。导入包和环境library(Seurat)library(ggplot2)library(MetaNeighbor)library(SingleCellExperiment)library(dplyr)导入数据这里以海豚和两个公开人的PFC脑区单细胞转录组数
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs