littlely_ll

5. 模型训练和调参（The caret package）

1. 简介(The caret package )
2. 可视化(The caret package)
3. 预处理(The caret package)
4. 数据分割（The caret package）

5. 模型训练和调参

内容：

Model Training and Parameter Tuning

An Example

Basic Parameter Tuning

Notes on Reproducibility

Customizing the Tuning Process

Pre-Processing Options

Alternate Tuning Grids

Plotting the Resampling Profile

The trainControl Function

Alternate Performance Metrics

Choosing the Final Model

Extracting Predictions and Class Probabilities

Exploring and Comparing Resampling Distributions

Within-Model

Between-Models

Fitting Models Without Parameter Tuning

5.1 Model Training and Parameter Tuning

caret包有很多函数试图精简构建模型和评估模型的过程。
train 函数能用于：
* 评估，应用抽样，模型调参的影响
* 通过参数选择最优模型
* 从训练集中评估模型表现
首先，需要选择一个具体地模型。现在，有233个可以使用；详情请看train Model List 或 train Model By Tag，在这些介绍中，有一个可被优化的参数列表。用户也可以自定义模型。
第一步就是调整模型（算法中的第一行就是选择一系列要估计的参数。例如，如果要拟合一个偏最小二乘模型，需要设定PLS估计的参数。）

一旦模型和要调整的参数值被定义，重抽样的类型也就被设定了。现在，在train中可以使用k折交叉验证（一次或重复的），留一交叉验证和自助法等抽样方法。重抽样过后，这个过程将会指导用户选择哪个参数。默认地，函数自动选择具有拥有最佳值的参数，尽管可以使用不同的算法。

5.2 An Example

mlbench包中有一个Sonar数据集，这里，我们载入数据集:

library(mlbench)
data(Sonar)
str(Sonar[, 1:10])

## 'data.frame':    208 obs. of  10 variables:
##  $ V1 : num  0.02 0.0453 0.0262 0.01 0.0762 0.0286 0.0317 0.0519 0.0223 0.0164 ...
##  $ V2 : num  0.0371 0.0523 0.0582 0.0171 0.0666 0.0453 0.0956 0.0548 0.0375 0.0173 ...
##  $ V3 : num  0.0428 0.0843 0.1099 0.0623 0.0481 ...
##  $ V4 : num  0.0207 0.0689 0.1083 0.0205 0.0394 ...
##  $ V5 : num  0.0954 0.1183 0.0974 0.0205 0.059 ...
##  $ V6 : num  0.0986 0.2583 0.228 0.0368 0.0649 ...
##  $ V7 : num  0.154 0.216 0.243 0.11 0.121 ...
##  $ V8 : num  0.16 0.348 0.377 0.128 0.247 ...
##  $ V9 : num  0.3109 0.3337 0.5598 0.0598 0.3564 ...
##  $ V10: num  0.211 0.287 0.619 0.126 0.446 ...

函数createDataPartition能创建一个分层的随机样本进入训练集和测试集：

library(caret)
set.seed(998)
inTraining <- createDataPartition(Sonar$Class, p = .75, list = FALSE)
training <- Sonar[ inTraining,]
testing  <- Sonar[-inTraining,]

我们将会使用这些数据来说明这些函数功能。

5.3 Basic Parameter Tuning

默认为，简单自助抽样用于上图算法的第3行。像重复k折交叉验证和留一法也可以使用。函数trainControl用来设动抽样类型：

fitControl <- trainControl(## 10-fold CV
                           method = "repeatedcv",
                           number = 10,
                           ## repeated ten times
                           repeats = 10)

更多关于trainControl的信息可以看下面章节。

train的前两个参数是预测变量和结果数据对象。第三个参数method设定模型类型（看train Model List 或 trian Model By Tag）。为了说明问题，我们会通过gbm包拟合一个boot tree模型。用重复交叉验证来拟合模型的基础语法为：

set.seed(825)
gbmFit1 <- train(Class ~ ., data = training, 
                 method = "gbm", 
                 trControl = fitControl,
                 ## This last option is actually one
                 ## for gbm() that passes through
                 verbose = FALSE)
gbmFit1

## Stochastic Gradient Boosting 
## 
## 157 samples
##  60 predictor
##   2 classes: 'M', 'R' 
## 
## No pre-processing
## Resampling: Cross-Validated (10 fold, repeated 10 times) 
## Summary of sample sizes: 142, 142, 140, 142, 142, 141, ... 
## Resampling results across tuning parameters:
## 
##   interaction.depth  n.trees  Accuracy   Kappa    
##   1                   50      0.7609191  0.5163703
##   1                  100      0.7934216  0.5817734
##   1                  150      0.7977230  0.5897796
##   2                   50      0.7858235  0.5667749
##   2                  100      0.8188897  0.6316548
##   2                  150      0.8194363  0.6329037
##   3                   50      0.7895686  0.5726290
##   3                  100      0.8130564  0.6195719
##   3                  150      0.8221348  0.6383441
## 
## Tuning parameter 'shrinkage' was held constant at a value of 0.1
## 
## Tuning parameter 'n.minobsinnode' was held constant at a value of 10
## Accuracy was used to select the optimal model using  the largest value.
## The final values used for the model were n.trees = 150,
##  interaction.depth = 3, shrinkage = 0.1 and n.minobsinnode = 10.

对于一个GBM模型，有三个主要的参数:
* 迭代次数，例如，树（在gbm函数中叫做n.trees）
* 树的复杂度，称作interaction.depth
* 学习率：算法适应的有多快，叫做shrinkage
* 训练样本的最小数目（n.minobsinnode）
检测模型的默认值在前两列给出（shrinkage和n.minobsinnode没有给出是因为拥有这些参数的候选模型使用同样的值）。标有accuracy的这一列是通过交叉验证计算出的准确率。准确率的标准差从交叉验证结果中计算出。Kappa这一列是通过重抽样结果计算的Cohen Kappa统计量（非加权）。train函数用于具体的模型（见train Model List 和 train Mode By Tag）。对于这些模型，train函数创建一个调整参数组。默认的，如果p是调整参数的个数，那么，参数组的大小为 3p 。做为另一个例子，正则判别分析（RDA）模型有两个参数（gamma和lambda），两个参数数值都在0和1之间。默认的训练参数组将会在二维空间中产生9种组合。
在为train函数设定模型时有一些要点。在下一节将介绍train 的额外其他功能。

5.4 Notes on Reproducibility

很多模型在参数估计阶段应用随机数，重抽样切片也使用随机数，有两种主要的方法可以控制随机子以确保结果可重复。
* 有两种方法确保在调用train函数的时候有相同的重抽样本。第一种是在调用train之前使用set.seed函数。随机数生成重抽样信息。另外的，如果你愿意使用特定的数据分割，可以使用trainControl函数的index，这将会在下面讲到。
* 当使用重抽样的模型创建后，自己自也已经创建了。在调用train函数之前设定随机子能保证使用了相同的随机数，当使用并行处理时这并不是一个问题。为了设定模型拟合随机子，trainControl需要调用另外一个参数seeds。这个参数是使用一个整数向量列表作为随机子。trainControl的帮助页面描述了这个选项的格式。

随机数怎样使用高度依赖包的作者。很少有目标模型没有控制生成随机数的，特别是在C代码中进行计算的。

5.5 Customizing the Tuning Process

有一些方法可以自定义参数选取和构建模型过程。

5.5.1 Pre-Processing Options

就像先前所提到的，train函数在模型拟合之前可以使用多种方法进行数据预处理。preProcess函数可以用来中心化和标准化，插值，空间符号变换和通过PCA或独立成分分析进行特征提取。
要怎么进行预处理，train函数有一个参数叫preProcess，这个参数会把方法传递到preProcess函数中，另外，preProcess也可以通过trainControl传递。
这些处理步骤将会应用于任何的预测过程，像predict.train, extractPrediction或extractProbs。预处理不会应用于直接使用object$finalModel这种对象的预测。
对于插值，有三种主要的实施方法：

k最近邻处理带有缺失值的样本，并能在训练集中找到k个最近的样本。这k个训练集的值作为原始数据集的替代。当计算到训练集样本的距离的时候，用于计算的预测变量要求没有缺失值。

另一种方法是使用训练集对每一个预测变量拟合一个bag树。这是一个具有正常准确率的模型，并能处理缺失值。当一个预测变量需要插值的时候，其他预测变量将会通过bag树返回值，并且通过他们预测的值作为一个新值，但模型可能有很大的计算开销。

预测变量的中位数也可以用来估计缺失值。

如果在训练集中有缺失值，PCA和ICA只用其中的完整的样本。

5.5.2 Alternate Tuning Grids

调参网格可以由用户设定。参数tuneGrid可以传入一个数据框，列包含设定的参数。列名需要和拟合模型的参数名一致。对于前面提到的RDA的例子，参数名为gamma,lambda.train函数将会对每一行的参数值进行调整模型。
对于boost树模型，我们需要固定学习率，而去调整n.trees的参数：

gbmGrid <-  expand.grid(interaction.depth = c(1, 5, 9), 
                        n.trees = (1:30)*50, 
                        shrinkage = 0.1,
                        n.minobsinnode = 20)

nrow(gbmGrid)

set.seed(825)
gbmFit2 <- train(Class ~ ., data = training, 
                 method = "gbm", 
                 trControl = fitControl, 
                 verbose = FALSE, 
                 ## Now specify the exact models 
                 ## to evaluate:
                 tuneGrid = gbmGrid)
gbmFit2

## Stochastic Gradient Boosting 
## 
## 157 samples
##  60 predictor
##   2 classes: 'M', 'R' 
## 
## No pre-processing
## Resampling: Cross-Validated (10 fold, repeated 10 times) 
## Summary of sample sizes: 142, 142, 140, 142, 142, 141, ... 
## Resampling results across tuning parameters:
## 
##   interaction.depth  n.trees  Accuracy  Kappa
##   1                    50     0.75      0.50 
##   1                   100     0.78      0.55 
##   1                   150     0.79      0.58 
##   1                   200     0.80      0.60 
##   1                   250     0.80      0.60 
##   1                   300     0.80      0.60 
##   :                   :        :         : 
##   9                  1350     0.82      0.64 
##   9                  1400     0.82      0.64 
##   9                  1450     0.82      0.64 
##   9                  1500     0.82      0.64 
## 
## Tuning parameter 'shrinkage' was held constant at a value of 0.1
## 
## Tuning parameter 'n.minobsinnode' was held constant at a value of 20
## Accuracy was used to select the optimal model using  the largest value.
## The final values used for the model were n.trees = 1000,
##  interaction.depth = 5, shrinkage = 0.1 and n.minobsinnode = 20.

如果训练集中有缺失值，PCA和ICA模型只会用完整的样本。
另一个选项是应用一个随机的参数组合，例如“随机搜索”，这个函数将在下面介绍。
要应用随机搜索，那就在调用trainControl的时候使用选项search = "random。这种情况下，tuneLength参数定义了要估计的参数组合的长度。

5.5.3 Plotting the Resampling Profile

plot函数用于检验模型性能和调参之间的关系。例如，函数的调用展示了第一次拟合的结果：

trellis.par.set(caretTheme())
plot(gbmFit2)

可以使用metric选项度量性能：

trellis.par.set(caretTheme())
plot(gbmFit2,metric = "Kappa")

其他类型的作图也可以使用。详情请看?plot.train。下面的代码展现出了结果的热力图：

trellis.par.set(caretTheme())
plot(gbmFit2, metric = "Kappa", plotType = "level",
     scales = list(x = list(rot = 90)))

也可以使用ggplot方法：

ggplot(gbmFit2)

## Warning: Ignoring unknown aesthetics: shape

也有其他作图函数展现抽样估计的更多细节。详情请看xyplot.train。
在这些图中可能需要一种不同的调参方式。要改变最终结果而不重新开始整个操作过程，update.train函数可用来重新拟合最终模型。可以看?update.train。

5.5.4 The`trainControl`Function

trainControl函数产生参数是要控制用可能的值去创建模型：

method：重抽样方法："boot","cv","LOOCV","LGOCV","repeatedcv","timeslice","none"和"oob"。最后一个出代估计（oob）只能应用于随机森林，袋装树，bagged earth,bagged flexible discriminant analysis或条件树森林模型。这并不包括GBM模型（gbm包作者指出，依照袋装树的OOB模型估计来选择调参并不是一个好主意）。对于留一法交叉验证，重抽样的性能度量并不能得到保证。

number和repeats：number控制K折交叉验证的数目或者自助法和留组交叉验证的抽样迭代次数。假设method = "repeatedcv",number = 10和repeates = 3，3个分开的10折交叉验证作为重抽样的方案。

verboseIter：输出训练日志的逻辑变量。

returnData：逻辑变量，把数据保存到称作trainingData的一个节点。

p：应用于LGOCV方法：训练比例。

对于method = "timeslice",trainControl拥有参数initialWindow,horizon和fixedWindow来控制交叉验证是怎样应用于时间序列数据的。

classProbs:逻辑变量，决定是否计算类别概率。

index和indexOut：每一次从抽样元素列表。每一个列表元素是用于迭代训练的样本行。当这些值没有设定时，train函数会产生它们。

summaryFunction：用于计算备用性能的函数。

selectionFunction：选择最佳参数的函数。

PCAthresh：ICAcomp和k：这些选项传递到preProcss函数中去。

returnResamp：包含一下值的字符串："all","final","none"。它们设定有多少抽样性能度量被保存。

allowParallel：逻辑变量，是否允许train函数使用并行处理（如果可能的话）。
还有其它选项在这没有讨论。

5.5.5 Alternate Performance Metrics

用户可以改变决定最佳设置的度量。默认的，回归使用RMSE和 R2 ，而分类使用准确率和Kappa统计量。回归和分类分别使用准确率和Kappa统计量选择参数值。train函数的metric参数允许用户选择哪种最优准则。例如，对于不平衡类的问题，用metric = "Kappa"来提高最中模型性能。
如果这些参数不理想，用户可以自定义性能度量。trainControl函数中有summaryFunction参数来设定计算性能的函数。这个函数应该有一下参数：
* data：数据框或矩阵的参考表，列包含观测值obs和预测结果pred。现在，类概率没法传递到这个函数中去。数据中是调参组合的预测值。如果trainControl函数中的classProbs参数设定为TRUE,在data中就会加入一列包含类概率的值。这些列名与类水平一样。另外，如果train函数中设定了weights，那么在数据集中就会再加一列weights的值。
* lev：是一个字符串，它有训练集中的输出因子水平。对于回归来说，NULL值会传递到这额函数。
* model：应用模型的字符串，（例如传递到train函数的参数method中去的值）。

函数的输出应该是一个没有空名的数值度量向量。默认为，train函数从预测类的及角度评估分类模型。另外，类概率也能用于性能测量。为了获得重抽样中预测的类概率，trainControl函数中的参数classProbs必须设定为TRUE。这会将概率值加入到每次抽样产生的预测中去。
在最后一节展示出，自定义函数能用于计算性能的平均得分。另一个内置函数twoClassFunction将会计算敏感度，特异性和ROC曲线下的面积。

head(twoClassSummary)

##                                                                                                                     
## 1 function (data, lev = NULL, model = NULL)                                                                         
## 2 {                                                                                                                 
## 3     lvls <- levels(data$obs)                                                                                      
## 4     if (length(lvls) > 2)                                                                                         
## 5         stop(paste("Your outcome has", length(lvls), "levels. The twoClassSummary() function isn't appropriate."))
## 6     requireNamespaceQuietStop("ModelMetrics")

为了使用这个准则重新建立boost tree模型，我们可以使用下面代码观察参数和ROC曲线下面积的关系：

fitControl <- trainControl(method = "repeatedcv",
                           number = 10,
                           repeats = 10,
                           ## Estimate class probabilities
                           classProbs = TRUE,
                           ## Evaluate performance using 
                           ## the following function
                           summaryFunction = twoClassSummary)

set.seed(825)
gbmFit3 <- train(Class ~ ., data = training, 
                 method = "gbm", 
                 trControl = fitControl, 
                 verbose = FALSE, 
                 tuneGrid = gbmGrid,
                 ## Specify which metric to optimize
                 metric = "ROC")
gbmFit3
## Stochastic Gradient Boosting 
## 
## 157 samples
##  60 predictor
##   2 classes: 'M', 'R' 
## 
## No pre-processing
## Resampling: Cross-Validated (10 fold, repeated 10 times) 
## Summary of sample sizes: 142, 142, 140, 142, 142, 141, ... 
## Resampling results across tuning parameters:
## 
##   interaction.depth  n.trees  ROC   Sens  Spec
##   1                    50     0.86  0.80  0.70
##   1                   100     0.87  0.82  0.73
##   1                   150     0.87  0.83  0.75
##   1                   200     0.87  0.84  0.76
##   1                   250     0.88  0.84  0.76
##   1                   300     0.88  0.84  0.76
##   :                   :        :     :      :    
##   9                  1350     0.89  0.87  0.76
##   9                  1400     0.89  0.87  0.77
##   9                  1450     0.89  0.87  0.77
##   9                  1500     0.89  0.87  0.77
## 
## Tuning parameter 'shrinkage' was held constant at a value of 0.1
## 
## Tuning parameter 'n.minobsinnode' was held constant at a value of 20
## ROC was used to select the optimal model using  the largest value.
## The final values used for the model were n.trees = 650,
##  interaction.depth = 5, shrinkage = 0.1 and n.minobsinnode = 20.

在这个案例中，最优参数的ROC曲线下的平均面积是0.896。

5.6 Choosing the Final Model

另一个自定义参数的过程就是修正用来选择最佳参数的算法。默认的，train函数选择具有最大性能值的模型，也可以使用其他模型的方案。Breiman等人建议简单的基于树的模型使用单个标准差规则。在这个案例中，识别了具有最佳性能值的模型，应用重抽样方法，我们能估计性能的标准误。最终的模型就是使用但标准差的最简单的模型。当基于树的模型刚开始出现过拟合，后来越来越适应模型的时候，这是有意义的。
train函数允许用户设定选取最终的的规则。参数selectionFunction用来提供能决定最终模型的函数。包中有三个函数：best选择最大或最小值，oneSE试图捕获Breiman等人的观点，tolerance选择具有一定最佳值忍耐度的最简单的模型。详情请看best。
只要拥有以下参数，用户也能自定义函数：

x是一个数据框，包括调整参数和与他们相关联的性能度量。每一行对应一个不同参数的组合。

metric字符向量，指定那个性能度量应被优化（可以直接传递到train函数）。

maximize逻辑值，表明一个性能度量的更大的值是否更好（可以直接传递到train函数）。

函数应该输出一个整数值，表明x的哪一行被选择。
作为一个例子，如果我们选择先前基于准确率的boost树模型，我们会选择：n.tree = 650,interaction.depth = 5, shrinkage = 0.1, n.minobsinnode = 20。然而，这张图中的刻度非常紧密，准确率在0.859至0.896之间。一个更简单的模型也可能有这样的准确率。
忍耐函数可以使用 (x−xbest)/xbest×100 来找出一个更简单的函数。例如，选择一个基于2%的性能损失的参数值。

whichTwoPct <- tolerance(gbmFit3$results, metric = "ROC", 
                         tol = 2, maximize = TRUE)  
cat("best model within 2 pct of best:\n")
## best model within 2 pct of best:
gbmFit3$results[whichTwoPct,1:6]
##    shrinkage interaction.depth n.minobsinnode n.trees       ROC      Sens
## 31       0.1                 5             20      50 0.8809623 0.8348611

这表明我们能得到一个更简单的模型，和具有最佳值的ROC面积0.896相比，这个模型的ROC面积为0.881.
这些函数的主要问题是怎样对模型的复杂性排序。在一些案例中，这很简单（例如简单树模型，偏最小二乘），但是在这样的模型中，模型排序是主观的。例如，一个有100次迭代，树的深度为2的boost树模型比50次迭代，深度为8的boost树更复杂吗？依据顺序，包会做出一些选择。在boost树模型案例中，包认为增加迭代次数比增加树的深度计算更快，所以，模型是先按照迭代排序然后再按照树深度排序。查看更多例子请看best。

5.7 Extracting Predictions and Class Probabilities

先前所提到的，train函数产生的对象包括finalModel里的最优模型。通过这些对象能够作出预测。在一些例子中，像pls或gbm对象，额外的参数需要设定。trian的对象应用参数优化的结果对新样本进行预测。例如，如果用predict.gbm作出预测，用户将不得不直接设定树的个数（没有默认值）。对于二分类问题，函数预测值是一种概率的形式，所以额外的步骤是要把它转化为因子向量。predict.train会自动处理这些细节。
在R中，有很少的标准语句来进行模型的预测。例如，为了获得类概率，很多predict方法会有一个参数type，用它来设定生成类概率或类别。不同的包使用不同的type值，像prob,posterior,response,probability或raw。在另外一些案例中，可能使用另外一些语句。
对于predict.train函数，type只取两个值class和prob。例如：

predict(gbmFit3, newdata = head(testing))
## [1] R R R R M M
## Levels: M R
predict(gbmFit3, newdata = head(testing), type = "prob")
##              M            R
## 1 9.799645e-04 0.9990200355
## 2 1.825908e-04 0.9998174092
## 3 5.373401e-08 0.9999999463
## 4 1.693365e-03 0.9983066351
## 5 9.999348e-01 0.0000651877
## 6 9.862454e-01 0.0137546480

5.8 Exploring and Comparing Resampling Distributions

5.8.1 Within-Model

对于一个特定的模型，有很多lattice函数探索参数调整和重抽样结果的关系：

xyplot和stripplot用于画出重抽样统计量。

hisstogram和densityplot用于查看参数调整的分布。

例如，下图创建了一个密度函数：

注意到，通过多个调整参数画出重抽样结果，如果你对这个感兴趣，那么resamples="all"应该放入控制选项中。

5.8.2 Between-Models

caret包包含一些函数，它可以通过重抽样分布把模型间的差别字符化。这些函数是基于Hothorn和Eugster等人的工作。
首先，用SVM模型拟合Sonar数据，数据通过preProc参数进行中心化和标准化。注意到随机数要先于模型设置，并且是和boost树模型使用的随机数是一样的。这保证抽到相同的样本，这对于我们比较两个模型有帮助。

set.seed(825)
svmFit <- train(Class ~ ., data = training, 
                 method = "svmRadial", 
                 trControl = fitControl, 
                 preProc = c("center", "scale"),
                 tuneLength = 8,
                 metric = "ROC")
svmFit                 
## Support Vector Machines with Radial Basis Function Kernel 
## 
## 157 samples
##  60 predictor
##   2 classes: 'M', 'R' 
## 
## Pre-processing: centered (60), scaled (60) 
## Resampling: Cross-Validated (10 fold, repeated 10 times) 
## Summary of sample sizes: 142, 142, 140, 142, 142, 141, ... 
## Resampling results across tuning parameters:
## 
##   C      ROC        Sens       Spec     
##    0.25  0.8672371  0.7413889  0.7466071
##    0.50  0.9030134  0.8326389  0.7794643
##    1.00  0.9221577  0.8700000  0.7748214
##    2.00  0.9318601  0.8902778  0.7714286
##    4.00  0.9373735  0.8881944  0.7998214
##    8.00  0.9442411  0.9061111  0.8125000
##   16.00  0.9445164  0.9173611  0.8126786
##   32.00  0.9445164  0.9123611  0.8166071
## 
## Tuning parameter 'sigma' was held constant at a value of 0.0115025
## ROC was used to select the optimal model using  the largest value.
## The final values used for the model were sigma = 0.0115025 and C = 16.

正则判别分析模型拟合数据：

set.seed(825)
rdaFit <- train(Class ~ ., data = training, 
                 method = "rda", 
                 trControl = fitControl, 
                 tuneLength = 4,
                 metric = "ROC")
rdaFit                 
## Regularized Discriminant Analysis 
## 
## 157 samples
##  60 predictor
##   2 classes: 'M', 'R' 
## 
## No pre-processing
## Resampling: Cross-Validated (10 fold, repeated 10 times) 
## Summary of sample sizes: 142, 142, 140, 142, 142, 141, ... 
## Resampling results across tuning parameters:
## 
##   gamma      lambda     ROC        Sens       Spec     
##   0.0000000  0.0000000  0.6768564  0.9244444  0.3951786
##   0.0000000  0.3333333  0.8356200  0.8441667  0.7278571
##   0.0000000  0.6666667  0.8578894  0.8248611  0.7798214
##   0.0000000  1.0000000  0.8487103  0.7754167  0.7653571
##   0.3333333  0.0000000  0.8934573  0.8688889  0.7478571
##   0.3333333  0.3333333  0.9130853  0.8987500  0.7803571
##   0.3333333  0.6666667  0.9079216  0.9109722  0.7692857
##   0.3333333  1.0000000  0.8667510  0.8304167  0.7760714
##   0.6666667  0.0000000  0.8856101  0.8704167  0.7326786
##   0.6666667  0.3333333  0.8935640  0.8920833  0.7289286
##   0.6666667  0.6666667  0.8869692  0.8833333  0.7416071
##   0.6666667  1.0000000  0.8560020  0.7868056  0.7728571
##   1.0000000  0.0000000  0.7192237  0.6590278  0.6460714
##   1.0000000  0.3333333  0.7215253  0.6591667  0.6487500
##   1.0000000  0.6666667  0.7226687  0.6615278  0.6487500
##   1.0000000  1.0000000  0.7242485  0.6661111  0.6462500
## 
## ROC was used to select the optimal model using  the largest value.
## The final values used for the model were gamma = 0.3333333 and lambda
##  = 0.3333333.

给出这些模型，我们能做出判断谁的性能比较好吗？我们首先用resamples收集重抽样结果。

resamps <- resamples(list(GBM = gbmFit3,
                          SVM = svmFit,
                          RDA = rdaFit))
resamps
## 
## Call:
## resamples.default(x = list(GBM = gbmFit3, SVM = svmFit, RDA = rdaFit))
## 
## Models: GBM, SVM, RDA 
## Number of resamples: 100 
## Performance metrics: ROC, Sens, Spec 
## Time estimates for: everything, final model fit
summary(resamps)
## 
## Call:
## summary.resamples(object = resamps)
## 
## Models: GBM, SVM, RDA 
## Number of resamples: 100 
## 
## ROC 
##       Min. 1st Qu. Median   Mean 3rd Qu. Max. NA's
## GBM 0.5179  0.8571 0.9048 0.8956  0.9479    1    0
## SVM 0.6786  0.9107 0.9557 0.9445  0.9844    1    0
## RDA 0.6032  0.8750 0.9219 0.9131  0.9643    1    0
## 
## Sens 
##      Min. 1st Qu. Median   Mean 3rd Qu. Max. NA's
## GBM 0.625  0.7778 0.8750 0.8679       1    1    0
## SVM 0.500  0.8750 0.8889 0.9174       1    1    0
## RDA 0.625  0.8750 0.8889 0.8988       1    1    0
## 
## Spec 
##       Min. 1st Qu. Median   Mean 3rd Qu. Max. NA's
## GBM 0.2857  0.7143 0.7500 0.7664  0.8571    1    0
## SVM 0.2857  0.7143 0.8571 0.8127  1.0000    1    0
## RDA 0.2857  0.7143 0.7500 0.7804  0.8571    1    0

注意到，在这个例子中，选项resamples = "final"应该由用户自定义。
有很多lattice作图方法用于重抽样分布的可视化：density plots,box-whiker plots, scatterplot matrices和scatterplots of summary statistics.例如：

trellis.par.set(theme1)
bwplot(resamps, layout = c(3, 1))

trellis.par.set(caretTheme())
dotplot(resamps, metric = "ROC")

trellis.par.set(theme1)
xyplot(resamps, what = "BlandAltman")

splom(resamps)

也可以应用像densityplot.resamples和parallel.resamples的可视化。
由于模型拟合相同的数据，所以比较模型的差异显得有意义。这样，我们减少可能存在的重抽样的相关性，计算差异，然后用t检验来检验模型是否有差异。

difValues <- diff(resamps)
difValues
## 
## Call:
## diff.resamples(x = resamps)
## 
## Models: GBM, SVM, RDA 
## Metrics: ROC, Sens, Spec 
## Number of differences: 3 
## p-value adjustment: bonferroni
summary(difValues)
## 
## Call:
## summary.diff.resamples(object = difValues)
## 
## p-value adjustment: bonferroni 
## Upper diagonal: estimates of the difference
## Lower diagonal: p-value for H0: difference = 0
## 
## ROC 
##     GBM       SVM       RDA     
## GBM           -0.04896  -0.01753
## SVM 1.168e-10            0.03143
## RDA 0.1616    3.835e-05         
## 
## Sens 
##     GBM       SVM       RDA     
## GBM           -0.04944  -0.03083
## SVM 0.0002316            0.01861
## RDA 0.1244317 0.3697745         
## 
## Spec 
##     GBM     SVM      RDA     
## GBM         -0.04625 -0.01393
## SVM 0.01577           0.03232
## RDA 1.00000 0.13861
trellis.par.set(theme1)
bwplot(difValues, layout = c(3, 1))

trellis.par.set(caretTheme())
dotplot(difValues)

5.9 Fitting Models Without Parameter Tuning

在模型参数值已知的例子中，train函数可以对整个训练集拟合模型而不用重抽样或调整参数。可以使用trainControl的method = "none".例如：

fitControl <- trainControl(method = "none", classProbs = TRUE)

set.seed(825)
gbmFit4 <- train(Class ~ ., data = training, 
                 method = "gbm", 
                 trControl = fitControl, 
                 verbose = FALSE, 
                 ## Only a single model can be passed to the
                 ## function when no resampling is used:
                 tuneGrid = data.frame(interaction.depth = 4,
                                       n.trees = 100,
                                       shrinkage = .1,
                                       n.minobsinnode = 20),
                 metric = "ROC")
gbmFit4
## Stochastic Gradient Boosting 
## 
## 157 samples
##  60 predictor
##   2 classes: 'M', 'R' 
## 
## No pre-processing
## Resampling: None

注意到plot.train,resamples,confusionMatrix.train和其他一些函数不能和这个gbmFit4对象一起使用，但是predict.train可以：

predict(gbmFit4, newdata = head(testing))
## [1] R R R R M M
## Levels: M R
predict(gbmFit4, newdata = head(testing), type = "prob")
##            M          R
## 1 0.07043641 0.92956359
## 2 0.02921858 0.97078142
## 3 0.01156062 0.98843938
## 4 0.36436834 0.63563166
## 5 0.92596513 0.07403487
## 6 0.82897570 0.17102430

你可能感兴趣的:(R语言caret包翻译,R语言caret包应用)

【日更挑战】2023-01-29比赛日NOTES 扁圆柱体
日更挑战当前排名：第651天，第649名，排名较昨日前进0名。比赛日，官网给出每场比赛的Notes（极个别场次没有），翻译如下Blues(2)vs.Avalanche(4)本场是雪崩全明星周末前的最后一场；Newhook成为雪崩/北方人队史上首位连续2个赛季在他的生日夜进球的球员；Binnington出场第200次（196次首发），蓝调队史上有200次以上出场纪录的门将，除了他之外，只有MikeL
PyTorch生成式人工智能（18）——循环神经网络详解与实现盼小辉丶 pytorch rnn 自然语言处理
PyTorch生成式人工智能（18）——循环神经网络详解与实现0.前言1.文本生成的挑战2.循环神经网络2.1文本数据2.2循环神经网络原理3.长短期记忆网络3.自然语言处理基础3.1分词3.2词嵌入3.3词嵌入在自然语言处理中的应用小结系列链接0.前言我们已经学习了如何生成数字和图像等内容。从本节开始，我们将主要聚焦于文本生成。人类语言极其复杂且充满细微差别，不仅仅涉及语法和词汇的理解，还包括上
宝妈开启副业的好处，宝妈八个正规兼职平台配音新手圈
作为一位宝妈，在享受母爱的同时，也渴望拥有自己的职业空间与成长机会，实现家庭与事业的双重平衡。开启副业，不仅能为家庭带来额外的经济支持，更是自我实现、提升自我价值的重要途径。以下，我将以有说服力的语气，阐述宝妈开启副业的多重好处，并介绍八个正规且适合宝妈的兼职平台，助您迈出精彩一步。配音新手圈是鼎音传媒公司开发的在线兼职公众号,职位包括:写手、程序开发、剪辑、设计、翻译、配音、无门槛、插画、每日更
有关Maven的个人笔记总结
Mavenpom.xml文件详解一级标签bulid(定义了项目的构建配置，包括编译、测试、打包等过程。可以指定插件和构建生命周期。)dependces（列出了项目依赖的所有外部库。每个依赖项都指定了其坐标（groupId,artifactId,version））depencymanagement（用于集中管理依赖版本，确保所有子模块使用相同的依赖版本，用于解决jar包依赖其他jar包产生的版本冲突
基于Paillier同态加密算法的金融数据安全共享机制研究【附数据】
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
深入解析Linux命令：创建目录mkdir的全面指南梦幻南瓜 linux linux 服务器运维
在Linux操作系统中，mkdir命令是创建目录的基础工具。无论是系统管理员还是普通用户，掌握mkdir的使用方法都是必不可少的。本文将详细解读mkdir命令的用法、选项及其在实际操作中的应用场景。1.mkdir命令的基本用法mkdir是“makedirectory”的缩写，用于在指定路径下创建新目录。其基本语法如下：mkdir[选项]目录名1.1创建单个目录最简单的用法是创建一个目录。例如，要在
ChatTongyi × LangChain：开启多模态AI应用创新之门
阿里云通义实验室推出的ChatTongyi（基于通义千问大模型）与LangChain框架的深度集成，为开发者打造了一套高效、灵活、全面的AI开发工具链。无论是文本对话、复杂任务自动化，还是图像理解，这一组合都为多场景智能应用的落地提供了坚实的基础。以下内容将从技术亮点到行业价值，带您系统梳理其核心能力与创新应用场景。1.极速上手：自然语言对话与流式输出核心能力：多轮对话理解：凭借强大的语言建模能力
动态分析软件：LS-DYNA_（16）.LS-DYNA在爆炸与冲击分析中的应用 kkchenjj 结构力学结构力学
LS-DYNA在爆炸与冲击分析中的应用引言爆炸与冲击分析是动态分析软件LS-DYNA中的一个重要应用领域。这些分析通常用于军事、航空航天、汽车安全和土木工程等多个行业，以评估结构在极端动态载荷下的响应。本节将详细介绍如何使用LS-DYNA进行爆炸与冲击分析，包括模型的建立、加载条件的设置、材料模型的选择以及结果的后处理。模型建立几何模型在LS-DYNA中，几何模型的建立是仿真的第一步。可以使用多种
Python标准模块--importlib
作者：zhbzz2007出处：http://www.cnblogs.com/zhbzz2007欢迎转载，也请保留这段声明。谢谢！1模块简介Python提供了importlib包作为标准库的一部分。目的就是提供Python中import语句的实现（以及__import__函数）。另外，importlib允许程序员创建他们自定义的对象，可用于引入过程（也称为importer）。什么是imp？另外有一个
LLM应用开发中的敏捷文档管理 AI天才研究院计算 Agentic AI 实战 AI人工智能与大数据 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
文章标题：LLM应用开发中的敏捷文档管理关键词：LLM应用开发敏捷文档管理敏捷开发方法文档生命周期管理敏捷文档工具摘要：本文旨在探讨在LLM（大型语言模型）应用开发过程中，敏捷文档管理的重要性及其具体实践方法。文章首先介绍了LLM应用开发的背景和敏捷文档管理的必要性，接着深入讲解了敏捷文档管理的核心概念和原理。随后，文章探讨了敏捷文档管理工具的选择与应用，以及如何在LLM应用开发中实施敏捷文档管理
掌握 RAG：使用 Langchain 和 Ollama 创建本地智能应用程序知世不是芝士 langchain 人工智能 ai大模型大语言模型 ollama 本地部署大模型大模型技术
引言随着大型语言模型（LLMs）的兴起，我们见证了一种新的工具类别的诞生。然而，LLMs也存在局限性，尤其是当面对需要最新信息或专有数据的商业用例时。本文将介绍如何通过微调和RAG来解决这些问题。LLMs的局限性传统LLMs训练成本高昂，且只能访问公共信息。对于商业用途，需要模型能够提供基于内部知识的最新回应。文章介绍了两种解决这一问题的方法：微调和RAG。微调微调是针对特定数据集进一步训练预训练
第十只猫咪一瓶白宝
已是黄昏时分，偌大的菜市场里，只剩寥寥无几的几个人正在挑选东西，看样子是附近公司忙了一天刚下班的白领们。卖菜的大爷大妈们也开始各自收拾自己的摊位，准备结束这忙碌且辛苦的一天。“毛毛啊，你也快收拾摊子回家吧。现在天气渐渐冷了，小姑娘要注意保暖。十几岁的年纪，做点生意也不容易，赶明儿我给你拿件旧衣服，你也给你篮子外面包一包，别冻着里面的小猫了，冻坏了你可卖不出去了。”菜市场的角落里，一位大婶一边手脚麻
基于深度学习的手写数字和符号识别系统：YOLOv5/v6/v7/v8/v10模型实现与UI界面集成 YOLO实战营深度学习 YOLO ui 人工智能目标检测计算机视觉
1.引言随着人工智能和深度学习技术的发展，手写数字和符号识别已经成为计算机视觉领域的重要研究方向。手写识别在很多实际应用中扮演着关键角色，例如邮政编码识别、表单自动处理和智能教育系统等。传统的手写识别方法通常依赖于复杂的特征工程，而深度学习则能够自动从数据中学习到特征，极大地提高了识别精度和速度。本文将介绍如何构建一个基于YOLO系列模型（YOLOv5、YOLOv6、YOLOv7、YOLOv8、Y
python量化实战_Python与量化投资从基础到实战.pdf weixin_39841709 python量化实战
作者：王小川出版发行:北京：电子工业出版社,2018.03ISBN号：978-7-121-33857-1页数：408原书定价:99.00开本:16开主题词:软件工具-程序设计-应用-投资中图法分类号:F830.59-39(经济->财政、金融->金融、银行->金融、银行理论)内容提要:本书主要讲解如何利用Python进行量化投资，包括对数据的获取、整理、分析挖掘、信号构建、策略构建、回测、策略分析等
Web安全之CSP weixin_30649641 web安全开发工具网络
内容安全策略(Content-Security-Policy,简称CSP)概念：内容安全策略(CSP)是一种web应用技术用于帮助缓解大部分类型的内容注入攻击，包括XSS攻击和数据注入等，这些攻击可实现数据窃取、网站破坏和作为恶意软件分发版本等行为。该策略可让网站管理员指定客户端允许加载的各类可信任资源。浏览器支持：统计来源：caniuse.com/contentsecuritypolicy&Mo
？？？实现高可用的故障转移策略的工具——Keepalived（含数据库的主从复制、MHA高可用简单配置） Lotus 沈棋 Linux运维_架构运维架构 keepalived
文章目录一、高可用与keepalived介绍1、什么是高可用2、实现高可用的技术1).负载均衡器2).故障转移工具3).数据库高可用性4).存储高可用性5).监控与报警工具6).云服务高可用性3、Keepalived介绍0-1）Keepalived是什么、功能介绍：Keepalived的功能*注：Nginx和LVS在负载均衡上使用的区别：实际应用场景*注：具体如何使用Keepalived和LVS进
Lua _G表和 _ENV表
定义在所有函数外部的变量我们可以称之为全局变量(GlobalVariable)，它的作用域默认是整个程序。但Lua作为一种嵌入式语言，代码段(chunk)都是由宿主应用调用的，它自身都不知道会被嵌入到哪个应用程序中。为了解决这个问题，它并没有使用全局变量，而是通过table对全局变量进行模拟。我们可以认为Lua语言把所有的全局变量保存在一个称为全局环境(GlobalEnvironment)的普通表
Prometheus+node_exporter+grafana监控部署(上）努力爬的小菜鸟 Linux prometheus grafana linux
目录一、部署Prometheus二、部署node_exporter三、把node_exporter加载进Prometheus四、部署grafana一、部署Prometheus1、从官网下载好Prometheus的安装包2、解压tarxfprometheus-2.41.0.linux-amd64.tar.gz3、做个软链方便更新ln-svprometheus-2.41.0.linux-amd64pr
2024年，或成近10年申请香港身份的最佳时机，中产趁机拿个身份教育福利多优才DIY申请
2023年香港人才清单新增至51项，从事jin融、建筑、科创等行业人才，可以申请优才，大大放宽了香港身份的申请难度。2024年，或成为近10余年申请香港身份的最佳时机。⬇️材料包+交流群+文书润色+续签指导⬇️看文末图片如果你申请香港身份，关图片⬆️拿模板⬆️不要从香港身份给子女教育带来的升学优势，很多中产家庭的家长深刻意识到，与其拼命卷娃，不如抓住一切机会，为孩子提供更好的教育资源，换一个轻松的
沈阳10家正规亲子鉴定中心地址一览(附2024年8月鉴定地址汇总）国医基因吴主任
在沈阳什么地方可以做亲子鉴定呢？沈阳市和平区南京北街155号的国医基因可以做亲子鉴定。在沈阳做一次亲子鉴定要花费多少钱？大概是要花费2000-4500元左右。在沈阳亲子鉴定是一种现代科技手段，为家庭关系提供了明确的答案。在复杂的社会关系中，它不仅帮助确认血缘关系，更在法律、医学和心理层面发挥着重要作用。本文将深入探讨亲子鉴定的科学原理、操作流程及其在现实生活中的应用和影响。沈阳亲子鉴定正规咨询机构
渗透测试视角：Web 应用常见漏洞的利用与防御策略
Web应用已成为企业业务的核心载体，但SQL注入、XSS、文件上传漏洞等安全问题频发。从渗透测试视角分析漏洞的利用原理，才能制定更有效的防御策略。本文将结合实战案例，解析Web应用常见漏洞的利用方式与防御方法。一、SQL注入漏洞：数据库的“隐形后门”SQL注入是最常见的Web漏洞之一，攻击者通过在参数中插入SQL语句，操控数据库获取数据或执行命令。漏洞原理与利用场景当Web应用未对用户输入进行过滤
筑牢网络安全防线：DDoS/CC 攻击全链路防护技术解析白山云北诗网络安全行业知识 web安全 ddos 安全高防cdn cc防护
当服务器带宽突然飙升至满负荷，业务系统瞬间瘫痪；当应用服务器CPU占用率持续99%，legitimate用户无法正常访问——这些场景背后，往往是DDoS或CC攻击的冲击。据2024年全球网络安全报告显示，DDoS攻击平均持续时间达4.5小时，单次攻击给企业造成的直接损失超80万元，而CC攻击因隐蔽性强，识别难度更高，已成为应用层威胁的主要来源。构建全链路防护体系，是企业抵御这类攻击的核心保障。一、
记录一个Android Studio v7包爆红的问题 Kyle_Xiong
在开发过程中，突然v7包的class全部爆红，但是可以运行，Clean、Rebuild、重启AndroidStudio及电脑、InvalidateCaches/Restart均不能够解决问题，特此在此处记录问题解决办法解决办法：File->CloseProject->重新打开项目->SycnProject这样红色的报错就没有了产生这个错误是因为androidstudio的一个bug产生的，在此记录
内容安全策略（CSP）详解：Web安全的关键防线 KP_0x01 web安全 web安全安全
目录一、CSP基础概念与核心价值1.1CSP的核心优势1.2主要防护目标二、CSP策略配置详解2.1基本指令集2.2典型配置方案三、高级防护技术与实践3.1非ce替代方案3.2哈希与nonce应用3.3常见配置错误与修正一、CSP基础概念与核心价值内容安全策略（ContentSecurityPolicy）是一种通过HTTP头或元素定义的安全标准，用于精确控制网页可以加载哪些外部资源，从根本上减少X
Python 应用无监督学习（一）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/6b15c463e64a9f03f0d968a77b424918译者：飞龙协议：CCBY-NC-SA4.0前言关于本节简要介绍了作者、本书的内容覆盖范围、开始时你需要的技术技能，以及完成所有活动和练习所需的硬件和软件要求。本书简介无监督学习是一种在没有标签数据的情况下非常有用且实用的解决方案。Python应用无监督学习引导你使用无监督学习技术与Py
周总结5.29-6.3 Sandra_n vue vue.js 数据结构
1.混入应用的是样式？【场景】2.es6/优化==继续看3.树组件操作：数据扁平化/模糊检索{也是把数据结构改了一下复制的ant官网}/默认展开收起{中途有问题比如不默认展开：判断数据删除某一节点展开等}/只呈现查询内容适合调接口{中途研究了一下树id和内容映射[人员树专业树]数据处理}4.置空下拉框v-model设为undefined就提示placeholder了也可以在某项想要的操作后设置初始
精选推荐：返利APP排行榜前十，优惠力度大比拼优惠券高省
省钱达人必备！返利APP排行榜前十深度推荐在这个物价飞涨的时代里如何成为一名真正的省钱达人？答案或许就藏在返利APP排行榜前十之中。这些应用不仅汇聚了海量的优惠信息和返利政策更通过智能推荐和个性化服务为用户打造了一个专属的省钱购物平台。今天我们就来为大家深度推荐这些优秀的返利APP带你一起探索省钱购物的奥秘让你在享受购物乐趣的同时也能轻松实现省钱目标。大家好，我是高省的波西导师。在开始本文的交流之
Python包高级开发技术：性能优化与系统集成软考和人工智能学堂 Python开发经验深度学习强化学习 python 性能优化开发语言
引言掌握Python包的高级开发技术是构建工业级应用的关键。本文将深入探讨Python包的性能优化策略、C扩展开发、异步IO集成以及跨语言互操作等高级主题，帮助你将Python包提升到专业水平。1.性能优化技术1.1性能分析工具链#性能分析工具矩阵perf_tools={'cProfile':'标准库分析器，提供函数级耗时统计','line_profiler':'行级分析器，需要@profile装
PHP面向对象进阶：抽象类、接口与类型声明软考和人工智能学堂 PHP和MySQL php程序设计 android 前端
引言在PHP面向对象编程中，抽象类、接口和类型声明是构建可扩展、可维护应用程序的重要工具。本文将深入探讨这些概念，展示它们如何帮助开发者创建更健壮的代码结构。抽象类（AbstractClasses）抽象类是不能被实例化的类，它定义了子类必须实现的方法模板。基本抽象类示例abstractclassAnimal{protected$name;publicfunction__construct($nam
2023-03-21呼建荣，中原焦点团队，网络中级第33期，坚持分享525天。呼建荣
阅读书籍《社会工作综合能力》第四章社会工作理论的应用。第六节人本主义和存在主义理论在社会工作中的应用。一、人本主义理论。1.人本主义理论的主要观点。人本主义相信人的理性，认为具有理性的人可以自主的选择行动，人本观点是即是人本取向社会工作的逻辑出发点，也是社会工作专业的重要价值基础。人本主义原则是温暖、尊重和接纳，诚实和真诚，同理。①真诚友谊，②积极聆听，③准确同理。2.人本主义理论在社会工作中的应
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found