小麦粒

数据集划分train_test_split\交叉验证Cross-validation

文章目录

一、交叉验证介绍

1.1 简单交叉验证 train_test_split
1.2 K折交叉验证 K-Folder Cross Validation

1.2.1 k-折交叉验证步骤

1.3 留一交叉验证 Leave-one-out Cross Validation
1.4 自助法 Bootstrapping
1.5 分层交叉验证 StratifiedKFold
1.6 留P交叉验证 LeavePOut
1.7 分组交叉验 GroupKFold

1.7.1 LeavePOut 和 ShuffleSplit 区别

1.8 时间序列分割 TimeSeriesSplit

二、train_test_split()

2.1 使用形式为
2.2 参数解释
2.3 计算交叉验证的指标

三、代码整合
有趣的事，Python永远不会缺席
培训说明

一、交叉验证介绍

交叉验证是在机器学习建立模型和验证模型参数时常用的办法。交叉验证，顾名思义，就是重复的使用数据，把得到的样本数据进行切分，组合为不同的训练集和测试集，用训练集来训练模型，用测试集来评估模型预测的好坏。在此基础上可以得到多组不同的训练集和测试集，某次训练集中的某样本在下次可能成为测试集中的样本，即所谓“交叉”。

那么什么时候才需要交叉验证呢？交叉验证用在数据不是很充足的时候。比如在我日常项目里面，对于普通适中问题，如果数据样本量小于一万条，我们就会采用交叉验证来训练优化选择模型。如果样本大于一万条的话，我们一般随机的把数据分成三份，一份为训练集（Training Set），一份为验证集（Validation Set），最后一份为测试集（Test Set）。用训练集来训练模型，用验证集来评估模型预测的好坏和选择模型及其对应的参数。把最终得到的模型再用于测试集，最终决定使用哪个模型以及对应参数。

1.1 简单交叉验证 train_test_split

第一种是简单交叉验证，所谓的简单，是和其他交叉验证方法相对而言的。首先，我们随机的将样本数据分为两部分（比如： 70%的训练集，30%的测试集），然后用训练集来训练模型，在测试集上验证模型及参数。接着，我们再把样本打乱，重新选择训练集和测试集，继续训练数据和检验模型。最后我们选择损失函数评估最优的模型和参数。

原始数据分成训练集、验证集和测试集，并且保持数据分布的一致性，可以使用shuffle
好处：处理简单，只需随机把原始数据分为两组即可
缺点：只进行了一次划分，数据结果具有偶然性，没有达到交叉的思想，由于是随机的将原始数据分组，所以最后验证集分类准确率的高低与原始数据的分组有很大的关系，得到的结果并不具有说服性。

from sklearn.model_selection import train_test_split
'''
(1)random_state不填或者为0时，每次都不同；其余值表示不同随机数
(2)shuffle表示是否在分割之前对数据进行洗牌（默认True）
'''
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.30,random_state=42,shuffle=True)

1.2 K折交叉验证 K-Folder Cross Validation

第二种是K折交叉验证（K-Folder Cross Validation）。和第一种方法不同，K折交叉验证会把样本数据随机的分成K份（一般是均分），每次随机的选择K-1份作为训练集，剩下的1份做测试集。当这一轮完成后，重新随机选择K-1份来训练数据。若干轮（小于K）之后，选择损失函数评估最优的模型和参数。
将每个子集数据分别做一次验证集，其余的K-1组子集数据作为训练集，这样会得到K个模型，用这K个模型最终的验证集的分类准确率的平均数作为此K-CV下分类器的性能指标。K一般大于等于2，实际操作时一般从3开始取，只有在原始数据集合数据量小的时候才会尝试取2。

应用最多，K-CV可以有效的避免过拟合与欠拟合的发生，最后得到的结果也比较具有说服性。

1.2.1 k-折交叉验证步骤

第一步，不重复抽样将原始数据随机分为 k 份。
第二步，每一次挑选其中 1 份作为测试集，剩余 k-1 份作为训练集用于模型训练。
第三步，重复第二步 k 次，这样每个子集都有一次机会作为测试集，其余机会作为训练集。
在每个训练集上训练后得到一个模型，
用这个模型在相应的测试集上测试，计算并保存模型的评估指标，
第四步，计算 k 组测试结果的平均值作为模型精度的估计，并作为当前 k 折交叉验证下模型的性能指标。

例如:

十折交叉验证

将数据集分成十份，轮流将其中9份作为训练数据，1份作为测试数据，进行试验。每次试验都会得出相应的正确率。
10次的结果的正确率的平均值作为对算法精度的估计，一般还需要进行多次10折交叉验证（例如10次10折交叉验证），再求其均值，作为对算法准确性的估计
模型训练过程的所有步骤，包括模型选择，特征选择等都是在单个折叠 fold 中独立执行的。
此外：
多次 k 折交叉验证再求均值，例如：10 次10 折交叉验证，以求更精确一点。
数据量大时，k设置小一些 / 数据量小时，k设置大一些。

优点：降低由一次随机划分带来的偶然性，提高其泛化能力，提高对数据的使用效率。
缺点：可能存在一种情况：数据集有5类，抽取出来的也正好是按照类别划分的5类，也就是说第一折全是0类，第二折全是1类，等等；这样的结果就会导致，模型训练时。没有学习到测试集中数据的特点，从而导致模型得分很低，甚至为0，

from sklearn.model_selection import KFold
kf = KFold(n_splits=2)
for train_index, test_index in kf.split(X):
    print('X_train:%s ' % X[train_index])
    print('X_test: %s ' % X[test_index])

1.3 留一交叉验证 Leave-one-out Cross Validation

第三种是留一交叉验证（Leave-one-out Cross Validation）LOO-CV，在数据缺乏的情况下使用，如果设原始数据有N个样本，那么LOO-CV就是N-CV，即每个样本单独作为验证集，其余的N-1个样本作为训练集，故LOO-CV会得到N个模型，用这N个模型最终的验证集的分类准确率的平均数作为此下LOO-CV分类器的性能指标。

通过反复的交叉验证，用损失函数来度量得到的模型的好坏，最终我们可以得到一个较好的模型。那这三种情况，到底我们应该选择哪一种方法呢？一句话总结，如果我们只是对数据做一个初步的模型建立，不是要做深入分析的话，简单交叉验证就可以了。否则就用S折交叉验证。在样本量少的时候，使用S折交叉验证的特例留一交叉验证。

即K = 样本数
优点：不存在数据分布不一致,每一回合中几乎所有的样本皆用于训练模型，因此最接近原始样本的分布，这样评估所得的结果比较可靠。实验过程中没有随机因素会影响实验数据，确保实验过程是可以被复制的。
缺点：耗时,计算成本高，需要建立的模型数量与原始数据样本数量相同。当数据集较大时几乎不能使用。

from sklearn.model_selection import LeaveOneOut
loo = LeaveOneOut()
for train_index, test_index in loo.split(X):
    print('X_train:%s ' % X[train_index])
    print('X_test: %s ' % X[test_index])

1.4 自助法 Bootstrapping

此外还有一种比较特殊的交叉验证方式，也是用于样本量少的时候。叫做自助法(bootstrapping)。比如我们有m个样本（m较小），每次在这m个样本中随机采集一个样本，放入训练集，采样完后把样本放回。这样重复采集m次，我们得到m个样本组成的训练集。当然，这m个样本中很有可能有重复的样本数据。同时，用没有被采样到的样本做测试集。这样接着进行交叉验证。由于我们的训练集有重复数据，这会改变数据的分布，因而训练结果会有估计偏差，因此，此种方法不是很常用，除非数据量真的很少，比如小于20个。

优点：

在数据集较小、难以划分时很有用
能从D中产生不同的S，对集成学习等方法有好处

缺点：

产生的S改变了D的分布，会引入估计偏差

import numpy as np
import pandas as pd
import random
data = pd.DataFrame(np.random.rand(10,4),columns=list('ABCD'))
data['y'] = [random.choice([0,1]) for i in range(10)]
train = data.sample(frac=1.0,replace=True) # 有放回随机采样
test = data.loc[data.index.difference(train.index)].copy() # 将未采样的样本作为测试集

1.5 分层交叉验证 StratifiedKFold

通过指定分组，对测试集进行无放回抽样。
对非平衡数据可以用分层采样，就是在每一份子集中都保持和原始数据集相同的类别比例。StratifiedKFold() 各个类别的比例大致和完整数据集中相同，若数据集有4个类别，比例是2:3:3:2，则划分后的样本比例约是2:3:3:2，StratifiedShuffleSplit() 划分中每个类的比例和完整数据集中的相同,若数据集有4个类别，比例是2:3:3:2，则划分后的样本比例也是2:3:3:2。
ShuffleSplit允许更精细地控制迭代数和训练集/检验集的样本比例。

# ==================分层K折交叉验证、分层随机交叉验证===================
# 如何解决样本不平衡问题
skf = StratifiedKFold(n_splits=3)
#各个类别的比例大致和完整数据集中相同，若数据集有4个类别，比例是2:3:3：2，则划分后的样本比例约是2:3:3：2
for train, test in skf.split(iris.data, iris.target):
    print("分层K折划分：%s %s" % (train.shape, test.shape))
    # break
'''
分层K折划分：(99,) (51,)
分层K折划分：(99,) (51,)
分层K折划分：(102,) (48,)
'''
skf = StratifiedShuffleSplit(n_splits=3)
# 划分中每个类的比例和完整数据集中的相同,若数据集有4个类别，比例是2:3:3：2，则划分后的样本比例也是2:3:3：2
for train, test in skf.split(iris.data, iris.target):
    print("分层随机划分：%s %s" % (train.shape, test.shape))
    # break
'''
分层随机划分：(135,) (15,)
分层随机划分：(135,) (15,)
分层随机划分：(135,) (15,)
'''

1.6 留P交叉验证 LeavePOut

LeavePOut与LeaveOneOut类似，它从完整的数据集里删除 p 个样本，产生所有可能的训练集和检验集。对于 n个样本，能产生m个训练-检验对: $C^n_p$

# ===========K折交叉验证、留一交叉验证、留p交叉验证、随机排列交叉验证===========
# k折划分子集
kf = KFold(n_splits=2)
for train, test in kf.split(iris.data):
    print("k折划分：%s %s" % (train.shape, test.shape))#k折划分：(75,) (75,)
    break

# 留一划分子集
loo = LeaveOneOut()
for train, test in loo.split(iris.data):
    print("留一划分：%s %s" % (train.shape, test.shape))#留一划分：(149,) (1,)
    break

# 留p划分子集,LeaveOneOut(n) 相当于 KFold(n, n_folds=n) 相当于LeavePOut(n, p=1)。
# 它从完整的数据集里挑选 p个样本，产生所有可能的训练集和检验集。对于 n 个样本，能产生(Cpn) 个训练-检验对。
# https://blog.csdn.net/wong2016/article/details/81407927

lpo = LeavePOut(p=2)
for train, test in lpo.split(iris.data):
    print("留p划分：%s %s" % (train.shape, test.shape))
    #留p划分：(148,) (2,)，排列组合算法Cp n = 150*149/2个模型11175
    break


# 随机排列划分子集
ss = ShuffleSplit(n_splits=3, test_size=0.25,random_state=0)
for train_index, test_index in ss.split(iris.data):
    print("随机排列划分：%s %s" % (train_index.shape, test_index.shape))
    # 随机排列划分：(112,) (38,)，n_splits是模型个数
    break

1.7 分组交叉验 GroupKFold

如何进一步测试模型的泛化能力？ 留出一组特定的不属于测试集和训练集的数据。有时我们想知道在一组特定的 groups 上训练的模型是否能很好地适用于看不见的 group 。为了衡量这一点，我们需要确保验证对象中的所有样本来自配对训练折叠中完全没有表示的组。

GroupKFold 是 k-fold 的变体，它确保同一个 group 在测试和训练集中都不被表示。例如，如果数据是从不同的 subjects 获得的，每个 subject 有多个样本，并且如果模型足够灵活以高度人物指定的特征中学习，则可能无法推广到新的 subject 。 GroupKFold 可以检测到这种过拟合的情况。
GroupKFold和StratifiedKFold 比较像，不过测试集是按照一定分组进行打乱的，即先分堆，然后把这些堆打乱，每个堆里的顺序还是固定不变的。

LeaveOneGroupOut 是一个交叉验证方案，它根据第三方提供的 array of integer groups （整数组的数组）来提供样本。这个组信息可以用来编码任意域特定的预定义交叉验证折叠。每个训练集都是由除特定组别以外的所有样本构成的。
这个是在GroupKFold 上的基础上混乱度又减小了，按照给定的分组方式将测试集分割下来。

LeavePGroupsOut 类似于 LeaveOneGroupOut ，但为每个训练/测试集删除与 P 组有关的样本。跟上面那个一样，只是一个是单组，一个是多组。

GroupShuffleSplit 迭代器是 ShuffleSplit 和 LeavePGroupsOut 的组合，它生成一个随机划分分区的序列，其中为每个分组提供了一个组子集。这个是有放回抽样。

# ==================================组 k-fold交叉验证、留一组交叉验证、留 P 组交叉验证、Group Shuffle Split==========================================
X = [0.1, 0.2, 2.2, 2.4, 2.3, 4.55, 5.8, 8.8, 9, 10]
y = ["a", "b", "b", "b", "c", "c", "c", "d", "d", "d"]
groups = [1, 1, 1, 2, 2, 2, 3, 3, 3, 3]
# 泛化能力，训练集和测试的样本不重合，但是各自内部可以重合
# k折分组
gkf = GroupKFold(n_splits=3)
# 训练集和测试集属于不同的组，同一组的样本不可能同时出现在同一折的测试集和训练集中。
for train, test in gkf.split(X, y, groups=groups):
    print("组 k-fold分割：%s %s" % (train, test))
'''
组 k-fold分割：[0 1 2 3 4 5] [6 7 8 9]
组 k-fold分割：[0 1 2 6 7 8 9] [3 4 5]
组 k-fold分割：[3 4 5 6 7 8 9] [0 1 2]
'''
# 留一分组
logo = LeaveOneGroupOut()
for train, test in logo.split(X, y, groups=groups):
    print("留一组分割：%s %s" % (train, test))
'''
留一组分割：[3 4 5 6 7 8 9] [0 1 2]
留一组分割：[0 1 2 6 7 8 9] [3 4 5]
留一组分割：[0 1 2 3 4 5] [6 7 8 9]
'''
# 留p分组
lpgo = LeavePGroupsOut(n_groups=2)
for train, test in lpgo.split(X, y, groups=groups):
    print("留 P 组分割：%s %s" % (train, test))
'''三个模型，三个类别C23=3
留 P 组分割：[6 7 8 9] [0 1 2 3 4 5]
留 P 组分割：[3 4 5] [0 1 2 6 7 8 9]
留 P 组分割：[0 1 2] [3 4 5 6 7 8 9]
'''
# 随机分组
gss = GroupShuffleSplit(n_splits=4, test_size=0.5, random_state=0)
for train, test in gss.split(X, y, groups=groups):
    print("随机分割：%s %s" % (train, test))

1.7.1 LeavePOut 和 ShuffleSplit 区别

LeavePOut 是使得数据集经过数次分割后，所有的测试集出现的元素的集合即是完整的数据集，即无放回的抽样，
ShuffleSplit 则是有放回的抽样，只能说经过一个足够大的抽样次数后，保证测试集出现了完成的数据集的倍数。

1.8 时间序列分割 TimeSeriesSplit

TimeSeriesSplit 是 k-fold 的一个变体，它首先返回 k 折作为训练数据集，并且 (k+1) 折作为测试数据集。请注意，与标准的交叉验证方法不同，连续的训练集是超越前者的超集。另外，它将所有的剩余数据添加到第一个训练分区，它总是用来训练模型。

这个类可以用来交叉验证以固定时间间隔观察到的时间序列数据样本。

针对时间序列的处理，防止未来数据的使用，分割时是将数据进行从前到后切割（这个说法其实不太恰当，因为切割是延续性的。。）

# ==================================时间序列分割==========================================
#是 k-fold 的一个变体，K折就是讲数据集切分成K小块，验证集和测试集相互形成补集它首先返，每次分割中不会有重叠。相当于无放回抽样。
# 而TimeSeriesSplit中，是又放回的
# 即K组数据，前一组的训练集+测试集，是后一组的训练集，，第K+1作为测试集，组成K个模型
# 请注意，与标准的交叉验证方法不同，连续的训练集是超越前者的超集。 另外，它将所有的剩余数据添加到第一个训练分区，它总是用来训练模型。
# 这个类可以用来交叉验证以固定时间间隔观察到的时间序列数据样本。

tscv = TimeSeriesSplit(n_splits=3)
TimeSeriesSplit(max_train_size=None, n_splits=3)
for train, test in tscv.split(iris.data):
    print("时间序列分割：%s %s" % (train.shape, test.shape))
    print(test)
'''三个模型
时间序列分割(39,) (37,)：
[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38] 
 [39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62
 63 64 65 66 67 68 69 70 71 72 73 74 75]
时间序列分割(76,) (37,)：
[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47
 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71
 72 73 74 75] 
 [ 76  77  78  79  80  81  82  83  84  85  86  87  88  89  90  91  92  93
  94  95  96  97  98  99 100 101 102 103 104 105 106 107 108 109 110 111
 112]
时间序列分割(113,) (37,)：
[  0   1   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16  17
  18  19  20  21  22  23  24  25  26  27  28  29  30  31  32  33  34  35
  36  37  38  39  40  41  42  43  44  45  46  47  48  49  50  51  52  53
  54  55  56  57  58  59  60  61  62  63  64  65  66  67  68  69  70  71
  72  73  74  75  76  77  78  79  80  81  82  83  84  85  86  87  88  89
  90  91  92  93  94  95  96  97  98  99 100 101 102 103 104 105 106 107
 108 109 110 111 112] 
 [113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130
 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148
 149]

'''

二、train_test_split()

2.1 使用形式为

train_test_split是交叉验证中常用的函数，功能是从样本中随机的按比例选取train data和test

from sklearn.model_selection import train_test_split 
X_train, X_test, y_train, y_test = train_test_split(train_data,train_target,test_size=0.2, random_state=0)

2.2 参数解释

train_data：样本特征集
train_target：样本的标签集
test_size：样本占比，测试集占数据集的比重，如果是整数的话就是样本的数量
random_state：是随机数的种子。在同一份数据集上，相同的种子产生相同的结果，不同的种子产生不同的划分结果

注
X_train,y_train:构成了训练集

X_test,y_test：构成了测试集

2.3 计算交叉验证的指标

使用交叉验证最简单的方法是在估计器和数据集上调用 cross_val_score 辅助函数。

三、代码整合

# coding = utf-8
# 2019/8/1  Luckyxxt：有趣的事，Python永远不会缺席！
''
from sklearn.model_selection import train_test_split,cross_val_score,cross_validate # 交叉验证所需的函数
from sklearn.model_selection import KFold,LeaveOneOut,LeavePOut,ShuffleSplit # 交叉验证所需的子集划分方法
from sklearn.model_selection import StratifiedKFold,StratifiedShuffleSplit # 分层分割
from sklearn.model_selection import GroupKFold,LeaveOneGroupOut,LeavePGroupsOut,GroupShuffleSplit # 分组分割
from sklearn.model_selection import TimeSeriesSplit # 时间序列分割
from sklearn import datasets  # 自带数据集
from sklearn import svm  # SVM算法
from sklearn import preprocessing  # 预处理模块
from sklearn.metrics import recall_score  # 模型度量

iris = datasets.load_iris()  # 加载数据集
print('样本集大小：',iris.data.shape,iris.target.shape)

# =====================数据集划分,训练模型======================
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.4, random_state=0)
# 交叉验证划分训练集和测试集.test_size为测试集所占的比例
print('训练集大小：',X_train.shape,y_train.shape)  # 训练集样本大小
print('测试集大小：',X_test.shape,y_test.shape)  # 测试集样本大小
clf = svm.SVC(kernel='linear', C=1).fit(X_train, y_train) # 使用训练集训练模型
print('准确率：%.3f'%(clf.score(X_test, y_test)))  # 计算测试集的度量值（准确率）准确率：0.967
print('未归一化',X_train[1:3])
'''
未归一化 [[4.8 3.1 1.6 0.2]
 [5.8 2.7 5.1 1.9]]
'''
#  如果涉及到归一化，则在测试集上也要使用训练集模型提取的归一化函数。
scaler = preprocessing.StandardScaler().fit(X_train)
print('scaler',scaler)
# scaler StandardScaler(copy=True, with_mean=True, with_std=True)
# 通过训练集获得归一化函数模型。（也就是先减几，再除以几的函数）。在训练集和测试集上都使用这个归一化函数
X_train_transformed = scaler.transform(X_train)
print('归一化',X_train_transformed[1:3])
'''
归一化 [[-1.17402201  0.00522823 -1.10334891 -1.19530695]
 [-0.04394735 -0.93585257  0.77939706  0.9337031 ]]
'''
clf = svm.SVC(kernel='linear', C=1).fit(X_train_transformed, y_train) # 使用训练集训练模型
X_test_transformed = scaler.transform(X_test)
print('归一化后score%.3f'%(clf.score(X_test_transformed, y_test)))  # 计算测试集的度量值（准确度），归一化后score0.933


# ========================直接调用交叉验证评估模型=================
clf = svm.SVC(kernel='linear', C=1)
scores = cross_val_score(clf, iris.data, iris.target, cv=5)  #交叉验证cv为迭代次数。
print('迭代5次的scores',scores)  # 打印输出每次迭代的度量值（准确度）
# [0.96666667 1.         0.96666667 0.96666667 1.        ]
print("Accuracy: %0.2f (+/- %0.2f)" % (scores.mean(), scores.std() * 2))
# 获取置信区间。（也就是均值和方差），std()计算标准偏差Accuracy: 0.98 (+/- 0.03)

# =======================多种度量结果===================
scoring = ['precision_macro', 'recall_macro'] #不懂
# precision_macro为精度，recall_macro为召回率
# sklearn.metrics.SCORERS.keys()
scores = cross_validate(clf, iris.data, iris.target, scoring=scoring,cv=5, return_train_score=True)
sorted(scores.keys())
print('测试结果：',scores)  # scores类型为字典。包含训练得分，拟合次数， score-times （得分次数）


# =================K折交叉验证、留一交叉验证、留p交叉验证、随机排列交叉验证====================
# k折划分子集
kf = KFold(n_splits=2)
for train, test in kf.split(iris.data):
    print("k折划分：%s %s" % (train.shape, test.shape))#k折划分：(75,) (75,)
    break

# 留一划分子集
loo = LeaveOneOut()
for train, test in loo.split(iris.data):
    print("留一划分：%s %s" % (train.shape, test.shape))#留一划分：(149,) (1,)
    break

# 留p划分子集,LeaveOneOut(n) 相当于 KFold(n, n_folds=n) 相当于LeavePOut(n, p=1)。
# 它从完整的数据集里挑选 p个样本，产生所有可能的训练集和检验集。对于 n 个样本，能产生(Cpn) 个训练-检验对。
# https://blog.csdn.net/wong2016/article/details/81407927

lpo = LeavePOut(p=2)
for train, test in lpo.split(iris.data):
    print("留p划分：%s %s" % (train.shape, test.shape))
    #留p划分：(148,) (2,)，排列组合算法Cp n = 150*149/2个模型11175
    break


# 随机排列划分子集
ss = ShuffleSplit(n_splits=3, test_size=0.25,random_state=0)
for train_index, test_index in ss.split(iris.data):
    print("随机排列划分：%s %s" % (train_index.shape, test_index.shape))
    # 随机排列划分：(112,) (38,)，n_splits是模型个数
    break

# ======================分层K折交叉验证、分层随机交叉验证========================
# 如何解决样本不平衡问题
skf = StratifiedKFold(n_splits=3)
#各个类别的比例大致和完整数据集中相同，若数据集有4个类别，比例是2:3:3：2，则划分后的样本比例约是2:3:3：2
for train, test in skf.split(iris.data, iris.target):
    print("分层K折划分：%s %s" % (train.shape, test.shape))
    # break
'''
分层K折划分：(99,) (51,)
分层K折划分：(99,) (51,)
分层K折划分：(102,) (48,)
'''
skf = StratifiedShuffleSplit(n_splits=3)
# 划分中每个类的比例和完整数据集中的相同,若数据集有4个类别，比例是2:3:3：2，则划分后的样本比例也是2:3:3：2
for train, test in skf.split(iris.data, iris.target):
    print("分层随机划分：%s %s" % (train.shape, test.shape))
    # break
'''
分层随机划分：(135,) (15,)
分层随机划分：(135,) (15,)
分层随机划分：(135,) (15,)
'''

# ==================================组 k-fold交叉验证、留一组交叉验证、留 P 组交叉验证、Group Shuffle Split==========================================
X = [0.1, 0.2, 2.2, 2.4, 2.3, 4.55, 5.8, 8.8, 9, 10]
y = ["a", "b", "b", "b", "c", "c", "c", "d", "d", "d"]
groups = [1, 1, 1, 2, 2, 2, 3, 3, 3, 3]
# 泛化能力，训练集和测试的样本不重合，但是各自内部可以重合
# k折分组
gkf = GroupKFold(n_splits=3)
# 训练集和测试集属于不同的组，同一组的样本不可能同时出现在同一折的测试集和训练集中。
for train, test in gkf.split(X, y, groups=groups):
    print("组 k-fold分割：%s %s" % (train, test))
'''
组 k-fold分割：[0 1 2 3 4 5] [6 7 8 9]
组 k-fold分割：[0 1 2 6 7 8 9] [3 4 5]
组 k-fold分割：[3 4 5 6 7 8 9] [0 1 2]
'''
# 留一分组
logo = LeaveOneGroupOut()
for train, test in logo.split(X, y, groups=groups):
    print("留一组分割：%s %s" % (train, test))
'''
留一组分割：[3 4 5 6 7 8 9] [0 1 2]
留一组分割：[0 1 2 6 7 8 9] [3 4 5]
留一组分割：[0 1 2 3 4 5] [6 7 8 9]
'''
# 留p分组
lpgo = LeavePGroupsOut(n_groups=2)
for train, test in lpgo.split(X, y, groups=groups):
    print("留 P 组分割：%s %s" % (train, test))
'''三个模型，三个类别C23=3
留 P 组分割：[6 7 8 9] [0 1 2 3 4 5]
留 P 组分割：[3 4 5] [0 1 2 6 7 8 9]
留 P 组分割：[0 1 2] [3 4 5 6 7 8 9]
'''
# 随机分组
gss = GroupShuffleSplit(n_splits=4, test_size=0.5, random_state=0)
for train, test in gss.split(X, y, groups=groups):
    print("随机分割：%s %s" % (train, test))


# ===========================时间序列分割=====================

tscv = TimeSeriesSplit(n_splits=3)
TimeSeriesSplit(max_train_size=None, n_splits=3)
for train, test in tscv.split(iris.data):
    print("时间序列分割：%s %s" % (train.shape, test.shape))
    print(test)

'''

有趣的事，Python永远不会缺席

欢迎关注小婷儿的博客

文章内容来源于小婷儿的学习笔记，部分整理自网络，若有侵权或不当之处还请谅解

如需转发，请注明出处：小婷儿的博客python https://www.cnblogs.com/xxtalhr/

博客园 https://www.cnblogs.com/xxtalhr/

CSDN https://blog.csdn.net/u010986753

有问题请在博客下留言或加作者：
     微信：tinghai87605025 联系我加微信群
     QQ ：87605025
     python QQ交流群：py_data 483766429

培训说明

OCP培训说明连接 https://mp.weixin.qq.com/s/2cymJ4xiBPtTaHu16HkiuA

OCM培训说明连接 https://mp.weixin.qq.com/s/7-R6Cz8RcJKduVv6YlAxJA

小婷儿的python正在成长中，其中还有很多不足之处，随着学习和工作的深入，会对以往的博客内容逐步改进和完善哒。重要的事多说几遍。。。。。。

你可能感兴趣的:(model_selection)

大模型训练时的内存泄漏与显存不足 ReadyShowShow 机器学习 stable diffusion
内存泄漏位置位置1FaceDetection不可重复创建FaceDetection，该位置是内存泄漏的大头mediapipe.solutions.face_detection.FaceDetection(model_selection=1,min_detection_confidence=0.5)位置2tensorboardX不可重复创建tensorboardX.SummaryWriterSumm
数据竞赛 faa00f53be81
主要的步骤：1、下载数据，详情见竞赛网址：2、加载并读取数据，主要用pandas：3划分数据集：主要的方法用两种：1设定比率，shuffle之后，直接取数，2，用sklearntraninsplit;用sklearn：重新导入新的包，model_selection简单有效，也可以自己手写实现。
ImportError: cannot import name cross_validation【问题解决】 TiAN-GL 遇到问题解决问题。python
原代码：原因：cross_validation是老版本sklearn中的模块，但是在新版本中，将其迁移到了sklearn.model_selection。解决方法：如下图所示，将cross_validation改为model_selection即可。问题解决。
Python cannot import name ‘cross_validation‘ from ‘sklearn‘ 解决方法一只名叫Me的猫 sklearn 人工智能 python
看书学习的时候碰到这个报错，发现是cross_validation被合并进了model_selection，所以应该改为fromsklearnimportmodel_selection
解决ModuleNotFoundError: No module named ‘sklearn.cross_validation‘ 万吼吼 python
问题描述在sklearn练习中,遇到了如下问题问题解决sklearn中已经废弃cross_validation,将其中的内容整合到model_selection中，将sklearn.cross_validation替换为sklearn.model_selection
解决ModuleNotFoundError: No module named 'sklearn.cross_validation' 来自宇宙岛的海龟 Bug
在sklearn0.18及以上的版本中，sklearn已经废弃cross_validation，将其中的内容整合到model_selection中，将sklearn.cross_validation替换为sklearn.model_selection即可fromsklearn.model_selectionimportKFold
【机器学习】报错之DataConversionWarning 大太阳花花公主 Python 机器学习
今天在做随机森林和决策树在交叉验证下的效果对比时出现了如下报错：E:\anaconda\lib\site-packages\sklearn\model_selection\_validation.py:593:DataConversionWarning:Acolumn-vectorywaspassedwhena1darraywasexpected.Pleasechangetheshapeofyto
python3运行随机森林代码时出现：DataConversionWarning RuaiTA 机器学习
当我敲完随机森林的代码然后运行时出现如下balabala一堆东西：D:\anaconda\envs\anaconda3\lib\site-packages\sklearn\model_selection\_validation.py:515:DataConversionWarning:Acolumn-vectorywaspassedwhena1darraywasexpected.Pleasecha
Python机器学习：train_test_split()划分数据集紫昂张 Python机器学习 python 开发语言
调用sklearn里面的model_selection包的train_test_split()函数可以一行代码划分好数据集。包名：fromsklearn.model_selectionimporttrain_test_split代码：x=data.drop(['Exited'],axis=1)y=data['Exited']X_train,X_test,y_train,y_test=train_t
from sklearn import cross_validation 报错的解决方法波尔德笔记学习生活 sklearn 机器学习人工智能
将：fromsklearnimportcross_validation换为：fromsklearnimportmodel_selection是的，没有看错，cross_validation换成model_selection
【scikit-learn】【RandomForest】【GridSearchCV】二分类应用实例及【ROC】曲线绘制 lixiaowang_327 机器学习数据挖掘 scikit-learn roc RandomForest GridSearchCV
全文参考1：http://scikit-learn.org/stable/auto_examples/model_selection/grid_search_digits.html#parameter-estimation-using-grid-search-with-cross-validation全文参考2：http://scikit-learn.org/stable/modules/mode
标题TypeError: ‘KFold’ object is not iterable错误 wdm-student KFlod探索 python
标题TypeError:‘KFold’objectisnotiterable错误KFold用于分层采样，k折交叉切分。cross_validation的库被取消后，KFold的函数被放在了model_selection的库函数中。而库更新后，不能按照原本的传入三个参数，原版KFold(list，n_splits=kflod,shuffle=True)修改f=KFold(n_splits=kflod
机器学习中 from sklearn.cross_validation import train_test_split出错 SageFlower python
机器学习中fromsklearn.cross_validationimporttrain_test_split出错解决方法：fromsklearn.model_selectionimporttrain_test_split原因：cross_validation里面的函数都放在model_selection里面了
Sklearn学习笔记3 model_selection模块 edwinhaha 机器学习机器学习
3Modelselectionandevaluation1sklearn.model_selection:ModelSelection1.1SplitterClasses（分组）1.2SplitterFunctions（拆分训练集与测试集）1.3Hyper-parameteroptimizers（超参数优化）1.4Modelvalidation（模型验证）1.5验证曲线：绘制分数来评价模型2Eva
Python数据分析之使用scikit-learn构建模型
一、使用sklearn转换器处理sklearn提供了model_selection模型选择模块、preprocessing数据预处理模块、decompisition特征分解模块，通过这三个模块能够实现数据的预处理和模型构建前的数据标准化、二值化、数据集的分割、交叉验证和PCA降维处理等工作。1.加载datasets中的数据集sklearn库的datasets模块集成了部分数据分析的经典数据集，可以
使用Python进行机器学习训练与测试遇到的问题汇总 PeterChen_ 人工智能 python 机器学习深度学习经验分享
问题及解决办法问题1：使用Anaconda3做Python机器学习入门实例预测波斯顿房价的回归训练时，引入模型训练模块（model_selection）报错。解决办法先打开AnacondaPrompt查看scikit-learn的版本：输入命令：condalist可以看到Anaconda3默认的scikit-learn版本是0.17.1：此版本没有包含model_selection模块，需要进行升
对在运动的刘耕宏进行抠图（含单帧与视频的分割算法应用) 游客26024 语义分割 Semantic Segmentation 算法计算机视觉语义分割 MediaPipe 人工智能
使用MediaPipe1.单帧图像代码讲解（1）#导包importcv2importmediapipeasmpimportmatplotlib.pyplotaspltif__name__=='__main__':#导入分割模块seg=mp.solutions.selfie_segmentation.SelfieSegmentation(model_selection=0)#readimgBGRto
No module named 'sklearn.cross_validation'的解决方法 Giyn 【Problems】【sklearn】机器学习
在机器学习问题中，为了将原始数据集分为训练集和测试集，通常使用sklearn.cross_validation里的train_test_split模块用来分割数据。但使用时遇到了这样的情况：因为在sklearn0.18及以上的版本中，cross_validation包已经被废弃。解决方法：把cross_validation改为model_selection即可：改为：
ModuleNotFoundError: No module named ‘sklearn.cross_validation‘ _yummy_ 错误集合 python 机器学习
ModuleNotFoundError:Nomodulenamed‘sklearn.cross_validation’报错的主要原因是：cross_validation这个包在就不再使用了，划分到了model_selection这个包中。因此修改为：fromsklearn.model_selectionimporttrain_test_split
ModuleNotFoundError: No module named ‘sklearn.cross_validation‘解决办法全洛 Python sklearn python 机器学习
在Python机器学习中，会用到使用scikit-learn中的train_test_split函数，把数据集切分为训练集和测试集。fromsklearn.cross_validationimporttrain_test_split用后发现会报错ModuleNotFoundError问题原因：这个cross_validatio这个包早就不在使用了，划分到了model_selection这个包中。解
解决 ModuleNotFoundError: No module named ‘sklearn.cross_validation‘ SeRenity24_C python sklearn 机器学习
解决ModuleNotFoundError:Nomodulenamed'sklearn.cross_validation'当执行下列代码报错时：fromsklearn.cross_validationimporttrain_test_split原因是cross_validation这个包已不再使用，划分到了model_selection这个包中。使用下列代码即可解决。fromsklearn.mod
ModuleNotFoundError: No module named ‘sklearn.cross_validation‘解决方法 caroline_richboom python python 机器学习人工智能
今天在使用python写程序时用到sklearn.cross_validation库，发生如下报错：ModuleNotFoundError:Nomodulenamed‘sklearn.cross_validation’后查阅资料多次尝试发现：cross_validation里面的函数现在都放在model_selection里面了。将sklearn.cross_validation换为model_s
出现 No module named ‘sklearn.cross_validation’ 错误上课不要摸鱼江 bug python 机器学习
原因：sklearn中已经废弃cross_validation,将其中的内容整合到model_selection操作：cross_validation改成model_selection，比如将fromsklearn.cross_validationimportKFoldfromsklearn.cross_validationimportcross_val_score改为fromsklearn.mo
sklearn模块导入ModuleNotFoundError: No module named sklearn.cross_validation错误解决方案 bigcindy python库报错解决方案机器学习
在运行sklearn老版本代码时，如：fromsklearn.cross_validationimporttrain_test_splitfromsklearn.cross_validationimportKFold,cross_val_score运行如上代码时会报错：造成上述报错的原因是新版本中相应的模块发生了变化，解决方法是：将cross_validation改成model_selection
Top15：报错解决：NameError: name ‘model_selection‘ is not defined Carl_blog 日常bug python bug 人工智能
Top15：报错解决：NameError:name'model_selection'isnotdefined原因解决办法：正常运行系统：Windows10环境：python=3.6.5pyfm=2016.2.10前言在参考《python金融风大数据风控建模实战：基于机器学习》这本书的第13章时，需要用到PyFM下载地址是LFD镜像网站：https://www.lfd.uci.edu/~gohlke
【Python 数据分析打怪升级之路 day01】sklearn进行数据预处理数据: 加载、划分、转换、降维夜斗小神社数据挖掘与机器学习 python 算法机器学习数据分析
数据分析打怪升级进度：day01一：使用sklearn转换处理数据1：model_selection模型选择模块2：preprocessing数据预处理模块3：decompisition特征分解模块三大模块功能：解决数据预处理、PCA降维工作、交叉验证等功能(一)：加载datasets模块中的数据集1:datasets模块（数据预处理、建模、数据集加载函数）a:load_boston（波士顿房价）
anaconda升级sklearn版本的实现方法
调用sklearn的model_selection时，发现sklearn中没有model_selection的模块。经过检查，发现anaconda中的sklearn版本太低，为0.17版本。于是，开始了sklearn的升级之旅。1.查看原有版本首先使用condalist命令，查看一下现有的版本：果不其然，版本是0.17.1，版本太低，果断开始升级。2.升级到最新版本使用condaupdatesci
sklearn机器学习包常用函数（连载）食堂一盏灯 sklearn 机器学习人工智能数据分析
做机器学习案例时，每个案例都会用到sklearn中不同的函数，导包时真的很头大！！！到底用哪个？为什么有的是model_selection?有的是feature_selection?有的是feature_extraction?有的是processing?本文就是为了解决自己的这个问题而写。（挖了好大一个坑欸）第一部分：收集整理函数名（完成）第二部分：每个函数的作用（择日填坑✌）第三部分：每个函数的
成功解决model_selection\_search.py:584: DeprecationWarning: "fit_params" as a constructor argument was d 一个处女座的程序猿 Computer knowledge
成功解决model_selection\_search.py:584:DeprecationWarning:"fit_params"asaconstructorargumentwasd目录解决问题解决思路解决方法解决问题model_selection\_search.py:584:DeprecationWarning:"fit_params"asaconstructorargumentwasdep
sklearn.cross_validation新版本中的替代方法 McGregorWwww 机器学习深度学习
问题描述：在sklearn0.18及以上的版本中，出现了sklearn.cross_validation无法导入的情况，原因是新版本中此包被废弃解决方法：只需将cross_validation改为model_selection即可，如下：包中的函数仍可继续使用。
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs