weixin_39677870

5折交叉验证_机器学习理论大会战——模型交叉验证

1 模型评估简述

作为一个监督型学习算法，我们对它所训练出来的学习模型通常都会做一个模型评估与参数寻优工作，以评价所训练出来的学习模型的优劣程度。同时，有效的参数寻优能够为当前构建的学习模型提供最佳的参数取值组合，从而提升模型的预测效率。

对于非监督学习算法，我们前面就曾介绍过，很难对它们开展一个定量的评估工作，因为它们并不清楚最终要学习到的知识是什么，进而也就缺乏评价的基础。最实际的评估办法就是人工评估，比如“专家组”的参考意见等。

在监督型学习算法训练中，我们经常要把一个数据集划分为训练集和测试集，所使用的函数也是我们已经多次打交道的train_test_split()函数。有关这个函数本身的介绍，我们这里不再啰嗦。只简单说说这个函数对开展模型训练有些什么影响。

train_test_split()函数，对数据集的划分是随机的，通常默认情况下，我们会利用该函数把数据划分为两份：75%的数据集作为训练集，剩余25%作为测试集用。但这种划分方式有时也会显得比较失败，原因就在于这种“随机”划分，我们无法控制，不知道最终被随机划分出来的训练集和测试集会是一种怎样的数据分布。可能有时能得到比较幸运的划分结果：所有难以分类的样例都在训练集中。在这种情况下，测试集将仅包含“容易分类的”样例，并且测试集精度会高得不切实际。相反，如果我们“不够幸运”，则可能随机地将所有难以分类的样例都放在测试集中，因此得到一个不切实际的低分数。

在这种情况下，我们就需要考虑其他更加有效的数据集划分方式。这就是我们这里要介绍所谓的“交叉验证”以及“k折交叉验证”等技术的原因所在。

而我们的模型评估，在分类问题上，通常是用模型的score()函数来得出整体的评估值；在回归问题上，则是用R²值来作为模型的评估指标。这点我们在此前的学习算法介绍中不止一次提到过。这里我们不再提。

现在我们来提另一种评估模型的方法——k折交叉验证。所谓的折就是等份的意思，一折就是一等份。k折就是说把数据集等分成k等份。因此，每一等份就叫做一折。k折交叉验证的意思就是，我们先利用第1折作为测试集，剩余的2到k折作为训练集，来训练出一个测试模型，得出该模型的预测精度值；然后我们利用第2折作为测试集，其余部分作为训练集，来训练出一个学习模型，得出该模型的预测精度；以此类推，直到我们选用第k折作为测试集，第1折到第k-1折为训练集，以此来训练出一个学习模型，并得出它的预测精度值。

这样我们就获得了k个学习模型，也得到了k个预测精度值，然后取其平均值就是k折交叉验证下的最终预测精度值，也可以作为模型的最终预测精度值来看待。

这是最基础的k折交叉验证。在Scikit-learn库中，实现基础k折交叉验证的函数由：cross_val_score()来实现，默认情况下的折数为3折。可以通过参数cv的设置来改变折数。

此外，我们还有其他的k折交叉验证机制，是源自于对基础k折交叉验证机制的改变，比如：

1、分层k折交叉验证机制，Scikit-learn库中的实现函数为：KFold()、StratifiedKFold()。

这种分层k折交叉验证机制，通常用于什么场合呢？我们看一个实际的例子：

假设我们现在获得的数据大致分为5类，且不凑巧的是，这批数据刚好分布得还挺有规律：前五分之一为1类，下一个五分之一为2类，...,最后一个五分之一为5类。如果我们选用基础的cross_val_score()来帮我们做5折交叉验证机制，也就是cv=5，那么我们会发现：第1折只有类别1，第2折只有类别2，第3折只有类别3，第4折只有类别4，第5折只有类别5。因此再做5折交叉验证机制时，我们就会很难受，因为当我们选用第1折作为测试集，其余为训练集时，发现训练过程中缺少了对第1类数据的学习，从而在测试集上展开预测时就会得到0的预测精度值(毕竟没学习过嘛)。以此类推，不论是哪一折作为测试集，所得到的预测精度值一定都是0。

这说明，基础的k折交叉验证机制就失效了，需要我们改变一下思路。打乱这批数据，并采用分层k折交叉验证机制：在分层交叉验证中，我们划分数据，使每个折中类别之间的比例与整个数据集中的比例相同。

使用分层k折交叉验证而不是k折交叉验证来评估一个分类器，这通常是一个好主意，因为它可以对泛化性能做出更可靠的估计。在只有10%的样本属于类别B的情况下，如果使用标准k折交叉验证，很可能某个折中只包含类别A的样本。利用这个折作为测试集的话，无法给出分类器整体性能的信息。

对于回归问题，scikit-learn默认使用标准k折交叉验证。也可以尝试让每个折表示回归目标的不同取值，但这并不是一种常用的策略，也会让大多数用户感到意外。

2、留一法验证机制，Scikit-learn库中的实现函数为：LeaveOneOut()。

你可以将留一法交叉验证看作是每折只包含单个样本的k折交叉验证。对于每次划分，你选择单个数据点作为测试集。这种方法可能非常耗时，特别是对于大型数据集来说，但在小型数据集上有时可以给出更好的估计结果。

3、打乱划分交叉验证机制，Scikit-learn库中的实现函数为：ShuffleSplit()。

在打乱划分交叉验证中，每次划分为训练集取样train_size个点，为测试集取样test_size个(不相交的)点。将这一划分方法重复n_iter次。这里的train_size、test_size、n_iter均为ShuffleSplit()函数中的参数，分别表示训练集数据占比，测试集数据占比、打乱数据集并分割数据集的次数。

打乱划分交叉验证可以在训练集和测试集大小之外独立控制迭代次数，这有时是很有帮助的。它还允许在每次迭代中仅使用部分数据，这可以通过设置train_size与test_size之和不等于1来实现。用这种方法对数据进行二次采样可能对大型数据上的试验很有用。ShuffleSplit还有一种分层的形式，其名称为StratifiedShuffleSplit，它可以为分类任务提供更可靠的结果。

4、分组交叉验证，在Scikit-learn库中的实现函数为：GroupKFold()，使用groups组数为参数。

假如我们有这样一批数据，每个类别的数据可能出现多个。如果这时我们采用分层交叉验证机制来度量分类器的性能，那么同一个类别的数据就有可能在训练集与测试集上都出现。此时我们会发现在测试集上预测一个数据的类别会更加轻松，但如果换成一个新的数据，则有可能就没那么预测准确。因此，在这种情况下，我们需要确保训练集与测试包含不同类别的数据。这点与分层k折交叉验证机制有所不同，注意不要搞混淆了。

实现分组交叉验证机制时，最重要的是需要指定这些数据所属的组别，也就是设置好groups。在小批量的数据集上做分组交叉验证机制实现，是相对容易的，因为数据量较小，设置groups来比较容易；可如果数据集规模很大，则此时来设置每个数据样本的group就显得困难得多了。这点需要加以注意。

最后，scikit-learn中还有很多交叉验证的划分策略，适用于更多的使用场景。但标准的KFold、StratifiedKFold和GroupKFold是目前最常用的几种。

下面我们就一一来体验下不同的交叉验证机制下对度量分类器的表现有何不同。

2 交叉验证机制实践

在讨论这些交叉验证机制的实践示例之前，有必要明确一点的是：

不论是分层交叉验证机制、留一法验证机制、打乱划分交叉验证机制还是分组交叉验证机制，其实都是在创建一个“交叉验证分离器”对象。我们在cross_val_score()中有一个cv参数，它可以设置具体的折数。但同时还可以作为一个接纳交叉验证分离器的载体。

因此，我们在常用到的机器学习算法的交叉验证机制方法中，通常都是以cross_val_score()函数为载体，以某个具体的交叉验证机制方法所创造的交叉验证分离器为载体赋予给cv参数，从而实现在当前的交叉验证机制下的分类器性能度量。

比如我们采用分层交叉验证机制，那么就应该按照如下的套路来展开分类器性能度量：

from sklearn.model_selection import KFold

kfold = KFold(n_splits=3, shuffle=True, random_state=0)

print("Cross-validation scores:\n{}".format(

cross_val_score(logreg, iris.data, iris.target, cv=kfold)))

或者：

from sklearn.model_selection import StratifiedKFold

skf = StratifiedKFold(n_splits=5)

print("Cross-validation scores:\n{}".format(

cross_val_score(logreg, iris.data, iris.target, cv=skf)))

具备这个基础，我们接下来看两个具体的实践示例。

1、汇总基础k折交叉验证机制、分层k折交叉验证机制、留一法验证机制、打乱划分交叉验证机制的实践示例：

from sklearn.model_selection import cross_val_score

from sklearn.datasets import load_iris

from sklearn.linear_model import LogisticRegression

from sklearn.model_selection import KFold

from sklearn.model_selection import LeaveOneOut

from sklearn.model_selection import StratifiedKFold

from sklearn.model_selection import ShuffleSplit

iris = load_iris()

print("鸢尾花类别:\n{}".format(iris.target))

clf_LR = LogisticRegression()

scores = cross_val_score(clf_LR, iris.data, iris.target)

print("基础k折交叉验证机制的预测精度值: {}".format(scores))

scores = cross_val_score(clf_LR, iris.data, iris.target, cv=5)

print("基础k折交叉验证机制的平均预测精度值e: {:.2f}".format(scores.mean()))

#不打乱数据集，但对数据集划分为5折时的分层交叉验证机制

kf = KFold(n_splits=5)

scores = cross_val_score(clf_LR, iris.data, iris.target, cv=kf)

print("5折的KFold交叉验证机制的预测精度值:{:.2f}".format(scores.mean()))

#打乱数据集后再来开展分层交叉验证机制

kf_3 = KFold(n_splits=3, shuffle=True, random_state=0)

scores = cross_val_score(clf_LR, iris.data, iris.target, cv=kf_3)

print("3折且打乱数据的KFold交叉验证机制的预测精度值:{:.2f}".format(scores.mean()))

#采用StratifiedKFold来开展分层k折交叉验证机制

skf = StratifiedKFold(n_splits=5)

scores = cross_val_score(clf_LR, iris.data, iris.target, cv=skf)

print("5折的StratifiedKFold交叉验证机制的预测精度值:{:.2f}".format(scores.mean()))

#留一法验证机制的表现

loo = LeaveOneOut()

scores = cross_val_score(clf_LR, iris.data, iris.target, cv=loo)

print("留一法验证机制下的平均预测精度值: {:.2f}".format(scores.mean()))

#打乱划分交叉验证机制的表现：

shuffle_split = ShuffleSplit(test_size=.5, train_size=.5, n_splits=10)

scores = cross_val_score(clf_LR, iris.data, iris.target, cv=shuffle_split)

print("打乱划分交叉验证机制的预测精度值:{:.2f}".format(scores.mean()))

其运行结果如下：

鸢尾花类别:

[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2

2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2

2 2]

基础k折交叉验证机制的预测精度值: [0.96078431 0.92156863 0.95833333]

基础k折交叉验证机制的平均预测精度值e: 0.96

5折的KFold交叉验证机制的预测精度值:0.75

3折且打乱数据的KFold交叉验证机制的预测精度值:0.94

5折的StratifiedKFold交叉验证机制的预测精度值:0.96

留一法验证机制下的平均预测精度值: 0.95

打乱划分交叉验证机制的预测精度值:0.92

大家可以从这个运行结果上看出点啥规律吗？比如我们是否可以在鸢尾花数据集上直接就用3折的分层交叉验证机制？另外，不同的交叉验证机制，在同一批数据集上，开展基于同一个学习算法的模型训练，所度量的模型性能的分值也是不一样的，这一点为我们今后实际开展机器学习模型的交叉验证提供了一个很好的参考。

2、我们再看一下有关分组交叉验证机制的一个简单实例：

from sklearn.model_selection import GroupKFold

from sklearn.datasets import make_blobs

from sklearn.model_selection import cross_val_score

from sklearn.linear_model import LogisticRegression

clf_LR = LogisticRegression()

# 创建模拟数据集

X, y = make_blobs(n_samples=12, random_state=0)

# 假设前3个样本属于同一组，接下来的4个属于同一组，以此类推

groups = [0, 0, 0, 1, 1, 1, 1, 2, 2, 3, 3, 3]

scores = cross_val_score(clf_LR, X, y, groups, cv=GroupKFold(n_splits=3))

print("分组交叉验证机制的预测精度值:\n{}".format(scores))

其运行结果如下：

分组交叉验证机制的预测精度值:

[0.75 0.8 0.66666667]

3 总结

这一节主要为大家展示了几种常见的交叉验证机制，它们在度量分类器的表现中通常都会起到不错的效果。

虽然介绍的交叉验证机制比较多，但通常我们只需要重点关注一下最常用到的几种即可：KFold、StratifiedKFold和GroupKFold以及最基础的那个cross_val_score验证机制。

OK，本节的知识就为大家分享到这里，谢谢大家。下一节我们将继续分享有关模型的参数寻优方法知识。

大麦云电脑，大麦云电脑的优势
随着5G技术的快速发展和广泛应用，云电脑迎来了前所未有的发展机遇。5G的高速率、低时延特性，为云电脑的流畅运行提供了更加稳定和快速的网络支持，使得云电脑在高清视频播放、大型游戏运行、实时在线办公等方面的用户体验得到了极大的提升，云电脑有望在未来成为人们数字生活的主流选择之一。今天小编将带大麦云电脑的优势。大麦云电脑的优势包括：1.高性能计算资源：大麦云电脑提供云端的高性能计算能力，允许用户在几乎任
销售易CRM 2024年市场表现分析及2025年展望程序员算法机器学习
在2024年，腾讯旗下销售易CRM作为国内领先的企业级SaaS服务提供商，在多个维度都取得了显著进展。让我们从几个关键方面来分析其表现并展望2025年的发展方向。产品创新与技术升级2024年，销售易在AI赋能方面投入大量资源，推出了智能销售助手功能，通过AI技术辅助销售团队进行客户画像分析、商机预测等工作。其私有化部署方案得到进一步优化，满足了更多大型企业的数据安全需求。移动端应用的用户体验也获得
数据结构与算法：动态规划dp：理论基础和相关力扣题（509.斐波那契数列、70.爬楼梯、62. 不同路径、63.不同路径Ⅱ、343.整数拆分） shanshandeisu 数据结构与算法 LeetCode 动态规划 leetcode 算法 dp 力扣数据结构
1.0.理论基础动态规划主要解决的问题种类有：背包问题打家劫舍股票问题子序列问题解决步骤：dp数组及其下标的意义递推公式dp数组初始化遍历顺序打印dp数组2.0.相关力扣题509.斐波那契数列classSolution:deffib(self,n:int)->int:ifn==0:return0ifn==1:return1dp=[0]*35dp[1]=1foriinrange(2,31):dp[i
程序员这辈子| 还有5天到2025年，说点掏心窝的话~ 前端后端程序员
1.不要追求完美，专注于成长作为一名程序员，初入职场时总想着把每一行代码都写得完美无缺，生怕出错。其实，真正重要的是不断地学习和成长。不要担心犯错，那是成长的必经之路。每一个Bug都是你前进的一步。#这是一个模拟简单的Bug修复过程的代码defdivide(a,b):try:returna/bexceptZeroDivisionError:print("Error:Divisionbyzerois
【云原生技术】k8s是不是不能处理0.1core的CUP配置，必须配置成100mi？阿寻寻云原生 kubernetes 容器
CPU的资源请求和限制特定的表示方式CPU配置的单位配置要求示例在Kubernetes中，CPU的资源请求和限制确实有特定的表示方式。关于你提到的0.1core和100m这两个值，以下是详细的解释：CPU配置的单位KubernetesCPU单位：Kubernetes使用milliCPU（毫核）作为CPU的计量单位。1核CPU=1000milliCPU(m)。例如，0.1核实际上表示为100m（10
【云原生技术】K8S更新策略有哪些方式，每种方式的可选必填字段有哪些，详细举例说明阿寻寻云原生 kubernetes 容器
更新策略有哪些方式一、更新策略详细举例1.**RollingUpdate（滚动更新）**说明：必填字段：可选字段：示例：2.**Recreate（重建）**说明：必填字段：可选字段：示例：3.**OnDelete（手动更新）**说明：必填字段：可选字段：示例：总结详细示例小结二、Recreate不可选minReadySeconds吗？Recreate更新策略与minReadySeconds示例总结
【软件测试】- 常用的10种测试环境、测试方法、测试工具简介阿寻寻软件测试大厂软件测试面试题测试工具
常用测试环境1.本地开发环境（LocalDevelopmentEnvironment/LDE）2.单元测试环境（UnitTestingEnvironment/UTE）3.集成测试环境（IntegrationTestingEnvironment/ITE）4.系统测试环境（SystemTestingEnvironment/STE）5.用户验收测试（UAT）环境（UserAcceptanceTestin
【软件开发/设计】需求文档模板阿寻寻软件开发/设计团队开发
需求文档模板一、需求文档模板1.文档信息2.项目概述3.范围定义4.需求详情4.1功能需求4.2非功能需求4.3用户界面和用户体验4.4数据管理4.5业务规则和逻辑5.项目里程碑和交付物6.假设和依赖7.风险评估8.附录9.审核和批准二、需求文档编写人员1、业务分析师2、产品经理3、项目经理4、跨职能团队协作5、总结创建一个高质量的需求文档对于确保项目成功至关重要。以下是一个需求文档的模板，可以帮
如何判断一个字符串是否是SM4加密梦魇星虹 Java 记录算法 java 开发语言
如何判断一个字符串是否是SM4加密1、在已知SM4密钥的情况下假设已知SM4密钥为：c1bc47ef2097e4c177e2e3ace52b9601publicclassSM4Utils{publicstaticfinalStringSM4K="c1bc47ef2097e4c177e2e3ace52b9601";/***获取sm4秘钥**@returnsm4秘钥*/publicstaticStri
1024基金会发起人冯雷受邀参与国家自然科学基金会《数智时代创新驱动创业理论建构与实践对话》人工智能
11月15日，由国家自然科学基金委员会管理科学部主办，自然科学基金项目“创新驱动创业的重大理论与实践问题研究”项目组、浙大管理学院联合承办的“数智时代创新驱动创业理论建构与实践对话”会议在浙江杭州圆满落幕。大会的圆桌会议「与实践对话」环节以其深度的话题讨论、内容的前瞻性、与话题的精彩性吸引了各界的目光。1024基金会发起人冯雷受邀出席，和其他行业专家共同探讨数智时代创新驱动创业的现实问题与实践需求
spring aop 梦魇星虹 Java 记录 spring java
springaop一、依赖jar包第一种：基于SpringFramework的基本AOP依赖组合org.springframeworkspring-context5.3.10org.springframeworkspring-aspects5.3.10第二种：SpringBoot项目org.springframework.bootspring-boot-starter-aop2.5.5第三种：Sp
2025年计算机专业毕业设计选题推荐速存小晓程序设计课程设计 java spring boot 毕业设计
2025最新计算机专业毕业设计选题推荐博主介绍CSDN特邀作者、博客专家、CSDN新星计划导师Java领域优质创作者，荣获“博客之星”称号掘金、华为云、阿里云、InfoQ等平台优质作者专注于Java技术及学生毕业项目实战指导高校教师/讲师，擅长同行交流合作文末获取源码联系方式主要内容SpringBoot、Vue、SSM框架应用HLMT（假设为某特定技术或框架）、Jsp、PHP、Node.js、Py
springboot初始化数据库+druid解密
1.yaml配置数据库连接配置#数据源配置spring.datasource.username=beebotlarkspring.datasource.password=WDShxRWTLSuKM6ucPN4E8hi0YWglium26wJVKitxRpzN2sopztgZpvgi4YFnuPXrAiLPMjuzgYK13we5SEwIHQ==spring.datasource.url=local
threejs 复习笔记 three.js
import*asTHREEfrom'https://unpkg.com/[email protected]/build/three.module.js'import{OrbitControls}from'https://github.com/mrdoob/three.js/blob/master/examples/jsm/controls/OrbitControls.js'import{OrbitCon
python把列表插入列表 Zoert
python相关学习资料：https://edu.51cto.com/video/4102.htmlhttps://edu.51cto.com/video/1158.htmlhttps://edu.51cto.com/video/4645.htmlPython中列表的嵌套与操作在Python编程中，列表（List）是一种非常重要的数据结构，它不仅可以存储数据，还可以进行各种操作，如插入、删除、排序
SGLang安装教程，部署你的大模型，性能比vllm好，实现张量并行，数据并行，加快推理速度，亲测效果好。张登杰踩人工智能结对编程 python
目前大模型部署工具主要是vllm，最近出现了SGLang，很多新开源大模型都支持SGLang的部署推理，例如deepseek-R1，Qwen2.5，Mistral，GLM-4，MiniCPM3，InternLM2，Llama3.2等。代码：GitHub-sgl-project/sglang:SGLangisafastservingframeworkforlargelanguagemodelsand
@RequestBody接收Json参数 | 用自定义注解对Vo对象中Date类型日期格式校验手hold刺猬 003.疑难问题 java springmvc json 正则表达式 spring boot
标题太长有木有？主要是为了把问题描述清楚，免得进错文章。问题描述昨天测试的同事测试接口的时候，测试出来一个Date类型校验问题。要求输入的日期格式是：yyyy-MM-ddHH:mm:ss，Vo中使用的注解如下：@DateTimeFormat(pattern=”yyyy-MM-ddHH:mm:ss”)测试同事输入下面两种参数都是保存成功，当输入为“202105”参数时，保存的数据变为“1970-01
c++瓷砖橙子亿 c++开发语言
今天的题目叫“瓷砖”，是“DFS深度优先搜索递归”一类的。题目描述在一个w×h的矩形广场上，每一块1x1的地面都铺设了红色或黑色的瓷砖。小谢同学站在某一块黑色的瓷砖上，他可以从此处出发，移动到上、下、左、右四个相邻的且是黑色的瓷砖上。现在他想知道，通过重复上述移动所能经过的黑色瓷砖数。输入第一行为两个数h和w，2≤w,h≤50,之间有一个空格隔开。以下为一个w行h列的二维字符矩阵，每个字符为“.”
华为今年的人均分红。。前端后端程序员华为
华为分红1月18日，华为发布内部文件，公布了ESOP（员工持股计划）的2024年度分红。每股价格7.85元，每股分红1.41元，分红收益率达18%（税前）。总的来说，股价没变，分红收益率下降了。虽然相比于2023年度每股分红1.5（税前收益率19.1%），同比下降了6%，但收益率18%还是相当顶尖的。要知道，2024年，保本理财已经正式进入2字头的时代了。我们可以回顾一下自2010年以来，华为「股
深度求索DeepSeek V2.5-1210发布：强大的AI代码生成器，开启联网搜索新纪元前端
深度求索团队近日发布了AI代码生成器DeepSeekV2.5系列的最终版本——DeepSeekV2.5-1210，并正式上线了备受期待的联网搜索功能。这标志着DeepSeekV2系列发展历程的一个重要里程碑，也为AI大模型在代码生成和信息检索领域树立了新的标杆。此次更新不仅带来了模型能力的全面提升，更重要的是开启了AI与实时信息互联的新篇章。DeepSeekV2.5-1210的核心改进：Post-
使用github.com/prometheus/client_golang/prometheus包的注意事项 qq_1536161955 prometheus golang 服务器
1.panic:duplicatemetricscollectorregistrationattempted重复注册。错误代码如下promauto.NewCounter(prometheus.CounterOpts{Name:"name",ConstLabels:prometheus.Labels{"k1":"v1"},})promauto.NewCounter(prometheus.Counte
GO语言使用Nacos（nacos-sdk-go的使用） dream21st goland学习笔记 golang 微服务 java
文章目录1注册中心使用1.1配置说明1.2注册服务1.3拉取服务1.4获取服务方法说明获取服务信息：获取所有实例列表：获取健康实例列表：获取一个健康实例：监听服务变化：取消服务监听：分页获取服务名列表：2配置中心使用发布数据：发布一个JSON数据：删除配置文件：获取配置文件里面的数据：监听配置文件的变化：取消监听配置文件的变化：搜索配置文件：Nacos/nɑ:kəʊs/是DynamicNaming
服务器日志自动上传到阿里云OSS备份 BinaryBoss 运维阿里云服务器阿里云运维
背景公司服务器磁盘空间有限，只能存近15天日志，但是有时需要查看几个月前的日志，需要将服务器日志定时备份到某个地方，需要查询的时候有地方可查。针对这个问题，想到3个解决方法：1、买一个配置比较低，磁盘空间比较大的服务器，专门用来存储其他服务器日志2、将服务器日志实时同步到阿里云日志服务3、将服务器日志定期同步到阿里云OSS方法1比较传统，且有丢失风险；由于我们历史日志查询频率不会很高（可能发现历史
centos下安装python3详细教程_centos python m0_60635321 2024年程序员学习 centos python linux
yum-yinstalllibffi-devel#安装pipyuminstallpython-pip*####4.用pip装wgetpipinstallwget*####5.用wget下载python3的源码包（评论区网友提供了淘宝镜像，替换了官网下载python3，提高下载速度）wgethttp://npm.taobao.org/mirrors/python/3.7.5/Python-3.7.5
ssm基于HTML5的红酒信息分享系统 Q_2743785109 计算机毕业设计 html5 前端 html
SSM基于HTML5的红酒信息分享系统是一个专注于红酒领域的综合性信息平台，旨在为红酒爱好者、从业者以及普通消费者提供一个便捷的交流与获取红酒相关信息的空间。一、系统背景与意义随着人们生活水平的提高和消费观念的转变，红酒作为一种高雅的饮品，越来越受到消费者的青睐。然而，红酒市场的信息不对称和消费者缺乏专业知识等问题限制了红酒文化的传播和消费者的购买决策。因此，开发一个基于SSM框架和HTML5技术
单片机基础模块——数码管模块 Moonnnn. 单片机单片机嵌入式硬件 51单片机蓝桥杯
1.原理共阳极数码管：0-亮1-灭共阴极数码管：0-灭1-亮编码推导该单片机中所用的是共阳极数码管，即0亮1灭按照dp->g->f->…->a的顺序写出数码管常见字段码2.Seg.c代码从原理图可以看到，我们需要对数码管进行位选（选择哪一个数码管进行显示）和段选（选择数码管显示的数据）。（图中为两个74HC573锁存器，在LED模块内有写）其中abcdefg和dp为段选，com1-8为位选。基本思
Linux编辑器——vim的基础使用 Yui_ Linux linux 编辑器 vim 笔记经验分享
文章目录1.vim的基本概念2.vim的基本操作3.vim命令模式命令集3.1移动光标3.2删除文字3.3复制3.4替换3.5撤销3.6更改3.7跳到指定的行1.vim的基本概念本文将介绍vim的三种模式，分别位：命令模式、插入模式、低行模式。他们的功能区分如下：正常/普通/命令模式控制屏幕光标的移动、字符、字或行的删除、移动某区段及进入插入模式，或者到末行模式插入模式只有在插入模式才可以做文字输
MySQL-分库分表飘飘渺渺渺红尘 Java Web Service mysql java 数据库
目录一、shardingsphere1、官方文档2、入门环境搭建2.1、引入依赖2.2、创建数据库2.3、sharding-jdbc分片策略配置2.4、事务2.5、mybatis-plus配置3、分片策略3.1、行表达式分片策略3.2、标准分片策略（1）精准分片算法精准分库算法精准分表算法（2）范围分片算法范围分库算法范围分表算法3.3、复合分片策略复合分片算法4、事务4.1、背景4.2、挑战4.
JDK新特性飘飘渺渺渺红尘 Java Web Service java 开发语言
目录Java81、Interface2、Lambda2.1、替代匿名内部类RunnerableComparatorListener2.2、集合遍历3、Stream3.1、流类型3.2、常用方法4、Date-Time4.1、java.time主要类4.2、格式化4.3、字符串转日期4.4、日期计算4.5、获取指定日期4.6、时区小结Java91、G1成为默认垃圾回收器Java101、G1并行Full
分布式-服务通信飘飘渺渺渺红尘 Java Web Service 分布式
目录一、RestTemplate1、简介2、使用2.1、GET2.2、POST2.3、exchange2.4、execute2.5、总结二、Feign1、简介2、使用2.1、OpenFeignServer2.2、OpenFeignClient3、@FeignClient4、参数三、Dubbo一、RestTemplate1、简介我们在访问http服务时，直接使用jdk的HttpURLConnecti
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement

5折交叉验证_机器学习理论大会战——模型交叉验证

你可能感兴趣的:(5折交叉验证,k折交叉验证,k折交叉验证法)