愤怒的可乐

从零实现深度学习框架——过拟合与欠拟合

引言

本着“凡我不能创造的，我就不能理解”的思想，本系列文章会基于纯Python以及NumPy从零创建自己的深度学习框架，该框架类似PyTorch能实现自动求导。

要深入理解深度学习，从零开始创建的经验非常重要，从自己可以理解的角度出发，尽量不使用外部完备的框架前提下，实现我们想要的模型。本系列文章的宗旨就是通过这样的过程，让大家切实掌握深度学习底层实现，而不是仅做一个调包侠。

本文主要介绍机器学习中常见的过拟合和欠拟合的概念，最后用一个实例展示过拟合的现象。

拆分数据集

我们在前面已经了解了机器学习简单流程：

使用大量相关数据集训练模型
通过模型在数据集上的误差迭代训练模型，得到在数据集上拟合较好的模型
最后可能会将模型应用到真实场景中

该数据集有一些为训练而收集的样本组成，称为训练数据集(training dataset)，或称为训练集(train set)。然后在训练数据上表现良好的模型，并不一定在新数据集上有同样的效果，这里的新数据集通常称为测试数据集(test dataset)，或称为测试集(test set)，测试集由随机选取的、未曾在训练集中出现的数据样本构成。

这样，训练集用于拟合模型参数，测试集用于评估拟合的模型，所谓的拟合是指模型对于测试集的适应效果怎么样。

机器学习的主要挑战是我们的模型必须能在之前未观测的新样本上表现良好，而不只是在训练集上表现良好。在之前未观测到的样本上表现良好的能力称为泛化(generalization)。

当我们训练机器学习模型时，我们可以使用某个训练集，在训练数集上计算得到的误差，称为训练误差(training error)，学习的目标是降低训练误差。机器学习也希望泛化误差(generalization error，也被称为测试误差(test error)) 很低。泛化误差被定义为新输入样本的误差期望，期望的计算基于不同的可能输入，这些输入来自于模型在现实中遇到的分布。

问题是，我们永远不能准确地计算出泛化误差，因为真实环境具有无限多的数据样本。实际上，我们只能通过将模型应用于一个独立的测试集(test set) 来估计泛化误差。

我们在训练集上训练模型，然后在测试集上测试模型，用测试集上的误差假设为模型对真实场景中的泛化误差。因此，我们只需要让训练好的模型在测试集上误差最小即可。

这是比较常见的做法，但如果可以的话，我们还可以拆分出一个验证集(dev set,开发集)。

由于在训练的时候，模型不能“看”到测试集的数据，我们不能直接根据测试集来调整模型，因此我们可以在训练集上训练好后，然后在验证集上测试不同的思路(比如超参数、权重初始化方法等)，从中选择一个，然后不断迭代去改善验证集上的表现，最后得到满意的模型，再去测试集上评估。

模型在验证集上的误差就是验证误差(validation error)。

但是在具体拆分数据集时，有一些要注意的事项，最重要的是验证集应该和测试集保持同一分布。

还有有了一批数据后，具体要如何拆分呢？

按照吴恩达老师的说法，数据量较少的时候，比如在十万级别以内的，可以用60%的数据作为训练集，20%的数据作为验证集，剩下20%的数据最为测试集；或者说你不想要验证集，那么建议70%的数据作为训练集，剩下30%的数据都作为测试集。

当数据量较大的时候，比如百万级以上，那么训练集/验证集/测试集按照98%/1%/1%的比例分就可以了。

用了这些数据集的概念后，我们就可以来了解过拟合和欠拟合问题了。

过拟合和欠拟合

我们说，训练集用于拟合模型参数，测试集用于评估拟合的模型。当一个模型在训练集上表现良好，但不能推广到测试集时(在测试集上拟合不好)，我们说这个模型是过拟合(overfitting) 的。如果训练出来的模型表现不好(误差高)，甚至在训练集上都表现不好，我们说这个模型是欠拟合(underfitting) 的。

通常我们可以通过比较训练误差和验证误差来判断模型训练的效果：

欠拟合 - 验证和训练误差都很高
过拟合 - 验证误差高，训练误差低
正常拟合 - 验证误差低，可以稍高于训练误差

最终，我们更关心验证误差，而不是训练误差和验证误差之间的差距。

是否过拟合或欠拟合可能取决于模型复杂性和可用训练集的大小。

有时没有拆分验证集，我们可以比较训练误差和测试误差。

模型复杂性

我们看一个经典的多项式例子。给定由单个特征 $x$ 和对应实数标签 $y$ 组成的训练数据，我们试图找到下面的 $d$ 阶多项式来估计标签 $y$ ：
$\hat y = \sum_{i=0}^d w_i x^i \tag 1$
这是一个线性回归问题，特征是 $x$ 的幂，权重是 $w_i$ ，偏置是 $w_0$ (我们令 $x^0=1$ )，由于是一个线性问题，我们可以使用均方误差作为损失函数。

高阶多项式函数比低阶多项式函数复杂得多。高阶多项式的参数较多，模型函数的选择范围较广。因此在训练集不变的情况下，高阶多项式通常比低阶多项式的训练误差更低。当数据样本包含了 $x$ 的不同值时，函数阶数等于数据样本数量的多项式函数可以完美拟合训练集。在下图中，我们直观地描述了多项式的阶数和欠拟合与过拟合之间的关系：

上图来自深度学习花书，横轴描述的是容量，我们可以理解为模型复杂度，纵轴表示误差。最佳复杂度在上图红线指向的位置。在红线左边属于欠拟合，红线右边属于过拟合。比较直观的就是，红线右边的泛化误差和训练误差的差距越来越大。

数据集大小

训练数据集中的样本越少，我们就越有可能过拟合。随着训练数据量的增加，泛化误差通常会减少。不管怎样，更多的数据不会有什么坏处，但是要注意训练数据集的数据分布和真实数据的分布问题。

通过实例理解过拟合与欠拟合

本例改自DIVE INTO DEEP LEARNING

本节我们通过多项式回归这个例子来理解过拟合与欠拟合。

给定 $x$ ，我们使用以下三阶多项式来生成训练和测试数据的标签：
$3.4\frac{x^2}{2!} + 5.6 \frac{x^3}{3!} + \epsilon \text{ where } \epsilon \sim \mathcal{N}(0, 0.1^2) \tag 2$
即真实多项式的最大阶数为3，最后的 $\epsilon$ 是噪声项，服从均值为0标准差为0.1的正态分布。同时为了避免非常大的梯度，我们将特征从 $x^i$ 调整为 $\frac{x^i}{i!}$ ，然后我们为训练集和测试集各生成100个样本：

import math

import numpy as np

max_degree = 30  # 多项式的最大阶数
n_train, n_test = 100, 100  # 训练和测试数据集大小
true_w = np.zeros(max_degree)  # 分配大量的空间
# 真实w只有前4位有效
true_w[0:4] = np.array([5, 1.2, -3.4, 5.6])

features = np.random.normal(size=(n_train + n_test, 1))
np.random.shuffle(features)
# 多项式特征
poly_features = np.power(features, np.arange(max_degree).reshape(1, -1))

for i in range(max_degree):
    poly_features[:, i] /= math.gamma(i + 1)  # gamma(n)=(n-1)!

# labels的维度:(n_train+n_test,)
labels = np.dot(poly_features, true_w)
# 增加均值为0标准差为0.1正态分布的噪声项
labels += np.random.normal(scale=0.1, size=labels.shape)

然后我们从生成的数据集中看一下前2个样本：

print(f"{features[:2]}\n {poly_features[:2, :]}\n  {labels[:2]}\n")

[[-0.1746]
 [ 0.0502]]
 [[ 1.     -0.1746  0.0152 -0.0009  0.     -0.      0.     -0.      0.
  -0.      0.     -0.      0.     -0.      0.     -0.      0.     -0.
   0.     -0.      0.     -0.      0.     -0.      0.     -0.      0.
  -0.      0.     -0.    ]
 [ 1.      0.0502  0.0013  0.      0.      0.      0.      0.      0.
   0.      0.      0.      0.      0.      0.      0.      0.      0.
   0.      0.      0.      0.      0.      0.      0.      0.      0.
   0.      0.      0.    ]]
  [4.8674 4.8666]

然后我们定义训练函数：

def train(train_features, test_features, train_labels, test_labels, num_epochs=400):
    loss = MSELoss(reduction=None)
    input_shape = train_features.shape[-1]
    # 不设置偏置，因为我们已经在多项式中实现了它
    model = nn.Linear(input_shape, 1, bias=False)
    batch_size = min(10, train_labels.shape[0])

    opt = SGD(model.parameters(), lr=0.01)
    animator = Animator(xlabel='epoch', ylabel='loss', yscale='log',
                        xlim=[1, num_epochs], ylim=[1e-3, 1e2],
                        legend=['train', 'test'])

    train_labels, test_labels = train_labels.reshape(-1, 1), test_labels.reshape(-1, 1)

    for epoch in range(num_epochs):
        train_loss, _ = run_epoch(model, train_features, train_labels, loss, opt, batch_size)
        if epoch == 0 or (epoch + 1) % 20 == 0:
            with no_grad():
                test_loss, _ = run_epoch(model, test_features, test_labels, loss, opt=None,
                                         batch_size=batch_size)
            animator.add(epoch + 1, (train_loss, test_loss))
    plt.show()
    print('weight:', model.weight.numpy())

该函数会进行多项式模型的训练，同时画出训练误差和验证误差，最后打印出模型训练得到的权重。

正常拟合

我们先看一下正常拟合，让它与生成数据的阶数相同相同，即三阶多项式，包含偏置。

# 从多项式特征中选择前4个维度，即1,x,x^2/2!,x^3/3!
train(poly_features[:n_train, :4], poly_features[n_train:, :4], labels[:n_train], labels[n_train:])

weight: [[ 5.0008  1.1922 -3.3991  5.6071]]

可以看到损失由100降低到了0.01级别，能有效降低训练损失和测试损失，学习到的模型参数也接近于真实 $w = [5, 1.2, - 3.4, 5.6]$ 。

终于会画动图了，相关代码请参考源码

欠拟合

我们再看看没有多项式的线性函数拟合。

# 从多项式特征中选择前2个维度，即1和x
train(poly_features[:n_train, :2], poly_features[n_train:,:2],labels[:n_train], labels[n_train:])

weight: [[2.5748 4.6183]]

此时减少模型的训练损失很困难。在最后一个迭代完成后，训练损失仍然很高。

过拟合

我们尝试使用一个阶数过高的多项式来训练模型。

train(poly_features[:n_train, :], poly_features[n_train:, :],
      labels[:n_train], labels[n_train:], num_epochs=1500)

weight: [[ 4.9733  1.239  -3.3014  5.4526 -0.3969  0.336   0.7446  0.0222  0.4165
  -0.2525 -0.0321  0.1681 -0.1694  0.1181  0.0084  0.1117 -0.0924  0.0733
   0.0274  0.2889  0.0242 -0.1679  0.1407 -0.3078  0.1213  0.1865  0.0977
  -0.2631  0.0658  0.0718]]

此时，这个过于复杂的模型会受到训练数据中噪声的影响。虽然训练损失可以有效地降低，但测试损失仍然很高。结果表示，复杂模型对数据造成了过拟合。

References

吴恩达深度学习
DIVE INTO DEEP LEARNING
深度学习花书

.NET MAUI 教程：入门与配置束慧可Melville
.NETMAUI教程：入门与配置项目地址:https://gitcode.com/gh_mirrors/ma/maui1.项目的目录结构及介绍在.NETMulti-platformAppUI（简称.NETMAUI）项目中，目录结构通常如下：YourProject/├──Android/│└──...//Android平台相关的代码和资源├──iOS/│└──...//iOS平台相关的代码和资源├─
强化学习很多ac架构的算法比如ppo，为什么使用状态价值网络而不使用动作价值网络实现critic呢?｜状态价值网络的优势与挑战｜Actor-Critic｜状态价值｜强化学习 concisedistinct 人工智能算法人工智能架构
目录1.强化学习的基础1.1策略与价值函数2.Actor-Critic架构概述2.1Critic的作用3.为什么选择状态价值网络？3.1训练稳定性3.2计算效率3.3高维动作空间的适应性4.使用状态价值网络的挑战4.1收敛速度4.2欠拟合风险5.解决方案与未来方向5.1改进的状态价值网络5.2结合动作价值和状态价值6.结论随着强化学习技术的不断发展，其在诸如游戏、机器人控制和金融预测等领域的应用越
APS_Schedule 我养的小猫 Python python
前言大家应该都知道在编程语言中，定时任务是常用的一种调度形式，在Python中也涌现了非常多的调度模块，本文将简要介绍APScheduler的基本使用方法。一、APScheduler介绍APScheduler是基于Quartz的一个python定时任务框架，实现了Quartz的所有功能，使用起来十分方便。提供了基于日期、固定时间间隔以及crontab类型的任务，并且可以持久化任务。APSchedu
日志2025.1.28 science怪兽 unity 游戏程序算法
日志2025.1.281.实现了霰弹枪射击//霰弹枪射击privatevoidShotgunShoot(){for(inti=0;i();_transposer=_cam.GetCinemachineComponent();}//改变相机的距离publicvoidChangeCameraDistance(floatdistance){_transposer.m_CameraDistance=dis
创建MAUI .NET 应用程序的详细教程 Tnp____ .net .NET
MAUI（多平台应用程序用户界面）是一个用于创建跨平台应用程序的开发框架。它是基于.NET平台的最新技术，可以让开发人员使用一个共享的代码库构建并运行在多个操作系统上的应用程序，如Android、iOS、Windows等。本文将详细介绍如何创建一个基于MAUI.NET的应用程序，并提供相应的源代码。步骤1：安装开发环境和工具首先，确保你的系统中已经安装了以下工具：.NET6SDK：前往Micros
度量年报中MD&A部分的信息含量的Python代码 Xiaorui~ 文本分析会计学 python pandas 开发语言
研究需求：度量年报中管理层讨论与分析部分的信息含量的代码，环境为python3，可更改年报的选取时间。代码实现：首先，需要安装tika和pandas库，tika用于解析PDF文件，pandas用于数据处理。可以使用以下命令进行安装：!pipinstalltika!pipinstallpandas然后，需要下载年报的PDF文件，并将其放置在指定路径下。接下来，可以使用以下代码对管理层讨论与分析部分进
MyBatis最佳实践:注解开发苏-言 mybatis java spring
注解：@Insert：添加@Update：修改@Delete：删除@Select：查询@Result：实现结果集封装@Results：可以和@Reslult一起使用，封装多个结果集@One：实现一对一和多对一的结果集封装@Many：实现一对多结果集封装MyBatis注解不能实现动态SQL使用：SqlMapConfig.xml配置文件编写注解：增删改查：@Select("select*fromuse
MyBatis最佳实践：提升数据库交互效率的秘密武器苏-言 mybatis 数据库
第一章：框架的概述：MyBatis框架的概述：MyBatis是一个优秀的基于Java的持久框架，内部对JDBC做了封装，使开发者只需要关注SQL语句，而不关注JDBC的代码，使开发变得更加的简单MyBatis通过XML或者注解的方式将要执行的各种Statement对象配置起来，通过Java对象和statement中SQL后，最终将结果已Java对象返回MyBatis采用了ORM的思想ORM思想：在
【Golang 面试题】每日 3 题（四十四） Pandaconda #Golang 面试专栏 golang 开发语言后端面试笔记
✍个人博客：Pandaconda-CSDN博客专栏地址：http://t.csdnimg.cn/UWz06专栏简介：在这个专栏中，我将会分享Golang面试中常见的面试题给大家~❤️如果有收获的话，欢迎点赞收藏，您的支持就是我创作的最大动力130.goroutine阻塞、唤醒和退出状态阻塞channel的读写操作、等待锁、等待网络数据、系统调用等都有可能发生阻塞，会调用底层函数runtime.go
技术速递｜.NET 9 Preview 6 现已推出！微软Reactor .net c#
作者：.NETTeam排版：AlanWang现在是了解最新.NET9预览版的好时机！我们刚刚发布了第六个预览版，在之前预览版的基础上添加了一些很棒的功能，并对.NETRuntime、SDK、库、C#和框架（包括ASP.NETCore、Blazor和.NETMAUI）进行了重大改进。请查看下面链接的完整发行说明并立即开始使用。下载.NET9Preview6此版本包含以下改进：库对System.Num
python 定时任务框架 assless python 自动化相关 python 定时任务 APSchedule 自动化测试
python定时任务框架如果想实现自定义定时任务框架，可以看看下面转载的文章写的很详细传送门=>APScheduler定时框架
6.《DevOps》系列K8S部署CICD流水线之K8S通过Yaml部署动态Jenkins-slave,以及Jenkins平台基于Gitlab实现SSO授权认证洋葱_学习过程 devops kubernetes jenkins
架构服务器IP服务名称硬件配置192.168.1.100k8s-master8核、16G、120G192.168.1.101k8s-node18核、16G、120G192.168.1.102k8s-node28核、16G、120G192.168.1.103nfs2核、4G、500G操作系统：Rocky9.3jenkins版本：2.477原理JenkinsMaster接到构建任务后会动态在集群中的一
（基础）Python实现定时任务的八种方案详解程序员-不秃头的阿焕 python 开发语言后端
在日常工作中，我们常常会用到需要周期性执行的任务，我们可以用Python直接实现这一功能。今天我们来学习一下这些基本的操作，有需要了解更多关于python相关知识的，免费领取资源的，请点击这个链接。目录利用whileTrue:+sleep()实现定时任务使用Timeloop库运行定时任务利用threading.Timer实现定时任务利用内置模块sched实现定时任务利用调度模块schedule实现
强化学习中，为什么用AC架构资源存储库算法强化学习算法
目录强化学习中，为什么用AC架构为什么用AC架构？AC架构的工作原理AC架构的优缺点优点：缺点：相关算法：基于AC架构的算法总结强化学习中，为什么用AC架构在强化学习（ReinforcementLearning,RL）中，AC架构（即Actor-Critic架构）是一种非常常用的架构，用于训练智能体（Agent）在环境中执行任务。AC架构结合了策略梯度方法和价值迭代方法，通过分离策略和价值函数的估
MyMvvmMaster：Android应用开发的MVVM架构解决方案不胖的羊
本文还有配套的精品资源，点击获取简介：MyMvvmMaster.zip是一个集成MVVM架构、RxJava2、Retrofit和ARouter的Android应用框架压缩包，旨在简化开发流程，增强代码的可读性和可维护性。本框架通过DataBinding库实现数据和UI的双向绑定，利用RxJava2优化异步编程，Retrofit简化网络请求处理，ARouter管理模块间路由，从而提供一个高效、模块化
mysql的测试方案蚂蚁质量 mysql 数据库
1.测试目标与范围1.1性能测试目标MySQL性能测试旨在评估数据库在不同负载条件下的响应速度、吞吐量和资源利用率，确保其能够满足业务需求。响应时间：衡量查询和事务处理的延迟，目标是将平均响应时间控制在100毫秒以内，95%的查询响应时间不超过200毫秒。吞吐量：通过QPS（每秒查询次数）和TPS（每秒事务数）评估数据库的处理能力，目标是在高并发场景下达到QPS10000+、TPS5000+。资源
技术速递｜.NET 9 中的 OpenAPI 文档生成微软Reactor .net
作者：MikeKistler排版：AlanWang.NET9中的ASP.NETCore通过引入全新的对OpenAPI文档生成功能的内置支持，简化了为API端点创建OpenAPI文档的过程。这项新功能旨在简化开发工作流程，并改善OpenAPI定义在ASP.NET应用中的集成。OpenAPI的广泛使用催生了丰富的工具和服务生态系统，它们能够帮助您更高效地构建、测试和记录API。例如，SwaggerUI
Oracle登录时忘记用户名或密码，怎么办？杨云龙666 oracle 数据库 sql database 数据库开发笔记经验分享
Oracle默认用户名和密码（注意：Oracle12c规定用户名都必须以C##开头，否则无法使用。）1.用户名:sys密码:change_on_install或者managerassysdba2.用户名:system密码:manager3.用户名:scott密码:tiger一、忘记账户：可以使用以上默认账号其中一个用户及密码，在PL/SQL管理工具中登录，运行selectusernamefromd
anaconda 安装后找不到prompt 刘凑华 prompt python 开发语言
解决方法，用cmd进入anaconda的安装目录，然后输入如下命令python .\Lib\_nsis.py mkmenus
linux监听tcp端口数据包,linux tcpdump抓包 weixin_39615741 linux监听tcp端口数据包
8种机械键盘轴体对比本人程序员，要买一个写代码的键盘，请问红轴和茶轴怎么选？tcpdump是在命令行下运行的常用数据包分析器。它允许用户显示通过计算机所连接的网络传输或接收的TCP/IP和其他数据包。根据BSD许可分发,tcpdump是免费软件。tcpdump适用于大多数类Unix操作系统：Linux，Solaris，BSD，macOS，HP-UX，Android和AIX等。在这些系统中,tcpd
php ip获取邮政编码,地理位置-如何从IP地址确定邮政编码和城市？哈士奇爱深海鱼 php ip获取邮政编码
以下是我发现的使用[http://ipinfodb.com/ip_locator.php]来获取其信息的代码段的修改版本。请记住，您也可以向他们申请API密钥，并直接使用API来获取您认为合适的信息。如您所见[http://ipinfodb.com/ip_location_api.php，]他们提供了从PHP到JavaScript到ASP.Net的所有示例。如前所述，下面不需要密钥，因为它可以拉动
Qutebrowser：Python程序员的浏览器利器东方佑量子变法 python
引言在日常工作中，我们常常会遇到一些重复性的操作，比如每天打开固定的几个网页，或者需要频繁地对网页进行截图。如果你是一位Python开发者，并且希望有一种更高效的方式来处理这些任务，那么今天介绍的Qutebrowser绝对会让你眼前一亮。Qutebrowser是一个基于Python和PyQt开发的键盘驱动浏览器，它不仅支持Vim风格的快捷键操作，还允许用户通过编写Python脚本来扩展其功能。接下
SSH隧道连接(基于linux) 小熊同学哦网络安全 ssh linux 运维
引言SecureShell（SSH）是一种网络协议，用于在不安全的网络中为网络服务提供安全的传输。SSH协议主要用来进行远程登录，管理服务器，传输文件等。本文将详细介绍SSH的工作原理、配置方法以及常见问题的解决方法，帮助读者更好地理解和使用SSH。1.SSH的基本概念1.1什么是SSH？SSH（SecureShell）是一种加密的网络协议，用于安全地连接到远程计算机。它提供了安全的通信通道，可以
瀑布式开发、快速原型开发、迭代式开发、螺旋式开发、敏捷式开发、DevOps开发的简介与对比晓北斗NorSnow 多媒体考试 devops 运维
以下是项目管理中常见的软件开发模式：瀑布式开发、快速原型开发、迭代式开发、螺旋式开发、敏捷式开发、DevOps开发的简介与对比表格：开发模式简介优点缺点适用场景瀑布式开发最早提出的系统化、结构化的开发方法，将软件开发过程划分为一系列顺序进行的阶段。1.顺序性强，便于管理和控制；2.文档齐全，有利于后期维护和升级；3.结构化可预测，便于计划和资源分配。1.缺乏灵活性，难以应对需求变化；2.早期缺陷检
《薄世宁医学通识50讲》以医学通识为主题，涵盖了医学的多个方面，包括医学哲学、疾病认知、治疗过程、医患关系、公共卫生等晓北斗NorSnow 图书课程分享学习方法程序员创富创业创新学习程序人生
《薄世宁医学通识50讲》是一门由薄世宁医生主讲的医学通识课程，该课程旨在通过深入浅出的方式，向广大听众普及医学知识，提升公众对医学的认知和理解。晓北斗推荐-薄世宁医学通识以下是对该课程的详细介绍：一、课程概述《薄世宁医学通识50讲》以医学通识为主题，涵盖了医学的多个方面，包括医学哲学、疾病认知、治疗过程、医患关系、公共卫生等。薄世宁医生以其丰富的医学知识和临床经验，将复杂的医学问题讲解得通俗易懂，
区别Mp3、AAC、WAV 、MWA这些音频文件晓北斗NorSnow 多媒体考试 aac
同学，MP3、AAC、WAV、WMA这些音频文件格式各有其特点和适用场景，下面我来为你详细解释一下它们的区别：MP3特点：MP3是一种广泛使用的音频压缩技术，它能够在音质丢失很小的情况下将音频文件压缩到更小的程度。MP3格式具有广泛的兼容性、网络传输便利性以及多样化的应用场景等特点，是全球范围内最受欢迎和应用最广的音频文件格式之一。音质与文件大小：MP3格式通过压缩音频数据来减小文件大小，同时保持
A6.Springboot-LLama3.2服务自动化构建（三）——编写Pipeline构建仓库初始化脚本 smart_ljh AI大模型应用与实战 spring boot 自动化 servlet jenkins 构建
下面我们接着上一篇文章《A5.Springboot-LLama3.2服务自动化构建（二）——Jenkins流水线构建配置初始化设置》继续往下分析，编写Pipeline构建脚本。一、统一Shell执行环境Jenkins执行Shell脚本时，会在Jenkins节点上创建一个临时的环境来执行该脚本。这个环境包含了Jenkins运行时需要的所有依赖和资源，以及用户在Jenkins配置中指定的环境变量。当用
搭建服务器VPN,Linux客户端连接WireGuard,Windows客户端连接WireGuard skyQAQLinux linux 服务器运维
Linux客户端连接WireGuard实验要求准备两台Linux系统，实现VPN服务端功能，安装wireguard-tools等软件包并配置，服务端使用proxy主机，客户端使用client主机环境准备主机名IP地址角色client（已存在）eth0：192.168.88.10/24（充当公网地址）10.10.10.2（充当私网VPN通信地址）客户端proxy（已存在）eth0：192.168.8
医学顶会 MICCAI‘24 | LKM-UNet: 大型内核视觉 Mamba UNet 用于医学图像分割小白学视觉医学图像处理论文解读 MICCAI 深度学习医学图像顶会医学图像处理论文解读
本文内容只为星球内部成员学习和学术交流，请勿用作他用本文内容只为星球内部成员学习和学术交流，请勿用作他用论文信息题目：LKM-UNet:LargeKernelVisionMambaUNetforMedicalImageSegmentationLKM-UNet:大型内核视觉MambaUNet用于医学图像分割作者：JinhongWang,JintaiChen,DannyChen,JianWu源码链接：
Java实现文件内容加解密 qq_34759280 Java java 安全加解密
背景近期在做一个对数据安全要求比较高的软件，用户要求做到对接口、文件、以及数据库部分敏感字段进行加密。由于系统中文件内容比较敏感，用户要求除了客户其他人不能查看文件具体内容，包括运维人员和开发人员。探讨其实文件加密并不算太复杂。无非就是在用户上传文件的时候将文件内容读出加密写入后再存到服务器，然后用户下载的时候将内容读出然后解密再写入输出流即可。简单实现计算机数据内容是二进制，针对二进制最简单高效
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D