weixin_39749243

dropout层_【深度学习理论】一文搞透Dropout、L1L2正则化/权重衰减

前言

本文主要内容——一文搞透深度学习中的正则化概念，常用正则化方法介绍，重点介绍Dropout的概念和代码实现、L1-norm/L2-norm的概念、L1/L2正则化的概念和代码实现～

要是文章看完还不明白，欢迎交流、分享、拍砖：）

详细内容如下：

1.正则化Regularization
- 1.1 过拟合Overfitting
- 1.2 欠拟合Underfitting
- 1.3 泛化能力generalization ability
- 1.4 解决或改善？
2.L1 L2正则化/权重衰减
- 2.1 范数和欧几里得空间
  - 范数Norm
  - 欧几里得空间
- 2.2 L1-范数和L2-范数
  - L1-范数
  - L2-范数
- 2.3 L1/L2正则化和权重衰减
  - L1/L2正则化
  - 权重衰减weight decay
  - 代码实现—pytorch
3.Dropout
- 3.1概述
  - 提出
  - 应用
  - 发展
- 3.2 Vanilla Dropout
- 3.3 Inverted Dropout
- 3.4 代码实现——pytorch
  - 从零开始实现
  - 简洁实现
参考

原文发表于语雀文档：

【深度学习理论+代码】一文搞透Dropout、L1L2正则化/权重衰减 · 语雀www.yuque.com

dropout层_【深度学习理论】一文搞透Dropout、L1L2正则化/权重衰减_第2张图片

1.正则化Regularization

什么是正则化？其作用是怎样的？了解正则化之前，我们需要先了解一下机器学习中欠拟合和过拟合的概念

1.1 过拟合Overfitting

过度拟合的意思，意味着模型训练过程中，对训练集的模拟和学习过度贴合；
过拟合带来的影响：模型训练时的检测率很高效果很好，但是用于实际检验时，效果很差，模型不能很准确地预测，即泛化能力差。

1.2 欠拟合Underfitting

和过拟合相对，欠拟合是指模型和数据集间的拟合程度不够，学习不足。
欠拟合的影响：和过拟合相对，欠拟合是指模型和数据集间的拟合程度不够，可能是学习轮数不够、数据集特征不规则、模型选择有问题等。欠拟合时，模型的泛化能力同样会很差。

1.3 泛化能力generalization ability

是指一个机器学习算法对于没有见过的样本的识别能力。泛化能力自然是越高越好。
在吴恩达机器学习中有一个线性回归预测房价的例子，非常形象直观：

dropout层_【深度学习理论】一文搞透Dropout、L1L2正则化/权重衰减_第3张图片

如上图，x轴表示房子面积，y轴表示房屋售价，图表中有5个样本点(训练集)，任务是找到合适的模型来拟合样本且用来预测未知的样本。
第一个模型是线性模型，对训练集样本欠拟合；
中间的二次方模型对样本拟合程度比较适中；
第三个四次方模型，对样本拟合程度更高，不过对于未来的新样本可能预测能力会很差，此为典型的过拟合。

1.4 解决或改善？

那么解决过拟合的方式有哪些？课程中给出了以下两点建议：1.丢弃一些不能帮助我们正确预测的特征。可以是手工选择保留哪些特征，或者使用一些模型选择的算法来帮忙（例如 PCA）2.正则化。保留所有的特征，但是减少参数的大小（magnitude）。当然，以上是机器学习中的一些通用做法，在深度学习中同样适用于。譬如深度学习中常见的降低过拟合/正则化方法：

使用L1正则化降低权重；
使用L2正则化/权重衰减weight decay；
Early stopping 早停，防止过拟合；
使用BN层batch normalization来规范数据分布，间接起到正则化的作用；
使用Dropout(及各种变种和改进版)随机丢弃一些神经元，来减低模型对部分神经元的依赖，加强模型的鲁棒性，达到正则化的效果；
Data augmentation数据增强，譬如将数据集图片处理后，增加平移旋转和缩放处理，增加噪声处理等，使得模型对各种复杂条件下的图像都能较好适应，增强鲁棒性。

有时L2正则化和weight decay常被人理解为同一种意思，实际上二者有时不可等价，见： https:// zhuanlan.zhihu.com/p/40 814046

当然，这么多正则化方式，每一点拎出来都可以出好几篇论文了～本文主要介绍的是常用的L2正则/权重衰减和Dropout，BN等放在以后的文章中介绍。

2.L1 L2正则化/权重衰减

本小节，讲讲L1正则化L2正则化和权重衰减(weight decay)，重点分为三个部分：

1.讲解L1/L2范数和L1/L2正则化的概念、来源、其在深度学习中的应用；
2.L2正则化和权重衰减的概念；
3.L2正则化/权重衰减在深度学习pytorch代码中的实现。

2.1 范数和欧几里得空间

范数Norm

在了解L1/L2正则化前，必须先了解L1-norm(L1范数)和L2-norm（L2范数），因为本质上，L1/L2正则化，即在机器学习/深度学习的loss损失函数中添加L1/L2范数的正则化项，以起到惩罚权重，达到正则化的效果，故称为L1/L2正则化。范数norm的定义是基于向量空间（Vector space）的，向量空间也称为线性空间，其概念起源于17世纪的解析几何、矩阵和欧几里得空间(Euclidean space)。我这里就不摆公式定义了，可以参考ｗｉｋｉ。

欧几里得空间

简单理解，欧几里得空间（Euclidean space）是向量空间的子集，起源于是古希腊学者欧几里得对物理空间的一种抽象(来源于生活中常见的二维平面，三维空间)并在其中定义了点线、内积、距离、角的概念。譬如：二维平面中一个点可以有坐标x,y；两点之间的距离表现为一条直线，其大小可以用

)表示；三维空间中，两点之间距离表现为一个向量，其大小可以用：

表示，两向量ａ和ｂ的内积定义为：

。当然，欧式空间也可以拓展至ｎ维度。在n=时，一个点需要用3个坐标来定义，而ｎ维欧式空间中，需要用n个坐标定义。

2.2 L1-范数和L2-范数

明明讨论的是范数，怎么扯到欧几里得空间去了？！

dropout层_【深度学习理论】一文搞透Dropout、L1L2正则化/权重衰减_第4张图片

我也很无奈啊，因为Ｌ２范数也被称为欧几里得范数：）这里，我就不摆范数的定义了。简单来说，我们可以把L2-norm放在欧式空间中来理解，且直观地理解其意义为向量的模长。p-范数的公式定义如下：

L1-范数

p = 1时为L1范数(L1-norm):

L1范数(又称为Taxicab norm or Manhattan norm)，看起来L1-norm即一组数的绝对值累加和。

L2-范数

p = 2时为L2范数(L2-norm):

L2范数又称为欧几里得范数/平方范数(还可称为 L norm, ℓ norm, 2-norm)，其用于表示向量_ x = (_x, x, ..., x__n)距离原点的距离。

2.3 L1/L2正则化和权重衰减

L1/L2正则化

前面说了那么多，有木有一脸懵逼？？？别慌，都是浮云～我们只要记住L1范数是绝对值和，L2范数是平方和(开根号)即可。简单来说，L1/L2正则化就是在机器学习/深度学习中应用了L1/L2范数，具体来说，就是在损失函数loss上增加了L1或L2范数项，达到参数惩罚的作用，即实现了正则化的效果，从而称为L1/L2正则化。

在之前的专栏文章：【吴恩达机器学习】第三周—逻辑回归、过拟合、正则化中，有个栗子比较形象地展示了L2正则化的过程，如下图：

dropout层_【深度学习理论】一文搞透Dropout、L1L2正则化/权重衰减_第5张图片

图中最右边的线性回归模型表达式为：

由于其高次项参数的使用，使得模型对训练数据过分拟合，导致对未来更一般的数据预测性大大下降，为了缓解这种过拟合的现象，我们可以采用L2正则化。具体来说就是在原有的损失函数上添加L2正则化项(l2-norm的平方)：

这里，通过设置正则化系数

可以较好地惩罚高次项的特征，从而起到降低过拟合，正则化的效果。至于高次项的特征如何受到系数的影响，如何被惩罚的，详见：【吴恩达机器学习】第三周—逻辑回归、过拟合、正则化。添加L2正则化修正以后的模型曲线：

dropout层_【深度学习理论】一文搞透Dropout、L1L2正则化/权重衰减_第6张图片

权重衰减weight decay

权重衰减weight decay，并不是一个规范的定义，而只是俗称而已，可以理解为削减/惩罚权重。在大多数情况下weight dacay 可以等价为L2正则化。L2正则化的作用就在于削减权重，降低模型过拟合，其行为即直接导致每轮迭代过程中的权重weight参数被削减/惩罚了一部分，故也称为权重衰减weight decay。从这个角度看，不论你用L1正则化还是L2正则化，亦或是其他的正则化方法，只要是削减了权重，那都可以称为weight dacay。
设：

参数矩阵为p（包括weight和bias）；
模型训练迭代过程中计算出的loss对参数梯度为d_p；
学习率lr；
权重衰减参数为decay

则不设dacay时，迭代时参数的更新过程可以表示为：p= p - lr×d_p;
增加weight_dacay参数后表示为：p = p - lr ×(d_p + p × dacay)

代码实现—pytorch

在深度学习框架的实现中，可以通过设置weight_decay参数，直接对weight矩阵中的数值进行削减（而不是像L2正则一样，通过修改loss函数）起到正则化的参数惩罚作用。二者通过不同方式，同样起到了对权重参数削减/惩罚的作用，实际上在通常的随机梯度下降算法(SGD)中，通过数学计算L2正则化完全可以等价于直接权重衰减。（少数情况除外，譬如使用Adam优化器时，可以参考：L2正则=Weight Decay？并不是这样）
正因如此，深度学习框架通常实现weight dacay/L2正则化的方式很简单，直接指定weight_dacay参数即可。

在pytorch/tensorflow等框架中，我们可以方便地指定weight_dacay参数，来达到正则化的效果，譬如在pytorch的sgd优化器中，直接指定weight_decay = 0.0001：

optimizer

在模型训练过程中，每一轮迭代时通过：l.backward()来自动求梯度；之后通过optimizer.step()进行参数矩阵的梯度更新。

在sgd的代码实现中，我们重点看step()方法的第26行：if weight_decay != 0: 表示了应用weight_decay参数的情况；倒数第二行：p.add_(d_p, alpha=-group['lr'])表示了参数矩阵的梯度更新。

@torch.no_grad

3.Dropout

3.1概述

提出

Dropout的提出，源于2012年Hinton的一篇论文——《Improving neural networks by preventing co-adaptation of feature detectors》。论文中描述了当数据集较小时而神经网络模型较大较复杂时，训练时容易产生过拟合，为了防止过拟合，可以通过阻止特征检测器间的共同作用来提高模型性能。

应用

2012年，大名鼎鼎的AlexNet网络的论文——《ImageNet Classification with Deep Convolutional Neural Networks》中，应用了Dropout,并且证明了其在提高模型精度和降低过拟合方面效果出色。由于AlexNet有效的网络结构+Dropout的应用，此模型在12年的ImageNet分类赛上以大幅优势领先第二名，从而使得深度卷积神经网络CNN在图像分类上的应用掀起一波热潮～

发展

在这以后，围绕Dropout又涌现出不少论文：
《Dropout:A Simple Way to Prevent Neural Networks from Overfitting》
《Improving Neural Networks with Dropout》
《Dropout as data augmentation》
等等。

不过总结起来，Dropout的原理都类似，只是实现方式有不同而已。比较流行的实现主要有两种类型：

Vanilla Dropout
Inverted Dropout

其中Vanilla Dropout是原论文中提出的，朴素实现版本；而Inverted Dropout则是更广为使用和流行的实现

3.2 Vanilla Dropout

Vanilla Dropout是原论文中提出的，这里我简单介绍下主要原理和流程。从上面的介绍中可知，Dropout的提出是为了降低过拟合的，具体是应用在深度神经网络的中间隐藏层上，对于某一层l,如果应用了概率p（可选超参数，例如可设置p = 0.5）的Dropout,即表面该层的神经元，在网络的训练/测试过程中，每个神经元都有50%的概率被“丢弃”，即此神经元不参与权重矩阵的计算。
具体流程如下：

dropout层_【深度学习理论】一文搞透Dropout、L1L2正则化/权重衰减_第7张图片

模型训练时应用Dropout的流程，概况一下描述就是：

1.随机概率p随机dropout部分神经元，并前向传播
2.计算前向传播的损失，应用反向传播和梯度更新(对剩余的未被dropout的神经元)
3.恢复所有神经元的，并重复过程1

此训练过程理解起来很简单，但是有个问题，就是测试时会比较麻烦。为了保持模型的分布相同，测试时也需要保持模型分布和训练时一样，需要以一个概率p来丢失部分神经元(即乘以1-p的概率来保留),这样会不太方便，而且同一个输入可能每次预测的结果不一样，不稳定。所以Vanilla Dropout并没有得到广泛应用，取而代之的是更方便的Inverted Dropout,我们在之前的文章——【吴恩达深度学习】—参数、超参数、正则化中介绍的就是这种Dropout。

3.3 Inverted Dropout

Inverted Dropout是在在各大深度学习框架中是更广泛使用的版本，其原理类似，就是实现起来和原始版本的dropout稍微有些区别。Inverted Dropout在训练阶段,同样应用p的概率来随机失活，不过额外提前除以1-p，这样相当于将网络的分布提前“拉伸”了，好处就是在预测阶段，网络无需再乘以1-p(来压缩分布)，这样预测时网络无需改动，输出也更加稳定。丢弃法不改变输入的期望
假设随机变量

为0和1的概率分别为p和1-p(丢弃和保留的概率)，则任意神经元

可以表示为：

而

，所以有：

即，Dropout并不改变神经元的期望值，即不改变整个输入的期望。

3.4 代码实现——pytorch

下面，我们借用《动手学习深度学习-pytorch版》的一个例子来描述Inverted Dropout的原理和代码实现。

首先，我们的神经网络模型如下：

dropout层_【深度学习理论】一文搞透Dropout、L1L2正则化/权重衰减_第8张图片

很简单总共3层，输入层4个神经元；中间隐藏层5个神经元

；输出层3个；

ϕ_为激活函数，输入为

，隐藏层中单元i的权重参数为：

，偏差bias为bi

则隐藏层激活单元表达式如下：

对隐藏层使用Dropout，设隐藏层中任意神经元被“丢弃” 的概率设为p，（保留的概率为1-p）。所谓的丢弃指将此神经元的值设为0(故其值不能被传递到下一层，相当于被砍掉了)。使用Dropout后，可能的一种网络形态：

dropout层_【深度学习理论】一文搞透Dropout、L1L2正则化/权重衰减_第9张图片

代码实现主要是这个简单神经网络模型在Fashion-mnist数据集上的训练，部分和书中一样，有两种实现方式：

1.从零开始实现
2.简洁版实现

1.从零开始实现主要是自定义dropout函数，自定义网络等；2.简洁实现即用pytorch现成的dropout和网络定义来实现模型的训练。

从零开始实现

为了表达对于某一层输入X应用dropout,我们可以定义以下函数：

def

dropout函数核心有两点：

1.mask = (torch.rand(X.shape) < keep_prob).float()
2. Y = mask * X / keep_prob

1.mask矩阵使用torch.rand可以产生0~1之间均匀分布的数字，< keep_prob(=1-p)处理后得到的矩阵中元素为True的概率为1-p,为False的概率为p，float()转换为1和0后，即完成了dropout的过程。mask矩阵和X相乘来模拟随机dropout(×0.0的即被失活，×1.0的即得到保留)2.mask * X即完成了p概率的dropout,再除以1-p是为了后面预测阶段无需更改网络
完整代码如下：

import

简洁实现

import

参考

深度学习中Dropout原理解析
神经网络Dropout层中为什么dropout后还需要进行rescale？
都9102年了，别再用Adam + L2 regularization了
l1正则与l2正则的特点是什么，各有什么优势？
《动手学习深度学习》-pytorch版
https://en.wikipedia.org/wiki/Norm_(mathematics)

uniapp 微信小程序手机号快速验证组件解密 encryptedData 获取手机号睡不着的可乐 uni-app 微信小程序
uniapp微信小程序手机号快速验证组件解密encryptedData获取手机号手机号快速验证组件该能力旨在帮助开发者向用户发起手机号申请，并且必须经过用户同意后，开发者才可获得由平台验证后的手机号，进而为用户提供相应服务。以下是旧版本组件使用指南，注意使用旧版本组件时，需先调用wx.login接口。建议开发者使用新版本组件，以增强小程序安全性。详情新版组件使用指南。因为需要用户主动触发才能发起手
软件测试基础知识必备之浅谈单元测试程序员阿沐软件测试软件测试单元测试
什么是单元测试？单元测试是指，对软件中的最小可测试单元在与程序其他部分相隔离的情况下进行检查和验证的工作，这里的最小可测试单元通常是指函数或者类。单元测试都是以自动化的方式执行，所以在大量回归测试的场景下更能带来高收益。单元测试代码里提供函数的使用示例，因为单元测试的具体表现形式就是对函数以各种不同输入参数组合进行调用。如何做好单元测试？1）代码的基本特征与产生错误的原因无论是开发语言还是脚本语言
《Oracle常见错误解析》 AAEllisonPang Oracle oracle 数据库
引言在Oracle数据库的日常管理和开发中，错误是不可避免的。无论是数据库管理员（DBA）还是开发人员，都可能在操作过程中遇到各种问题。Oracle数据库的复杂性使得错误的种类繁多，但幸运的是，大多数常见错误都有相对固定的解决方法。本文将为您详细解析20个Oracle常见错误，并提供针对性的解决方案，帮助您快速定位问题并高效解决，确保系统的稳定运行。背景Oracle数据库作为全球最广泛使用的关系型
Java高并发容器的内核解析：从无锁算法到分段锁的架构演进猿享天开开发语言 java
《Java高并发容器的内核解析：从无锁算法到分段锁的架构演进》本文将以JUC包核心容器为切入点，深入剖析ConcurrentHashMap在Java8中的64位Hash分段技术，解密LinkedBlockingQueue双锁队列设计的吞吐量秘密，并给出各容器在亿级流量场景下的性能压测对比与选型决策矩阵。一、BlockingQueue体系：生产者-消费者模式的工业级实现1.阻塞队列的四大行为矩阵行为
TensorFlow和Pytorch在功能上的区别以及优势 Honeysea_70 #算法 tensorflow pytorch 人工智能
功能上的区别1.计算图TensorFlow：使用静态计算图（StaticGraph）。在运行模型之前，需要先构建完整的计算图，然后通过会话（Session）运行图。优点是性能优化更高效，适合大规模分布式训练和生产环境部署。缺点是调试相对复杂，因为计算图的构建和运行是分离的。PyTorch：使用动态计算图（DynamicGraph）。计算图是动态构建和执行的，每次迭代都会重新构建图。优点是调试方便，
Js 获取url的参数值程序猿老罗前端前端 javascript
Js获取url的参数值，支持获取中文的值。//获取url中的参数值functiongetUrlParam(name){name=name.replace(/[\[\]]/g,"\\$&");varregex=newRegExp("[?&]"+name+"(=([^&#]*)|&|#|$)");varresults=regex.exec(window.location.href);if(!resul
【ROS实战】02-ROS架构介绍卓有成效的程序员 ROS ROS 机器人人工智能
1.简介你是否曾有过这样的疑问：我按照文档安装了ROS，依照要求写了一些示例节点（node）、消息（msg）和话题（topic），但觉得过程既麻烦又繁琐。也许你开始怀疑：为什么需要ROS？它到底帮我解决了什么问题？本文将通过一个简单的例子，介绍ROS的架构，阐明它解决了哪些问题，以及它如何帮助我们简化开发流程。2.移动案例假设我们要编写一个能够控制机器人移动的程序。随着程序的增多，我们需要进行模块
Laravel Breeze日语化插件：Breezejp——您的日本市场快速接入解决方案孔振冶Harry
LaravelBreeze日语化插件：Breezejp——您的日本市场快速接入解决方案breezejpLaravelBreeze(+LaravelUIとJetstream)を一瞬で日本語化し、言語切替機能も提供するパッケージです/Laravelの各種バリデーションメッセージも日本語化するのでBreeze無しでも便利✨项目地址:https://gitcode.com/gh_mirrors/br/br
C++ 各种map对比越甲八千【道阻且长C++】c++哈希算法开发语言
文章目录特点比较1.`std::map`2.`std::unordered_map`3.`std::multimap`4.`std::unordered_multimap`5.`hash_map`（SGISTL扩展）C++示例代码代码解释特点比较1.std::map底层实现：基于红黑树（一种自平衡的二叉搜索树）。元素顺序：元素按照键（key）的升序排列。键的唯一性：每个键只能出现一次，插入重复键的
无人机4G双链路技术分析！云卓SKYDROID 无人机云卓科技科普遥控器高科技链路
一、技术要点1.双链路架构设计同时接入两个独立的4G网络（如不同运营商或频段），采用冗余或聚合模式。冗余模式下链路互为备份，聚合模式下带宽叠加。支持动态切换逻辑，根据信号质量、延迟等参数选择最优链路。2.多模通信模块与协议支持集成双SIM卡或eSIM，兼容多运营商网络，支持多频段（如LTE-FDD/TDD）。需适配通信协议（如TCP/IP优化、QoS保障），确保数据完整性。3.数据分流与聚合数据分
AI进化论：从图灵测试到智能革命的临界点 A达峰绮人工智能数据处理经验分享 AIGC AI人工智能
智能觉醒的起源密码（1943-2010）在曼彻斯特维多利亚大学的实验室里，1948年"Baby"计算机完成人类首个存储程序运行实验时，艾伦·图灵正在构思《计算机器与智能》。这篇划时代论文提出的"模仿游戏"测试，为人工智能奠定了哲学基础。1956年达特茅斯会议上，麦卡锡正式提出"人工智能"概念，当时学界乐观预测"二十年内机器将完成人类所有工作"。神经网络的发展轨迹充满戏剧性：1958年罗森布拉特发明
AI时代个人财富增长实战指南：从零基础到精通变现的完整路径 A达峰绮人工智能
（本文基于人工智能技术发展规律，结合互联网经济底层逻辑，为普通从业者构建系统性AI应用框架）一、建立AI认知基础：技术理解与工具掌握技术分类认知人工智能工具分为四大功能模块：自然语言处理（文本生成、对话交互）、计算机视觉（图像视频处理）、数据分析（预测建模）、自动化控制（流程优化）。建议新手首先掌握语言类工具的基础操作，逐步扩展到其他领域。工具操作逻辑通用AI工具通常包含三大核心功能模块：输入界面
业务概念模型，你必须知道的建模分析工具 SystemEngineeringLab 统一建模语言需求分析
引言回想经历过不同的团队、不同的产品线、大量的产品需求迭代建设，在系统建设（多数是业务系统）中往往偏重于方案域求解，比如，而弱化或忽视对问题域的分析建模。这篇短文章浅谈一下“业务概念模型”，希望对大家有所帮助。什么是业务概念模型对于概念模型我们并不陌生，其本质是模型，是对某个域信息的建模，例如常见的E-R图是对数据模型的建模。多数情况下，作为技术我们更多的接触的是技术域的分析与建模。业务概念模型（
Sass：深度解析与实战应用 QQ828929QQ sass 前端 css
在前端开发的浪潮中，CSS预处理器因其强大的功能和灵活性而备受推崇。其中，Sass（SyntacticallyAwesomeStylesheets）无疑是这些预处理器中的佼佼者。本文将深入解析Sass的核心概念、语法特性以及实战应用，并通过代码样例展示其强大的功能。Sass是什么？Sass（SyntacticallyAwesomeStylesheets）是一种CSS预处理器，它允许我们使用变量、嵌
Java常用集合与映射的线程安全问题深度解析 QQ828929QQ java 安全开发语言
Java常用集合与映射的线程安全问题深度解析一、线程安全基础认知在并发编程环境下，当多个线程同时操作同一集合对象时，若未采取同步措施，可能导致以下典型问题：数据竞争：多个线程同时修改数据导致结果不可预测状态不一致：部分线程看到集合的中间状态内存可见性：线程本地缓存与主内存数据不同步死循环风险：特定操作引发无限循环（如JDK7的HashMap扩容）二、典型非线程安全集合问题分析1.ArrayList
Python - 爬虫；爬虫-网页抓取数据-工具curl MinggeQingchun Python 爬虫 curl python
一、爬虫关于爬虫的合法性通用爬虫限制：Robots协议【约定协议robots.txt】robots协议：协议指明通用爬虫可以爬取网页的权限robots协议是一种约定，一般是大型公司的程序或者搜索引擎等遵守几乎每一个网站都有一个名为robots.txt的文档，当然也有部分网站没有设定robots.txt。对于没有设定robots.txt的网站可以通过网络爬虫获取没有口令加密的数据，也就是该网站所有页
浅谈一家全球电商在Kubernetes环境上的CI/CD落地与实践 Docker_
云原生技术生态近几年狂飙猛进，现已成为互联网公司的主流服务端技术栈。公司要快速响应市场变化和需求变更，就离不开自动化流水线进行编译、打包和部署，如何基于Kubernetes落地CI/CD就是DevOps团队需要解决的首要问题之一，同时也是衡量公司DevOps能力成熟度的重要指标之一。本文主要分享iHerb在Kubernetes技术栈中CI/CD落地的情况和实施过程中的一些经验总结。背景本人目前就职
javaweb学习Day10 乐一粒学编程学习 java 开发语言
来源：尚硅谷2022版javaweb今日内容：1.日期和字符串之间的格式化//String->java.util.DateStringdateStr1="2021-12-3012:59:59";SimpleDateFormatsdf=newSimpleDateFormat("yyyy-MM-ddHH:mm:ss");try{Datedate1=sdf.parse(dateStr1);}catch(
【北上广深杭大厂AI算法面试题】计算机视觉篇...如何解决多尺度问题？努力毕业的小土博^_^ AI算法题库人工智能算法计算机视觉深度学习神经网络
【北上广深杭大厂AI算法面试题】计算机视觉篇…如何解决多尺度问题？【北上广深杭大厂AI算法面试题】计算机视觉篇…如何解决多尺度问题？文章目录【北上广深杭大厂AI算法面试题】计算机视觉篇...如何解决多尺度问题？前言数据级别的多尺度模型架构上的多尺度表示FPN代码示例（PyTorch）说明其他多尺度处理方法总结欢迎铁子们点赞、关注、收藏！祝大家逢考必过！逢投必中！上岸上岸上岸！upupup大多数高校
【大模型书籍PDF】从零开始大模型开发与微调：基于PyTorch与ChatGLM （推荐）_从零开始大模型开发与微调 pdf 喝不喝奶茶丫 pytorch 人工智能语言模型大模型转行大模型 AI大模型微调
今天又来给大家推荐一本大模型方面的书籍。本书使用PyTorch2.0作为学习大模型的基本框架，以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术，为读者揭示大模型开发技术。本书配套示例源代码、PPT课件。（书籍分享）
从零开始学习黑客技术，看这一篇就够了网络安全-旭师兄学习 web安全 python 密码学网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包黑客，对于很多人来说，是一个神秘的代名词，加之影视作品夸张的艺术表现，使得黑客这个本来只专注于技术的群体，散发出亦正亦邪的神秘色彩。黑客源自英文hacker一词，最初曾指热心于计算机技术、水平高超的电脑高手，尤其是程序设计人员，逐渐区分为白帽、灰帽、黑帽等。其中，白帽黑客被称为道德黑客。他们不会非法入侵用户网络，而是通过一系列测试检查
Python爬虫：数据抓取工具及类库详解 2401_84692751 程序员 python 爬虫开发语言
wget也是一个利用URL语法在命令行环境下进行文件传输的工具,其基本用法为wget[URL地址][参数],如:wgethttps://www.baidu.com其常用参数如下:下面例子演示如何使用wget镜像一个网站到本地并启动:使用wget--mirror命令将整个网站的镜像下载到本地wget--mirror-p--convert-linkshttp://www.httpbin.org切换到下
笔记-LeetCode 787: K 站中转内最便宜的航班我只是什么都不会而已算法
题目描述有n个城市通过一些航班连接。给你一个数组flights，其中flights[i]=[fromi,toi,pricei]，表示该航班都从城市fromi开始，以价格pricei抵达toi。现在给定所有的城市和航班，以及出发城市src和目的地dst，你的任务是找到出一条最多经过k站中转的路线，使得从src到dst的价格最便宜，并返回该价格。如果不存在这样的路线，则输出-1。代码模板（BFS+最短
《交互式线性代数》 wblong_cs 矩阵论线性代数矩阵
《交互式线性代数》*InteractiveLinearAlgebra*由DanMargalit和JosephRabinoff编写，是一本聚焦线性代数的教材。本书旨在教授线性代数的核心概念、方法及其应用，通过代数与几何相结合的方式，帮助读者深入理解线性代数的本质，培养解决实际问题的能力。核心内容线性方程组求解代数方法：介绍线性方程组的基本概念，如解的定义、解集等。通过消元法和行变换，将方程组转化为增
大语言模型学习路线：从入门到实战大模型官方资料语言模型学习人工智能产品经理自然语言处理搜索引擎
大语言模型学习路线：从入门到实战在人工智能领域，大语言模型（LargeLanguageModels,LLMs）正迅速成为一个热点话题。本学习路线旨在为有基本Python编程和深度学习基础的学习者提供一个清晰、系统的大模型学习指南，帮助你在这一领域快速成长。本学习路线更新至2024年02月，后期部分内容或工具可能需要更新。适应人群已掌握Python基础具备基本的深度学习知识学习步骤本路线将通过四个核
CSS的滑动门技术 xiao____ming html5 css3
在制作导航栏等网页元素时，常常需要为其设置特殊形状的背景，为了使各种特殊形状的背景能够自适应元素中文本的多少，即实现自由拉伸滑动，就出现了CSS滑动门技术。微信的导航栏：滑动门简单使用：Documenta{display:inline-block;height:33px;line-height:33px;background:url(to.png)no-repeat;margin:100px;pa
Java 中 final 与 effectively final yaoxin521123 【原来如此】java 开发语言
Java中final与effectivelyfinal一、为什么我们需要final和effectivelyfinal？为什么这些关键字重要？在Java中，一些变量需要在初始化后不再变化，以确保程序的安全性和可读性。为什么你需要关心final和effectivelyfinal？防止变量进一步修改导致的不可控度问题。提高代码可读性和维护性。对于区别final和effectivelyfinal来说，懂得
Java面试黄金宝典5 ylfhpy Java面试黄金宝典 java 面试开发语言职场和发展算法
1.ConcurrentHashMap和HashTable有哪些区别原理HashTable：它继承自Dictionary类，是Java早期提供的线程安全哈希表。其线程安全的实现方式是对每个方法都使用synchronized关键字进行同步。例如，在调用put、get等方法时，整个HashTable会被锁定，其他线程必须等待当前线程释放锁后才能访问该方法。javaimportjava.util.Has
个人陈述华中科技大学管理学院财务金融系 alexhus 力学AI有限元保研
t今天怀着无比激动的心情来向各位老师陈述我本科三年来的个人学习科研情况，并且十分感谢各位老师能够在百忙之中抽出时间阅读这份陈述。我来自安徽省淮北市，2009年9月通过高考进入华中科技大学学习，现为管理学院财务金融系财务管理0901班的学生。下面我将从学术背景、科研经历、学术兴趣、研究生阶段学习计划等方面来做具体的陈述。学术背景通过在华中科技大学管理学院财务金融系近三年的学习与积累，我在公司财务管理
树莓派4B arm平台aarch64 pip安装pytorch 纬领网络 pytorch arm 深度学习
比如你要安装torch1.7.1的版本，你执行下面这行命令pip3installtorch==1.7.1torchvision==0.8.2torchaudio==0.7.2-fhttps://torch.kmtea.eu/whl/stable-cn.html
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>