All_In_gzx_cc

pytorch快速上手（8）-----pytorch优化器简介

文章目录

一、简介
二、optimizer
- 属性
- 方法
- - 1. zero_grad()
  - 2. step()
  - 3. add_param_group()
  - 4. state_dict()
  - 5. load_state_dict()
- 学习率
- 动量
三、常见优化器介绍
- 1. BGD（Batch Gradient Descent）
- 2. Stochastic Gradient Descent（SGD）
- 3. Mini-Batch Gradient Descent(MBGD)
- 4. SGD + Momentum（动量梯度下降）
- 5. Nesterov accelerated gradient（NAG）
- 6. Adagrad（自适应梯度/Adaptive Gradient）
- 7. RMSProp（Root Mean Square Propagation）
- 8. AdaDelta（自适应增量）
- 9. Adam（自适应矩阵/Adaptive Momentum Estimation）

深度学习五个步骤： 数据 ——> 模型 ——> 损失函数 ——> 优化器 ——> 迭代训练，通过前向传播，得到模型的输出和真实标签之间的差异，也就是 损失函数，有了损失函数之后，模型反向传播得到 参数的梯度，接下来就是 优化器根据这个梯度去更新参数。

一、简介

pytorch的优化器：更新模型参数。

在更新参数时一般使用梯度下降的方式去更新。梯度下降常见的基本概念

导数：函数在指定坐标轴上的变化率；
方向导数：指定方向上的变化率；
梯度：一个向量，方向为方向导数取得最大值的方向。

所以梯度是一个向量，方向是导数取得最大值的方向，也就是增长最快的方向，而梯度下降是沿着梯度的负方向去变化。

二、optimizer

class Optimizer:
    defaults: dict
    state: dict
    param_groups: List[dict]
 
    def __init__(self, params: _params_t, default: dict) -> None: ...
    def __setstate__(self, state: dict) -> None: ...
    def state_dict(self) -> dict: ...
    def load_state_dict(self, state_dict: dict) -> None: ...
    def zero_grad(self, set_to_none: Optional[bool]=...) -> None: ...
    def step(self, closure: Optional[Callable[[], float]]=...) -> Optional[float]: ...
    def add_param_group(self, param_group: dict) -> None: ...

属性

defaults: 优化器的超参数，主要存储一些学习率、momentum的值等等
state: 用来存储参数的一些缓存。例如使用momentum的时候，需要用到前几次的梯度，就存在这。
params_groups: 管理参数组。是一个list。list的每一个元素是一个字典。字典中有一个’params’的key，其对应的值才是真正的参数。

方法

1. zero_grad()

清空所管理参数的梯度。

参数是一个张量，张量有梯度grad.

pytorch有一个特性：张量梯度是不会清零的。在每一次反向传播采用autograd计算梯度的时候，是累加的。

所以应当在梯度求导之前（backward之前）把梯度清零。

2. step()

step()会执行当前采用的优化器策略进行参数更新，具体的策略有很多种，例如随机梯度下降法，momentum加动量的方法，自适应学习率的方法等，后面会具体介绍。

3. add_param_group()

添加一组参数到优化器中。

优化器可以管理很多参数，这些参数是可以分组的。我们对不同组的参数可以有不同的超参数的设置。例如在模型的fintune中，对模型前面特征提取的部分希望他的学习率小一些，更新的慢一些；而后面的自己定义的全连接层，希望学习率更大一些。这样就可以把整个模型分成两组，一组是前面特征提取的参数，一组是后面全连接层的参数

4. state_dict()

获取优化器当前状态信息字典。

optimizer = optim.SGD([weight], lr=0.1, momentum=0.9)
opt_state_dict = optimizer.state_dict()
 
print("state_dict before step:\n", opt_state_dict)
 
for i in range(10):
    optimizer.step()
 
print("state_dict after step:\n", optimizer.state_dict())
# 训练10次之后将模型的参数保存下来
torch.save(optimizer.state_dict(), os.path.join(BASE_DIR, "optimizer_state_dict.pkl"))

5. load_state_dict()

加载状态信息字典

optimizer = optim.SGD([weight], lr=0.1, momentum=0.9)
state_dict = torch.load(os.path.join(BASE_DIR, "optimizer_state_dict.pkl"))
 
print("state_dict before load state:\n", optimizer.state_dict())
optimizer.load_state_dict(state_dict)
print("state_dict after load state:\n", optimizer.state_dict())

学习率

在梯度下降的过程中，学习率起到控制参数更新的一个步伐的作用。

若没有学习率，随着迭代次数的增多，loss值反而越来越大，说明在参数更新过程中，步子迈的太大，反而跳过了最优值，这时需要一个参数来控制这个跨度，这个就是学习率。

动量

Momentum(动量、冲量)：结合当前的梯度与上一次更新的信息，用于当前更新。

所以在考虑动量的情况下，可以更快的走到山脚下，也就是说参数更新的更快。那动量是怎么用于参数更新的呢？

先看一下指数加权平均的概念，指数加权平均在时间序列中经常用于求取平均值的一个方法，它的思想是这样，求取当前时刻的平均值，距离当前时刻越近的那些参数值，它的参考性越大，所占的权重就越大，这个权重是随时间间隔的增大呈指数下降，所以叫做指数滑动平均。公式如下：

v_t是当前时刻的一个平均值，这个平均值有两项构成，

一项是当前时刻的参数值 θ_t , 所占的权重是1-β，这个 β 是个参数。
另一项是上一时刻的一个平均值，权重是 β 。

假设给了一系列 day-温度的数据，求解第100天温度的平均值


可以发现，beta 越小，就会发现它关注前面一段时刻的距离就越短，比如0.8，会发现往前关注20天基本上后面的权重都是0了，意思就是说这时候是平均的过去20天的温度，而0.98关注过去的天数会非常长，也就是说这时候平均的过去50天的温度。所以β 在这里控制着记忆周期的长短，或者平均过去多少天的数据对现在的影响。参数β 常设置为0.9，也就是 1/(1-β) 等于10，关注过去10天左右的温度，如下图是不同β 下温度的一个变化曲线：

红色的那条，是 beta=0.9，也就是过去10天温度的平均值；
绿色的那条，是 beta=0.98，也就是过去50天温度的平均值；
黄色的那条，beta=0.5，也就是过去2天的温度的平均。

在理解指数加权平均之后，来看一下加了Momentum的梯度下降，其基本思想是计算梯度的指数加权平均，并利用该梯度更新权重，pytorch中实现：

普通的梯度下降：
Momentum梯度下降：

所以当前梯度的更新量会考虑到当前梯度，上一时刻的梯度，前一时刻的梯度，这样一直往前，越往后的权重越小。下面通过代码来了解一下momentum的作用

def func(x):
    return torch.pow(2*x, 2)    # y = (2x)^2 = 4*x^2        dy/dx = 8x

iteration = 100
m = 0.0     # .9 .63

lr_list = [0.01, 0.03]

momentum_list = list()
loss_rec = [[] for l in range(len(lr_list))]
iter_rec = list()

for i, lr in enumerate(lr_list):
    x = torch.tensor([2.], requires_grad=True)

    momentum = 0. if lr == 0.03 else m
    momentum_list.append(momentum)

    optimizer = optim.SGD([x], lr=lr, momentum=momentum)

    for iter in range(iteration):

        y = func(x)
        y.backward()

        optimizer.step()
        optimizer.zero_grad()

        loss_rec[i].append(y.item())

for i, loss_r in enumerate(loss_rec):
    plt.plot(range(len(loss_r)), loss_r, label="LR: {} M:{}".format(lr_list[i], momentum_list[i]))
plt.legend()
plt.xlabel('Iterations')
plt.ylabel('Loss value')
plt.show()

三、常见优化器介绍

pytorch中的优化器可以大体分为两类：

一类是基于SGD及其优化，
另一类是Per-parameter adaptive learning rate methods（逐参数自适应学习率方法），如AdaGrad、RMSProp、Adam等。

1. BGD（Batch Gradient Descent）

梯度更新规则：
BGD采用整个训练集的数据来计算 cost function 对参数的梯度

缺点：
由于在一次更新中，是对整个数据集计算梯度，所以训练速度慢，如果训练集很大，需要消耗大量的内存，且全量梯度下降不能进行在线模型参数更新。

2. Stochastic Gradient Descent（SGD）

SGD是通过每个样本迭代更新一次，如果样本量很大的情况，那么可能只用到其中的部分样本数据参数就能更新到最优，对比BGD,一次迭代需要全部的数据，一次迭代不可能达到最优，迭代10次就需要将训练集训练10次。

缺点：
1、如果样本中噪音比较多，使得SGD并不是每次迭代向着整体最优化的方向进行；
2、SGD因为更新比较频繁，会造成 cost function 有严重的震荡；
3、可能会收敛到局部最优，但由于震荡会跳过最优。

3. Mini-Batch Gradient Descent(MBGD)

梯度更新规则：
MBGD 每次利用一小批样本，即n个样本进行计算，这样可以降低参数更新时的方差，收敛更稳定，另一方面可以利用矩阵操作来进行更有效的梯度计算。

缺点：
1、MBGD 不能保证很好的收敛性，learning rate 如果选择太小，收敛速度慢，选择太大，会使得 cost function 在极小值附近震荡（一种解决措施是先设置大一点的learning rate，当达到某个阈值时，就减少learning rate，不过这个阈值要提前设定）；
2、对所有的参数更新时应用同样的learning rate，如果数据是稀疏的，更希望对频率出现低的特征进行大一点的更新。

注：深度学习中的SGD优化算法是指mini-batch SGD(MBGD)

torch.optim.SGD(params, lr=<required parameter>, momentum=0, dampening=0, weight_decay=0, nesterov=False)

param: 管理的参数组
lr: 初识学习率
momentum：动量系数，
beta weight_decay: L2正则化系数
nesterov: 是否采用NAG

4. SGD + Momentum（动量梯度下降）

将之前的梯度都联系起来，不再是每一次梯度都是独立的情况。让每一次参数的更新方向不仅仅取决于当前位置的梯度，还受到上一次参数更新方向的影响。

优点：
通过过去梯度信息来优化下降速度，如果当前梯度与之前梯度方向一致时候，收敛速度得到加强，反之则减弱。换句话说，加快收敛同时减小震荡。

缺点：
可能在下坡过程中累计动量太大，冲过极小值点。

另外，pytorch中的 SGD with momentum 已经在optim.SGD中的参数momentum中实现。

5. Nesterov accelerated gradient（NAG）

NAG（加速梯度下降）相比于动量梯度下降的区别是，通过使用未来梯度来更新动量。即将下一次的预测梯度∇θJ(θ−η⋅m)考虑进来。
参数更新公式为：

与普通的momentum的区别如下图

在pytorch中，通过参数nesterov=True 来实现Nesterov Momentum。
优点：
1、相对于动量梯度下降法，因为NAG考虑到了未来预测梯度，收敛速度更快（如上图）。
2、当更新幅度很大时，NAG可以抑制震荡。例如起始点在最优点的左侧←，γm对应的值在最优点的右侧→，对于动量梯度而言，叠加η∇1 使得迭代后的点更加远离最优点→→。而NAG首先跳到γm对应的值→，计算梯度为正，再叠加反方向的η∇2 ←，从而达到抑制震荡的目的。

6. Adagrad（自适应梯度/Adaptive Gradient）

AdaGrad在训练过程中动态调整学习率，对不同参数根据累计梯度平方和更新不同学习率。
参数更新公式：

其中⊙是点乘，相当于求梯度的平方。ϵ为防止除0及维持数据稳定的极小项，一般取10^(-6)
因为s是梯度平方和的累加项，所以：

1、梯度一直变化较大的参数，学习率下降也较快，即高频特征使用较小学习率。
2、梯度一直变化较小的参数，学习率下降也较慢，即低频特征使用较大学习率。
3、因为累加性，学习率的趋势是不断衰减的，这也符合迭代后期靠近极值点时需设置较小的学习率的直观想法。

优点： 每个变量都有适应自己的学习率

缺点： 由于学习率的不断衰减在迭代过程早期衰减过快可能直接导致后期收敛动力不足，使得AdaGrad无法获得满意的结果。

pytroch实现：

torch.optim.Adagrad(params, lr=0.01, lr_decay=0, weight_decay=0, initial_accumulator_value=0)

7. RMSProp（Root Mean Square Propagation）

针对于AdaGrad的学习率衰减过快缺点，RMSProp通过指数加权移动平均(累计局部梯度信息)替代累计平方梯度和来优化AdaGrad，使得远离当前点的梯度贡献小。
迭代更新公式：

其中β为RMSProp的衰减因子。s为关于梯度的指数加权移动平方和，初始值为0。⊙为点乘，即对应项乘积。

优点： 在Adagrad基础上添加衰减因子，在学习率更新过程中权衡过去与当前的梯度信息，减轻了因梯度不断累计导致学习率大幅降低的影响，防止学习过早结束。

缺点： 引入了超参数β,增加模型复杂性。同时依赖全局学习率η。
pytorch中的实现：

torch.optim.RMSprop(params, lr=0.01, alpha=0.99, eps=1e-08, weight_decay=0, momentum=0, centered=False)

8. AdaDelta（自适应增量）

AdaDelta是针对于Adagrad的另一种优化，它相对于RMSProp，使用参数θ变化量的指数加权移动平方和替换了全局学习率η。其思想是利用一阶方法近似模拟二阶牛顿法。

sg为关于梯度的指数加权移动平方和，sΔθ是关于参数θ变化量的指数加权移动平方和。二者初始值设为0。ϵ是维持数据稳定的常数，一般设置为10^{-6}。
在AdaDelta优化中，分子可以看成一个动量加速项，通过指数加权方式累积先前的梯度变化量。分母项则是与RMSProp一样，所以也可以将RMSProp看成是AdaDelta的一种特殊情况。
优点：
不需要人工设置学习率。

9. Adam（自适应矩阵/Adaptive Momentum Estimation）

Adam融合了RMSProp及Momentum的思想，做到了学习率自适应和动量加速收敛的效果。
参数更新公式为：

其中第三和第四项是s和m的偏差修正值，使得过去的梯度权值和为1，防止值过小。超参数一般设置为β=0.999, γ=0.9, ε=10^-8。

torch.optim.Adam(params, lr=0.001, betas=(0.9, 0.999), eps=1e-08, weight_decay=0, amsgrad=False)

参考链接： https://blog.csdn.net/Dear_learner/article/details/123219459

Ubuntu系统上为Cursor编辑器添加dock栏图标熊明才 ubuntu 编辑器 linux
我来帮您在Ubuntu系统上为Cursor编辑器添加dock栏图标。我们需要创建一个desktopentry文件。让我们创建一个新的.desktop文件：/usr/share/applications/cursor.desktop[DesktopEntry]Version=1.0Type=ApplicationName=CursorComment=AI-firstcodeeditorExec=/h
Manjaro /opt/google/chrome error 熊明才 chrome 前端
mingcai@Manjaroin/opt/google/chrome[22:34:02]$./google-chrome[62841:62841:0516/223407.119870:ERROR:process_singleton_posix.cc(353)]其他计算机(mingcai-systemproductname)的另一个GoogleChrome进程(2931)好像正在使用此个人资料。C
基于 Vue 的拖拽缩放卡片组件：实现思路、方法及使用指南 Jiaberrr javascript 前端 vue.js 前端框架
引言在前端开发中，实现可交互的组件能够极大地提升用户体验。本文将介绍一个基于Vue封装的可缩放卡片组件，从实现思路、代码具体实现以及使用方法等方面进行详细阐述，帮助开发者更好地理解和运用这一组件。项目源码地址：https://gitcode.com/Jiaberrr/vue3-pc-template实现思路定位与布局：通过position:absolute对卡片进行定位，利用left、top、ri
微信小程序加载H5页面及与H5页面通信的实战教程 Jiaberrr 小程序微信小程序前端 javascript webview
在微信小程序的开发过程中，我们有时需要在小程序中嵌入H5页面。本文将详细介绍如何在微信小程序中通过webview加载H5页面，并实现小程序与H5页面的通信。一、准备工作搭建微信小程序开发环境，具体步骤请参考官方文档：https://developers.weixin.qq.com/miniprogram/dev/framework/quickstart.html准备一个H5页面，可以是本地文件或线
港科夜闻 | 香港科大与微软亚洲研究院签署战略合作备忘录,推动医学健康教育及科研协作... 香港科大内地办(北京) microsoft 人工智能
关注并星标每周阅读港科夜闻建立新视野开启新思维1、香港科大与微软亚洲研究院签署战略合作备忘录，推动医学健康教育及科研协作。根据备忘录，双方将结合各自于科研领域的优势，携手推动医学健康领域的交流与合作。合作方向将涵盖人才培训、革新智慧医疗服务及发展医疗科技研究等三大范畴，全面推动及提升未来医学教育。香港科大在早期已与微软公司有多方面的合作，探索不同领域的研究。本次双方进一步深化协作，并专注于AI与生
多云架构下JuiceFS实现一致性与低延迟数据分发的深度解析 GZM888888 数据库
多云架构下JuiceFS实现一致性与低延迟数据分发的深度解析一、JuiceFS在多云架构中的角色与优势1.JuiceFS简介JuiceFS是一个高性能的分布式文件系统，专为云原生环境设计，支持多种公有云和私有云的对象存储服务。它通过将数据存储在对象存储中，而将元数据存储在高性能的元数据服务中，实现了数据的高效管理和访问。JuiceFS的这种设计使其在多云架构中具有显著的优势，能够提供一致性和低延迟
【SpringAOP】Spring AOP 底层逻辑：切点表达式与原理简明阐述 GGBondlctrl SpringBoot java 后端切点表达式 Spring AOP 代理模式
前言本期讲解关于springaop的切面表达式和自身实现原理介绍~~~感兴趣的小伙伴看一看小编主页：GGBondlctrl-CSDN博客你的点赞就是小编不断更新的最大动力那么废话不多说直接开整吧~~目录️1.切点表达式1.1execution表达式1.2@annotation1.自定义注解2.切面类3.添加注解️2.SpringAOP原理2.1代理模式1.静态代理（了解）2.动态代理（八股）2.2
星火文档问答上线！定制你的专属知识库 AI 研究所人工智能
放眼全球，大模型正从热烈讨论走向应用落地。麦肯锡最新研究报告，生成式AI有望为全球经济贡献约7万亿美元的价值，并将AI的总体经济效益提高50%左右。一方面，越来越多工作实现自动化与智能化。另一方面，企业与个人依旧要每天处理海量数据，从技术文档、市场分析、产品介绍到公司规章制度。如何利用大模型强大自然语言处理能力，盘活企业知识库资产，配备一个24小时在线的“企业大脑”呢？成为企业大脑大模型依旧存在挑
2024最新「阿里」Java高级工程师面试高频题：JVM+Redis+并发+算法+框架 2401_89285777 java 面试 jvm
Java集合22题ArrayList和Vector的区别。说说ArrayList,Vector,LinkedList的存储性能和特性。快速失败(fail-fast)和安全失败(fail-safe)的区别是什么？hashmap的数据结构。HashMap的工作原理是什么?Hashmap什么时候进行扩容呢？List、Map、Set三个接口，存取元素时，各有什么特点？Set里的元素是不能重复的，那么用什么
F#语言的计算机基础编程小筑包罗万象 golang 开发语言后端
F#语言的计算机基础引言在现代编程的世界中，随着计算机科学的发展，编程语言的种类也在不断增加。F#作为一种函数式编程语言，借助于.NET平台的强大功能，正在受到越来越多程序员的关注。本文将深入探讨F#语言的基础知识与计算机科学的关系，以帮助读者更好地理解这一语言的特点及其应用。一、F#语言概述1.1F#语言的起源F#语言最初由微软研究院的DonSyme开发，其设计目的是为了支持函数式编程，同时与.
解锁面向对象编程：Python 类与对象详解 Yui_ python python 开发语言笔记学习
大家好，我是Yui_如果文章知识点有错误的地方，请指正！和大家一起学习，一起进步如有不懂，可以随时向我提问，我会全力讲解~如果感觉博主的文章还不错的话，希望大家关注、点赞、收藏三连支持一下博主哦~！你们的支持是我创作的动力！我相信现在的努力的艰辛，都是为以后的美好最好的见证！人的心态决定姿态！欢迎讨论：如有疑问或见解，欢迎在评论区留言互动。点赞、收藏与分享：如觉得这篇文章对您有帮助，请点赞、收藏并
GB和GB/T的区别是什么？详解国家标准的不同分类怎么睡不醒(づ ●─● )づ经验分享微信公众平台
GB和GB/T的主要区别体现在标准的性质、意义、定义以及法律效力上。一、标准的性质•GB：GB是国家标准的代号，它表示的是必须执行的强制性标准。这类标准通常对全国经济、技术发展有重大意义，且在全国范围内统一执行。•GB/T：GB/T表示的是推荐性国家标准，其中“T”代表推荐的意思。这类标准在生产、交换、使用等方面，通过经济手段或市场调节而自愿采用。二、意义与定义•GB：强制性标准是保障人体健康、人
初始JavaEE篇 —— 文件操作与IO 我要学编程(ಥ_ಥ) JavaEE java-ee java 开发语言文件操作 IO
找往期文章包括但不限于本期文章中不懂的知识点：个人主页：我要学编程程(ಥ_ಥ)-CSDN博客所属专栏：JavaEE目录文件介绍Java标准库中提供操作文件的类文件系统操作File类的介绍File类的使用文件内容操作二进制文件的读写操作文本文件的读写操作文件介绍文件分为两种：一种是狭义上的文件；另一种是广义上的文件。狭义的文件就是指机器上存储数据的地方，在电脑上面，C盘、D盘这些就可以称为文件；而广
# 云原生技术的未来：构建灵活高效的下一代应用架构随着企业数字化转型的加速，云原生技术正逐渐成为构建现代化应用程序的关键支柱。通过云原生技术，企业能够利用云计算的强大功能，快速构建、部署和扩展应用小zzzzzzzz 云原生架构云计算
云原生技术的未来：构建灵活高效的下一代应用架构随着企业数字化转型的加速，云原生技术正逐渐成为构建现代化应用程序的关键支柱。通过云原生技术，企业能够利用云计算的强大功能，快速构建、部署和扩展应用程序，适应市场需求的快速变化。云原生不仅改变了软件开发的方式，也重塑了企业的IT架构。本文将探讨云原生的核心概念、应用场景、未来发展趋势以及面临的挑战。1.云原生技术的核心概念云原生（CloudNative）
# 区块链技术的未来：重新定义信任与数字世界的基础区块链技术近年来迅速崛起，作为一种分布式账本技术，它以其去中心化、不可篡改和透明的特性，吸引了金融、供应链、医疗等多个行业的广泛关注。区块链不仅是小zzzzzzzz 区块链分布式账本去中心化
区块链技术的未来：重新定义信任与数字世界的基础区块链技术近年来迅速崛起，作为一种分布式账本技术，它以其去中心化、不可篡改和透明的特性，吸引了金融、供应链、医疗等多个行业的广泛关注。区块链不仅是加密货币（如比特币）的基础技术，更正在成为构建未来数字世界的重要基石。本文将探讨区块链的基本原理、应用场景、未来发展趋势以及面临的挑战。1.区块链的基本原理区块链是一种通过加密技术和共识算法实现的分布式账本系
# 边缘计算的未来：推动实时智能化应用的关键技术随着物联网（IoT）、5G和人工智能（AI）的发展，边缘计算正在成为推动智能化应用的重要技术之一。通过在设备本地或网络边缘进行数据处理，边缘计算能够小zzzzzzzz 人工智能边缘计算物联网
边缘计算的未来：推动实时智能化应用的关键技术随着物联网（IoT）、5G和人工智能（AI）的发展，边缘计算正在成为推动智能化应用的重要技术之一。通过在设备本地或网络边缘进行数据处理，边缘计算能够减少延迟、降低带宽消耗，并在需要快速决策的场景中提供实时响应能力。与云计算相比，边缘计算能够在网络的“边缘”进行更多的智能处理，从而优化整体系统的效率和可靠性。本文将探讨边缘计算的核心概念、应用场景、未来发展
事务隔离机制（超详细）上官花雨 oracle 数据库
学习目标那什么是事务？事务的四大特性一、原子性二、一致性三、隔离性四、持久性事务的生命周期一、开始事务二、执行事务操作三、提交事务四、回滚事务五、事务结束事务的并发控制一、并发控制的基本概念二、并发控制的目标三、并发控制的方法四、并发控制中的其他问题五、并发控制的实现与优化事务隔离机制又是什么？一、定义与目的二、隔离级别的分类三、实现原理四、应用场景与权衡事务隔离机制有几个嘞？一、事务隔离级别的分
Java 如何只测试某个类或方法：Maven与IntelliJ IDEA的不同方法及注意事项 2301_79306982 java intellij-idea
1.使用Maven只测试某一个类或方法(1)测试一个类Maven提供了通过命令行运行特定测试类的能力：mvn-Dtest=ClassNametest示例：mvn-Dtest=fileIOTesttest这将只运行fileIOTest类的所有测试方法。(2)测试一个具体方法如果只想运行某一个类中的特定测试方法，可以指定类名和方法名：mvn-Dtest=ClassName#methodNametest
Redis 中 TTL 的基本知识与禁用缓存键的实现策略（Java）码农研究僧 Java 缓存 redis java 缓存策略
目录前言1.基本知识2.Java代码前言找工作，来万码优才：#小程序://万码优才/r6rqmzDaXpYkJZF单纯学习Redis可以看我前言的Java基本知识路线！！对于Java的基本知识推荐阅读：java框架零基础从入门到精通的学习路线附开源项目面经等（超全）【Java项目】实战CRUD的功能整理（持续更新）在Java项目中，Redis配置了全局的TTL时间，后续想到可以通过设定单个key的
在 Azure 100 学生订阅中新建 Ubuntu VPS 并部署 Mastodon 服务器 shelby_loo 服务器 azure ubuntu
今天想和大家分享一下如何在Azure的100学生订阅中，创建一台UbuntuVPS，并通过Docker部署Mastodon服务器。Mastodon是一个开源的社交网络平台，允许用户创建自己的实例，类似于Twitter，但更加去中心化。Docker则是一个容器化技术，能够让我们轻松地打包和运行应用程序，使得部署和管理变得简单高效。使用到的Docker和Mastodon软件简介Docker是一种开源平
mac配置 iTerm2 使用lrzsz与服务器传输文件 YAIMZA Linux macos 服务器 lrzsz
mac配置1.安装支持rz和sz命令的lrzszbrewinstalllrzsz2.下载iterm2-send-zmodem.sh和iterm2-recv-zmodem.sh两个脚本#克隆仓库gitclonehttps://github.com/aikuyun/iterm2-zmodem~/iterm2-zmodem#进入到仓库目录cd~/iterm2-zmodem#设置脚本文件可执行权限chmo
redis.call()和redis.pcall()的区别荆州克莱面试题汇总与解析 spring cloud spring boot spring 技术 css3
redis.call()与redis.pcall()很类似,他们唯一的区别是当redis命令执行结果返回错误时，redis.call()将返回给调用者一个错误，而redis.pcall()会将捕获的错误以Lua表的形式返回redis.call()和redis.pcall()两个函数的参数可以是任意的Redis命令：eval"returnredis.call('set','foo','bar')"0
C#关于架构框架与的CRUD思考 Daniel的万事通杂货铺 Winform应用开发 c#架构开发语言
在C#中进行CRUD（创建、读取、更新、删除）操作时，选择合适的架构框架对于项目的可维护性、扩展性和性能至关重要。以下是一些关于CRUD操作和架构框架的思考点：1.架构模式MVC(Model-View-Controller):这是一种广泛使用的Web应用架构模式，特别是在ASP.NETMVC中。它将应用程序分为三个主要部分：模型（数据和业务逻辑）、视图（用户界面）和控制器（处理输入并响应）。这种分
数据仓库的复用性：深入的主题域设计方案 PersistDZ 数据仓库大数据
以下是深入的主题域设计方案，涵盖从基础理论、业务分析到技术实现的各个层面，力求全面、实用，适用于复杂业务场景（例如：企业级多租户SaaS系统或跨领域的大型数据仓库建设）。深入的主题域设计方案1.核心理念与原则1.1核心理念主题域设计是数据仓库的逻辑分层方法之一，其核心理念是：业务驱动：主题域应源于业务需求，并映射业务逻辑。高内聚、低耦合：一个主题域只关注一个业务主题，减少跨域依赖。面向复用：通过合
大数据框架之kafka详解 xingchensuiyue 大数据 zookeeper kafka kafka
目录1kafka介绍1.1kalka是什么？1.2Kafka内部原理1.3为什么需要消息队列？2Kafka的消息系统语义3Kafka生产过程分析3.1写入方式3.2分区（Partition）3.3副本（Replication）3.4Producer写入流程3.5消费者组3.6消费方式扩展：纠删码技术1kafka介绍1.1kalka是什么？可以简单的将kafka看做是一种消息队列，启动生产者与消费者
RV1126+FFMPEG推流项目(6)视频码率及其码率控制方式学习嵌入式的小羊~ ffmpeg 音视频
视频从采集到编码再到线程获取编码后的数据，已经全部说完。接下来继续来说应该比较重要的，和视频相关的。就是码率。视频码率及其码率控制方式一、什么是码率？视频码率是指在单位时间内传输的视频数据量，通常以kbps（千位每秒）为单位。视频的质量与码率有密切关系，通常来说，码率越高，视频的清晰度和精度也越高。高码率的视频与原始的YUV文件更加接近，但同时也意味着更大的文件体积和更高的带宽要求。视频码率与分辨
蓝桥杯算法题——K好数（Python DP方法）韩仙男 Python刷题算法动态规划 python
蓝桥杯算法题——K好数（Python方法）题目重现问题描述输入格式输出格式输入样例输出样例数据规模与约定解题思路理解题目带备忘录的动态规划（DP）方法可能的坑代码题目重现蓝桥杯算法题ALGO-3K好数原题链接:link.问题描述如果一个自然数N的K进制表示中任意的相邻的两位都不是相邻的数字，那么我们就说这个数是K好数。求L位K进制数中K好数的数目。例如K=4，L=2的时候，所有K好数为11、13、
消息中间件的基础概念入门全镇人的希望概念消息平台 kafka
目录一、什么是消息中间件1.1、简介1.2、消息中间件的主要作用解耦合异步通信负载均衡可靠性与持久性消息路由与调度削峰事务支持监控与审计跨平台和跨语言支持二、常用消息中间件对比2.1、RabbitMQ2.1.1、特点2.1.2、适用场景2.2、ApacheKafka2.2.1、特点2.2.2、适用场景2.3、ActiveMQ2.3.1、特点2.3.2、适用场景2.4、Redis（使用Pub/Sub
mysql rr实现原理_MySQL 锁 ——No.4 当前读、快照读、快照读实现原理及RC｜RR 隔离级别下的 InnoDB 的非阻塞读如何实现... weixin_39740346 mysql rr实现原理
当前读诸如select...lockinsharemode、select...forupdate、update、delete、insert均为当前读；当前读本质上是加了锁的增删该查语句，无论上的是共享锁还是排他锁均为当前读.这些语句被称为当前读的根本原因是因为它读取的是记录的最新版本，并且在读取之后，还需保证其他事务不能修改当前记录，对读取的记录加锁；上面的除select语句加的是共享锁外，其他的
【Meetup回顾第1期】竟是这样的国产数据库，YashanDB技术内幕曝光运维数据库
4月1日，由深圳计算科学研究院崖山数据库系统YashanDB团队策划的第1期技术Meetup【崖山论“见”】于线下顺利举办。YashanDB研发总监欧伟杰博士带来了《开门见山|崖山数据库系统有啥不一样》的精彩分享，以下为活动回顾。YashanDB：面向混合负载的创新架构YashanDB是一款基于统一内核，支持单机/主备、共享集群、分布式等多种部署方式，覆盖OLTP/HTAP/OLAP交易和分析混合
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod