量子位

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

原作 Sebastian Ruder
王小新编译自 ruder.io
量子位出品 | 公众号 QbitAI

深度学习的基本目标，就是寻找一个泛化能力强的最小值，模型的快速性和可靠性也是一个加分点。

随机梯度下降（SGD）方法是1951年由Robbins和Monro提出的[1]，至今已有60年历史。在当前的深度学习研究中，这种方法至关重要，一般被用在反向传播过程中。

近年来，研究人员提出一些新的优化算法，使用了不同方程来更新模型参数。2015年Kingma和Ba提出的Adam方法[18]，可看作是目前最常用的优化算法之一。这表明，从机器学习工作者的角度来说，深度学习优化中的最佳方法在很大程度上是保持不变的。

然而，今年还有很多新的方法提出，这可能会影响接下来在模型优化中所使用的方法。在这篇文章中，Ruder从他的角度，介绍了深度学习优化方法中一些振奋人心的工作和可能的发展方向。阅读这篇文章时，要熟悉SGD方法和自适应学习率方法，如Adam方法。

改进Adam方法

尽管，像Adam这样的自适应学习率方法使用十分广泛，但是，在物体识别[17]和机器翻译 [3]等研究任务中，很多前沿的研究成果仍然在使用传统的带动量SGD方法。

Wilson等人在最新研究中[15]给出一些理由来说明，与带动量SGD方法相比，自适应学习率方法会收敛于不同的极小值，且结果通常不大理想。从经验上得出，在物体识别、字符级语言建模和句法分析等任务中，自适应学习率方法得到的极小值通常比带动量SGD方法得到的极小值要差。这似乎与直觉相反，因为Adam方法有很好的收敛机制，且其自适应学习率会比传统的SGD方法表现得更好。但是，Adam和其他自适应学习率方法也有一些局限性。

解耦权值衰减

在一些数据集上，Adam方法的泛化能力比带动量SGD方法要差的一个可能原因是权值衰减（weight decay）。权值衰减常被用于图像分类问题中，即在每次参数更新后，把衰减率W_t与权重θ_t相乘，其中衰减率W_t略小于1：

这能防止权重变得过大。因此，权值衰减也可以理解为一种L₂正则化项，这取决于施加在Loss上的权值衰减率W_t：

权值衰减方法一般可作为上述的正则化项，或是直接修改梯度，通常在很多神经网络库中有调用函数。在动量和Adam算法的更新方程中，通过与其他衰减项相乘来修改梯度值时，所以权值衰减与L₂正则化不一样。因此，Loshchilov和Hutter在2017年提出“解耦权值衰减”[19]，与原始定义相同，在每次参数更新后通过这种方法来更新梯度。

带动量和权值衰减的SGD方法（SGDW）按照以下方式更新梯度：

其中，η为学习率，第二个方程的第三项为解耦权值衰减。同样地，我们得到带权值衰减的Adam方法（AdamW）：

其中，m_t和m̂_t是第一时刻的偏差和偏差校正估计值，v_t和v̂_t是第二时刻的偏差和偏差校正估计值，β₁和β₂是相应的衰减率，且加入相同的权值衰减项。作者表示，这种方法大幅提高了Adam方法的泛化能力，且在图像分类数据集上与带动量SGD方法效果相当。

另外，它将学习率的选择过程与权值衰减的选择过程分离开，这能更好地实现超参数优化，因为超参数间不再互相依赖。它还把优化器的实现与权值衰减的实现过程分开，这有助于构建更简洁和可重用的代码，参考fast.ai AdamW/SGDW implementation（https://github.com/fastai/fastai/pull/46/files）。

固定指数移动平均值

最近的一些研究（Dozat and Manning, 2017[13]、Laine and Aila, 2017[16]）通过实验发现，调低β₂值，影响了Adam方法中过去平方梯度的指数移动平均值的贡献度。一般来说，β₂的默认值为0.999，设置为0.99或0.9后，在不同任务中表现更好，这表明可能存在指数移动平均值的问题。

ICLR 2018正在审核的一篇文章On the Convergence of Adam and Beyond（https://openreview.net/forum?id=ryQu7f-RZ）研究了这个问题，指出过去平方梯度的指数移动平均值是自适应学习率方法泛化能力不佳的另一个原因。自适应学习速率方法的核心，是通过过去平方梯度的指数移动平均值来更新参数，例如Adadelta，RMSprop和Adam。研究指数平均的贡献度，这个思路的动机性很好，能防止学习率随着训练而变得极小，这也是Adagrad方法的关键缺陷。但是，梯度的短期记忆性在其他情况下变成了阻碍。

在Adam方法收敛到一个次优解时，我们观察到一些小批次样本贡献了大幅且有效的信息梯度，但是这种情况很少发生，指数平均后减小了它们的影响，导致模型收敛性差。作者给出了一个简单的凸优化问题，可以看到Adam方法中也存在这种现象。

作者提出了一种新算法AMSGrad来解决这个问题，它使用过去平方梯度的最大值来更新参数，而不是先前的指数平均。AMSGrad方法的更新过程如下，这里不带有偏差校正估计：

实验表明，在小数据集和CIFAR-10数据集上，这种方法的性能比Adam方法更好。

调整学习率

在许多情况下，我们不需要改进和调整模型结构，而是该调整超参数。在语言建模中的一些最新研究表明，与更复杂的模型相比，调整LSTM参数[20]和正则化参数[21]就可以得到最先进的性能。

在深度学习优化中，一个重要的超参数就是学习率η。实际上，在SGD方法中，需要构建一个合适的学习率退火方案，来得到一个良好的收敛最小值。人们会认为，像Adam这样的自适应学习率方法，对不同的学习率更具有鲁棒性，因为这些方法能自我更新学习率。但是，即使对于这些方法，好的学习率和最佳的学习率也可能有很大的差别（Andrej Karpathy‏Verified account说最佳学习率是3e-4 https://twitter.com/karpathy/status/801621764144971776）。

Zhang在2017年的一个研究表明[2]，在调整学习率退火方案和动量参数后，该SGD方法的性能与Adam有得一拼，而且收敛速度更快。另一方面，我们可能认为Adam方法中学习率的自适应性可能模仿了学习速率退火，但是一个明确的退火方案仍然是有帮助的。因为，如果我们把SGD方法中的学习率退火添加到Adam中，它能在机器翻译任务中表现得比SGD方法更好，且更快地收敛[4]。

事实上，学习率退火方案似乎是一种新的特征工程，因为我们发现，改进的学习率退火方案能改善模型的最终收敛性能。Vaswani等人在2017年给出了一个有趣的例子[14]。在模型调参时，通常需要进行大规模的超参数优化，这个文章的创新点在于也把学习率退火方案当作是要优化的具体焦点。作者使用了Adam方法，其中β₁= 0.9，和非默认参数β₂= 0.98、ε=10^-9，这可以说对学习率η来说是最精细的退火方案之一：

其中d_model是模型参数的数目，且warmup_steps为4000。

Smith等人在2017年的另一篇论文[5]揭示了学习率和批次大小间的一个有趣关联。这两个超参数通常被认为是相互独立的，但是他们发现，减小学习率相当于增加批次大小，而后者能提高并行训练速度。反过来想，我们可以减少模型更新次数，并通过提高学习率和缩放批次大小来提高训练速度。这个发现影响到大规模深度学习的训练过程，可在不需要超参数调整的前提下，重新调整现有的训练计划。

热重启（warm restarts）

带重启的SGD方法

另一个最近提出的有效方法是SGDR[6]，Loshchilov和Hutter用热重启方式来替代学习率退火制度，来改进SGD方法。在每次重启时，学习率初始化为某个值，然后逐渐减少。重要的是，这种重启可随时进行，因为优化不是从头开始，而是从模型在上一个步骤收敛的参数开始的。关键在于，通过一个积极的余弦退火方案来调整学习率，这会很快地降低学习率，如下所示：

其中ηⁱ_min和ηⁱ_max是第i次训练时学习率的变化区间，T_cur表示从上次重启后已完成的迭代次数，且T_i规定了下一次重启的迭代次数。与常规的学习率退火方案相比，热重启方法（T_i=50，T_i=100和T_i=200）的性能如图1所示。

图1：加入热重启的学习率方法性能变化

重启后，用一个高的初始学习率能从根本上把参数从先前收敛的最小值弹射到损失函数曲面的不同区域。这种积极的退火机制使模型能快速收敛到一个新且更好的解决方案。作者通过观察还发现，使用热重启的随机梯度下降方法的所需时间比学习率退火机制少了2〜4倍，并能达到相当或更好的性能。

使用热重启的学习率退火也叫做循环变化学习率，最初由Smith[22]提出。fast.ai学生给出了另外两篇文章，讨论了热重启和循环变化学习率，地址如下：

https://medium.com/@bushaev/improving-the-way-we-work-with-learning-rate-5e99554f163b

http://teleported.in/posts/cyclic-learning-rate/

快照集成（Snapshot ensembles）

快照集成是一种最近由Huang提出的巧妙方法[7]，即在训练单个模型时使用热重启来组装一个集合，且基本上无额外的代价。这种方法可以训练一个单模型，按照之前看到的余弦退火制度收敛，然后保存模型参数，并进行热重启，重复这些步骤M次。最后，所有保存的模型快照形成一个集合。在图2中可以看到，常用的SGD优化在误差曲面上的性能与快照集成过程的性能差异。

图2：SGD与快照集成

一般来说，集成是否成功取决于组合中每个模型的多样性。因此，快照集成依赖于余弦退火方案的能力，使得模型在每次重启后能够收敛到不同的局部最优值。作者证明，这在实践中是成立的，在CIFAR-10、CIFAR-100和SVHN上取得了很好的效果。

带重启的Adam方法

热重启最初在Adam方法中并不适用，因为它的权值衰减不正常。在固定权值衰减后，Loshchilov和Hutter在2017年同样地把热重启扩展到Adam中。其中，ηⁱ_min= 0，ηⁱ_max= 1，得到：

建议开始时选取较小的T_i（迭代次数在1-10之间），并在每次重启时将其乘以一个系数T_mult，如2。

学习优化

去年最有趣的论文之一是Andrychowicz等人撰写的Learning to learn by gradient descent by gradient descent，也是reddit网友选出的“2016年最佳论文”[23]。他们训练了LSTM优化器，用于在训练主要模型时更新参数。不幸的是，学习单独的LSTM优化器，或是使用预先训练好的LSTM优化器进行优化，都会大大增加模型训练的复杂度。

今年还有一篇很有影响力的“learning to learn”论文，使用LSTM来生成特定领域语言的模型结构[24]。虽然搜索过程需要大量的资源，但是所发现的结构可以用来取代已有的结构。这个搜索过程已经被证明是有效的，并且在语言建模方面取得最先进的效果，并且在CIFAR-10上取得了很有竞争力的结果。

同样的搜索策略也可以应用于任何已经被手工定义其关键过程的其他领域，其中一个领域就是深度学习的优化算法。正如以前所看到的，优化算法十分符合这个规则：它们都使用了过去梯度的指数移动平均值（如动量）和过去平方梯度的指数移动平均值（如Adadelta，RMSprop，Adam）的组合[25]。

Bello等人[8]定义了一个特定领域的语言，由对优化有用的基元组成，如这些指数移动平均值。然后，他们从所有可能的更新规则空间中采样更新规则，使用此更新规则来训练模型，并基于测试集上训练模型的性能来更新RNN控制器。完整流程如图3所示。

图3：神经优化搜索

特别是，他们还定义了两个更新方程，即PowerSign和AddSign。PowerSign的更新公式如下：

其中，α是一个超参数，通常设为e或者2；f(t)设为1，或是衰减函数（随着时间步t重新执行线性、循环或衰减），其中m_t是过去梯度的移动平均值。通常，设置α= e，且无衰减。注意到，更新通过α^f(t)或1 /α^f(t)来缩放梯度，取决于梯度方向和移动平均值是否一致。这表明，这种类似动量的过去梯度和当前梯度之间的相似性是优化深度学习模型的关键信息。

AddSign定义如下：

其中，α通常设置为1或2，与上面类似，这次的尺度更新为α+f(t)或α−f(t)，取决于梯度方向的一致性。作者指出，PowerSign和AddSign在CIFAR-10上的表现优于Adam、RMSprop和带动量SGD方法，并能很好地转换到其他任务中，如ImageNet分类和机器翻译。

理解泛化

优化问题与泛化能力是密切相关的，因为模型收敛的最小值决定了模型的泛化能力。因此，优化问题的进展与理解这种极小值泛化能力的理论进展是密切相关的，且能更深入地理解深度学习中的泛化能力。

但是，我们对深度神经网络泛化能力的理解仍然很浅显。最近的研究表明，可能是局部极小值的数量随参数数量呈指数型增长[9]。考虑到目前深度学习结构中参数数量巨大，这样的模型能收敛且泛化能力较好，特别是考虑到它们可以完全记住随机输入[10]，这似乎看起来很神奇[10]。

Keskar等人[11]认为最小值的锐度是泛化能力不佳的原因，他们还特别指出，批次梯度下降所找到的尖锐极小值具有较高的泛化误差。这是直观的，因为我们通常会希望这个函数是平滑的，出现尖锐极小值表明相应误差曲面的高度不规则性。然而，近期研究表明，锐度可能不是一个好的指标，因为它表明局部最小值能够很好地泛化[12]，而且Eric Jang的Quora答案中也讨论了这些内容，链接如下：
https://www.quora.com/Why-is-the-paper-%E2%80%9CUnderstanding-Deep-Learning-Requires-Rethinking-Generalization%E2%80%9D-important/answer/Eric-Jang?srid=dWc3

有一篇ICLR 2018投稿论文（https://openreview.net/forum?id=r1iuQjxCZ），通过一系列消融分析，表明一个模型在激活空间中对单个方向有依赖性，即单个单元或特征图谱的激活是其泛化能力的良好预测。他们证明，这种模式适用于不同数据集上的训练模型，以及不同程度的标签损坏。他们还发现，加入Dropout并没有助于解决这个问题，而批次归一化阻碍了单方面的依赖性。

虽然以上这些研究表明仍然有很多我们不知道的深度学习优化知识，但要记住，收敛性保证和在凸优化中的很多现有工作和思路，在一定程度上也可应用于非凸优化问题中。NIPS 2016上大量的优化教程对该领域很多理论工作进行了很好的综述。

结论

我希望上面内容能很好地总结过去一年在深度优化问题中一些令人信服的发展。如果还有其他漏掉的方面，或是文章中有错误，请联系我。

文中提到的25篇文献，可以去原文文末自取：http://ruder.io/deep-learning-optimization-2017/

— 完 —

活动报名

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？_第11张图片

加入社群

量子位AI社群12群开始招募啦，欢迎对AI感兴趣的同学，加小助手微信qbitbot4入群；

此外，量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募，面向正在从事相关领域的工程师及研究人员。

进群请加小助手微信号qbitbot4，并务必备注相应群的关键词~通过审核后我们将邀请进群。（专业群审核较严，敬请谅解）

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？_第12张图片

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

RAID的介绍和实战操作
一RAID的介绍RAID（RedundantAarryofIndependentDisks）：廉价磁盘冗余阵列是一种通过将多个物理磁盘组合成一个逻辑单元来提高数据存储性能、可靠性或两者兼顾的技术。作用：提高性能：通过并行读写（数据分块）加速数据访问。增强容错能力：通过冗余数据（如镜像或校验）防止磁盘故障导致的数据丢失。扩展存储容量：将多个磁盘合并为更大逻辑单元。（简单说就是提高容错以及读写速率）类
java Script笔记
第一章,初始javascript1,javascript的基本概念JavaScript一种直译式脚本语言，一种基于对象和事件驱动并具有安全性的客户端脚本语言；也是一种广泛应用客户端web开发的脚本语言。简单地说，JavaScript是一种运行在浏览器中的解释型的编程语言。2,Javascript的特点解释性的脚本语言（代码不进行预编译）与其他脚本语言一样，JavaScript也是一种解释性语言，它
C语言动态内存管理 Oo৹Oo৹Oo৹ C语言 c语言开发语言青少年编程学习
1.为什么要动态内存C语言的数据结构(数组，结构体...)通常是固定大小的，即使是变长数组，在其作用域内依然是固定长度的。但是对于空间的要求，有些时候需要的空间大小在程序运行的时候才能知道，因此C语言引入动态内存开辟，让程序员自己可以申请和释放空间2.malloc和freeI.mallocmalloc函数可以用于开辟动态内存，这个函数向内存申请一块连续可用的空间，并返回指向这块空间的地址如果开辟成
《自我放松训练》读书笔记 dear心理咨询师黄倩雯
重复背诵一些有自己编排的指令，比如我的双臂在发热或者我的身体在变得越来越轻松，直到自己感觉到由该指令说描述的效果正在身体上出现，这类似于臆想和幻觉的演习，属于潜意识领域的内容。首先设想一个舒适的身体姿势，不要自己支撑着身体。松开身上的衣物首饰其实置身于安静舒适的环境中当发出指令时，要积极的为体察自己的感觉做好准备。发指令是这平时的深呼吸动作。做完一段动作是做些恢复身体灵敏动作。最后，积极的建议结束
告别项目混乱：基于 pnpm + Turborepo 的现代化 Monorepo 工程化最佳实践码力无边-OEC 前端 web 前端框架 javascript
告别项目混乱：基于pnpm+Turborepo的现代化Monorepo工程化最佳实践随着前端项目日益复杂，团队规模不断扩大，我们正面临一个棘手的问题：项目间的代码复用、依赖管理和构建流程变得越来越混乱。传统的“一个项目一个仓库”(Polyrepo)模式，导致了严重的“轮子”重复制造、版本不一致和协作效率低下。是时候引入一种更先进的组织方式了：Monorepo。它并不是一个新概念，Google、Fa
设计模式的详细介绍
目录六大原则（1）单一职责原则：（2）开闭原则：（3）里氏替换原则：（4）依赖倒置原则：（5）迪米特法则：（6）接口隔离原则：总结单例模式工厂模式简单工厂模式工厂方法模式抽象工厂模式建造者模式代理模式六大原则（1）单一职责原则：类的职责应该单一，一个方法只做一件事。职责划分清晰明了，每次改动到最小单位的类或者方法。使用建议：两个完全不一样的功能不能放在一个类中，一个类应该是一组相关性很高的函数、数
前端性能优化“核武器”：新一代图片格式(AVIF/WebP)与自动化优化流程实战
前端性能优化“核武器”：新一代图片格式(AVIF/WebP)与自动化优化流程实战当你的页面加载时间超过3秒时，用户的跳出率会飙升到40%以上。而在所有的前端性能优化手段中，图片优化无疑是投入产出比最高的一环。一张未经优化的巨大图片，就足以让你的所有努力付诸东流。然而，很多开发者对图片优化的理解还停留在“压缩一下JPG”的阶段。实际上，我们已经进入了一个由WebP和AVIF主导的新时代。这两种新一代
深入理解 Vue 3 中的 emit
深入理解Vue3中的emit在Vue3中，组件通信是开发中非常重要的一部分，其中通过emit实现父子组件通信是最常见的方式之一。emit的作用是：子组件可以通过触发自定义事件将数据传递给父组件。在本篇文章中，我们将从以下几个方面详细讲解emit的使用：基础概念使用方法与语法配合props实现完整的父子通信在TypeScript中的类型推断注意事项与最佳实践一、基础概念什么是emit？emit是Vu
你知道哪些淘宝优惠券返利 App 拥有最高的返利率吗？值得推荐的淘宝优惠券返利 App 排行榜！浮沉导师
返利App是一个比较新的应用类型，通过这些手机应用程序，你可以在购物时获得额外的折扣和奖励，进而达到省钱的目的。这些应用通常在网上商店中可以免费下载，并与不同的在线零售商界面相集成，以更好的服务用户。如果你是一位淘宝党，那么使用淘宝优惠券返利App真的非常值得推荐。在过去几年中，越来越多的淘宝返利应用程序已经被制作，并在各大应用商店上贴出来。一份返利App排行榜可供参考，不仅可以帮助你较快、更方便
CSS中隐藏滚动条的同时保留滚动功能码力无边-OEC HTML+CSS css 前端 web 网页开发
在CSS中，我们可以通过一些技巧来隐藏滚动条，同时保留滚动功能。以下是几种常用的方法和具体的实现步骤。1.使用overflow和::-webkit-scrollbar这种方法适用于大多数现代浏览器。通过设置overflow属性启用滚动，同时利用::-webkit-scrollbar来隐藏滚动条（此伪元素只适用于WebKit内核的浏览器，如Chrome和Safari）。实现步骤：/*隐藏滚动条，启用
数据湖与数据仓库在云平台的融合架构：Delta Lake实战指南 AI云原生与云计算技术学院 AI云原生与云计算数据仓库架构 ai
数据湖与数据仓库在云平台的融合架构：DeltaLake实战指南关键词：数据湖,数据仓库,云平台,融合架构,DeltaLake,湖仓一体,数据治理摘要：本文深入探讨数据湖与数据仓库在云平台的融合架构，以DeltaLake为核心技术载体，解析湖仓融合的技术原理、实施路径及最佳实践。通过对比传统数据架构的痛点，阐述DeltaLake如何通过ACID事务、Schema管理、时间旅行等特性实现非结构化数据湖
阅读‖《大概念教学》刘徽（第一章）楠木终有香
（引言）图解大概念和它的概念小伙伴这个部分作者列举了当下教育改革中出现的许多新的概念，讲解了这些概念为什么出现以及它们之间的关键。首先要明白，在社会的发展下，教育的生活价值显得尤为迫切，学生在校所学对学生的未来有多大的价值和意义。因此，学校教育就不能只是教教材，而要用教材教。作者解释:教教材是指只教书上的专家结论，而用教材教指的是通过专家结论来建立学生的专家思维，就是俗称的“像科学家一样思考，像文
好听的话别当真，难听的话别走心。 Cx33071
什么东西都是攒出来的，钱是，好感是，失望和悲伤也是。若重要，总会想办法。不重要，总会找理由。咬咬牙过完这段有点拧巴的日子，以后的所有都值得期待了。没有谁有义务陪你一起长大，半路上谁离开了也正常，但请你用绝对的理智和清醒，去压制自己内心的难受和爱。大部分事情都不能细想，也不要较真，否则就天天都很难过。生活是属于每个人自己的感受，不属于任何别人的看法。有人说：人生如粥，宜疾宜徐看火候；也有人说，人生如
2022年5月19日可转债晨报小智爱投资
今日可申购新债：杭氧转债：正股杭氧股份，发行规模11.37亿元，公司评级AA+，初始转股价格28.69元/股，当前转股价值96.514元，积极申购。今日上市新债：无强赎期内的转债：无。晚间公告汇总：1、垒知集团：发布公告，垒知转债5月20日上市，发行规模仅3.96亿，预估上市首日价格150元以上。2、精工钢构：发布公告，精工转债5月23日上市，发行规模20亿，当前转股价值88.4元，预估上市首日价
Extreme values modelling 绪论 Liam_ml
极端值建模和估算是各种应用领域的重要挑战，例如环境，水文，金融，精算科学。样本的极端部分可能非常重要。也就是说，它可能表现出更大的潜在风险，例如高浓度的空气污染物，洪水，极端索赔规模。一般而言，极端之建模有三个方面：UnivariateExtremeValueTheory:单变量极值理论。BivariateExtremeValueTheory:双变量极值理论MultivariateExtremeV
【Python】人脸识别宅男很神经 python 开发语言
第一章：计算机视觉与图像处理的基石在深入人脸识别之前，我们必须首先牢固掌握计算机视觉和图像处理的基本概念。人脸，本质上就是一张复杂的图像，对图像的理解是所有高级视觉任务的起点。1.1图像的本质：像素与数字化表示图像，在我们看来是连续的画面，但在计算机内部，它却是离散的数值矩阵。1.1.1什么是像素？图像的最小单元像素（Pixel），是构成数字图像的最小单位。可以将其想象成一个微小的彩色点。一张数字
我会养你一辈子，即使我爱的人是我妻子纵然没有纵然
我小时候长得四不像，不像爸，不像妈，不像姑，不像舅。以至于朋友现在看到我小时候的照片时，都会忍不住感叹一下，你在阿姨肚子里基因变异了吧。是真的又黑又丑，很不招人喜欢，至少，我的爷爷奶奶是真的很不喜欢我。当然，我奶奶不喜欢我，除了我长得丑，还有一部分原因是因为我老爸老妈。说起来，我爸爸的出生有点尴尬，他是家里第一个男丁，前面有一个姐姐，后面又出生了妹妹和弟弟。奶奶几乎把所有的爱都给了我的小姑和叔叔。
2018-01-23 Amybubu
“脱单不脱皮，脱贫不脱水，脱脂不脱色”，凡士林吾皇限量版礼盒简直是讲出了我的心声。神马前任的渣男，都不及吾皇带给妾身“一本正经的闭月羞花”！心动的美妞们，还不趁着汪年优惠的脚步，随Amy一同去最靠谱的凡士林天猫旗舰店剁手拔草666！~
中原焦点团队中级第二十六期李月苗坚持分享第164天 aa6d9fcc1298
2021.7.16约练了十几场咨询，大多数咨询师的大致思路：先找方向。聊大致的状况，需要解决的问题。明确目标；询问重要他人的观点，以便激发当事人解决问题的动力。；也可以用奇迹问句，为当事人勾画愿景，明确目标。用例外问句，找以前的成功经验。什么时候这件事不发生或者较少发生，让当事人多说一些这些例外是如何发生的。并鼓励当事人思考例外发生时的细节。最后反馈时，让当事人尝试多做例外经验，以促使当事人发生改
2023-02-03 每天微笑愉婉柔
20230203《会痛的不是爱》69笔记每场权力斗争都提醒了我曾经受伤的地方笔记：1有斗争，有挣扎，想防卫，这很正常。会受伤，难受，痛苦，这也很正常。无需去否认，抵触，想要尽快摆脱逃离这些。只需要去承认，去接受，去经历体验这些，并从这些里探索，哪些是过往的自己，以及现在的自己又可以如何。2权力斗争意味着我们活在经验中、恐惧中、防卫中；成长和疗愈带领我们活在体验中、对恐惧的直面中、对当下和关系伙伴的
你有清洁癖吗？最等闲
文/最等闲看到一个段子：网友看完《断舍离》，大受启发，顺手就把《断舍离》给扔了。清洁癖应该是“断舍离”的一个分支，即定时打扫和整理你的所有事物，来达到心灵整洁和愉悦的一种方式。其实这是一种值得推广的习惯，但中国文化的博大精深之处一方面就体现在文字上，带病字框的词语，大多数情况下并不是好的词语。清洁的频率太高，涉入的事物太多，不仅达不到心灵的愉悦和整洁感，反而会使自己身心疲惫，甚至烦躁不安。这种程度
2018-09-05：闲话驿舟
之一：傅雷夫妇之死上海江苏路284弄5号1966年9月3日，凌晨两只凳子同时倒下凳子倒在棉被上凳子只是倒了而已果真没有发出任何声响之二：与月有关的日月潭是台湾的月牙泉是甘肃的蓝月谷是云南的我所知道的与月有关的仅此三个蓝月谷我去过很美很美另外两个也很美吧我心底里想去但不敢夸下海口说这两个地方我一定会去美的地方还有很多如果真的没去原谅我吧我只是一个共和国的极普通的公民之三：头鱼查干湖的头鱼很值钱上次又
除了猫粮和猫罐头，资深铲屎官还会喂这种香蕉码头
相信绝大多数养猫的人平时喂猫一般都选择猫粮+罐头，这样的方法，但是今天推荐另外的一种高阶喂猫方法，就是冻干！什么是冻干呢？冻干，顾名思义就是用低温脱水技术，让肉里的水分迅速脱离，保持营养的同时，还利于保存。一般来说，冻干是脱水后的产物，所以很多斤鲜肉，才能制作出一斤冻干，所以冻干的价格自然就很贵。冻干也分主食冻干和零食冻干主食冻干可以代替猫粮长期喂食，因为除了肉本身之外，主食冻干还添加了不少猫咪需
Android平台上的高效文本编辑器实现与应用溪水边小屋
本文还有配套的精品资源，点击获取简介：在Android应用开发中，实现复杂的文本编辑功能是一个常见需求。”android-text-editor”是一个为Android定制的准文本编辑器组件，使用Kotlin语言编写，提供扩展的文本编辑功能。该编辑器支持富文本编辑，插入多媒体，查找替换，撤销/重做操作，代码高亮，手势控制，夜间模式和自定义主题等特性。开发者可以通过简单配置和事件监听来集成这个组件，
学生信息管理系统的VFP数据库设计与实现溪水边小屋
本文还有配套的精品资源，点击获取简介：《学生管理系统vfp数据库》是一个基于VisualFoxPro（VFP）的学生信息管理软件，旨在帮助教育机构记录、管理学生数据并提供分析功能。该系统包括数据库设计、用户界面设计、数据操作、事务处理、报表统计、安全性管理、程序架构及代码优化等核心功能。学生管理系统是VFP数据库开发的学习和实践平台，适用于初学者。1.VisualFoxPro数据库开发基础Visu
我的这帮学生们真让我哭笑不得体验者旁观者
我的这帮学生们真让我哭笑不得我一整天都在处理学生的事情，我的头都要大了，满脑子都是事情，这个学生那个家长，象炸开了花，都需要去处理。本以为没有的事却也有事！我都要一个一个去给他们交谈，给他们信心，让他们自立自强，要有远大的目标和志向。他都没读过书，见过世面，哪有什么目标和志向。更谈不上有大的胸怀与格局了。一上午给这学生谈话，与家长交流，教学生解决学不下去的方法。有些问题是家长的教育问题，思想观念。
骗子无处不在俞小宁
昨晚去健身，黄教练说可能她妈妈和她妹妹被骗了，我问怎么回事，她说她姑姑叫她妈妈和妹妹每人交七万多元投资某个项目，一年后每人会得到八十万元的收益。可能吗？一年有十几倍的收益，肯定是骗局！骗子们很会抓住别人贪心、爱赚小便宜的心态，放出诱饵，让别人上钩，骗到钱就跑路。我去年也被一位以前的好友拉上钩，投7700元，有几百倍的收益，如果没实现，由她本人赔我，其实，我是一千个不相信一万个不相信，最后，我说：我
北京秋天的街道竹子黄了
北京秋天的街道黄叶在纷纷地飘我来到这里好多年心❤也在四处飘骑着小黄车寻找归属晚餐在哪里我不知道图片发自App北京秋天的街道荷塘的月色在飘我在四环的街边徜徉闻着成熟的味道我的未来不是梦我心里知道要付出努力才能见分晓图片发自App北京秋天的街道麻辣的味道在飘我想起我的家乡我的母亲在田埂上远眺我的初恋已成过去自行车和汽车要各有各的道图片发自App2019年8月12日夜
直播声卡什么牌子的音质比较好,2022 年直播声卡推荐选购指南测评君高省
直播声卡和平时我们用的声卡有什么区别吗？大家要注意哈，直播用的声卡，和我们平时电脑自带的声卡、专业录音声卡是有区别的。直播声卡的功能更偏向于娱乐，有较多的特效，比如混音、降噪、闪避、哄笑、变声等特效，对说话的声音也有一定的美化效果。录音真卡则更偏向于专业录音，着重对音质的表现，而直播所需要的特效，则是没有的（不过，专业录音声卡通过后期安装机架，也可以实现直播功能）。怎么选择直播声卡呢？哪些直播声卡
京东不够99如何免运费？京东拒收快递需要承担运费吗？氧惠导师
在京东商品购物的时候，很多消费者都会考虑运费的问题，因为根据平台的规则，订单金额要达到99元才可以享受免配送费的服务。但并不是每一单都能凑够99元，在不满99元的情况下，怎么操作才能免运费呢？拒收需不需要承担运费？➤推荐网购薅羊毛app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、外卖红包返利等。（应用市场搜“氧惠
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理