zz的学习笔记本

【深度学习】吴恩达课程笔记(四)——优化算法

笔记为自我总结整理的学习笔记，若有错误欢迎指出哟~

【吴恩达课程笔记专栏】
【深度学习】吴恩达课程笔记(一)——深度学习概论、神经网络基础
【深度学习】吴恩达课程笔记(二)——浅层神经网络、深层神经网络
【深度学习】吴恩达课程笔记(三)——参数VS超参数、深度学习的实践层面

吴恩达课程笔记——优化算法

八、优化算法
- 1.优化算法介绍
- 2.批量梯度下降（Batch Gradient Descent）
- - 目的
  - 步骤
  - 优点
  - 缺点
- 3.随机梯度下降（Stochastic Gradient Descent, SGD）
- - 目的
  - 步骤
  - 优点
  - 缺点
- 4.小批量梯度下降（Mini-batch Gradient Descent）
- - 目的
  - 步骤
  - 优点
  - 缺点
  - 理解
  - 如何选择mini-batch size
- 5.指数加权平均数（Exponentially Weighted Averages）
- - 目的
  - 步骤
  - 优点
  - 缺点
  - 具体加权过程举例
  - 指数加权平均的偏差修正
- 6.动量梯度下降法 (Gradient descent of Momentum)
- - 目的
  - 基本原理
- 7.RMSprop
- - 目的
  - 优点
  - 基本原理
- 8.Adam 优化算法(Adam optimization algorithm)
- - 简介
  - 工作方式
  - 优点
  - 算法
- 9.学习率衰减(Learning rate decay)
- - 做法
  - 几种公式
- 10.局部最优问题

八、优化算法

1.优化算法介绍

当涉及深度学习优化算法时，我们通常会面临一个目标：最小化一个损失函数。这个损失函数衡量了模型预测与实际值之间的差距。为了找到最佳的模型参数，我们需要使用优化算法来调整这些参数，以便最小化损失函数。

以下是一些常用的深度学习优化算法：

梯度下降（Gradient Descent）：通过计算成本函数相对于参数的梯度，并沿着梯度的反方向更新参数，以最小化成本函数。
随机梯度下降（Stochastic Gradient Descent, SGD）：与梯度下降类似，但是每次迭代中只使用一个样本来计算梯度，这在大型数据集上更有效。
小批量梯度下降（Mini-batch Gradient Descent）：结合了批量梯度下降和随机梯度下降的优点，每次迭代使用一小批样本来计算梯度。
指数加权平均数（ Exponentially weighted averages）：常用于计算梯度的指数加权平均或者计算参数的指数加权平均。
动量梯度下降法 (Gradient descent of Momentum) ：梯度下降算法的一种改进版本，它结合了梯度下降和动量的概念。
RMSProp：通过考虑梯度的平方的指数衰减平均值来调整学习率，以应对Adagrad的学习率急剧下降问题。
Adam 优化算法(Adam optimization algorithm) ：在训练神经网络时有效地调整参数，并能够适应不同参数的变化情况，结合了动量梯度下降法和RMSProp算法。
学习率衰减(Learning rate decay) ：在训练神经网络时逐渐降低学习率的过程。

这些算法都有各自的优劣势，适用于不同类型的深度学习任务。在实际应用中，通常需要根据具体问题和数据集的特点来选择合适的优化算法。

2.批量梯度下降（Batch Gradient Descent）

目的

批量梯度下降是为了优化模型参数，使得损失函数达到最小值，从而实现训练数据的拟合和模型的泛化能力。

步骤

初始化参数：随机初始化模型参数或采用预训练的参数作为初始值。
对于整个训练样本集合进行如下操作：
- 计算梯度：计算损失函数关于所有训练样本的参数的梯度，即
  $\nabla J(\theta) = \frac{1}{m} \sum_{i=1}^{m} \nabla J(\theta; x^{(i)}, y^{(i)})$
- 更新参数：利用所有训练样本的梯度信息，按照梯度下降的更新规则来更新模型参数：
  $\theta = \theta - \eta \cdot \nabla J(\theta)$
  其中， ( η ) 是学习率， ( m ) 是训练样本的数量。

优点

可以保证收敛性，即在合理的学习率下，批量梯度下降一定可以找到全局最优解或局部最优解。

缺点

当训练样本很大时，计算所有训练样本的梯度会非常耗时，尤其在内存有限的情况下。
对于大规模数据集，批量梯度下降的计算效率较低。

3.随机梯度下降（Stochastic Gradient Descent, SGD）

目的

随机梯度下降（Stochastic Gradient Descent, SGD）是梯度下降法的一种变种

通过每次迭代仅利用单个训练样本的梯度信息，来更新模型参数，从而减少计算开销，并加快收敛速度。

步骤

初始化参数：随机初始化模型参数或采用预训练的参数作为初始值。
对于每个训练样本 (x⁽ⁱ⁾, y⁽ⁱ⁾) 进行如下操作：
- 计算梯度：计算损失函数关于当前样本的参数的梯度，即
  
  $\nabla J(\theta; x^{(i)}, y^{(i)})$
- 更新参数：利用当前样本的梯度信息，按照梯度下降的更新规则来更新模型参数：
  
  $\theta = \theta - \eta \cdot \nabla J(\theta; x^{(i)}, y^{(i)})$
  
  其中，（ η ）是学习率。

优点

减少计算开销：由于每次仅利用单个样本来更新参数，相比批量梯度下降，SGD在计算上更为高效。
适用于大规模数据集：特别适用于大规模数据集，因为每次迭代只需要处理一个样本。

缺点

不稳定性：由于每次迭代仅利用单个样本，使得更新方向带有较大的随机性，可能导致收敛过程不稳定。
学习率调整困难：学习率的选择对于SGD的影响较大，需要谨慎调整。

4.小批量梯度下降（Mini-batch Gradient Descent）

目的

小批量梯度下降是为了优化模型参数，使得损失函数达到最小值，从而实现训练数据的拟合和模型的泛化能力。

步骤

初始化参数：随机初始化模型参数或采用预训练的参数作为初始值。
对于每个小批量样本(x⁽ⁱ⁾, y⁽ⁱ⁾) 进行如下操作：
- 计算梯度：计算损失函数关于当前小批量样本的参数的梯度，即
  $\frac{1}{m} \sum_{i=1}^{m} \nabla J(\theta; x^{(i)}, y^{(i)})$
- 更新参数：利用当前小批量样本的梯度信息，按照梯度下降的更新规则来更新模型参数：
  $\theta = \theta - \eta \cdot \frac{1}{m} \sum_{i=1}^{m} \nabla J(\theta; x^{(i)}, y^{(i)})$
  其中， ( η ) 是学习率， ( m ) 是小批量样本的大小。

优点

小批量梯度下降结合了梯度下降和随机梯度下降的优点，可以更快地收敛到局部最优解。
可以充分利用矩阵运算的并行性，提高计算效率。

缺点

需要调节的超参数更多，如学习率 ( η ) 和小批量样本的大小 ( m )。
需要对数据进行分批处理，增加了实现的复杂性。

理解

定义梯度下降时使用一次全部样本集合为一代。

batch梯度下降的 J 会不断下降；mini-batch梯度下降的 J 不一定会不断下降，但是整体呈现下降趋势。

两者都需要多次遍历全部数据集才会有效果。在mini-batch中，如果只经历一代，那么梯度下降的效果虽然比batch一代好，但总体效果仍是微小的。
使用mini-batch时，每重新开始遍历一次数据集，应当把数据集中的数据重新打乱分配到mini-batch中，体现出随机性

如何选择mini-batch size

小训练集：使用batch gradient decent（m less than 2000）
通常的minibatch size：64、128、256、512、1024

5.指数加权平均数（Exponentially Weighted Averages）

目的

指数加权平均数用于对时间序列数据进行平滑处理，以便观察数据的长期趋势。

步骤

假设给定一个序列 ( x₁, x₂, …, x_t )，其指数加权平均数 ( v_t) 的计算方式为：

$v_t = \beta v_{t-1} + (1-\beta) x_t$
( 0 < < 1 ) 被称为平滑因子，较大的平滑因子意味着新观测值对平均数的影响更大，从而使得平均数更快地适应最新的观测值；而较小的平滑因子则意味着平均数更加稳定、更不容易受到新观测值的影响。

( v₀ ) 可以被初始化为 0 或者 x₁ ，为了在开始时确定初始的指数加权平均数值

优点

对不同时刻的数据赋予不同的权重，更加灵活地适应数据变化。
计算高效，每次更新只需要一次乘法和一次加法运算。

缺点

对于某些特定类型的数据，可能对异常值（outliers）过于敏感，从而影响平均值的准确性。

具体加权过程举例

假设英国去年第t天的气温是θ_t

要用一条曲线拟合温度变化，可以进行如下操作
$v_0=0 \\ v_t=\beta v_{t-1}+(1-\beta)\theta_t$

其中 v_t 是第t天附近的 1/(1-) 天的平均天气。

为什么这么规定？

$（1-ε）^{1/ε}约等于\frac{1}{e}（数学中一个挺重要的数）\\ 这说明\frac{1}{1-\beta}天之外的数所占的权重总共不到\frac{1}{e}，不那么值得关注了$

$\beta = 0.9\\ (1-0.1)^{\frac{1}{0.1}} = 0.9^{10} \\ \beta = 0.98 \\ (1-0.02)^{\frac{1}{0.02}} = 0.98^{50}$

可以看出越大，平均的天数越大，拟合得越粗略。

红色：=0.9；绿色：=0.98

指数加权平均的偏差修正

由于v₀=0，v₁= v₀ + (1-) θ₁ = （1-）θ₁，前几个v_i的值会非常的小，如图中紫线。当迭代到一定数量之后，拟合才变得正常（紫线逼近绿线）。

偏差修正的目的是为了消除初始时刻的平均值对整体平均值的影响。偏差修正可以通过以下公式实现：
$\hat{v_t} = \frac{v_t}{1 - \alpha^t} \\ \hat{v_t} 表示经过偏差修正后的平均值\\ v_t 表示未经修正的平均值\\ \beta 为平滑因子\\ t 表示时间步\\$
通过偏差修正，可以有效地减小最初几个数据点对平均值的影响，得到更加准确和稳定的指数加权平均值。

6.动量梯度下降法 (Gradient descent of Momentum)

目的

加速梯度下降过程

基本原理

传统的梯度下降法在更新参数时只考虑当前的梯度值，而动量梯度下降法引入了一个额外的动量项，用于模拟物理中的动量效应。

在每次参数更新时，动量梯度下降法会根据当前梯度和上一次的动量来计算一个更新量，并将该更新量应用于参数。更新量由两部分组成：一部分是当前梯度的方向，另一部分是上一次动量的方向。

蓝线是一般梯度下降的成本函数值迭代情况，红线是动量梯度下降法中成本函数迭代境况。

我们使用指数加权平均来计算新的dW和db。在竖直方向上，由于平均值接近0，所以动量梯度下降的竖直方向迭代值接近0 。在水平方向上，动量梯度下降的迭代值则为正常水平。
$\beta \cdot dw_{t-1} + (1 - \beta) \cdot \frac{\partial J}{\partial w}\\ db = \beta \cdot db_{t-1} + (1 - \beta) \cdot \frac{\partial J}{\partial b}\\ w = w - \alpha \cdot dw\\ b = b - \alpha \cdot db\\$

$\beta 是动量系数,通常取0.9\\ \alpha 是学习率\\ J 是损失函数\\ dw_{t-1} 和 db_{t-1} 表示上一次的权重和偏置更新量\\ \frac{\partial J}{\partial w} 和 \frac{\partial J}{\partial b} 分别是损失函数对权重和偏置的偏导数\\ w 和 b 分别表示更新后的权重和偏置$

7.RMSprop

目的

解决传统梯度下降法中学习率衰减过快的问题。RMSprop通过对梯度的平方进行指数加权移动平均来调整学习率，从而加速模型的训练。

优点

使用它的时候可以适当加大学习率

基本原理

如图，我们不想要绿线，而想要蓝线。

我们需要计算一个额外变量S，S等于目前数据附近水平方向或竖直方向的d_X的方差。

我们在更新数据（W、b）的时候，把原来要减掉的d_X除以这个方差，那么方差大的方向变化量就减少，方差小的方向变化量就仍处于正常水平甚至增大。

8.Adam 优化算法(Adam optimization algorithm)

简介

adam是训练神经网络中最有效的优化算法之一。它结合了momentum和RMSprop。

工作方式

计算上一个梯度的指数加权平均，存储在v中。
计算上一个梯度指数加权平均的平方，存储在s中。
使用adam的规则更新参数。

优点

通常比较节省内存（尽管还是比GD和momentum多）
即使在低学习率条件下也能运行得很好

算法

$\begin{cases} v_{dW^{[l]}} = \beta_1 v_{dW^{[l]}} + (1 - \beta_1) \frac{\partial \mathcal{J} }{ \partial W^{[l]} } \\ v^{corrected}_{dW^{[l]}} = \frac{v_{dW^{[l]}}}{1 - (\beta_1)^t} \\ s_{dW^{[l]}} = \beta_2 s_{dW^{[l]}} + (1 - \beta_2) (\frac{\partial \mathcal{J} }{\partial W^{[l]} })^2 \\ s^{corrected}_{dW^{[l]}} = \frac{s_{dW^{[l]}}}{1 - (\beta_1)^t} \\ W^{[l]} = W^{[l]} - \alpha \frac{v^{corrected}_{dW^{[l]}}}{\sqrt{s^{corrected}_{dW^{[l]}}} + \varepsilon} \end{cases} \\ l = 1, ..., L$
其中：

t是adam进行到的步数
L是神经网络的层数
₁（建议使用0.9）和 ₂（建议使用0.999）是控制两个指数加权平均的
α 是学习率
ε 是一个用来放置分母为0的值很小的数

9.学习率衰减(Learning rate decay)

做法

在不同的代（epoch）上使用递减的学习率

几种公式

$\alpha=\frac{1}{1+decayrate*epochnum}*\alpha_0 \\ \alpha=a^{epochnum}*\alpha_0 \\ \alpha=\frac{k}{\sqrt{epochnum}}*\alpha_0 \\ 手动调整\alpha的值$

10.局部最优问题

在神经网络规模较大、参数较多的时候，实际上很难达到局部最优点，更有可能达到的是鞍点。因此梯度下降被困在局部最优点不是很大的问题。
鞍点会减缓学习速度，而momentum、RMSprop、Adam正式可以解决这种问题

哈希基础例题稠密的连通图算法复习之字符串字符串算法哈希数据结构 hash
文章目录例题一：子串查找例题二：字符串的删除操作例题三：字符串合并操作的应用哈希前置知识请戳这里->哈希绪论昨天我们对哈希的基础知识有了一定的了解，并已经知道了如何求子串、拼接子串的哈希值，今天我们就这两个操作分析一些基础例题，加深理解和掌握。例题一：子串查找LOJ#103.子串查找显然这是一道kmp算法的模板题朴素的做法是枚举文本串的每一个位置作为模式串开始比较的位置。设枚举到主串的位置是iii
python 虚拟环境介绍 The One Neo python 开发语言
一、pippip介绍很简单，但是在学习深度学习的时候，虽然用过，但也仅仅是用过，对其了解不多，更多的是下载包，相对于pip，用的更多的反而是anaconda和miniconda这两个python包管理器。pip是Python的包管理工具，主要用于安装、更新、卸载Python软件包。它是Python官方推荐的工具，能够从PythonPackageIndex(PyPI)下载并安装符合指定依赖关系的包。
2025最新Transformer模型及深度学习前沿技术应用 weixin_贾 Python MATLAB python 深度学习 MATLAB编程深度学习模型图神经网络自编码物理信息神经网络目标检测大语言模型
第一章、注意力（Attention）机制1、注意力机制的背景和动机（为什么需要注意力机制？注意力机制的起源和发展里程碑）。2、注意力机制的基本原理（什么是注意力机制？注意力机制的数学表达与基本公式、用机器翻译任务带你了解Attention机制、如何计算注意力权重？）3、注意力机制的主要类型：键值对注意力机制（Key-ValueAttention）、自注意力（Self-Attention）与多头注意
tensorflow keras 报错：No gradients provided for any variable 原因与解决办法研志必有功 tensorflow报错 tensorflow 深度学习机器学习神经网络自然语言处理
错误分析Nogradientsprovidedforanyvariable这个意思是没有梯度给已知的所有函数，为什么会出现这个错误呢，因为在深度学习中，梯度的更新是由于反向传播算法的实现的，如果损失函数没有与已知的任何（除输入）层关联，那么，损失函数就无法求出关于各个函数的梯度，导致错误解决办法例如损失函数defcontrastive_loss_layer(left_inputs,right_in
golang游戏开发学习笔记-开发一个简单的2D游戏(基础篇） 2401_86638887 golang 学习笔记
go-glexamplego-gl的示例代码二.基础概念这里涉及到的概念在之前的文章里基本上都有过介绍，不再赘述。不过大家有兴趣可以去看一看碰撞检测的一些算法实现三.依赖没有新增任何依赖四.资源准备我们创建的游戏世界里有两个地方需要用到纹理资源（贴图），一是组成世界的方块、二是游戏主角。由于方块是静态的，不需要动画效果，所以只需要一张贴图就可以了。而游戏主角则需要多张纹理图像来组成运动时的动画。要
element ui 中 Cascader 级联选择器实现动态加载动态禁用入门_cascader动态加载(2) 2401_84619606 程序员前端面试学习
专业技能一般来说，面试官会根据你的简历内容去提问，但是技术基础还有需要自己去准备分类，形成自己的知识体系的。简单列一下我自己遇到的一些题HTML+CSSJavaScript前端框架前端性能优化前端监控模块化+项目构建代码管理信息安全网络协议浏览器算法与数据结构团队管理开源分享：【大厂前端面试题解析+核心总结学习笔记+真实项目实战+最新讲解视频】最近得空把之前遇到的面试题做了一个整理，包括我本人自己
Day60 图论part10 2401_83448199 图论
今天大家会感受到Bellman_ford算法系列在不同场景下的应用。建议依然是：一刷的时候，能理解原理，知道Bellman_ford解决不同场景的问题，照着代码随想录能抄下来代码就好，就算达标。二刷的时候自己尝试独立去写，三刷的时候才能有一定深度理解各个最短路算法。Bellman_ford队列优化算法（又名SPFA）代码随想录importjava.util.*;publicclassMain{pu
代码随想录算法训练营第 42 天 |LeetCode 188.买卖股票的最佳时机IV LeetCode309.最佳买卖股票时机含冷冻期 LeetCode714.买卖股票的最佳时机含手续费 HIT最菜电控代码随想录算法训练营算法 leetcode c++数据结构动态规划
代码随想录算法训练营Day42代码随想录算法训练营第42天|LeetCode188.买卖股票的最佳时机IVLeetCode309.最佳买卖股票时机含冷冻期LeetCode714.买卖股票的最佳时机含手续费目录代码随想录算法训练营前言LeetCode188.买卖股票的最佳时机IVLeetCode309.最佳买卖股票时机含冷冻期LeetCode714.买卖股票的最佳时机含手续费一、LeetCode18
代码随想录算法训练营第16天|LeetCode112路径总和LeetCode113路径总和iiLeetCode106.从中序与后序遍历序列构造二叉树LeetCode105从前序与中序遍历序列构造二叉树 HIT最菜电控代码随想录算法训练营算法开发语言 leetcode 数据结构 c++
代码随想录算法训练营Day16代码随想录算法训练营第16天|LeetCode112路径总和LeetCode113路径总和iiLeetCode106.从中序与后序遍历序列构造二叉树LeetCode105.从前序与中序遍历序列构造二叉树目录代码随想录算法训练营前言LeetCode112路径总和,LeetCode113路径总和iiLeetCode106.从中序与后序遍历序列构造二叉树LeetCode10
数据结构与算法（两两交换链表中的结点）银迢迢算法笔记链表数据结构
原题24.两两交换链表中的节点-力扣（LeetCode）给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。示例1：输入：head=[1,2,3,4]输出：[2,1,4,3]示例2：输入：head=[]输出：[]示例3：输入：head=[1]输出：[1]解答建立一个虚拟结点virtual指向head，cur=virtu
数据结构与算法（删除链表的倒数第n个结点）银迢迢算法笔记链表数据结构
原题19.删除链表的倒数第N个结点-力扣（LeetCode）给你一个链表，删除链表的倒数第n个结点，并且返回链表的头结点。示例1：输入：head=[1,2,3,4,5],n=2输出：[1,2,3,5]示例2：输入：head=[1],n=1输出：[]示例3：输入：head=[1,2],n=1输出：[1]解答定义一个虚拟头结点virtual（设置虚拟头节点，为了方便对所有结点统一进行操作，而不需要对h
实现整个巡检流程的标准化的智慧能源开源了。 AI服务老曹前端 javascript 人工智能算法
简介AI视频监控平台,是一款功能强大且简单易用的实时算法视频监控系统。愿景在最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，减少企业级应用约95%的开发成本，在强大视频算法加持下的AR使得远程培训和远程操作指导不仅仅能够实现前后场的简单互动，而且能够实现人机结合，最终实现整个巡检流程的标准化。用户仅需在界面上简单操作，即可实现全视频的接入及布控。基础项
pyinstaller下载_Python用PyInstaller打包笔记军神关云长_大凡 python python 开发语言后端
转自：pyinstaller下载_Python用PyInstaller打包笔记_weixin_39660931的博客-CSDN博客为了把python程序发布到没有安装python解释器的Windows环境中使用，需要打包成exe可执行文件。现在常见的python打包工具有cx_Freeze、PyInstaller和py2exe，想想我当初接触python的时候，似乎只有py2exe，而且有不少问题
【无人机三维路径规划】基于粒子群算法无人机山地三维路径规划含Matlab源码天天Matlab科研工作室 Matlab各类代码 matlab
1简介1无人机路径规划环境建模本文研究在已知环境下的无人机的全局路径规划，建立模拟城市环境的三维高程数字地图模型。考虑无人机飞行安全裕度后用圆柱体模拟建筑物，用半球体模拟其他树木等障碍及禁飞区，其三维高程数学模型表示为[10,10]:2适应度函数在采用粒子群算法进行路径规划时，适应度函数用以评价生成路径的优劣程度，也是算法种群迭代进化的依据，适应度函数的优劣决定着算法执行的效率与质量。为了更好地进
cv君独家视角 | AI内幕系列十四：【手机、相机防抖大揭秘】数字防抖、鸡头防抖、光学防抖、AI防抖等(附源码+长期更新) cv君原创项目级实战项目 cv君独家视角 AI内幕系列深度学习与计算机视觉精品人工智能 ai isp 科技 python
目录摘要主要防抖技术手机防抖对比某拇指相机技术分析：1.基础介绍2.功能需求2.1功能背景2.2技术背景与技术选型2.3技术方案2.4可行性落地链路2.5竞品调研与市场分析2.6防抖主客观评价源码实现运动防抖步骤：代码实现性能优化与改进代码改进进一步改进与应用深度学习方法示例实时处理与应用示例运动摄影无人机航拍摄像头防抖设备计算资源需求复杂场景处理参数调整和优化实时处理需求误差累积并行和分布式处理
【无人机三维路径规划】基于蛾群算法MSA实现复杂城市地形下无人机避障三维航迹规划天天科研工作室无人机路径规划无人机无人机三维路径规划 MATLAB MSA
【无人机三维路径规划】基于蛾群算法MSA实现复杂城市地形下无人机避障三维航迹规划文章目录【无人机三维路径规划】基于蛾群算法MSA实现复杂城市地形下无人机避障三维航迹规划文章介绍优势基本步骤辅助函数代码分享参考资料文章介绍基于蛾群算法（MothSwarmAlgorithm,MSA）实现复杂城市地形下无人机避障三维航迹规划是指利用蛾群算法这种元启发式优化算法来解决无人机在复杂城市环境中进行航行时的避障
【SWO三维路径规划】基于matlab蜘蛛蜂算法SWO复杂山地环境下无人机三维路径规划【含Matlab源码 3576期】 Matlab研究室 matlab
欢迎来到Matlab研究室博客之家✅博主简介：985研究生，热爱科研的Matlab仿真开发者，完整代码论文复现程序定制期刊写作科研合作扫描文章底部QQ二维码。个人主页：Matlab研究室代码获取方式：扫描文章底部QQ二维码⛳️座右铭：行百里者，半于九十；路漫漫其修远兮，吾将上下而求索。更多Matlab路径规划仿真内容点击①Matlab路径规划（研究室版
《5G NR标准：下一代无线通信技术》读书笔记——LTE概述 Laolu5 读书笔记 5g
目录一.LTE概述1.频谱灵活性1.1载波聚合1.2授权辅助接入2.多天线增强2.1扩展的多天线传输2.2多点协作和传输2.3增强的控制信道结构3.密集度、微蜂窝和异构部署3.1中继3.2异构部署3.3微蜂窝开关3.4双连接3.5动态TDD3.6WLAN互通4.终端增强5.新场景5.1设备到设备通信5.2机器类型通信（MTC）5.3降低时延-sTTI5.4V2V和V2X5.5飞行器未完待续一.LT
C++学习：STL初识 DesolateGIS c++学习开发语言
一、基本概念STL广义上分为：容器、算法、迭代器容器和算法通过迭代器进行连接。STL分为六大组件：容器、算法、迭代器、仿函数、适配器、空间配置器。STL容器就是将运用广泛的一些数据结构实现出来，常用的数据结构有：数组、链表、树、栈、队列、集合、映射等容器容器分为序列式容器和关联式容器。序列式容器：强调排序，容器内的每个元素都有固定的位置关联式容器：二叉树结构，个元素之间没有严格的物理顺序关系例如：
基于混合蝴蝶粒子群算法粒子群算法蝴蝶算法实现无人机复杂山地环境下航迹规划附matlab代码机器学习之心路径规划算法无人机 matlab
一、引言1.1、研究背景和意义无人机（UnmannedAerialVehicle,UAV）技术在过去几十年中取得了显著进展，其在军事侦察、灾害救援、物流运输、地理测绘等领域的应用日益广泛。路径规划作为无人机自主飞行的核心技术之一，对于提高无人机的飞行效率和任务执行能力具有至关重要的意义。特别是在复杂山地环境中，合理的路径规划不仅能确保飞行安全，还能有效延长无人机的飞行时间和提升任务完成的成功率。无
数学建模：评价性模型学习——层次分析法（AHP模型）美肚鲨ccc matlab 矩阵数据分析算法
目录前言一、流程介绍二、模型实现1.构建层次结构2.构建判断矩阵1.对指标进行赋权2.建立判断矩阵3.层次单排序及一致性检验1、准则层2、方案层4、计算得分三、方法分析总结前言之前在课程作业上简单用过层次分析法，这次再系统性学习一遍，写一篇学习笔记！一、流程介绍构建层次结构构建判断矩阵计算权重、一致性检验计算得分得出结论二、模型实现1.构建层次结构探究以下五个城市的城市旅游竞争力排名：成都、杭州、
一致性哈希HashRing 留白1108 哈希算法算法一致性哈希
一致性哈希HashRing一致性哈希算法是一种高效的分布式存储和负载均衡技术，广泛应用于分布式系统中，如缓存集群、分布式数据库等。它通过将数据和节点映射到一个环形的哈希空间，实现了数据的均匀分布和节点的动态扩展。本文将详细介绍一致性哈希算法的原理，并通过一个完整的Java实现来展示其应用。一、一致性哈希算法原理一致性哈希算法的核心思想是将数据和节点映射到一个环形的哈希空间中。具体步骤如下：1.哈希
数学建模笔记——层次分析法（AHP） less is more_0930 《数学》数学建模笔记算法
本文借鉴了数学建模清风老师的视频和课件，如有错误欢迎大家批评指正。原视频地址：清风数学建模：https://www.bilibili.com/video/BV1DW411s7wihttps://www.bilibili.com/video/BV1DW411s7wi1.预备知识层次分析法：层次分析法(TheAnalyticHierarchyProcess，AHP)是一种系统分析与决策的综合评价方法，
基于一致性哈希的分布式Top-K 留白1108 哈希算法分布式算法 TopK
基于一致性哈希的分布式Top-K在分布式系统中，数据的高效存储和快速查询是一个常见的挑战。一致性哈希（ConsistentHashing）是一种常用于分布式存储和负载均衡的技术，而Top-K查询则是数据分析中的经典问题。本文将通过一个Java实现的案例，展示如何结合一致性哈希和多线程技术，高效地完成分布式环境下的Top-K计算。实现思路一致性哈希分片：将数据通过一致性哈希算法分配到不同节点。局部T
C++多线程笔记：使用std::lock_guard实现对共享数据的保护 zxw_tiantan
使用std::lock_guard实现对共享数据的保护，可使用如下简单实现：classmy_test_mutex{public:voidadd_to_list(intnew_value){std::lock_guardguard(some_mutex);some_list.push_back(new_value);}boollist_contains(intvalue_to_find){std::
ElasticSearch学习笔记 --- 调研笔记知识点杨鑫newlfe 大数据挖掘与大数据应用案例搜索引擎
笔记总结知识点：1.安装ElasticSearch。2.ELasticSearch是使用Java开发并使用Lucene作为核心来实现所有索引和搜索的功能3.使用是通过简单的restfulAPI来使用。4.安装Marvel(ES的管理和监控)5.特点：分布式的实时文件存储，每个字段都被索引并可被搜索分布式的实时分析搜引擎可以扩展到上百台服务器，处理PB级机构化或非结构化数据6.集群是一组具有相同cl
TypeScript 学习笔记（十五）：TypeScript 与数据库的深度结合 Evaporator Core typescript 学习笔记
TypeScript学习笔记（十五）：TypeScript与数据库的深度结合1.引言在前几篇学习笔记中，我们探讨了TypeScript的基础知识、前后端框架的结合应用、测试与调试技巧、性能优化、前端架构设计以及TypeScript的工具和生态系统。本篇将重点介绍TypeScript与数据库的深度结合，包括如何使用TypeScript操作关系型数据库和非关系型数据库。2.TypeScript与关系型
Deepseek r1回答：人工智能的本质是什么？给人类社会带来的意义是什么？相比于之前的互联网革命，这一轮的人工智能革命的特点和异同点有哪些？强化学习曾小健 Deepseek原理与使用人工智能
嗯，用户问的是人工智能的本质、对社会的意义，以及和互联网革命的比较。首先得拆解这三个问题，逐个分析。用户可能对AI有一定了解，但想深入理解其核心和影响。可能需要从技术、社会、历史角度切入。先想AI的本质。本质是什么？是模拟人类智能，还是数据处理？可能需要提到机器学习、深度学习，尤其是神经网络。但本质可能更深层，比如自主决策、模式识别。还要区分弱AI和强AI，现在都是弱AI，专注于特定任务。然后是意
leetcode刷题Day4｜寻找两个正序数组的中位数我要学土木 leetcode刷题 leetcode 算法数据结构
leetcode刷题Day4｜寻找两个正序数组的中位数给定两个大小分别为m和n的正序（从小到大）数组nums1和nums2。请你找出并返回这两个正序数组的中位数。算法的时间复杂度应该为O(log(m+n))。题解：classSolution{public:doublefindMedianSortedArrays(vector&nums1,vector&nums2){intn=nums1.size(
转换器与预估器，KNN算法，朴素贝叶斯算法，决策树，随机森林的特点，优缺点 qq_43625764 笔记 KNN算法随机森林朴素贝叶斯算法机器学习算法决策树
转换器与预估器，KNN算法，朴素贝叶斯算法，决策树，随机森林的特点，优缺点1转换器与预估器实例化转换器fit_transform转换实例化预估器fit将训练集的特征值和目标值传进来fit运行完后，已经把这个模型训练出来了2KNN算法根据你的邻居来推测你的类别，如何确定谁是你的邻居（用距离公式，最常用的是欧式距离）还有曼哈顿距离–求绝对值，明可夫斯基距离（欧式距离和曼哈顿距离的一个退p=1曼哈顿距离
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

【深度学习】吴恩达课程笔记(四)——优化算法

吴恩达课程笔记——优化算法

八、优化算法

1.优化算法介绍

2.批量梯度下降（Batch Gradient Descent）

目的

步骤

优点

缺点

3.随机梯度下降（Stochastic Gradient Descent, SGD）

目的

步骤

优点

缺点

4.小批量梯度下降（Mini-batch Gradient Descent）

目的

步骤

优点

缺点

理解

如何选择mini-batch size

5.指数加权平均数（Exponentially Weighted Averages）

目的

步骤

优点

缺点

具体加权过程举例

指数加权平均的偏差修正

6.动量梯度下降法 (Gradient descent of Momentum)

目的

基本原理

7.RMSprop

目的

优点

基本原理

8.Adam 优化算法(Adam optimization algorithm)

简介

工作方式

优点

算法

9.学习率衰减(Learning rate decay)

做法

几种公式

10.局部最优问题

你可能感兴趣的:(深度学习,深度学习,笔记,算法)