有人寒窗苦读

PyTorch | 自动求导 Autograd

一、自动求导要点
二、计算图
三、标量反向传播
四、非标量反向传播
- 1. 定义叶子节点及算子节点
- 2. 手工计算 y 对 x 的梯度
- 3. 调用 backward 来获取 y 对 x 的梯度

\qquad

在神经网络中，一个重要的内容就是进行参数学习，而参数学习离不开求导，那么

P y T o r c h

是如何进行求导的呢？

\qquad

现在大部分深度学习架构都有自动求导的功能，

P y T o r c h

也不例外，

P y T o r c h

中所有神经网络的核心是 autograd包，它就是用来自动求导的。 autograd包为张量上的所有操作提供了自动求导机制。它是一个在运行时定义（ define-by-run）的框架，这意味着反向传播（神经网络前向传播 & 反向传播）是根据你的代码来确定如何运行，并且每次迭代可以是不同的。

\qquad

torch.Tensor是 autograd包的核心类，在自动梯度计算中还有另外一个重要的类 torch.Function，这两个类相互连接并生成一个 有向非循环图，它表示和存储了完整的计算历史。接下来我们先简单介绍

t e n s o r

如何实现自动求导，然后介绍计算图，最后用代码来实现这些功能。

一、自动求导要点

$\qquad$ 无论如何定义计算过程、如何定义计算图，要谨记我们的核心目的是为了计算某些 $t e n s o r$ 的梯度。在 $p y t o r c h$ 的计算图中，其实只有两种元素：数据（ $t e n s o r$ ）和运算，运算就是加减乘除、开方、幂指对、三角函数等可求导运算，而 $t e n s o r$ 可细分为两类：叶子节点（Leaf Node）和非叶子节点。使用 backward() 函数反向传播计算 $t e n s o r$ 的梯度时，并不计算所有 $t e n s o r$ 的梯度，而是只计算满足这几个条件的 $t e n s o r$ 的梯度：
$\qquad\qquad$ （1）类型为叶子节点
$\qquad\qquad$ （2）requires_grad=True
$\qquad\qquad$ （3）依赖该 $t e n s o r$ 的所有 $t e n s o r$ 的 $requires\_grad=True$

$为实现对 T e n s o r 自动求导，需要考虑以下事项：$

创建叶子节点（Leaf Node）的 $t e n s o r$ ，使用requires_grad参数指定是否记录对其的操作，requires_grad参数的缺省值为 $F a l s e$ 。如果设置requires_grad参数为 $T r u e$ ，那么将会追踪所有对于该张量的操作。当完成计算后通过调用backward()方法自动计算所有的梯度，这个张量的所有梯度将会自动积累到grad属性。
可以使用tensor.requires_grad_()方法修改 $t e n s o r$ 的requires_grad属性。要阻止张量跟踪历史记录，可以调用tensor.detach()方法将其与计算历史记录分离，并禁止跟踪它将来的计算记录。为了防止跟踪历史记录（和使用内存），可以将代码块包装在with torch.no_grad():中。在评估模型、测试模型阶段中特别有用，因为模型中可能具有requires_grad = True的可训练参数，但是我们不需要梯度计算。
通过运算创建的 $t e n s o r$ （即非叶子节点）会自动被赋予grad_fn属性，该属性引用了创建 $t e n s o r$ 自身的 $F u n c t i o n$ （用户手动创建的 $t e n s o r$ 的grad_fn是 $N o n e$ ，即叶子节点的grad_fn为 $N o n e$ ）
最后得到的 $t e n s o r$ 执行 backward()函数，此时自动计算各变量的梯度，并将累加结果保存到grad属性中。计算完成后，非叶子节点的梯度自动释放。
backward()函数：torch.autograd.backward(tensors, grad_tensors=None, retain_graph=None, create_graph=False, grad_variables=None)
$\qquad$ 参数 $t e n s o r s$ 如果是标量，函数 $b a c k w a r d$ 计算参数 $t e n s o r s$ 对于给定计算图叶子节点的梯度。
$\qquad$ 参数 $t e n s o r s$ 如果不是标量，需要另外指定参数 $grad\_tensors$ ，参数 $grad\_tensors$ 必须和参数 $t e n s o r s$ 的长度相同，或者满足广播机制。在这一种情况下， $b a c k w a r d$ 实际上实现的是代价函数关于计算图叶子节点的梯度计算，而不是参数 $t e n s o r s$ 对于给定计算图叶子节点的梯度。
反向传播的中间缓存会被清空，如果需要进行多次反向传播，需要指定backward()函数中的参数retain_graph=True。多次反向传播时，梯度是累加的。
非叶子节点的梯度 backward 调用后即被清空。
可以通过用 torch.no_grad() 包裹代码块的形式来阻止 autograd 去跟踪那些标记为 .requesgrad=True 的张量的历史记录。这一步在测试阶段经常使用。

$\qquad$ 在整个过程中， $P y T o r c h$ 采用计算图的形式进行组织，该计算图为动态图，且在每次前向传播时，将重新构建。

二、计算图

$\qquad$ 计算图是一种有向无环图像（Directed Acyclic Graph，DAG），用图形方式来表示算子与变量之间的关系，直观高效。如下图所示，圆形表示变量，矩阵表示算子。如表达式： $z = w x + b$ ，可以写成两个表达式： $y = w x$ ，则 $z = y + b$ ，其中 $w 、 x 、 b$ 是变量，是用户创建的变量，不依赖于其他变量，故又称为叶子节点。为计算各叶子节点的梯度，需要把对应的张量参数requires_grad设置为 $T r u e$ ，这样就可以自动跟踪其历史记录。 $y 、 z$ 是计算得到的变量，非叶子节点，z为根节点。 $m u l$ 和 $a d d$ 是算子（或操作或函数）。由这些变量及算子，就构成一个完整的计算过程（或前向传播过程）。

$前向传播计算图$

$\qquad$ 我们的目标是更新各叶子节点的梯度，根据复合函数倒数的链式法则，不难算出各叶子节点的梯度：
$\displaystyle \frac{\partial z}{\partial x}=\frac{\partial z}{\partial y}\frac{\partial y}{\partial x}=w\\\displaystyle \frac{\partial z}{\partial w}=\frac{\partial z}{\partial y}\frac{\partial y}{\partial w}=x\\\displaystyle \frac{\partial z}{\partial b}=1$
$\qquad PyTorch$ 调用 backward() 方法，将自动计算各节点的梯度，这是一个反向传播过程，这个过程可用下图表示。且在反向传播过程中，autograd沿着下图，从当前根节点 $z$ 反向溯源，利用导数链式法则，计算所有叶子节点的梯度，其梯度值将累加到grad属性中。对非叶子节点的计算操作（或Function）记录在grad_fn属性中，叶子节点的grad_fn值为None。

$反向传播计算图$

三、标量反向传播

$\qquad$ 假设 $x 、 w 、 b$ 都是标量， $z = w x + b$ ，对标量 $z$ 调用 backward() 方法，我们无须对 backward() 传入参数。

$\qquad 注：只有浮点型数据才能计算梯度，其他类型数据是不能计算张量梯度的。$

$\qquad$ 以下是实现自动求导的代码：

import torch
# 1. 定义叶子节点及算子节点
# 定义输入张量x
x = torch.Tensor([2])
# 初始化权重参数w，偏移量b，并设置requires_grad属性为True，为自动求导
w = torch.randn(1,requires_grad=True)
b = torch.randn(1,requires_grad=True)
# 实现前向传播
y = torch.mul(w,x) # 等价于w*x
# retain_grad()显式地保存非叶节点的梯度
y.retain_grad()
z = torch.add(y,b) # 等价于y+b
# retain_grad()显式地保存非叶节点的梯度
z.retain_grad()
# 查看x,w,b叶子节点的requires_grad属性
print("x,w,b 的 requires_grad 属性分别为：{},{},{}".format(x.requires_grad,w.requires_grad,b.requires_grad))

# 2. 查看叶子节点、非叶子节点的属性
# 查看非叶子节点的requires_grad属性
# 因与w，b有依赖关系，故y，z的requires_grad属性也是：True，True
print("y,z 的 requires_grad 属性分别为：{},{}".format(y.requires_grad,z.requires_grad))
# 查看各节点是否为叶子节点
# x,w,b,y,z 是否为叶子节点：True,True,True,False,False
print("x,w,b,y,z 是否为叶子节点：{},{},{},{},{}".format(x.is_leaf,w.is_leaf,b.is_leaf,y.is_leaf,z.is_leaf))
# 查看叶子节点的grad_fn属性
# 因为x,w,b都为用户所创建，故x,w,b的grad_fn属性：None,None,None
print("x,w,b 的 grad_fn 属性：{},{},{}".format(x.grad_fn,w.grad_fn,b.grad_fn))
# 查看非叶子节点的grad_fn属性
print("y,z 的 grad_fn 属性：{},{}".format(y.grad_fn,z.grad_fn))

# 3. 自动求导，实现梯度方向传播，即梯度的反向传播
# 基于z张量进行梯度反向传播，执行backward之后计算图会自动清空
# 如果需要多次使用backward，需要修改参数retain_graph为True，此时梯度是累加的
# z.backward(retain_graph=True)
z.backward()
# 查看叶子节点的梯度，x是叶子节点但它无须求导，故其梯度为None
print("叶子节点x,w,b的梯度分别为：{},{},{}".format(x.grad,w.grad,b.grad))
# 非叶子节点的梯度，执行backward之后，会自动清空
print("非叶子节点y,z的梯度分别为：{},{}".format(y.grad,z.grad))

四、非标量反向传播

$\qquad PyTorch$ 有个简单的规定，不让张量（Tensor）对张量求导，只允许标量对张量求导，因此，如果目标张量对一个非标量调用backward()，则需要传入一个gradient参数，该参数也是张量，而且需要与调用backward()的张量形状相同。

$\qquad$ 传入gradient参数是为了把张量对张量的求导转换为标量对张量的求导。举例来说，假设目标值为 $\pmb{\vec{loss}}=(y_1,y_2,\ \cdots,y_m)$ ，输入值为 $\pmb{\vec{x}}=(x_1,x_2,\ \cdots,x_n)$ ，传入的gradient参数为 $\pmb{\vec{v}}=(v_1,v_2,\ \cdots,v_m)$ ，那么就可以把张量 $\pmb{\vec{loss}}^T$ 对张量 $\pmb{\vec{x}}$ 的求导，转换为标量 $\pmb{\vec{v}}\cdot\pmb{\vec{loss}}^T$ 对张量 $\pmb{\vec{x}}$ 的求导。即把张量 $\pmb{\vec{v}}$ （维度为 $1\times m$ ）乘以原来 $\displaystyle\frac{\partial\pmb{\vec{loss}^T}}{\partial\pmb{\vec{x}}}$ 得到的雅可比（Jacobian）矩阵（维度为 $m\times n$ ），便可以得到一个梯度矩阵（维度为 $1\times n$ ）。

$\qquad$ 下面通过一个实例进行说明。

1. 定义叶子节点及算子节点

import torch
# 定义叶子节点张量x，形状为1x2
x = torch.tensor([[2,3]],dtype=torch.float,requires_grad=True)
# 初始化 Jacobian 矩阵
J = torch.zeros(2, 2)
# 初始化目标张量，形状为1x2
y = torch.zeros(1, 2)
# 定义y与x之间的映射关系，y1=x1**2+3*x2，y2=x2**2+2*x1
y[0,0] = x[0,0] ** 2 + 3 * x[0,1]
y[0,1] = x[0,1] ** 2 + 3 * x[0,0]

2. 手工计算 y 对 x 的梯度

$\qquad$ 我们先手工计算一下 $y$ 对 $x$ 的梯度，验证 $P y T o r c h$ 的 $b a c k w a r d$ 的结果是否正确。

$\qquad y$ 对 $x$ 的梯度是一个雅可比矩阵，我们可以通过以下方法进行计算各项的值。

$\qquad$ 假设 $x=(x_1=2,x_2=3)$ ， $y=(y_1=x_1^2+3x_2,y_2=x_2^2+2x_1)$ ，不难得到：
$J=\left[\begin{matrix} \displaystyle\frac{\partial y_1}{\partial x_1} & \displaystyle\frac{\partial y_1}{\partial x_2}\\ \quad \\ \displaystyle\frac{\partial y_2}{\partial x_1} & \displaystyle\frac{\partial y_2}{\partial x_2}\end{matrix}\right]=\left[\begin{matrix} 2x_1 & 3\\ 2 & 2x_2\end{matrix}\right]=\left[\begin{matrix} 4 & 3\\ 2 & 6\end{matrix}\right]$

3. 调用 backward 来获取 y 对 x 的梯度

y.backward(torch.Tensor([[1,1]]))
print(x.grad) # 结果为 tensor([[6., 9.]])

$\qquad$ 这个结果与我们手工运算的不符，虽然这个结果是错误的，那错在哪里呢？这个结果的计算过程是：
$\pmb{\vec{v^T}}\cdot J=\left[\begin{matrix} 1 & 1\end{matrix}\right]\left[\begin{matrix} 4 & 3\\ 2 & 6\end{matrix}\right]=\left[\begin{matrix} 6 & 9\end{matrix}\right]$

$\qquad$ 由此可见，错在 $\pmb{\vec{v}}$ 的取值，通过这种方式得到的并不是 $y$ 对 $x$ 的梯度。这里我们可以分成两步计算。首先，让 $\pmb{\vec{v}}=(1,0)$ 得到 $y_1$ 对 $\pmb{\vec{x}}$ 的梯度；然后，使 $\pmb{\vec{v}}=(0,1)$ 得到 $y_2$ 对 $\pmb{\vec{x}}$ 的梯度。这里因需要重复使用backward()，需要使参数retain_graph=True，具体代码如下：

# 生成y1对x的梯度
y.backward(torch.Tensor([[1,0]]),retain_graph=True)
J[0]=x.grad
# 梯度是累加的，故需要对x的梯度清零
x.grad=torch.zeros_like(x.grad)
# 生成y2对x的梯度
y.backward(torch.Tensor([[0,1]]))
J[1]=x.grad
# 显示Jacobian矩阵的值
# tensor([[4., 3.],
#        [2., 6.]])
print(J)

AI需要的基础数学知识大囚长机器学习大模型人工智能
AI（人工智能）涉及多个数学领域，以下是主要的基础数学知识：1.线性代数矩阵与向量：用于表示数据和模型参数。矩阵乘法：用于神经网络的前向传播。特征值与特征向量：用于降维和主成分分析（PCA）。奇异值分解（SVD）：用于数据压缩和降维。2.微积分导数与偏导数：用于优化算法（如梯度下降）。链式法则：用于反向传播算法。积分：在概率和统计中有应用。3.概率与统计概率分布：如高斯分布、伯努利分布等。贝叶斯定
云游戏一二事大囚长运维人生游戏世界游戏
云游戏让CDN边缘计算加速发展，边缘计算节点越来越类似于神经网络的终端节点，AI人类大脑正在加速形成。云游戏就是元宇宙的前站和先锋。云游戏解决了哪些痛点：1.终端成本高玩家购买高端主机设备来适应游戏不断提升的硬件要求，极大程度地加重了玩家成本2.游戏包越来越大，下载安装成本高游戏画面越来越精细的同时也带来了不断膨胀的游戏包体，给游戏存储与推广都带来了更大的压力和成本3.游戏无法在多种终端间自由切换
自学成才之路，DeepSeek R1 论文解读智识世界Intelligence 神经网络深度学习自然语言处理课程设计学习方法
DeepSeekR1的论文看完后，后劲很大。虽然我推荐所有人都去阅读一下，但我估计实际去读的人应该很少。今天把论文里的三个亮点，用通俗易懂地方式写出来，希望能让更多人了解这篇论文有多么重要。亮点一：告别“刷题班”，纯“实战”也能练出推理大神！我们平时学习，是不是经常要“刷题”？做大量的练习题，才能巩固知识，提高解题能力。以前训练AI模型，也差不多是这个套路，要先给AI“喂”大量的“习题”（监督数据
Python 如何使用 Bert 进行中文情感分析程序员徐师兄 Python 入门专栏 python bert 开发语言情感分析
前言在自然语言处理（NLP）领域，情感分析是一个非常常见且重要的应用。情感分析通常用于识别文本中的情感，例如判断一条微博或评论是正面、负面还是中性。在过去的几年中，随着深度学习的发展，BERT（BidirectionalEncoderRepresentationsfromTransformers）模型迅速成为了处理自然语言的强大工具。BERT是一种基于Transformer架构的预训练模型，它能够
P1 Pytorch入门实战——Pytorch实现mnist手写数字识别今天补充能量了吗 pytorch 人工智能 python 深度学习机器学习
本文為365天深度學習訓練營中的學習紀錄博客原作者：K同学啊|接輔導、項目定制一、MNIST手写数字数据集介绍MNIST手写数字数据集来源于是美国国家标准与技术研究所，是著名的公开数据集之一。数据集中的数字图片是由250个不同职业的人纯手写绘制包含了70000张图片，其中60000张为训练数据，10000为测试数据，70000张图片均是28*28。如果我们把每一张图片中的像素转换为向量，则得到长度
【MotionCap】DROID-SLAM 1 ：介绍及安装等风来不如迎风去 AI入门与实战人工智能 SLAHMR DROID-SLAM
DROID-SLAM：DROID-SLAM:DeepVisualSLAMforMonocularDROID-SLAM：适用于单目、立体和RGB-D相机的深度视觉SLAMStereo,andRGB-DCamerashttps://arxiv.org/abs/2108.10869DROID-SLAM:DeepVisualSLAMforMonocular,Stereo,andRGB-DCamerasfi
PyTorch深度学习实战（43）——手写文本识别盼小辉丶深度学习 pytorch 人工智能
PyTorch深度学习实战（43）——手写文本识别0.前言1.手写文本识别1.1基本概念1.2输入和输出格式1.3CTC损失值2.模型与数据集分析2.1数据集分析2.2模型分析3.实现手写文本识别模型小结系列链接0.前言手写文本识别，也称为手写文本的光学字符识别(OpticalCharacterRecognition,OCR)，是计算机视觉和自然语言处理中的一项具有挑战性的任务。与印刷文本不同，手
算法中的时间复杂度和空间复杂度 CM莫问人工智能算法常见概念算法人工智能 python 时间复杂度空间复杂度
一、背景随着人工智能的纵深发展，我们会发现现在做算法很多时候都是通过掉包来解决问题了。Torch或者Tensorflow之类的深度学习库大大减少了算法工程师的工作量，而且在张量运算、反向传播等环节，这些深度学习库的模块设计也尽最大可能地降低了计算的时间和空间复杂度，从而不需要我们额外进行过多的干预。如果不是科班读计算机相关专业的，相信不少朋友第一次听说时间复杂度和空间复杂度的概念是在找工作刷lee
DeepMind的新突破：GenCast 新加坡内哥谈技术人工智能大数据语言模型
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/如今，人工智能（AI）在天气预报领域的表现已经可以与传统计算方法媲美。然而，AI模型的训
使用神经网络做二分类预测 weixin_33816300 人工智能 python matlab
不想整理代码了。先给个结果图：train0loss:1838.0616train100loss:1441.5283train200loss:1299.4546train300loss:934.36536train400loss:506.06702train500loss:322.9782train600loss:271.5825train700loss:360.091train800loss:23
ARM Cortex-M3与Cortex-M4权威指南胡妃意
ARMCortex-M3与Cortex-M4权威指南【下载地址】ARMCortex-M3与Cortex-M4权威指南ARMCortex-M3与Cortex-M4权威指南欢迎阅读《ARMCortex-M3与Cortex-M4权威指南（第3版）》，这是一本针对嵌入式系统开发者量身打造的深度学习手册项目地址:https://gitcode.com/Open-source-documentation-tu
【数据挖掘实战】房价预测机器学习司猫白数据挖掘人工智能 python 机器学习
本次对kaggle中的入门级数据集，房价回归数据集进行数据挖掘，预测房屋价格。本人主页：机器学习司猫白机器学习专栏：机器学习实战PyTorch入门专栏：PyTorch入门深度学习实战：深度学习ok，话不多说，我们进入正题吧概述本次竞赛有79个解释变量（几乎）描述了爱荷华州艾姆斯住宅的各个方面，需要预测每套住宅的最终价格。数据集描述本次数据集已经上传，大家可以自行下载尝试文件说明train.csv-
Neural Architecture Search (NAS) 原理和应用 weixin_58349913 python
NeuralArchitectureSearch(NAS)原理和应用NeuralArchitectureSearch(NAS)是一种自动化设计神经网络架构的技术。它通过搜索空间中的不同架构配置来找到最优或接近最优的神经网络结构，从而减少人工设计网络结构的工作量。NAS的目标是通过自动化的方式获得比手工设计更高效、准确的模型架构，特别适用于对网络架构要求较高的任务。1.NAS的基本原理NAS的核心思
GPT-4对话模型在客服中的应用与前景：开启智能客服新时代 Echo_Wish 前沿技术人工智能 python 人工智能 gpt
GPT-4对话模型在客服中的应用与前景：开启智能客服新时代随着人工智能技术的迅猛发展，基于深度学习的对话模型在各个领域中得到了广泛应用。其中，GPT-4对话模型在客服系统中的应用尤为引人注目。本文将探讨GPT-4在客服中的应用与未来发展前景，并结合具体代码示例进行说明。一、GPT-4对话模型概述GPT-4（GenerativePre-trainedTransformer4）是OpenAI开发的一种
模型压缩与优化技术——神经架构搜索（Neural Architecture Search, NAS） DuHz 轻量化模型机器学习计算机视觉人工智能神经网络深度学习数据挖掘语音识别
模型压缩与优化技术中的神经架构搜索（NeuralArchitectureSearch,NAS）技术1.引言在深度学习领域，神经网络的架构设计对模型的性能至关重要。传统的手动设计网络架构的过程费时费力，且通常依赖于经验和直觉。为了提升效率与效果，神经架构搜索（NeuralArchitectureSearch,NAS）作为一种自动化的方法，能够通过算法寻找和优化最佳的神经网络架构。NAS可以在图像识别
Element修改表格结构样式集合（后续实时更新）白嫖叫上我 element-ui vue.js elementui 前端
场景修改前端Element组件el-table样式实现线表格-->-->执行-->轨迹轨迹-->.guiji-pop{height:100%;width:100%;.tablepro{width:100%;height:calc(100%-0.82rem);margin-top:0.16rem;::v-deep.el-table__body-wrapper{height:calc(100%-0.4
【揭秘】图像算法工程师岗位如何进入？认识祂人工智能算法图像算法工程师
“图像算法工程师，主要专注于开发图像处理和计算机视觉算法，广泛应用于各行业。本文，我们来揭秘一下他们的日常工作，以及如何成为这一领域的专业人才。”01图像算法工程师的日常工作算法设计与开发图像算法工程师的核心任务是设计和开发算法，以解决特定的图像处理或计算机视觉问题。常见的任务包括：图像分类：使用卷积神经网络（CNN）对图像进行分类，常见算法如ResNet、VGG。目标检测：在图像中定位并标注物体
SGLang安装教程，部署你的大模型，性能比vllm好，实现张量并行，数据并行，加快推理速度，亲测效果好。张登杰踩人工智能结对编程 python
目前大模型部署工具主要是vllm，最近出现了SGLang，很多新开源大模型都支持SGLang的部署推理，例如deepseek-R1，Qwen2.5，Mistral，GLM-4，MiniCPM3，InternLM2，Llama3.2等。代码：GitHub-sgl-project/sglang:SGLangisafastservingframeworkforlargelanguagemodelsand
deepin 下如何实现一个文件即可读写又可只读 deepin
在Linux系统的运维过程中，我们常常会遇到需要对文件或目录进行灵活权限管理的场景。例如，某个应用的存储目录空间不足，或者需要为开发人员提供只读访问权限，同时又不影响原有配置文件的写入权限。本文将介绍如何通过mount--bind和相关选项来实现这些需求。问题背景在实际工作中，我们可能会遇到以下场景：应用程序的存储目录空间不足，但无法直接扩容。需要为开发人员提供配置文件的只读权限，同时保留原有文件
深度求索DeepSeek V2.5-1210发布：强大的AI代码生成器，开启联网搜索新纪元前端
深度求索团队近日发布了AI代码生成器DeepSeekV2.5系列的最终版本——DeepSeekV2.5-1210，并正式上线了备受期待的联网搜索功能。这标志着DeepSeekV2系列发展历程的一个重要里程碑，也为AI大模型在代码生成和信息检索领域树立了新的标杆。此次更新不仅带来了模型能力的全面提升，更重要的是开启了AI与实时信息互联的新篇章。DeepSeekV2.5-1210的核心改进：Post-
QAT与PTQ模型量化方法的区别 old_power 计算机视觉模型量化深度学习计算机视觉
QAT（QuantizationAwareTraining）和PTQ（PostTrainingQuantization）是两种常见的模型量化方法，用于减少深度学习模型的计算和存储开销，同时尽量保持模型的性能。1.QAT（QuantizationAwareTraining）定义：QAT是在模型训练过程中引入量化操作，使模型在训练时就能感知到量化带来的影响，从而更好地适应量化后的精度损失。流程：在训练
毕设分享深度学习街道行人流量计数系统 fawubio_A 毕业设计 python 毕设
文章目录0前言1项目运行效果2设计概要2原理介绍2.1目标检测概况什么是目标检测？发展阶段2.2行人检测行人检测简介行人检测技术难点行人检测实现效果4最后0前言这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要
Keras、TensorFlow、PyTorch框架对比及服务器配置揭秘小深ai硬件分享人工智能深度学习服务器
深度学习框架：开启智能大门的钥匙在数字化浪潮中，深度学习如明星照亮众多领域。从智能安防的人脸识别，到医疗图像分析、电商商品推荐、智能语音助手等，其身影无处不在，改变着生活与工作方式。在深度学习领域，Keras、TensorFlow和PyTorch是主流框架，能助开发者构建强大智能模型。但这些框架要充分发挥作用，离不开合适的服务器配置，就像魔法师需要魔法棒和魔力，下面我们就来看看这些具体的框架吧:框
Python 编译Edge-TTS（edge_tts）转MP3工具浩读语音朗读 edge-tts python edge 自然语言处理前端
Python编译Edge-TTS利用PIPEdge-tts库来实现Azure神经网络自然语音转MP3，这应该是微软给老百姓们一个共享前沿科技大餐。（edge_tts）找了网上的很多源代，现在利用现有公开的代码混编译一个个人的学习工具。代码仅供学习研究。fromtkinterimport*fromtkinter.filedialogimport*fromtkinter.messageboximpor
深度学习｜表示学习｜卷积神经网络｜局部链接是什么？｜06 漂亮_大男孩表示学习深度学习学习 cnn
如是我闻：局部连接（LocalConnectivity），是卷积神经网络（CNN）中的一个关键特性。什么是局部连接（LocalConnectivity）？局部连接指的是：在卷积操作中，每个神经元（或输出单元）只与输入数据的一个局部区域相关联，而不是与整个输入数据相连。换句话说：全连接网络（FullyConnectedLayer）中，每个神经元会与上一层所有的神经元相连。卷积网络（Convoluti
deepin分享-Linux & Windows 双系统时间不一致解决方案 deepin
在双系统环境中（如Windows和Linux），时间同步问题是一个常见的困扰。Windows和Linux对系统时间的处理方式不同，这可能导致时间显示不一致。本文将介绍两种解决方法，帮助你解决Linux和Windows双系统时间不一致的问题。问题背景Windows操作系统直接将CMOS时间（硬件时钟）视为本地时间，不根据时区进行转换。每次调整系统时区或修改时间时，Windows会直接修改CMOS时间
deepin-UEFI 引导：从入门到重装 deepin
在现代计算机中，UEFI（统一可扩展固件接口）已成为主流的启动方式，逐渐取代了传统的BIOS。UEFI提供了许多改进，如更灵活的启动管理、更大的分区支持以及更快的启动速度。然而，对于许多Linux用户来说，UEFI的复杂性可能会带来一些挑战，尤其是在多系统环境中。本文将详细介绍如何在Linux下使用UEFI引导系统，以及如何在出现问题时进行修复和重装。1.UEFI的基本原理UEFI是一种替代传统B
强化学习代码实践1.DDQN:在CartPole游戏中实现 Double DQN 洪小帅游戏 python gym pytorch 深度学习
强化学习代码实践1.DDQN:在CartPole游戏中实现DoubleDQN1.导入依赖2.定义Q网络3.创建Agent4.训练过程5.解释6.调整超参数在CartPole游戏中实现DoubleDQN（DDQN）训练网络时，我们需要构建一个使用两个Q网络（一个用于选择动作，另一个用于更新目标）的方法。DoubleDQN通过引入目标网络来减少Q-learning中过度估计的偏差。下面是一个基于PyT
深度学习中交叉熵函数的导数:(极简) 洪小帅深度学习人工智能神经网络 python
文章目录前言一.交叉熵函数的导数二.Z,y为有n条数据的矩阵前言另一个博主有更详细的推导https://blog.csdn.net/chaipp0607/article/details/101946040一.交叉熵函数的导数softmax:令一条数据最后的输出为[z1,z2,z3,z4,…,z10],这里令输出层的神经元数量为10pi=ezi∑j=110ezjpi=\frac{e^{z_i}}{\
【Python】已完美解决：ERROR: Could not find a version that satisfies the requirement re 屿小夏 python 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><

PyTorch | 自动求导 Autograd