不牌不改

torch.nn.LocalResponseNorm（局部响应归一化）详解（附源码解析）

torch.nn.LocalResponseNorm

局部响应归一化的理解

局部归一化的动机：在神经生物学有一个概念叫做侧抑制(lateral inhibitio)，指的是被激活的神经元抑制相邻神经元。归一化的目的是“抑制”，局部响应归一化就是借鉴侧抑制的思想来实现局部控制，尤其当我们使用RELU的时候这种”侧抑制“很管用。

也就是说你可以理解为对一个位置的值进行变形，变形的结果是该位置的值占邻域内的全部值的一个抽象的比重。

好处：有利于增加泛化能力，做了平滑处理，识别率提高1-2%。LRN层模仿生物神经系统的侧抑制机制，对局部神经元的活动创建竞争机制，使得响应比较大的值相对更大，提高模型泛化能力。Hinton在Imagenet中表明分别提升1.4%和1.2%。

LocalResponseNorm参数讲解

torch.nn.LocalResponseNorm(size, alpha=0.0001, beta=0.75, k=1.0)

$b_{x,y}^i = a_{x,y}^i/\left(k+\frac{\alpha}{size}\sum_{j=max(0,i-size//2)}^{min(C-1,i+(size-1)//2)} (a^j_{x,y})^2\right)^\beta$

简单解释一下公式：

输入为 $(N, C, W, H)$ 时，即四维的第一维表示样本数，第二维表示通道数，第三四维表示宽高；
输出与输入维度个数及维度大小相同；
$\alpha$ 就是参数alpha， $\beta$ 就是参数beta， $k$ 就是参数k， $s i z e$ 就是参数size；
$i$ 和 $j$ 分别表示第 $i$ 和第 $j$ 个通道， $x$ 和 $y$ 分别表示宽高维度上的位置；
注意公式中 $m i n$ 中的 $C$ 就是 $(N, C, W, H)$ 中的 $C$ ，符号 $/ /$ 表示整除。

参数详解：

size：表示对一个位置的值进行局部响应归一化需要涉及的邻域通道的个数。比如size=3，则当 $i = 0$ 时上述公式中的 $j$ 的变化范围是 $[0, 1]$ ，也就是说涉及的通道为第0个通道和第1个通道；当 $i = 1$ 时 $j$ 的变化范围是 $[0, 2]$ ，涉及通道为第0、1、2个通道。（详细理解需要看下面对“实现方式”的讲解）
alpha：见公式，系数。
beta：见公式，指数。
k：见公式，作用是防止发生除0的情况。

图文讲解过程

LRN 根据归一化方向不同有两种形式，分别为 $Inter-Channel\space LRN$ 和 $Intra-Channel\space LRN$ ：

因为AlexNet中和PyTorch中都是实现的第一种（ $Inter-Channel\space LRN$ ），即在通道这一维度上进行局部响应归一化，也就是对于每一个位置的变形后的值都由其相邻通道内对应位置的值决定，所以我们只讲第一种。而第二种（ $Intra-Channel\space LRN$ ）则是在同一个通道内进行局部响应，即每个通道内的像素值与同通道内的相邻像素值有关，不做过多的讲解。

Inter-Channel LRN Example

假设输入为 $(1, 4, 3, 3)$ ，如下图。设置参数size=2，alpha=1，beta=1，k=0，则计算过程如下。

在计算第一个通道的第一个元素局部响应归一化后的值时，因为 $j$ 的下限是 $m a x (0, i - s i z e / / 2) = m a x (0, - 1) = 0$ ，上限是 $i + (s i z e - 1) / / 2 = i = 0$ ，所以需要考虑的通道仅为第0通道，即仅与(0,0,0)处的1有关，代入公式得到 $1/(0+\frac{1}{2}×(1^2))=2.00$ 。

再看(1,0,0)位置的1响应后的值， $j$ 的范围是 $[0, 1]$ ，所以需要考虑的通道为第0通道和第1通道，即与(0,0,0)处的1和(1,0,0)处的1有关，代入公式得到 $b=1/(0+\frac{1}{2}×(1^2+1^2))=1.00$ 。

其他以此类推。

PyTorch中对LocalResponseNorm函数的实现

这部分是重点，详细解析源码。

源码：

def local_response_norm(input, size, alpha=1e-4, beta=0.75, k=1.):
    # type: (Tensor, int, float, float, float) -> Tensor
    r"""Applies local response normalization over an input signal composed of
    several input planes, where channels occupy the second dimension.
    Applies normalization across channels.

    See :class:`~torch.nn.LocalResponseNorm` for details.
    """
    if not torch.jit.is_scripting():
        if type(input) is not Tensor and has_torch_function((input,)):
            return handle_torch_function(
                local_response_norm, (input,), input, size, alpha=alpha, beta=beta, k=k)
    dim = input.dim() # 重点！
    if dim < 3:
        raise ValueError('Expected 3D or higher dimensionality \
                         input (got {} dimensions)'.format(dim))
    div = input.mul(input).unsqueeze(1) # 重点！
    if dim == 3:
        div = pad(div, (0, 0, size // 2, (size - 1) // 2))
        div = avg_pool2d(div, (size, 1), stride=1).squeeze(1)
    else: # 重点！
        sizes = input.size() # 重点！
        div = div.view(sizes[0], 1, sizes[1], sizes[2], -1) # 重点！
        div = pad(div, (0, 0, 0, 0, size // 2, (size - 1) // 2)) # 重点！
        div = avg_pool3d(div, (size, 1, 1), stride=1).squeeze(1) # 重点！
        div = div.view(sizes) # 重点！
    div = div.mul(alpha).add(k).pow(beta) # 重点！
    return input / div # 重点！

需要注意的就只有注释“重点！”的几条语句。只讲解四维输入的情况，即输入为 $(N, C, W, H)$ 。

先规定我们的输入是（图文中的样例）：

import torch
import torch.nn as nn

c1 = [[1,2,3], [4,3,6], [7,8,9]]
c2 = [[1,2,1], [2,3,2], [3,4,3]]
c3 = [[2,1,2], [3,2,3], [4,3,4]]
c4 = [[4,2,1], [5,2,1], [2,2,4]]
x = torch.tensor([[c1, c2, c3, c4]], dtype=torch.float32)

print(x.size())
print(x)
"""
torch.Size([1, 4, 3, 3])
tensor([[[[1., 2., 3.],
          [4., 3., 6.],
          [7., 8., 9.]],

         [[1., 2., 1.],
          [2., 3., 2.],
          [3., 4., 3.]],

         [[2., 1., 2.],
          [3., 2., 3.],
          [4., 3., 4.]],

         [[4., 2., 1.],
          [5., 2., 1.],
          [2., 2., 4.]]]])
"""

从第一句看起：

dim = input.dim() # 重点！

这步是获取输入的维度。如果是四维，则会到else语句。

再看下一步：

div = input.mul(input).unsqueeze(1)

可以理解div为临时变量，现在div保存的是我们输入的四维张量进行按位平方操作，之后再在dim=1的维度进行扩充。

首先要明白.unsqueeze(1)是在干什么：

import torch

input = torch.ones(1, 4, 3, 3, dtype=torch.float32)
print(input.size())
print(input)
"""
torch.Size([1, 4, 3, 3])
tensor([[[[1., 1., 1.],
          [1., 1., 1.],
          [1., 1., 1.]],

         [[1., 1., 1.],
          [1., 1., 1.],
          [1., 1., 1.]],

         [[1., 1., 1.],
          [1., 1., 1.],
          [1., 1., 1.]],

         [[1., 1., 1.],
          [1., 1., 1.],
          [1., 1., 1.]]]])
"""

如果对input调用.unsqueeze(1)：

print(input.unsqueeze(dim=1).size())
print(input.unsqueeze(dim=1))
"""
torch.Size([1, 1, 4, 3, 3])
tensor([[[[[1., 1., 1.],
           [1., 1., 1.],
           [1., 1., 1.]],

          [[1., 1., 1.],
           [1., 1., 1.],
           [1., 1., 1.]],

          [[1., 1., 1.],
           [1., 1., 1.],
           [1., 1., 1.]],

          [[1., 1., 1.],
           [1., 1., 1.],
           [1., 1., 1.]]]]])
"""

发现只是在dim=1多插入了一维，其他没有变化。

如果调用.unsqueeze(0)和调用.unsqueeze(4)：

print(input.unsqueeze(dim=0).size())
print(input.unsqueeze(dim=4).size())
"""
torch.Size([1, 1, 4, 3, 3])
torch.Size([1, 4, 3, 3, 1])
"""

就是起到扩充维度个数的作用。

言归正传，div = input.mul(input).unsqueeze(1)语句就是将输入的四维张量input先进行平方再进行扩维。

以上图中举的样例作为输入，执行该步得到的输出为：（对源码稍微修改一下，在该语句后加上个print就可以观察输出了）

import torch
import torch.nn as nn

lrn = nn.LocalResponseNorm(size=2, alpha=1, beta=1, k=0)

c1 = [[1,2,3], [4,3,6], [7,8,9]]
c2 = [[1,2,1], [2,3,2], [3,4,3]]
c3 = [[2,1,2], [3,2,3], [4,3,4]]
c4 = [[4,2,1], [5,2,1], [2,2,4]]
x = torch.tensor([[c1, c2, c3, c4]], dtype=torch.float32)
lrn(x)
"""
torch.Size([1, 1, 4, 3, 3]) # 扩充维度
tensor([[[[[ 1.,  4.,  9.],
           [16.,  9., 36.],
           [49., 64., 81.]],

          [[ 1.,  4.,  1.],
           [ 4.,  9.,  4.],
           [ 9., 16.,  9.]],

          [[ 4.,  1.,  4.],
           [ 9.,  4.,  9.],
           [16.,  9., 16.]],

          [[16.,  4.,  1.],
           [25.,  4.,  1.],
           [ 4.,  4., 16.]]]]]) # 平方
"""

进入else，只看维度在三维以上的情况。else中的第一句是：

sizes = input.size()

获取输入张量的各个维度的大小。

再下一句：

div = div.view(sizes[0], 1, sizes[1], sizes[2], -1)

对五维张量div进行变形，第二维度大小变为1，由于上面.unsqueeze(1)变换的就是第二维度，所以该语句对div没有影响。（应该是在其他情况下会有影响）

再看下一句：

div = pad(div, (0, 0, 0, 0, size // 2, (size - 1) // 2))

这句话是为div加上padding，至于怎么加，先假设div的五个维度为 $(N, N e w, C, W, H)$ ，在 $C$ 这一维度的最前面插入 $s i z e / / 2$ 个大小为 $(W, H)$ 的全零padding，在 $C$ 这一维度的最后面插入 $(s i z e - 1) / / 2$ 个大小为 $(W, H)$ 的全零padding。

还是对于上面的输入张量而言，如果我们规定size=2，则该语句执行后的输出如下：

"""
tensor([[[[[ 0.,  0.,  0.],
           [ 0.,  0.,  0.],
           [ 0.,  0.,  0.]],

          [[ 1.,  4.,  9.],
           [16.,  9., 36.],
           [49., 64., 81.]],

          [[ 1.,  4.,  1.],
           [ 4.,  9.,  4.],
           [ 9., 16.,  9.]],

          [[ 4.,  1.,  4.],
           [ 9.,  4.,  9.],
           [16.,  9., 16.]],

          [[16.,  4.,  1.],
           [25.,  4.,  1.],
           [ 4.,  4., 16.]]]]])
"""

size=2，所以前面要插入1个padding，后面要插入0个padding，没有问题。

如果size=3，则输出如下：

"""
tensor([[[[[ 0.,  0.,  0.],
           [ 0.,  0.,  0.],
           [ 0.,  0.,  0.]],

          [[ 1.,  4.,  9.],
           [16.,  9., 36.],
           [49., 64., 81.]],

          [[ 1.,  4.,  1.],
           [ 4.,  9.,  4.],
           [ 9., 16.,  9.]],

          [[ 4.,  1.,  4.],
           [ 9.,  4.,  9.],
           [16.,  9., 16.]],

          [[16.,  4.,  1.],
           [25.,  4.,  1.],
           [ 4.,  4., 16.]],

          [[ 0.,  0.,  0.],
           [ 0.,  0.,  0.],
           [ 0.,  0.,  0.]]]]])
"""

根据整除计算的结果也可以算出前面、后面均插入一个padding。

再看下一条语句：

div = avg_pool3d(div, (size, 1, 1), stride=1).squeeze(1)

该语句进行三维平均池化操作，再进行.unsqueeze(1)的逆操作。

二维平均池化我们都知道是计算 $\sum_{m=W_0}^{W_1}\sum_{n=H_0}^{H_1}input$ ，也就是一个样本的一个通道的一块区域（二维，理解为一个面内）像素值的均值。

类似地，三维平均池化是对于一个五维张量 $(N, C, D, W, H)$ 而言的，是计算 $\sum_{k=D_0}^{D_1}\sum_{m=W_0}^{W_1}\sum_{n=H_0}^{H_1}input$ ，也就是一个样本的一个通道的一块区域（三维，理解为一个体内）像素值的均值。

我们知道了.unsqueeze(1)是加一个维度，那么.squeeze(1)就是删去dim=1这一维度，对咱们的样例没有影响。

注意是对加入padding后的五维张量进行操作。

仍以size=2为例：（前面加入一个padding，后面不加）

假设灰色部分为padding部分，即全0；紫色、绿色、粉色依次为原先的第一、二、三通道。

进行三维平均池化的窗口大小为 $(s i z e, 1, 1)$ ，所以对于(0,0,0)位置的池化操作为(div(0,0,0) + div(1, 0, 0))/2，对(1,0,0)位置的池化为(div(1, 0, 0) + div(2, 0, 0))/2，对(2,0,0)位置的池化为(div(2, 0, 0) + div(3, 0, 0))/2，由于(3,0,0)后面就没有通道了，所以(X,0,0)位置的池化就没有了。其他位置同理。

对于该样例，输出一下该语句执行完的结果：

size=2时
进行池化前：
"""
tensor([[[[[ 0.,  0.,  0.],
           [ 0.,  0.,  0.],
           [ 0.,  0.,  0.]],

          [[ 1.,  4.,  9.],
           [16.,  9., 36.],
           [49., 64., 81.]],

          [[ 1.,  4.,  1.],
           [ 4.,  9.,  4.],
           [ 9., 16.,  9.]],

          [[ 4.,  1.,  4.],
           [ 9.,  4.,  9.],
           [16.,  9., 16.]],

          [[16.,  4.,  1.],
           [25.,  4.,  1.],
           [ 4.,  4., 16.]]]]])
"""
进行池化后：
"""
tensor([[[[ 0.5000,  2.0000,  4.5000],
          [ 8.0000,  4.5000, 18.0000],
          [24.5000, 32.0000, 40.5000]],

         [[ 1.0000,  4.0000,  5.0000],
          [10.0000,  9.0000, 20.0000],
          [29.0000, 40.0000, 45.0000]],

         [[ 2.5000,  2.5000,  2.5000],
          [ 6.5000,  6.5000,  6.5000],
          [12.5000, 12.5000, 12.5000]],

         [[10.0000,  2.5000,  2.5000],
          [17.0000,  4.0000,  5.0000],
          [10.0000,  6.5000, 16.0000]]]])
"""

验证一下，(0,0,0)的值变成了(1+0)/2=0.5。（多验证几个）没问题。

有能力的也可以试试输出当size=3时的池化结果，也就是前后都加了一个padding。

再看下一条语句：

div = div.view(sizes)

将池化后的结果变回原来的样式。其实我们上一步的.squeeze(1)已经将div变回去了。

再看下一条语句：

div = div.mul(alpha).add(k).pow(beta)

上述语句相当于已经计算出公式中的
$\sum_{j=max(0,i-size//2)}^{min(C-1,i+(size-1)//2)} (a^j_{x,y})^2$
这一部分，所以该语句就是将其余的部分算上。

先每一个位置都乘以 $\alpha$ ，再加上 $k$ ，进行幂操作。

最后返回return input / div，原张量除以上面计算得到的分母，整个公式计算完成。

最后的输出：

"""
tensor([[[[2.0000, 1.0000, 0.6667],
          [0.5000, 0.6667, 0.3333],
          [0.2857, 0.2500, 0.2222]],

         [[1.0000, 0.5000, 0.2000],
          [0.2000, 0.3333, 0.1000],
          [0.1034, 0.1000, 0.0667]],

         [[0.8000, 0.4000, 0.8000],
          [0.4615, 0.3077, 0.4615],
          [0.3200, 0.2400, 0.3200]],

         [[0.4000, 0.8000, 0.4000],
          [0.2941, 0.5000, 0.2000],
          [0.2000, 0.3077, 0.2500]]]])
"""

总结一下，PyTorch实现该函数的重点思路是先在前面、后面分别加上 $s i z e / / 2$ 和 $(s i z e - 1) / / 2$ 个padding，再以 $(s i z e, 1, 1)$ 为窗口进行3D池化，中间过程加上各种运算即可。

脑电分析入门指南：信号处理、特征提取与机器学习 Ao000000 信号处理机器学习人工智能
脑电分析入门指南一、为什么要研究脑电1.课题目标（解决什么问题）2.输入与输出二、脑电分析的整体流程三、每一步详解1.数据采集2.预处理3.特征提取4.特征选择/降维5.分类与识别四、研究过程中遇到的挑战与解决方法五、学习感受一、为什么要研究脑电1.课题目标（解决什么问题）本课题旨在通过对脑电（EEG）的采集与分析，提取有用的神经信息，实现对某类脑状或行为的识别/预测/评估。例如：情绪识别、疾病诊
【动手学深度学习】4.10 实战Kaggle比赛：预测房价 XiaoJ1234567 《动手学深度学习》深度学习人工智能
目录4.10实战Kaggle比赛：预测房价1）数据预处理2）模型定义与训练3）模型评估与预测4）模型训练与预测提交5）示例超参数（可调）4.10实战Kaggle比赛：预测房价数据来源：Kaggle房价预测比赛.1）数据预处理读取数据importpandasaspdtrain_data=pd.read_csv('../data/kaggle_house_pred_train.csv')test_da
【机器学习-08】参数调优宝典：网格搜索与贝叶斯搜索等攻略云天徽上机器学习机器学习人工智能
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
NLP-D7-李宏毅机器学习---X-Attention&&GAN&BERT&GPT 甄小胖机器学习自然语言处理机器学习 bert
—0521今天4:30就起床了！真的是迫不及待想看新的课程！！！昨天做人脸识别系统的demo查资料的时候，发现一个北理的大四做cv的同学，差距好大！！！我也要努力呀！！不是比较，只是别人可以做到这个程度，我也一定可以！！！要向他学习！！！开始看课程啦！-----0753看完了各种attention，由于attention自己计算的限制，当N很大的时候会产生计算速度问题，从各种不同角度（人工知识输入
PyTorch 在 Python 自然语言处理中的运用 Python编程之道 Python编程之道 python pytorch 自然语言处理 ai
PyTorch在Python自然语言处理中的运用关键词：PyTorch，Python，自然语言处理，深度学习，文本分类，情感分析摘要：本文全面探讨了PyTorch在Python自然语言处理（NLP）领域的运用。首先介绍了相关背景知识，包括目的范围、预期读者等内容。接着详细阐述了核心概念，如词嵌入、循环神经网络等，并给出了相应的原理示意图和流程图。深入讲解了核心算法原理，结合Python代码进行详细
板凳-------Mysql cookbook学习（十一--------4)
唐宇迪机器学习实战课程笔记https://blog.csdn.net/weixin_54338498/article/details/128818007?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7ECtr-1-12881
AAAI—24—Main—paper（关于Multi—Modal的全部文章摘要）
我们生活在一个由多种模态（Multimodal）信息构成的世界，包括视觉信息、听觉信息、文本信息、嗅觉信息等等，当研究的问题或者数据集包含多种这样的模态信息时我们称之为多模态学习多模态机器学习旨在处理学习（视觉，听觉，语言等）不同模态融合交织的信息。下游任务（1）视觉问答1.视觉问答(visualquestionanswering,VQA).给予视觉输入(图像或视频),VQA代表了正确提供一个问题
神经网络初步学习3——数据与损失 X Y O 神经网络学习人工智能
一、传统机器学习与神经网络前言：该部分需要一定的机器学习与数学基础（很浅的基础），如果有不理解的地方可以自行查阅。（1）区别这里不妨以图像识别为例子：（1）在传统的机器学习视角中：我们需要人工手动去设置并提取我们的特征量，例如常见的SIFT、SURF和HOG等，随后需要我们选择合适的分类器（例如：SVM、KNN等分类器）,接着把我们的参数训练出来。（2）而在神经网络的视角中：我们只需要把图片喂给它
量化价值投资中的深度学习技术：TensorFlow实战
量化价值投资中的深度学习技术：TensorFlow实战关键词：量化价值投资,深度学习,TensorFlow,股票预测,因子模型,LSTM神经网络,量化策略摘要：本文将带你走进"量化价值投资"与"深度学习"的交叉地带，用小学生都能听懂的语言解释复杂概念，再通过手把手的TensorFlow实战案例，教你如何用AI技术挖掘股票市场中的价值宝藏。我们会从传统价值投资的痛点出发，揭示深度学习如何像"超级分析
ResNet：深度卷积神经网络的里程碑心想事“程” 小知识点 cnn 人工智能神经网络
一、引言在深度学习的发展历程中，深度卷积神经网络（CNN）不断演进，旨在提升对图像等数据的特征提取与分类能力。然而，随着网络层数的增加，传统CNN面临着梯度消失、梯度爆炸以及退化等棘手问题，训练变得愈发困难。2015年，由微软研究院提出的ResNet（ResidualNetworks，残差网络）横空出世，它以独特的残差学习思想，成功攻克了这些难题，在ImageNet竞赛中大放异彩，开创了深度神经网
视觉算法之卷积神经网络清风AI 深度学习算法详解及代码复现计算机视觉 cnn 神经网络深度学习 python 课程设计毕业设计
定义与特点卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种专为处理具有网格结构的数据而设计的深度学习模型。其独特的结构和功能使其在图像处理、语音识别等领域展现出卓越的性能:CNN的核心设计理念源于对生物视觉系统的模仿。通过模拟大脑皮层中视网膜和视觉皮层的层次化结构,CNN能够有效地捕捉图像中的局部特征并逐步抽象为高层语义信息。这种设计使得CNN特别擅长处理图像和音
卷积神经网络架构的演进：从AlexNet到EfficientNet t0_54manong 大数据与人工智能 cnn 架构人工智能个人开发
在过去的8.5年里，深度学习取得了飞速的进步。回溯到2012年，AlexNet在ImageNet上的Top-1准确率仅为63.3%，而如今，借助EfficientNet架构和师生训练法，我们已经能达到超过90%的准确率。本文将聚焦于卷积神经网络（CNN）架构的演变，深入探究其背后的基本原理。一些关键术语在深入了解各种架构之前，我们需要明确几个关键术语。更宽的网络意味着卷积层中有更多的特征图（滤波器
【AI大模型】PyTorch Lightning 简化工具我爱一条柴ya 学习AI记录人工智能 pytorch python ai AI编程
PyTorchLightning是一个轻量级的PyTorch封装库，它通过抽象训练循环的工程细节，让研究人员可以专注于模型设计和实验。以下是PyTorchLightning的核心概念和实战指南。核心优势基础使用：三步搭建训练流程1.定义LightningModuleimporttorchimporttorch.nnasnnimportpytorch_lightningasplfromtorchme
一文搞懂 Cursor 内部工作原理~ zz_jesse
介绍了Cursor，一个结合了AI技术的代码编辑器，它通过深度学习和语义索引的方式，提升了开发者的工作效率。Cursor通过与VSCode相似的界面和功能，以及自己的AI特性，实现了代码的智能化编辑和错误检查。译文从这开始～～你可能已经看到新闻：OpenAI正以高达30亿美元的价格收购Windsurf！与此同时，Cursor的母公司Anysphere也正在以90亿美元估值融资9亿美元！这对于代码生
如何让AI真正理解你的意图（自适应Prompt实战指南） nine是个工程师大语言模型人工智能 prompt
目前的LLM模型，在理解用户意图方面，正在使用自适应Prompt技术，来提升模型的理解能力。目前使用deepseek推理模型能明显看到自适应的一个过程。前言：为什么你的AI总是"答非所问"？相信很多人都遇到过这样的情况：你问：“帮我写一个Python爬虫”AI答：给你一堆理论知识和完整教程（你只想要简单代码）你问：“推荐一部电影”AI答：推荐了《教父》（你想看轻松喜剧）你问：“解释一下机器学习”A
AI人工智能与机器学习的大数据融合应用 AI智能探索者人工智能机器学习大数据 ai
AI人工智能与机器学习的大数据融合应用关键词：AI人工智能、机器学习、大数据、融合应用、数据挖掘摘要：本文深入探讨了AI人工智能与机器学习在大数据融合应用方面的相关内容。首先介绍了研究的背景、目的、预期读者和文档结构，对核心术语进行了清晰定义。接着阐述了AI、机器学习和大数据的核心概念及相互联系，给出了形象的文本示意图和Mermaid流程图。详细讲解了核心算法原理，并通过Python源代码进行说明
目标检测YOLO实战应用案例100讲-基于深度学习的自动驾驶目标检测算法研究（续）林聪木目标检测 YOLO 深度学习
目录基于双蓝图卷积的轻量化自动驾驶目标检测算法5.1引言5.2DarkNet53网络冗余性分析5.3双蓝图卷积网络5.4实验结果及分析基于深度学习的自动驾驶目标检测算法研究与应用传统的目标检测算法目标检测基线算法性能对比与选择相关理论和算法基础2.1引言2.2人工神经网络2.3FCOS目标检测算法2.4复杂交通场景下的目标检测难点与FCOS改进方案基于FCOS的目标检测算法改进3.1引言3.2Re
AI人工智能遇上TensorFlow：技术融合新趋势 AI大模型应用之禅人工智能 tensorflow python ai
AI人工智能遇上TensorFlow：技术融合新趋势关键词：人工智能、TensorFlow、深度学习、神经网络、机器学习、技术融合、AI开发摘要：本文深入探讨了人工智能技术与TensorFlow框架的融合发展趋势。我们将从基础概念出发，详细分析TensorFlow在AI领域的核心优势，包括其架构设计、算法实现和实际应用。文章包含丰富的技术细节，如神经网络原理、TensorFlow核心算法实现、数学
深度学习核心知识简介和模型调参研术工坊深度学习知识和技巧深度学习人工智能 python
深度学习模型调优就像调制一道复杂的菜肴，需要掌握多种"调料"的用法。本文将为您详解这些关键"调料"，帮助您烹饪出高性能的模型。###核心参数及其影响####1️⃣Loss（损失函数）**基本介绍**：衡量模型预测与真实值差距的指标，是模型优化的指南针。**生活类比**：想象你在教小孩认识动物：-**完美情况**：小孩看到猫说"猫"，看到狗说"狗"→Loss=0-**有错误**：小孩看到猫说"狗"→
【小白入门必看】一文读懂深度学习计算机视觉技术及学习路线
一、什么是计算机视觉？计算机视觉，其实就是教机器怎么像我们人一样，用摄像头看看周围的世界，然后理解它。比如说，它能认出这是个苹果，或者那边有辆车。除此之外，还能把拍到的照片或者视频转换成有用的信息，帮我们做决定。整个过程就是为了让机器能看懂图像，然后根据这些图像来做出聪明的选择。二、计算机视觉实现起来难吗？人类依赖视觉，找辆汽车轻而易举，毕竟汽车那么大，一眼就能看出来，所以常误以为计算机视觉简单，
2025年跑深度学习电脑配置-深度学习显卡推荐 OpenCV图像识别人工智能深度学习智能电视人工智能
2025年跑深度学习任务，电脑配置需从处理器、内存、显卡、存储、散热与电源、扩展性、网络连接等多方面综合考量，以下是具体分析：处理器（CPU）多核高性能：深度学习涉及大量并行计算任务，需要处理器具备强大的多核处理能力。英特尔至强Scalable处理器（SapphireRapids或后续架构）和AMDEPYC处理器（Genoa或后续架构）是不错的选择。英特尔至强Scalable处理器提供卓越的单核性
【零基础学AI】第30讲：生成对抗网络(GAN)实战 - 手写数字生成 1989 0基础学AI 人工智能生成对抗网络神经网络 python 机器学习近邻算法深度学习
本节课你将学到GAN的基本原理和工作机制使用PyTorch构建生成器和判别器DCGAN架构实现技巧训练GAN模型的实用技巧开始之前环境要求Python3.8+需要安装的包：pipinstalltorchtorchvisionmatplotlibnumpyGPU推荐（可大幅加速训练）前置知识第21讲TensorFlow基础第23讲神经网络原理基本PyTorch使用经验核心概念什么是GAN？GAN就像
【深度学习第六期深度学习中的归一化与正则化技术：原理、实践与应用】码上有前 Python 深度学习 Pytorch 深度学习人工智能 cnn
作者：“码上有前”文章简介：深度学习欢迎小伙伴们点赞、收藏⭐、留言深度学习中的归一化与正则化技术：原理、实践与应用摘要：本文深入探讨深度学习中批量归一化（BN）、层归一化（LN）、标准化以及正则化等关键技术。详细阐述它们的基本原理，包括如何调整数据分布、控制模型复杂度等；通过丰富的实例和对应代码，展示在不同网络架构中这些技术的具体实现方式，以及对模型训练和性能的影响；同时，对比分析各项技术的特点和
如何使用Python控制笔记本电脑屏幕亮度？很酷的站长编程笔记电脑 python 开发语言
Python已成为世界上最受欢迎的编程语言之一，这要归功于它的简单性、多功能性和广泛的应用程序。凭借其广泛的库和框架，Python可用于从Web开发到机器学习以及介于两者之间的任何内容。在Python中，最流行的数据分析和操作库之一是Pandas，它提供了处理表格数据的强大工具。在本教程中，我们将使用Python和屏幕亮度控制库来探索如何控制笔记本电脑屏幕亮度。我们将向您展示如何使用Python通
10、量子神经网络：从理论到实践安检量子神经网络 PennyLane Qiskit
量子神经网络：从理论到实践1.量子神经网络简介量子神经网络（QuantumNeuralNetworks,QNNs）是量子计算与经典机器学习相
深度神经网络课程设计：从理论到实践 Vita Libre
本文还有配套的精品资源，点击获取简介：深度神经网络是深度学习预测的核心技术，本课程设计项目旨在教授学生如何构建和应用深度神经网络进行各种预测任务，包括图像识别和自然语言处理。学生将通过源代码示例学习从网络架构设计、数据预处理到模型训练与评估的完整流程，并掌握深度学习的基本概念、组件及技巧。1.深度神经网络定义和在深度学习预测中的角色深度神经网络（DeepNeuralNetworks,DNNs）是深
深度学习基础与应用：从理论到实战创新工场
本文还有配套的精品资源，点击获取简介：深度学习是人工智能的核心分支，通过模拟人脑神经网络处理大量数据以执行复杂任务。Python因其简洁性和强大的库支持成为深度学习研究的首选语言。本文概述了深度学习基础概念、核心算法、Python框架，并假设了一个包含教程、示例代码、数据集、交互式学习环境、性能评估指标和进阶主题的“deep-learning-study-main”压缩包内容，旨在帮助学习者深入理
大模型与智能体：螺旋共生，绘就智能新蓝图东锋17 人工智能大模型智能体人工智能
大模型与智能体：螺旋共生，绘就智能新蓝图在人工智能的前沿领域，大模型与智能体宛如两颗璀璨的星辰，以一种精妙的螺旋共生关系，重塑着智能世界的格局，深刻影响着我们生活与工作的方方面面。大模型：构筑智能大厦的基石大语言模型，像广为人知的GPT-4、通义千问等，凭借在海量数据中深度学习的锤炼，展现出卓越的语言理解与生成天赋。它们就像知识渊博的学者，能熟练应对各类自然语言任务。无论是洋洋洒洒的文章创作，还是
huggingface 笔记： Trainer UQI-LIUWJ 笔记人工智能
Trainer是一个为Transformers中PyTorch模型设计的完整训练与评估循环只需将模型、预处理器、数据集和训练参数传入Trainer，其余交给它处理，即可快速开始训练自动处理以下训练流程：根据batch计算loss使用backward()计算梯度根据梯度更新权重重复上述流程直到达到指定的epoch数1配置TrainingArguments使用TrainingArguments定义训练
深度学习之迁移学习路溪非溪人工智能迁移学习机器学习
认识迁移学习迁移学习（TransferLearning）是机器学习中的一种重要技术，其核心思想是将在一个任务上学习到的知识（模型参数、特征表示等），迁移应用到另一个相关但不同的任务中，从而提升新任务的学习效率和性能，尤其是在新任务数据有限的情况下。一、迁移学习的核心动机传统机器学习通常要求为每个新任务收集大量标注数据并从头训练模型，但现实中面临以下挑战：数据稀缺：例如医疗影像分析（罕见疾病样本少）
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb

torch.nn.LocalResponseNorm（局部响应归一化）详解（附源码解析）

torch.nn.LocalResponseNorm

局部响应归一化的理解

LocalResponseNorm参数讲解

图文讲解过程

PyTorch中对LocalResponseNorm函数的实现

你可能感兴趣的:(【Pytorch学习】,深度学习,pytorch,机器学习)