莱维贝贝、

通俗易懂的反向传播法（python 代码实现）

1. 计算图

1.1 计算图的优点

2. 链式法则

2.1 计算图的反向传播

2.2 什么是链式法则

2.3 链式法则和计算图

2.3 反向传播

2.3.1 加法节点的反向传播

2.3.2 乘法节点的反向传播

2.2.4 苹果例子

3.简单层的实现

3.1 乘法层的实现

3.2 加法层的实现

4 激活函数层的实现

4.1 ReLU层

4.2 Sigmoid层

5 Affine/Softmax层的实现

5.1 Affine层

5.2 批版本的Affine

5.3 Softmax-with-Loss层

6 误差反向传播的实现

1. 计算图

计算图将计算过程用图形表示出来。这里说的图形是数据结构图，通过多个节点和边表示（连接节点的直线称为“边”）。
用计算图求解几个常见的问题：

问题1：太郎在超市买了2个100日元一个的苹果，消费税是10%，请计算支付金额。

问题2：太郎在超市买了2个苹果、 3个橘子。其中，苹果每个100日元，橘子每个150日元。消费税是10%，请计算支付金额。

综上，用计算图解题的情况下，需要按如下流程进行。
1.构建计算图。
2.在计算图上，从左向右进行计算。
这里的第2歩“从左向右进行计算”是一种正方向上的传播，简称为正向传播（forward propagation）。正向传播是从计算图出发点到结束点的传播。既然有正向传播这个名称，当然也可以考虑反向（从图上看的话，就是从右向左）的传播。实际上，这种传播称为反向传播（backward propagation）。反向传播将在接下来的导数计算中发挥重要作用。

1.1 计算图的优点

优点1：局部计算使各个节点致力于简单的计算，从而简化问题，如下图所示

优点2：利用计算图可以将中间的计算结果全部保存起来（比如，计算进行到2个苹果时的金额是200日元、加上消费税之前的金额650日元等）。

优点3：可以通过反向传播高效计算导数

2. 链式法则

反向传播将局部导数向正方向的反方向（从右到左）传递，传递这个局部导数的原理，是基于链式法则（chain rule）

2.1 计算图的反向传播

假设存在y = f(x)的计算，这个计算的反向传播如下图所示：

反向传播的计算顺序是，将信号E乘以节点的局部导数，然后将结果传递给下一个节点。这里所说的局部导数是指正向传播中y = f(x)的导数，也就是y关于x的导数。比如，假设y = f(x) = x^2，
则局部导数为 = 2x。把这个局部导数乘以上游传过来的值（本例中为E），然后传递给前面的节点。

2.2 什么是链式法则

深度学习-链式求导：https://blog.csdn.net/weixin_40476348/article/details/94434483 （这位博主介绍的很详细）

2.3 链式法则和计算图

“**2”节点表示平方运算
根据链式法则，成立，对应“z关于x的导数”。也就是说，反向传播是基于链式法则的。

的结果为2(x + y)

2.3 反向传播

2.3.1 加法节点的反向传播

首先来考虑加法节点的反向传播。这里以z = x + y为对象，观察它的反向传播。 z = x + y的导数可由下式（解析性地）计算出来。

由图可知加法节点的反向传播只是将输入信号输出到下一个节点

2.3.2 乘法节点的反向传播

我们考虑z = xy，这个式子的导数用下式表示。

由图乘法的反向传播需要正向传播时的输入信号值，案列如下图所示：

因为乘法的反向传播会乘以输入信号的翻转值，所以各自可按1.3 × 5 =6.5、 1.3 × 10 = 13计算。

2.2.4 苹果例子

3.简单层的实现

3.1 乘法层的实现

层的实现中有两个共通的方法（接口） forward()和backward()。 forward()对应正向传播， backward()对应反向传播。

class MulLayer:
    def __init__(self):  # 初始化x,y
        self.x = None
        self.y = None

    def forward(self, x, y): # 接受x和y两个参数，将他们相乘后输出
        self.x = x
        self.y = y                
        out = x * y

        return out

    def backward(self, dout):  # 将从上游传来的导数（dout）乘以正向传播的翻转值，然后传给下游
        dx = dout * self.y
        dy = dout * self.x

        return dx, dy

# coding: utf-8


class MulLayer:
    def __init__(self):
        self.x = None
        self.y = None

    def forward(self, x, y):
        self.x = x
        self.y = y
        out = x * y

        return out

    def backward(self, dout):
        dx = dout * self.y
        dy = dout * self.x

        return dx, dy



apple = 100
apple_num = 2
tax = 1.1

mul_apple_layer = MulLayer()
mul_tax_layer = MulLayer()

# forward
apple_price = mul_apple_layer.forward(apple, apple_num)
price = mul_tax_layer.forward(apple_price, tax)

# backward
dprice = 1
dapple_price, dtax = mul_tax_layer.backward(dprice)
dapple, dapple_num = mul_apple_layer.backward(dapple_price)

print("price:", int(price))
print("dApple:", dapple)
print("dApple_num:", int(dapple_num))
print("dTax:", dtax)

3.2 加法层的实现

class AddLayer:
    def __init__(self): # 不需要进行初始化
        pass

    def forward(self, x, y): #  接受x和y两个参数，将它们相加后输出
        out = x + y

        return out

    def backward(self, dout): # 将上游传来的导数（dot）原封不动地传递给下游
        dx = dout * 1
        dy = dout * 1

        return dx, dy

# coding: utf-8


class MulLayer:
    def __init__(self):
        self.x = None
        self.y = None

    def forward(self, x, y):
        self.x = x
        self.y = y
        out = x * y

        return out

    def backward(self, dout):
        dx = dout * self.y
        dy = dout * self.x

        return dx, dy


class AddLayer:
    def __init__(self):
        pass

    def forward(self, x, y):
        out = x + y

        return out

    def backward(self, dout):
        dx = dout * 1
        dy = dout * 1

        return dx, dy


apple = 100
apple_num = 2
orange = 150
orange_num = 3
tax = 1.1

# layer
mul_apple_layer = MulLayer()
mul_orange_layer = MulLayer()
add_apple_orange_layer = AddLayer()
mul_tax_layer = MulLayer()

# forward
apple_price = mul_apple_layer.forward(apple, apple_num)  # (1)
orange_price = mul_orange_layer.forward(orange, orange_num)  # (2)
all_price = add_apple_orange_layer.forward(apple_price, orange_price)  # (3)
price = mul_tax_layer.forward(all_price, tax)  # (4)

# backward
dprice = 1
dall_price, dtax = mul_tax_layer.backward(dprice)  # (4)
dapple_price, dorange_price = add_apple_orange_layer.backward(dall_price)  # (3)
dorange, dorange_num = mul_orange_layer.backward(dorange_price)  # (2)
dapple, dapple_num = mul_apple_layer.backward(dapple_price)  # (1)

print("price:", int(price))
print("dApple:", dapple)
print("dApple_num:", int(dapple_num))
print("dOrange:", dorange)
print("dOrange_num:", int(dorange_num))
print("dTax:", dtax)

4 激活函数层的实现

先来实现激活函数的ReLU层和Sigmoid层的实现

4.1 ReLU层

激活函数ReLU由下式表示： y关于x的导数，如下式所示：

如果正向传播时的输入x大于0，则反向传播会将上游的值原封不动地传给下游。反过来，如果正向传播时的x小于等于0，则反向传播中传给下游的信号将停在此处。用计算图表示的话如下图所示

class Relu:
    def __init__(self):
        self.mask = None

    def forward(self, x):
        self.mask = (x <= 0)
        out = x.copy()
        out[self.mask] = 0

        return out

    def backward(self, dout):
        dout[self.mask] = 0
        dx = dout

        return dx

Relu类有实例变量mask。这个变量mask是由True/False构成的NumPy数组，它会把正向传播时的输入 x的元素中小于等于0的地方保存为 True，其他地方（大于0的元素）保存为 False。如下例所示， mask变量保存了由 True/False构成的NumPy数组

正向传播时的输入值小于等于0，则反向传播的值为0。因此，反向传播中会使用正向传播时保存的 mask，将从上游传来的 dout的mask中的元素为True的地方设为0。

4.2 Sigmoid层

实现sigmoid函数的公式如下：

步骤1：

“/”节点表示

步骤2：

“+”节点将上游的值原封不动地传给下游

步骤3：

“exp”节点表示y = exp(x)，它的导数由下式表示。

步骤4：

×”节点将正向传播时的值翻转后做乘法运算。因此，这里要乘以-1。

集约化的“sigmoid”节点：

class Sigmoid:
    def __init__(self):
        self.out = None

    def forward(self, x):
        out = sigmoid(x)
        self.out = out
        return out

    def backward(self, dout):
        dx = dout * (1.0 - self.out) * self.out

        return dx

5 Affine/Softmax层的实现

5.1 Affine层

复习下神经网络正向传播的流程：

这里， X、 W、 B 分别是形状为(2,)、 (2, 3)、 (3,)的多维数组。这样一来，神经元的加权和可以用 Y = np.dot(X, W) + B计算出来。然后， Y 经过激活函数转换后，传递给下一层。

矩阵的乘积运算中对应维度的元素个数要保持一致

神经网络的正向传播中进行的矩阵的乘积运算在几何学领域被称为“仿射变换” 。因此，这里将进行仿射变换的处理实现为“Affine层”

Affine层的计算图（注意变量是矩阵，各个变量的上方标记了该变量的形状）
接下来看下反向传播的推导：

中的T表示转置。转置操作会把W的元素(i, j)换成元素(j, i)。用数学式表示的话，可以写成下面这样。

5.2 批版本的Affine

前面介绍的Affi ne层的输入X是以单个数据为对象的。现在我们考虑N个数据一起进行正向传播的情况，也就是批版本的Affine层。

正向传播时，偏置会被加到每一个数据（第1个、第2个……）上。因此，反向传播时，各个数据的反向传播的值需要汇总为偏置的元素。用代码表示的话，如下所示。

综上所述， Affine的实现如下所示：另外， Affine的实现考虑了输入数据为张量（四维数据）的情况，与这里介绍的稍有差别。

class Affine:
    def __init__(self, W, b):
        self.W =W
        self.b = b
        
        self.x = None
        self.original_x_shape = None
        # 权重和偏置参数的导数
        self.dW = None
        self.db = None

    def forward(self, x):
        # 对应张量
        self.original_x_shape = x.shape
        x = x.reshape(x.shape[0], -1)
        self.x = x

        out = np.dot(self.x, self.W) + self.b

        return out

    def backward(self, dout):
        dx = np.dot(dout, self.W.T)
        self.dW = np.dot(self.x.T, dout)
        self.db = np.sum(dout, axis=0)
        
        dx = dx.reshape(*self.original_x_shape)  # 还原输入数据的形状（对应张量）
        return dx

5.3 Softmax-with-Loss层

softmax函数会将输入值正规化之后再输出。比如手写数字识别时， Softmax层的输出如下图

输入图像通过Affi ne层和ReLU层进行转换， 10个输入通过Softmax层进行正规化。在这个例子中，“ 0”的得分是 5.3，这个值经过Softmax层转换为 0.008（ 0.8%）；“ 2”的得分是10.1，被转换为0.991（ 99.1%）

神经网络中进行的处理有推理（inference）和学习两个阶段。神经网络的推理通常不使用Softmax层。比如，用图5-28的网络进行推理时，会将最后一个 Affine层的输出作为识别结果。神经网络中未被正规
化的输出结果（图 5-28中 Softmax层前面的 Affine层的输出）有时被称为“得分”。也就是说，当神经网络的推理只需要给出一个答案的情况下，因为此时只对得分最大值感兴趣，所以不需要Softmax层。
不过，神经网络的学习阶段则需要Softmax层。

下面来实现Softmax层。考虑到这里也包含作为损失函数的交叉熵误差（cross entropy error），所以称为“Softmax-with-Loss层”。 Softmax-withLoss层（Softmax函数和交叉熵误差）的计算图如下图所示

“简易版”的Softmax-with-Loss层的计算图

注意的是反向传播的结果。 Softmax层的反向传播得到了（y1 - t1, y2 - t2, y3 - t3）这样“漂亮”的结果。由于（y1, y2, y3）是Softmax层的输出，（t1, t2, t3）是监督数据，所以（y1 - t1, y2 - t2, y3 - t3）是Softmax层的输出和教师标签的差分。神经网络的反向传播会把这个差分表示的误差传递给前面的层，这是神经网络学习中的重要性质
神经网络学习的目的就是通过调整权重参数，使神经网络的输出（Softmax的输出）接近教师标签。因此，必须将神经网络的输出与教师标签的误差高效地传递给前面的层。刚刚的（y1 - t1, y2 - t2, y3 - t3）正是Softmax层的输出与教师标签的差，直截了当地表示了当前神经网络的输出与教师标签的误差。
这里考虑一个具体的例子，比如思考教师标签是（0, 1, 0）， Softmax层的输出是(0.3, 0.2, 0.5)的情形。因为正确解标签处的概率是0.2（20%），这个时候的神经网络未能进行正确的识别。此时， Softmax层的反向传播传递的是(0.3, -0.8, 0.5)这样一个大的误差。因为这个大的误差会向前面的层传播，所以Softmax层前面的层会从这个大的误差中学习到“大”的内容。
再举一个例子，比如思考教师标签是(0, 1, 0)， Softmax层的输出是(0.01,0.99, 0)的情形（这个神经网络识别得相当准确）。此时Softmax层的反向传播传递的是(0.01, -0.01, 0)这样一个小的误差。这个小的误差也会向前面的层传播，因为误差很小，所以Softmax层前面的层学到的内容也很“小”。

现在来进行Softmax-with-Loss层的实现，实现过程如下所示。

class SoftmaxWithLoss:
    def __init__(self):
        self.loss = None
        self.y = None # softmax的输出
        self.t = None # 监督数据

    def forward(self, x, t):
        self.t = t
        self.y = softmax(x)
        self.loss = cross_entropy_error(self.y, self.t)
        
        return self.loss

    def backward(self, dout=1):
        batch_size = self.t.shape[0]
        if self.t.size == self.y.size: # 监督数据是one-hot-vector的情况
            dx = (self.y - self.t) / batch_size
        else:
            dx = self.y.copy()
            dx[np.arange(batch_size), self.t] -= 1
            dx = dx / batch_size
        
        return dx

6 误差反向传播的实现

之前介绍的误差反向传播法会在步骤2中出现

【AIGC时代】OneCode前端框架入门指南：从环境搭建到第一个应用低代码老李 OneCode实战低代码软件行业学习前端框架
在人工智能生成内容(AIGC)技术飞速发展的今天，前端开发领域正经历着前所未有的变革。AI工具能够批量生成代码，但如何将这些自动生成的代码转化为可维护、高质量的生产级应用，成为开发者面临的核心挑战。OneCode框架凭借其独特的设计理念，在这一背景下展现出显著优势，本文将带您从零开始，快速掌握OneCode框架的使用方法。一、AIGC背景下选择OneCode框架的四大理由AIGC工具的普及为前端开
【Pyhton】文件读取：读取整个（大型）文件莫斯利安有点甜 python python 开发语言
正常情况下，如果文件不是很大，内存能够满足要求，使用内存读取就ok读取大型文件时，直接将整个文件内容加载到内存中可能会导致内存不足的问题。为了避免这种情况，Python提供了多种高效的方法来逐块或逐行读取大型文件。以下是几种常见的方法：方法1：逐行读取逐行读取文件是一种非常高效的方式，因为它一次只处理文件的一行，不会占用过多内存。withopen('large_file.txt','r',enco
【Python】文件应用：在with外部使用读取到的文件莫斯利安有点甜 python python 开发语言服务器
在Python中，使用withopen打开文件是一种常用的方式，它可以自动管理文件的打开和关闭。但是，文件只能在with内部使用，若要在withopen之外使用文件对象，可以通过以下几种方式实现：使用readlines()方法创建一个包含各行内容的列表使用readlines()方法可以一次性读取文件的所有行，并将它们存储在一个列表中。这种方式非常适合在withopen块中读取文件内容，然后在块之外
【Python】类中的参数传递莫斯利安有点甜 python python 开发语言前端
目录1`__init__`方法中的参数传递1.1有默认值的参数1.2没有默认值的参数1.3混合使用有默认值和无默认值的参数2类中方法的参数传递2.1从类的外部调用方法2.2从类的内部调用方法更多示例：传递多个参数3注意事项1__init__方法中的参数传递在Python中，__init__方法中的参数是否必须在实例化类时给出，取决于这些参数是否有默认值。以下是两种情况的详细说明：1.1有默认值的参
【Python】if __name__ == “__main__“: 莫斯利安有点甜 python python 开发语言
目录1.if__name__=="__main__":基本介绍2.使用场景3.实际应用示例1：简单的模块示例2：包含多个函数和类的模块4.高级用法动态模块加载多线程或多进程中的使用5.注意事项模块名称的动态性：包中的使用：避免意外执行代码：6.最佳实践封装入口逻辑：模块化设计：7.相关资源1.ifname==“main”:基本介绍if__name__=="__main__":是Python中一种常
python-26-回调函数用法和基于python发送邮件皮皮冰燃 python3 python
文章目录1什么是回调函数？1.1回调函数1.2回调函数的来源2回调示例2.1示例一2.1.1even.py2.1.2callback_demo.py2.2示例二2.2.1普通函数调用2.2.2回调函数2.3中间函数的调用者3QQ邮箱3.1POP3用于收取邮件3.2IMAP用于收取邮件3.3SMTP用于发送邮件3.4python发送邮件4参考附录1什么是回调函数？1.1回调函数回调函数就是一个被作为
PyMySQL：高级用法全解析
在数据驱动的时代，数据库操作是软件开发中至关重要的一环。PyMySQL作为Python中操作MySQL数据库的一个强大库，为开发者提供了便捷高效的数据库交互方式。在这篇博客中，我们将深入探讨PyMySQL的高级用法，带你领略其强大之处。一、连接池的构建与使用在实际应用中，频繁地创建和销毁数据库连接是非常耗时且低效的。连接池的出现就是为了解决这个问题。以下是使用PyMySQL构建连接池的示例：imp
PyMySQL的使用方法有哪些？怎么用？骨灰级收藏家互联网 python爬虫 mysql Python mysql 操作系统
PyMySQL的使用方法有哪些？怎么用？PyMySQL一个纯Python实现的MySQL客户端库，支持兼容Python3用于代替MySQLdb，其使用方法和MySQLdb几乎相同，但目前pymysql支持python3.x而后者不支持3.x版本。学习目标：能够使用PyMySQL完成数据库的增删改查1.思考如何实现将100000条数据插入到MySQL数据库?答案:如果使用之前学习的MySQL客户端来
三种方法详解最长回文子串问题
文章目录题目描述方法一：动态规划状态转移方程：状态转移公式：代码实现：使用滚动数组优化空间方法二：中心扩展法核心思想算法步骤代码实现复杂度分析方法三：马拉车算法算法思路代码实现复杂度分析三种方法对比回文子串是字符串处理中的经典问题，本文将通过动态规划、中心扩展和马拉车算法三种方法，详细解析如何高效求解最长回文子串，并对比各方法的优劣。题目描述方法一：动态规划我们定义一个二维布尔数组dp，其中：dp
力扣经典算法之爬楼梯
今天来用两种的方法解一道题题目如下：假设你正在爬楼梯。需要n阶你才能到达楼顶。每次你可以爬1或2个台阶。你有多少种不同的方法可以爬到楼顶呢？先分析题目吧，我觉得它在考我数学思维，解数学题嘛，一步步来吧。n=1：走1步，只能有1种解法n=2：可以走1+1步，也可以直接走2步，2种解法n=3：可以走的方式有：1+1+1，1+2，2+1，共3种n=4：走法有1+1+1+1，1+2+1，2+1+1，1+1
今日Github热门仓库推荐2025-07-08
今日Github热门仓库推荐2025-07-08如果让AI分别扮演后端开发人员和前端开发人员，然后看看他们分别对github每天的trending仓库感兴趣的有哪些，并且给出他感兴趣的理由，那会发生什么呢？本内容通过Python+AI生成，项目地址跳转后端开发人员推荐仓库名称：rustfs/rustfs仓库推荐理由：作为一个有10年后端开发经验的工程师，我对高性能和分布式系统有浓厚的兴趣。Rust
【LeetCode 热题 100】54. 螺旋矩阵 xumistore LeetCode leetcode 矩阵算法 java
Problem:54.螺旋矩阵题目：给你一个m行n列的矩阵matrix，请按照顺时针螺旋顺序，返回矩阵中的所有元素。文章目录整体思路完整代码时空复杂度时间复杂度：O(M*N)空间复杂度：O(1)(不考虑输出列表)整体思路这段代码旨在解决一个经典的矩阵问题：螺旋矩阵(SpiralMatrix)。问题要求按照顺时针螺旋的顺序，返回矩阵中的所有元素。该算法采用了一种非常直观的“路径模拟”策略。它模拟一个
算法45：动态规划专练(力扣70: 爬楼梯力扣746：使用最小花费爬楼梯) 适合java程序员的算法算法算法动态规划 leetcode
力扣70题：爬楼梯假设你正在爬楼梯。需要n阶你才能到达楼顶。每次你可以爬1或2个台阶。你有多少种不同的方法可以爬到楼顶呢？示例1：输入：n=2输出：2解释：有两种方法可以爬到楼顶。1.1阶+1阶2.2阶示例2：输入：n=3输出：3解释：有三种方法可以爬到楼顶。1.1阶+1阶+1阶2.1阶+2阶3.2阶+1阶分析：1.如果有1个楼梯，那只能走1步登顶。1中方法2.如果有2个楼梯。a.我们可以一次走一
区块链重塑域名商业版图：技术革新、市场机遇与未来图景 boyedu 区块链终端域名区块链终端域名
在Web3.0时代，区块链技术正以去中心化、抗审查、身份绑定等特性重构域名系统，不仅解决了传统DNS的安全漏洞与中心化风险，更开创了数字身份、品牌资产化等全新商业模式。以下从技术革新、市场现状、挑战应对及典型案例四个维度，深入剖析区块链域名的商业潜力。一、技术革新：区块链如何重构域名基础设施？去中心化根域名系统Handshake协议：通过UTXO模型与SHA3算法构建无需许可的域名注册体系，其HN
SEO优化技巧深度解析：从算法逻辑到实战策略的全链路突破 boyedu 网站建设网站建设网站运营网站架构
第一章搜索引擎算法逻辑：SEO优化的底层密码1.1算法进化史：从关键词匹配到意图理解搜索引擎算法经历了从简单关键词匹配到复杂语义理解的跨越式发展。早期算法以PageRank为核心，通过分析网页间链接关系评估权威性。随着Hummingbird算法的推出，搜索引擎开始解析自然语言，BERT算法进一步实现上下文语义理解。当前算法已形成多维度评估体系，涵盖内容质量、用户体验、权威性建设等层面。以Googl
香港推出的稳定币和数字货币的区别 boyedu 加密货币数字货币香港稳定币加密货币虚拟货币
香港推出的稳定币与数字货币在定义、发行主体、监管框架、使用场景及战略定位上存在显著差异。以下为具体解析：一、定义与性质的核心区别稳定币定义：与法定货币（如美元、港元）或资产挂钩的加密货币，旨在通过抵押或算法维持价值稳定。示例：京东币链科技测试的稳定币锚定港元，用于跨境支付；蚂蚁数科计划发行与美元挂钩的稳定币。特点：保留加密货币的去中心化特性，但通过储备资产（如现金、国债）减少价格波动。数字货币定义
有了 25k Star 的MediaCrawler爬虫库加持，三分钟搞定某红书、某音等平台爬取！前端后端爬虫
大家好，我是程序员凌览。今天给大家介绍一个超实用的Python爬虫实战项目——MediaCrawler。这个项目可以实现小红书、抖音、快手、B站和微博的爬虫功能，覆盖了当下热门的自媒体平台。它能够高效抓取这些平台上的视频、图片、评论、点赞和转发等信息。MediaCrawler支持的平台及功能如下图：快速开始下载项目代码访问MediaCrawlerGitHub仓库，点击“Code”按钮下载项目代码。
【机器学习|学习笔记】随机森林（Random Forest, RF）详解，附代码。努力毕业的小土博^_^ 机器学习基础算法优质笔记1 机器学习学习笔记随机森林人工智能
【机器学习|学习笔记】随机森林（RandomForest,RF）详解，附代码。【机器学习|学习笔记】随机森林（RandomForest,RF）详解，附代码。文章目录【机器学习|学习笔记】随机森林（RandomForest,RF）详解，附代码。前言起源随机子空间法与Bagging的萌芽原理算法机制理论保障发展应用优缺点优点缺点Python实现示例（Scikit-learn）欢迎铁子们点赞、关注、收藏
Python （类型提示）指定参数类型: 以及参数注解斐非韭 python python pycharm
类型标注的使用类型标注（Typeannotations）是一种直接的方式，并且是类型文档中最常见到的那种方式。声明一个函数参数的类型，只要在参数名称的后面加个":“号，带上类型名称就行了。声明函数的返回值类型，只要在函数声明结束之前，也就是”:“号之前加入一个”->"，带上类型名称。常见数据类型int,long,float:整型,长整形,浮点型bool,str:布尔型，字符串类型List,Tupl
python3 annotations weixin_30615767 python 开发工具
引文与描述：AddingarbitrarymetadataannotationstoPythonfunctionsandvariables说说我的体会：类似编译的作用，能够帮助你尽早地避免错误1.不支持Python2+>>>deftest_annotation_py2(a_str:str):File"",line1deftest_annotation_py2(a_str:str):^SyntaxE
LSA主题模型：基于奇异值分解的主题模型 AI天才研究院 AI人工智能与大数据 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LSA主题模型：基于奇异值分解的主题模型1.背景介绍主题模型是一种无监督的机器学习技术，用于发现大规模文本语料库中隐藏的语义结构。它能够自动识别文档集合中的主题，并根据这些主题对文档进行聚类和分类。主题模型在文本挖掘、信息检索、推荐系统等领域有着广泛的应用。LSA（LatentSemanticAnalysis）是一种经典的主题模型算法，基于奇异值分解（SVD）对词-文档矩阵进行分解，从而揭示词语和
云原生API Gateway：连接微服务的桥梁 AI云原生与云计算技术学院云原生 gateway 微服务 ai
云原生APIGateway：连接微服务的桥梁关键词：云原生、API网关、微服务架构、服务治理、流量管理、服务网格、DevOps摘要：本文深入探讨云原生环境下API网关的核心原理与实践应用，解析其在微服务架构中作为统一入口的关键作用。通过详细阐述API网关的核心功能、技术架构、算法原理及数学模型，结合Kubernetes实战案例演示流量管理、安全防护、服务编排等核心能力。同时分析典型应用场景，推荐前
python聚合函数aggregate和annotate的小坑你喝不喝热水啊 python python
最近在工作项目中发现了一个坑，就是关于aggregate和annotate这两个聚合函数的区别用法。现在百度上很多搜索的答案对初学者不是很友好，就是直接给出了一句代码，然后也不讲清楚，就用annotate后的结果取第一条（如：a[0]）取值。这样就导致很多初学者也不会去思考太多，直接copy下来就用，最后导致数据汇总有问题（也不止初学者了，项目组里面有些工作了几年的人都不知道二者区别，也是百度到了
人工智能驱动下的可再生能源气象预测：构建绿色能源时代的新大脑一ge科研小菜菜人工智能人工智能能源
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注一、背景：新能源快速发展下的预测焦虑为应对气候变化和实现碳中和目标，全球能源系统正在加速从“化石主导”向“可再生主导”过渡。风能、太阳能等清洁能源已成为未来能源结构的关键支柱。根据国际能源署（IEA）预测，到2050年，全球超70%的电力将来自可再生能源。然而，可再生能源具有显著的**“天气依赖性”和“波动不确定性”**，风速、光照、温度、湿度等
开源的人像动画生成工具LivePortrait 研创通之逍遥峰图像处理人工智能作画
LivePortrait是由快手科技联合中国科学技术大学和复旦大学共同开发的一款先进AI驱动肖像动画工具，它能够将静态的人像照片转化为带有真实面部表情和头部运动的动态视频。这项技术代表了当前AI生成内容(AIGC)领域的最新进展，通过创新的算法设计和高效的计算框架，为用户提供了强大且易用的动画生成能力。以下将从技术原理、核心功能、应用场景、使用方法和比较优势等多个维度，全面介绍这一工具。LiveP
筑牢 AIGC 安全防线：警惕提示词注入攻击 CS创新实验室 AIGC AIGC 安全大模型提示词提示词注入
在AIGC（生成式人工智能）技术蓬勃发展的当下，其在各个领域的应用日益广泛。然而，随着AIGC技术的深入应用，安全问题也逐渐凸显，提示词注入攻击便是其中不容忽视的一大威胁。对于AIGC开发者而言，深入了解提示词注入攻击并做好防范工作，是保障AIGC系统安全稳定运行的关键。提示词注入攻击的基本知识提示词注入攻击是指攻击者通过精心设计和构造提示词，利用AIGC模型对输入文本的处理机制，干扰模型的正常运
AI人工智能助力联邦学习通信效率优化的解决方案 AI智能应用人工智能 ai
AI驱动的联邦学习通信效率优化：从理论到实践的全面解决方案元数据框架标题AI驱动的联邦学习通信效率优化：从理论到实践的全面解决方案关键词联邦学习（FederatedLearning）、通信优化（CommunicationEfficiency）、AI赋能（AI-Enabled）、参数压缩（ParameterCompression）、客户端选择（ClientSelection）、联邦蒸馏（Federa
**深度解析Annotated Jieba：Python中的高效中文分词库**
深度解析AnnotatedJieba：Python中的高效中文分词库去发现同类优质开源项目:https://gitcode.com/项目简介是一个基于Jieba的增强版分词库，为了解决原Jieba库在复杂场景下的需求，它提供了更丰富的功能和更友好的API设计。该项目由USTCDane开发并维护，旨在帮助开发者更好地理解和使用Jieba进行中文文本处理。技术分析1.代码注释与文档AnnotatedJ
python中使用annotate时，报错误
TypeErrorTraceback(mostrecentcalllast)CellIn[58],line161159plt.xlabel("FPR")160plt.ylabel("TPR")-->161plt.annotate(xy=(.4,.2),xytext=(.5,.2),s='ROCcurve(area=%0.2f)'%auc_test)TypeError:annotate()missi
Python 异步爬虫（aiohttp）高效抓取新闻数据小白学大数据 python 爬虫开发语言
一、异步爬虫的优势在传统的同步爬虫中，爬虫在发送请求后会阻塞等待服务器响应，直到收到响应后才会继续执行后续操作。这种模式在面对大量请求时，会导致大量的时间浪费在等待响应上，爬取效率较低。而异步爬虫则等待可以在服务器响应的同时，继续执行其他任务，大大提高了爬取效率。aiohttp是一个支持异步请求的Python库，它基于asyncio框架，可以实现高效的异步网络请求。使用aiohttp构建异步爬虫，
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa

通俗易懂的反向传播法（python 代码实现）

1. 计算图

1.1 计算图的优点

2. 链式法则

2.1 计算图的反向传播

2.2 什么是链式法则

2.3 链式法则和计算图

2.3 反向传播

2.3.1 加法节点的反向传播

2.3.2 乘法节点的反向传播

2.2.4 苹果例子

3.简单层的实现

3.1 乘法层的实现

3.2 加法层的实现

4 激活函数层的实现

4.1 ReLU层

4.2 Sigmoid层

5 Affine/Softmax层的实现

5.1 Affine层

5.2 批版本的Affine

5.3 Softmax-with-Loss层

6 误差反向传播的实现

你可能感兴趣的:(机器学习与深度学习算法,神经网络,人工智能,机器学习,python)