精英的英

【手搓深度学习算法】从头创建卷积神经网络

背景

深度学习神经网络中，卷积神经网络在图像处理中独放异彩，现在主流的框架中对卷积神经网络的封装已经非常完善了，但是，对初学者来说，使用这些高层的API，不利于我们深入理解卷积神经网络的原理和思想，所以，想要动手实现一个简单的卷积神经网络，通过查阅资料，参考他人的代码，总结了这篇文档。

术语解释

卷积神经网络（Convolutional Neural Network，CNN）是一种深度学习神经网络结构，主要用于图像识别、计算机视觉等领域。该结构在处理图像等高维数据时表现出色，因为它具有共享权重和局部感知的特点，一方面减少了权值的数量使得网络易于优化，另一方面降低了模型的复杂度，也就是减小了过拟合的风险。

卷积神经网络主要由卷积层、池化层、全连接层和激活函数等组成。其中，卷积层是CNN的核心部分，它通过卷积操作提取输入图像的特征，并将这些特征作为下一层的输入。池化层则用于降采样，可以减少卷积层输出的特征图的大小，从而减少网络参数和计算量。全连接层则用于将卷积层和池化层的输出连接起来，以便最终进行分类和预测。

卷积神经网络的训练主要是通过反向传播算法来更新网络中的权重，从而使得网络能够逐步学习到输入数据的特征，并在最终的分类或预测任务中得到较好的性能。

目前，卷积神经网络已经在图像分类、物体识别、人脸识别、自然语言处理等领域取得了非常出色的成果，是现代深度学习领域的重要组成部分。

为什么要使用卷积神经网络

使用卷积神经网络（CNN）的原因主要有以下几点：

局部感知: CNN能处理局部输入。这是因为在CNN中，每一个神经元只接收输入区域的小部分数据，这使得网络能够专注于局部特征，而不是全局特征。

权重共享: 在CNN中，权重是共享的。这意味着无论在图像的哪个位置，同一卷积核都会进行相同的操作。这不仅减少了模型的参数数量，还增强了模型对平移不变性的处理能力。

池化层（Pooling）: 池化层用于降低数据的维度，减少计算量，同时保留重要信息。这有助于防止过拟合，提高模型的泛化能力。

多层次特征提取: CNN通过逐层卷积和池化操作，能够从底层到高层提取并逐渐抽象出图像中的特征。这使得CNN在处理图像、语音等高维数据时具有显著的优势。

强大的表达能力: 通过设计不同的卷积核，CNN能够学习并表达多种特征。此外，多层卷积能够让模型在更抽象的层次上理解输入数据。

有效利用数据: 对于具有大量标注数据的场景，CNN能够有效地利用这些数据进行训练，从而提高模型的准确率。

并行计算能力: 由于卷积操作具有局部性和权重共享的特性，CNN非常适合进行并行计算，这大大提高了模型的训练速度。

综上所述，由于以上优点，卷积神经网络在图像识别、计算机视觉、自然语言处理等领域得到了广泛应用。

任务描述

本项目旨在使用基本Python库和Numpy库，实现一个简单的卷积神经网络模型，包括一个卷积核为3 * 3 的卷积层，一个最大池化层，和一个使用softmax函数的全连接层

具体实现

定义一个卷积层

备注：我们定义的卷积层假设输入是2维的numpy数组，只存在一个卷积层且Batch为1

以下是在名为Conv3x3的类中的内容

在初始化中定义卷积核*这段代码通过传入的num_filters参数定义输出数据的维度，然后创建随机的3x3的卷积核，

使用除以9，用于初始化卷积核的权重，将其缩放到一个较小的值范围（这里是0到1/9之间）。这种初始化方法可以帮助防止在训练过程中出现梯度消失或梯度爆炸的问题。*

def __init__(self, num_filters):
    self.num_filters = num_filters
    self.filters = np.random.randn(num_filters, 3, 3) / 9

生成感受野的迭代器

先获取图像的宽高，然后在图像上以步长为1滑动3x3的卷积窗口，得到（感受野，x，y）的迭代器

def iterate_regions(self, image):
    h, w = image.shape

    for i in range(h - 2):
      for j in range(w - 2):
        im_region = image[i:(i + 3), j:(j + 3)]
        yield im_region, i, j

定义前向传播的函数

卷积网络的前向传播过程即将卷积核和感受野进行加权求和，然后迭代每一个卷积核输出n维的特征向量

def forward(self, input):
    self.last_input = input
    h, w = input.shape
    output = np.zeros((h - 2, w - 2, self.num_filters))

    for im_region, i, j in self.iterate_regions(input):
      output[i, j] = np.sum(im_region * self.filters, axis=(1, 2))

    return output

定义反向传播的函数

卷积网络的反向传播可以简单的理解为，通过损失函数的梯度更新卷积层的权重，即卷积核的权重，其中损失函数的梯度可以简单理解为在损失函数中对权重和偏差求偏导数，更新权重的过程中，使用了超参数学习率，通过改变学习率的大小，可以改变模型的收敛速度和精度。
其中，每个卷积核都经历了i * j轮的迭代，通过对应感受野梯度和像素值的点积得到权重更新的梯度
注意：这里作者为了偷懒，只用了一层卷积层，而且卷积层是第一个网络层，所以卷积层的反向传播函数不需要返回梯度

def backprop(self, d_L_d_out, learn_rate):
    d_L_d_filters = np.zeros(self.filters.shape)

    for im_region, i, j in self.iterate_regions(self.last_input):
      for f in range(self.num_filters):
        d_L_d_filters[f] += d_L_d_out[i, j, f] * im_region

    self.filters -= learn_rate * d_L_d_filters
    return None

定义一个最大池化层

卷积神经网络（CNN）中的最大池化层主要有以下作用：

增加特征平移不变性：池化层可以提高网络对微小位移的容忍能力，增强特征的鲁棒性。

减小特征图大小：池化层对空间局部区域进行下采样，使下一层需要的参数量和计算量减少，并降低过拟合风险。

引入非线性：最大池化可以带来非线性，这是目前最大池化更常用的原因之一。

不同的区域迭代器

生成不重叠的2x2图像区域，用于池化操作。

def iterate_regions(self, image):
    h, w, _ = image.shape
    new_h = h // 2
    new_w = w // 2

    for i in range(new_h):
      for j in range(new_w):
        im_region = image[(i * 2):(i * 2 + 2), (j * 2):(j * 2 + 2)]
        yield im_region, i, j

前向传播函数

最大池化层的前向传播过程即是以指定的池化核大小作为窗口，在输入特征图上进行不重叠的滑动，每次取当前窗口内的最大值，生成新的特征图，对2*2的池化层，因为每个池化窗口内的特征数量从 2 * 2 变成 1 * 1，所以图像的尺寸将会变成输入图的一半，减少了模型的复杂程度，同时，每个池化窗口内删除了3/4的特征值，可以让特征更好的体现非线性，又因为每个池化窗口内只取最大值，可以保留输入特征图的重要特征。

def forward(self, input):
    self.last_input = input

    h, w, num_filters = input.shape
    output = np.zeros((h // 2, w // 2, num_filters))

    for im_region, i, j in self.iterate_regions(input):
      output[i, j] = np.amax(im_region, axis=(0, 1))

    return output

反向传播函数

最大池化层的反向传播函数可以简单理解为，通过其输出梯度更新池化之前的特征图上每个池化感受野上特征值最大的点的梯度，其他位置的梯度为0。

def backprop(self, d_L_d_out):
    d_L_d_input = np.zeros(self.last_input.shape)

    for im_region, i, j in self.iterate_regions(self.last_input):
      h, w, f = im_region.shape
      amax = np.amax(im_region, axis=(0, 1))
      #计算每个区域的最大值。这将返回一个数组，其中包含每个通道的最大值。

      for i2 in range(h):
        for j2 in range(w):
          for f2 in range(f):
            # 如果当前特征点是特征值最大的点，将输出梯度矩阵中对应的梯度值复制到输入梯度矩阵中每个感受野的最大值位置
            if im_region[i2, j2, f2] == amax[f2]:
              d_L_d_input[i * 2 + i2, j * 2 + j2, f2] = d_L_d_out[i, j, f2]

    return d_L_d_input

定义一个Softmax层

Softmax是一种激活函数，用于将指定的输入向量转化成指定种类别的输出概率

$y_i = \frac{\exp(a_i)}{\sum_{j=1}^{n} \exp(a_j)}$

初始化权重和偏差

初始化本层的权重和偏差，权重应该是输入节点数量 x 分类数量的矩阵，以便和前一层的输出特征矩阵做点积。

def __init__(self, input_len, nodes):
    self.weights = np.random.randn(input_len, nodes) / input_len
    self.biases = np.zeros(nodes)

前向传播函数

Softmax的前向传播函数的作用：

将数据展平，比如：输入特征是5维28*28的张量，则展平后数据变成长度为5x28x28的向量。
将展平后的向量与本层的权重做点积，然后加上本层的偏差向量，得到本层输出的向量。
将本层的输出向量做如上公式的计算，得到每个类别的概率。

def forward(self, input):
    self.last_input_shape = input.shape

    input = input.flatten()
    self.last_input = input

    input_len, nodes = self.weights.shape

    totals = np.dot(input, self.weights) + self.biases
    self.last_totals = totals

    exp = np.exp(totals)
    return exp / np.sum(exp, axis=0)

反向传播函数

Softmax的反向传播函数即是对Softmax的前向传播函数逐层计算梯度

假设Softmax层的输入为向量 $\mathbf{z}$ ，其第 $i$ 个元素为 $z_i$ ，输出为向量 $\mathbf{a}$ ，其第 $i$ 个元素为 $a_i$ 。Softmax函数定义为：

$a_i = \frac{e^{z_i}}{\sum_{j=1}^{n}e^{z_j}}$

其中， $n$ 是输入向量 $\mathbf{z}$ 的长度。

在反向传播过程中，我们需要计算损失函数 $L$ 对于输入向量 $\mathbf{z}$ 的梯度 $\frac{\partial L}{\partial \mathbf{z}}$ 。根据链式法则，我们有：

$\frac{\partial L}{\partial z_i} = \sum_{j=1}^{n}\frac{\partial L}{\partial a_j}\frac{\partial a_j}{\partial z_i}$

其中， $\frac{\partial L}{\partial a_j}$ 是损失函数 $L$ 对于输出向量 $\mathbf{a}$ 的梯度，它可以根据具体的损失函数计算得到。接下来，我们需要计算 $\frac{\partial a_j}{\partial z_i}$ 。

当 $i = j$ 时，我们有：

$\frac{\partial a_i}{\partial z_i} = \frac{e^{z_i}\sum_{j=1}^{n}e^{z_j} - e^{2z_i}}{(\sum_{j=1}^{n}e^{z_j})^2} = a_i(1-a_i)$

当 $\neq j$ 时，我们有：

$\frac{\partial a_j}{\partial z_i} = \frac{-e^{z_i}e^{z_j}}{(\sum_{k=1}^{n}e^{z_k})^2} = -a_ia_j$

将上述结果代入链式法则中，我们得到：

$\frac{\partial L}{\partial z_i} = \frac{\partial L}{\partial a_i}a_i(1-a_i) - \sum_{j \neq i}\frac{\partial L}{\partial a_j}a_ia_j = a_i(\frac{\partial L}{\partial a_i} - \sum_{j=1}^{n}\frac{\partial L}{\partial a_j}a_j)$

注意到 $\sum_{j=1}^{n}\frac{\partial L}{\partial a_j}a_j$ 是标量对向量的导数，它等于标量对向量各个元素的导数之和乘以向量的各个元素，即：

$\sum_{j=1}^{n}\frac{\partial L}{\partial a_j}a_j = \mathbf{a}^T\frac{\partial L}{\partial \mathbf{a}}$

因此，我们可以将梯度 $\frac{\partial L}{\partial \mathbf{z}}$ 表示为：

$\frac{\partial L}{\partial \mathbf{z}} = \mathbf{a} \odot (\frac{\partial L}{\partial \mathbf{a}} - \mathbf{a}^T\frac{\partial L}{\partial \mathbf{a}})$

其中， $\odot$ 表示逐元素乘法。这个公式就是Softmax层反向传播的梯度计算公式。

使用梯度下降法，权重和偏置会按照以下方式更新：
$learn_rate × d L dweights \text{weights} -= \text{learn\_rate} \times \frac{\text{d} L}{\text{d} \text{weights}}$
$learn_rate × d L dbiases \text{biases} -= \text{learn\_rate} \times \frac{\text{d} L}{\text{d} \text{biases}}$

函数返回的是损失关于输入的梯度，即 $\frac{\text{d} L}{\text{d} \text{inputs}}$ 。这个梯度可以用于更新下一层的权重和偏置。

代码详解

def backprop(self, d_L_d_out, learn_rate):

接受两个参数：d_L_d_out 和 learn_rate。d_L_d_out 是上一层传下来的梯度，而 learn_rate 是学习率，用于更新权重和偏置。

寻找非零梯度

for i, gradient in enumerate(d_L_d_out):
  if gradient == 0:
    continue

这个循环遍历传入的梯度 d_L_d_out。由于 softmax 层的特性，通常只有一个元素的梯度是非零的。找到这个非零元素并进行处理。

计算 e 的 totals 次方

t_exp = np.exp(self.last_totals)

这里，self.last_totals 是 softmax 层输入（即上一层的输出）的累加和。这行代码计算了 e 的 self.last_totals 次方。

计算 S，即所有 e^totals 的和

S = np.sum(t_exp)

S是所有e^totals` 的和，用于归一化，使 softmax 输出的概率之和为 1。

计算输出对 totals 的梯度

d_out_d_t = -t_exp[i] * t_exp / (S ** 2)
d_out_d_t[i] = t_exp[i] * (S - t_exp[i]) / (S ** 2)

这里计算了 softmax 函数对 totals 的偏导数。这个偏导数用于后续计算损失函数对权重、偏置和输入的梯度。

计算 totals 对权重/偏置/输入的梯度

d_t_d_w = self.last_input
d_t_d_b = 1
d_t_d_inputs = self.weights

计算了 totals 对权重（self.weights）、偏置（这里简化为 1）和输入（self.last_input）的梯度。注意这里totals 是输入和权重的线性组合，且偏置的梯度为常数 1。

计算损失对 totals 的梯度

d_L_d_t = gradient * d_out_d_t

通过链式法则计算了损失函数对 totals 的梯度。它是将上一步计算的梯度与传入的梯度相乘得到的。

计算损失对权重/偏置/输入的梯度

d_L_d_w = d_t_d_w[np.newaxis].T @ d_L_d_t[np.newaxis]
d_L_d_b = d_L_d_t * d_t_d_b
d_L_d_inputs = d_t_d_inputs @ d_L_d_t

通过链式法则和矩阵运算计算了损失函数对权重、偏置和输入的梯度。这些梯度将用于更新网络的参数。

更新权重和偏置

self.weights -= learn_rate * d_L_d_w
self.biases -= learn_rate * d_L_d_b

这里使用梯度下降法更新了权重和偏置。学习率 learn_rate 控制了参数更新的步长。

返回输入的梯度

return d_L_d_inputs.reshape(self.last_input_shape)

最后，函数返回了损失函数对输入的梯度，以便传递给前一层进行反向传播。梯度的形状被重新调整为与输入相匹配。

def backprop(self, d_L_d_out, learn_rate):
    for i, gradient in enumerate(d_L_d_out):
      if gradient == 0:
        continue

      # e^totals
      t_exp = np.exp(self.last_totals)

      # Sum of all e^totals
      S = np.sum(t_exp)

      # Gradients of out[i] against totals
      d_out_d_t = -t_exp[i] * t_exp / (S ** 2)
      d_out_d_t[i] = t_exp[i] * (S - t_exp[i]) / (S ** 2)

      # Gradients of totals against weights/biases/input
      d_t_d_w = self.last_input
      d_t_d_b = 1
      d_t_d_inputs = self.weights

      # Gradients of loss against totals
      d_L_d_t = gradient * d_out_d_t

      # Gradients of loss against weights/biases/input
      d_L_d_w = d_t_d_w[np.newaxis].T @ d_L_d_t[np.newaxis]
      d_L_d_b = d_L_d_t * d_t_d_b
      d_L_d_inputs = d_t_d_inputs @ d_L_d_t

      # Update weights / biases
      self.weights -= learn_rate * d_L_d_w
      self.biases -= learn_rate * d_L_d_b

      return d_L_d_inputs.reshape(self.last_input_shape)

训练过程

训练过程可以总结为以下几步：

加载数据集
创建需要的卷积层，池化层和Softmax层
通过组合各层创建前向传播序列
创建单个训练序列，包括执行前向传播序列，计算损失梯度，反向传播
根据具体情况，迭代执行训练序列

# We only use the first 1k examples of each set in the interest of time.
# Feel free to change this if you want.
train_images = mnist.train_images()[:1000]
train_labels = mnist.train_labels()[:1000]
test_images = mnist.test_images()[:1000]
test_labels = mnist.test_labels()[:1000]

conv = Conv3x3(8)                  # 28x28x1 -> 26x26x8
pool = MaxPool2()                  # 26x26x8 -> 13x13x8
softmax = Softmax(13 * 13 * 8, 10) # 13x13x8 -> 10

def forward(image, label):
  '''
  Completes a forward pass of the CNN and calculates the accuracy and
  cross-entropy loss.
  - image is a 2d numpy array
  - label is a digit
  '''
  # We transform the image from [0, 255] to [-0.5, 0.5] to make it easier
  # to work with. This is standard practice.
  out = conv.forward((image / 255) - 0.5)
  out = pool.forward(out)
  out = softmax.forward(out)

  # Calculate cross-entropy loss and accuracy. np.log() is the natural log.
  loss = -np.log(out[label])
  acc = 1 if np.argmax(out) == label else 0

  return out, loss, acc

def train(im, label, lr=.005):
  # Forward
  out, loss, acc = forward(im, label)

  # Calculate initial gradient
  gradient = np.zeros(10)
  gradient[label] = -1 / out[label]

  # Backprop
  gradient = softmax.backprop(gradient, lr)
  gradient = pool.backprop(gradient)
  gradient = conv.backprop(gradient, lr)

  return loss, acc

print('MNIST CNN initialized!')

# Train the CNN for 3 epochs
for epoch in range(3):
  print('--- Epoch %d ---' % (epoch + 1))

  # Shuffle the training data
  permutation = np.random.permutation(len(train_images))
  train_images = train_images[permutation]
  train_labels = train_labels[permutation]

  # Train!
  loss = 0
  num_correct = 0
  for i, (im, label) in enumerate(zip(train_images, train_labels)):
    if i % 100 == 99:
      print(
        '[Step %d] Past 100 steps: Average Loss %.3f | Accuracy: %d%%' %
        (i + 1, loss / 100, num_correct)
      )
      loss = 0
      num_correct = 0

    l, acc = train(im, label)
    loss += l
    num_correct += acc

测试过程

测试过程中重要的是使用测试数据集，而且测试过程中不再反向传播梯度

# Test the CNN
print('\n--- Testing the CNN ---')
loss = 0
num_correct = 0
for im, label in zip(test_images, test_labels):
  _, l, acc = forward(im, label)
  loss += l
  num_correct += acc

num_tests = len(test_images)
print('Test Loss:', loss / num_tests)
print('Test Accuracy:', num_correct / num_tests)

完整代码下载

https://github.com/vzhou842/cnn-from-scratch?tab=readme-ov-file

EXPLAIN 解码：MySQL 索引优化的黄金决策术渡难繁辰数据库 mysql sql mysql 数据库 sql
引言在MySQL数据库中，索引是优化查询性能的核心工具。但盲目添加索引会导致写性能下降和存储浪费，而缺少关键索引又会引发全表扫描的灾难。如何科学决策？答案在于深入分析查询执行计划——EXPLAIN。本文将聚焦如何通过EXPLAIN诊断查询瓶颈，精准制定索引策略。一、EXPLAIN的核心字段解读EXPLAIN输出结果中的关键字段揭示了查询的执行逻辑，以下为需重点关注的列：1.type列：查询访问数据
人工智能时代下的数据新职业：新兴工作岗位版图研究司南锤 economics 人工智能
目录摘要第一章：AI驱动的数据价值链重构1.1从“沉睡金矿”到“流动的血液”：数据作为核心经济资产的激活1.2知识的新经济学：零边际成本革命1.3AI作为新的“操作系统”：重塑产业竞争格局第二章：基石层：数据准备与质量保障中的角色2.1数据标注与标签领导力：数据标注经理/主管2.2“地面真实”的守护者：AI数据质量专家第三章：技术核心层：构建AI与机器学习全生命周期的工程角色3.1AI生产线架构师
【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts) 视频教程 - 基于wordcloud库实现词云图
大家好，我是java1234_小锋老师，最近写了一套【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts)视频教程，持续更新中，计划月底更新完，感谢支持。今天讲解基于wordcloud库实现词云图视频在线地址：2026版【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts+爬虫)视频教程（火爆连载更新中..
阅读计划宁都5971胡英
一、指导思想：一本书，就像那汪洋大海中的一滴滴水滴，却能让我们看到一个个千姿百态的大世界。让书本为孩子打开一扇扇窗，丰富知识，开阔视野，活跃思维，陶冶情操。图片发自App二、读书目标：每一个学生都想读书、爱读书、会读书，从小养成热爱书籍，博览群书的好习惯，让学生在读书中体验到读书能给自己带来快乐。图片发自App三、读书口号：书香润泽童年，阅读丰富人生。四、阅读内容：1、学校规定的阅读篇目。2、班级
2021-02-05 桂亘
昨天做到了早晨5点起床，感觉精神状态还不错，证明了每天4点起床那本书讲的有一定道理。问题是早睡有困难。所以，这两天我试着将作息时间作一定的调整，就是每天晚上九点过点睡觉，争取在十点左右进入睡眠状态，这样，可以在每天五点左右起床。这样睡眠时间也可以在7个小时左右。只是工作上每天都很忙，看来这个岗位是难得调整了，只得干下去。要怎么应对这么多的工作呢，也只能超前计划，尽量往前赶。因为明天又不知道会增加什
【机器学习】探索未来科技的前沿：人工智能、机器学习与大模型 AIGC零基础入门小白 AI大模型大模型教程人工智能机器学习科技 AI大模型 AIGC AI教程大模型教程
文章目录引言一、人工智能：从概念到现实1.1人工智能的定义1.2人工智能的发展历史1.3人工智能的分类1.4人工智能的应用二、机器学习：人工智能的核心技术2.1机器学习的定义2.2机器学习的分类2.3机器学习的实现原理2.4机器学习的应用2.5机器学习的示例代码2.6解释代码三、大模型：推动AI前沿发展的关键技术3.1大模型的定义3.2大模型的发展历程3.3深度学习与神经网络3.4大模型的优势与挑
现代人工智能综合分类：大模型时代的架构、模态与生态系统司南锤 economics 人工智能分类数据挖掘
目录引言：人工智能的第四次浪潮与新分类的必要性第一节：大型模型范式的基础支柱1.1规模化假说：算力、数据与算法的三位一体1.2“涌现能力”之谜：当“更多”变为“不同”1.3自监督学习（SSL）革命第二节：大型模型的技术分类学2.1Transformer：现代人工智能的架构基石2.2架构分化：一种功能性分类2.3提升效率与规模：专家混合模型（MoE）2.4超越Transformer：下一代架构的探索
2018-06-02开始有计划的每天生活陳境墨
2018年6月2日星期六晴每日必做事：晨修念佛：完成五点听早课：在听掌门直播相关事项边准备早餐，今天易经课程没听跟音频读经典3样：跟读《伤寒论》《神农百草经》《难经》各一节诵读《无量寿经》：上卷看书：看《好妈妈胜过好老师》第168页到173页。看书心得：现在很多小学生做作业是为了老师，为了家长而做。作业是为了学会，巩固知识点而做的，但是现在很多老师会使用“暴力作业”，动不动就要抄几遍几遍。许多家长
基于YOLOv8的火灾智能检测系统设计与实现斟的是酒中桃深度学习人工智能 pyqt yolo
在各类安全事故中，火灾因其突发性强、破坏力大，一直是威胁人们生命财产安全的重大隐患。传统的火灾检测方式多依赖烟雾传感器、温度传感器等，存在响应滞后、易受环境干扰等问题。随着深度学习技术的飞速发展，基于计算机视觉的火灾检测方法凭借其实时性强、检测范围广等优势，逐渐成为研究热点。本文将简单介绍一款基于深度学习的火灾智能检测系统的设计与实现过程。一、系统整体设计本火灾智能检测系统旨在通过深度学习技术实现
人工智能入门指南：从基础概念到实际应用
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。https://www.captainbed.cn/north文章目录1.**人工智能的基本概念**1.1什么是人工智能？1.2人工智能的分类2.**人工智能的核心技术**2.1机器学习（MachineLearning）2.1.1机器学习的类型2.1.2机器学习流程2.2深度学习（DeepLearni
Sequential Thinking：AI深度思考的新范式及其与CoT、ReAct的对比分析码字的字节人工智能 Sequential CoT ReAct
引言：AI深度思考的演进与SequentialThinking的崛起在人工智能技术快速发展的今天，AI模型的思考能力正经历着从简单应答到深度推理的革命性转变。这一演进过程不仅反映了技术本身的进步，更体现了人类对机器智能认知边界的持续探索。早期的大语言模型虽然能够生成流畅的文本，但在处理复杂问题时往往表现出"浅思考"的局限性——答案可能看似合理，却缺乏严谨的推理过程和系统性考量。例如，2022年的一
Python接地气入门。
欢迎来到"鑫哆哆"编程角世界上最好的语言PYTHON?鑫哆哆跟python的机缘为什么选择python合理的设计学习计划，有助于攻略的成功合理驯服自己脑子合理骗过自己脑子合理安排反馈鑫哆哆的学习python计划基础语法缩进语句规则控制语句规则表达式规则函数规则对象规则类型规则数学运算直接觉醒！鑫哆哆的课程选取迈出第一步恭喜大家成功入门python！总结世界上最好的语言PYTHON?新的一年祝大家心
4.11号复盘，第100天牛欢Vincent
昨天计划22：30睡觉，躺下后玩了会手机聊了会天，瞬间23：00，定的五点闹钟，起床后例行打卡，然后昏睡过去，6：20才起床，“假早起”要不起。早睡很简单，放下手机就成功一大半，但凡拿着手机，时间就会野蛮消耗。不早睡，早起无从谈起。只要躺下，就放下手机，把微信通知关闭，调好闹钟，睡觉，明早见。
健康是福倪说我听
图片发自App刚刚发完《为什么要日更》这篇文章就中断了一天日更。有点不好意思，但是原因很简单，昨天中午开始剧烈的头疼伴随着发烧，我感冒了。即便是感冒也不会发烧的我，昨天迎来了来日本4年以来一次用一个手的手指都能算过来的罕见发烧。浑身无力，盖了两层被子还是觉得冷，不管是站着，坐着，躺着还是在房间里给自己烧点热水，剧烈的头疼都会伴随着我，本来安排好的计划也被这突然来袭的感冒打个措手不及。不禁感慨“健康
Datawhale X 魔塔 Ai夏令营 --深度学习基础
一、局部极小值与全局极小值全局极小值：在损失函数的整个定义域内，损失值最小的点。这是我们在训练深度学习模型时希望找到的点，因为它代表着模型的最佳性能。局部极小值：在损失函数的一个局部区域内，损失值达到最小，但在整个函数定义域内可能不是最小的。当优化算法陷入局部极小值时，它可能会误以为已经找到了全局最优解，从而停止搜索。局部极小值的检测两种直观的方法来检测局部极小值：可视化方法：对于低维问题，我们可
20190320 沐沐_2557
【今日回顾】001结营流程海报002十二期最后一张晚安海报（想哭）003复盘完成，今天在群里各种吹水【运营经验】大家的默契和信任度都有了，聊天更深入，家人，朋友，这种感觉真好【见识|感悟】没有了打卡的压力，管理组和学员们都皮了起来，今天一天太欢乐了【每日一夸】永艾，这小姑娘就是宝藏【明日计划】001继续我的课程笔记002研究时间管理003和乐乐做下一期初步规划004期待小伙伴运营学院的表现
学大伟业：苏州大学2019年高考分省分专业录取分数线倒霉熊033
苏州大学位于江苏苏州，是一所211综合类院校，其化学、物理学、材料科学、临床医学等学科排在全球领先水平。北京学大伟业（bjxdwy）整理入学途径、王牌专业和2019年分省分专业录取分数线，供参考。一、学校简介苏州大学是江苏省属重点综合性大学，国家“211工程”重点建设高校、“2011计划”首批牵头高校。学校有天赐庄校区、独墅湖校区、阳澄湖校区3个校区，设有26个学院，130个本科专业；11个学科进
深度学习模块实践手册（第十二期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
56、Ghost模块论文《GhostNet:MoreFeaturesfromCheapOperations》1、作用：Ghost模块是一种轻量级的特征提取模块，旨在通过廉价操作生成更多特征图，减少计算量的同时保持模型性能。传统卷积神经网络在生成特征图时存在大量冗余计算，Ghost模块通过将特征图生成过程分解为两个步骤，有效减少了计算复杂度，特别适合移动端和嵌入式设备部署。2、机制Ghost模块的机
算法工程师必看！个性化信息流推荐算法系统的架构设计与优化实战指南
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AIAgent智能体》（跟我一起学人工智能）【陈敬雷编著】【清华大学出版社】GPT多模态大模型与AIAgent智能体书籍本章配套视频课程【陈敬雷】推荐算法系统实战全系列精品课【陈敬雷】文章目录推荐算法系统系列二算法工程师必看！个性化信息流推荐算法系统的架构设计与优化实战指南更多技术内容总结推荐算法系统系列二算
DETR革命：目标检测的Transformer时代加油吧zkf 目标检测 YOLO python 开发语言人工智能图像处理
《DETR从0到1：目标检测Transformer的崛起》为什么会有DETR？在深度学习目标检测发展史上，2014~2019年几乎被基于卷积神经网络（CNN）的检测器统治：两阶段：FasterR-CNN、MaskR-CNN单阶段：YOLO、SSD、RetinaNet这些检测器虽然效果强大，但背后依赖：✅Anchor（先验框）✅NMS（非极大值抑制）✅特征金字塔、手工设计问题：结构复杂、调参困难、不
Day246小姐姐童言趣语康馨予
二胎政策开放以来，二胎家庭备战的，成功的，地下到处跑的都是二娃，姑娘班上也是十之八九都或生或怀或计划着二胎的大事件。被追着二胎也是常有的事，从婆婆，到身边的朋友，再到小姐姐，甚至我那老母亲嘴上不说，心里也是嘀咕着。打电话总是旁敲侧击问我姑娘孤不孤单，小姐姐原来不跟我站一条线上的，因为他看别人家都有跟屁虫她没有心里痒痒，后来我跟她讲二娃到来以后，二娃小就需要更多的关照，我陪她的时间会减少，抱她的机会
深度学习模块实践手册（第十一期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
46、缩放点积注意力模块论文《AttentionIsAllYouNeed》1、作用：缩放点积注意力（ScaledDot-ProductAttention）是Transformer模型的核心组件，旨在解决序列建模中长距离依赖关系捕捉的问题。传统的循环神经网络（RNN）在处理长序列时存在梯度消失或爆炸的问题，且并行性较差。该模块通过计算查询（Query）、键（Key）和值（Value）之间的相似度，实
写作进阶模式浅析能源小李
上篇文章对目前写作中的差距进行了思考总结，主要是三方面差距：文字数量差距、干练语言与固有文风的差距、美化排版的差距。那么我们该如何针对性的制定写作进阶计划，该如何不断提高写作能力，构建自己成熟的写作模式呢？本文将进行简要分析。图片发自App写作进阶模式就是指针对我们自身写作技能提高的系统的方式方法。结合自身对写作的理解，从以下三个层面构建写作进阶模式。【进阶一锤炼提高写作思考力】写作本身是一种思考
《任长霞》：心系民众，为他们排忧解难，而忘了自己显山露水
任长霞的父亲生日到了，她母亲这几年一直想在这一天照一张全家福。可她被任命为登封市公安局长三年来，总是工作忙无法赶回家照全家福被搁浅。快到这一天时，一家人早就约好一定赶回来。当然，任长霞没有忘记这事。她计划好在参加完郑州市公安局举报的拔河比赛后，就回去给患上痴呆的父亲庆生照全家福。可在她心有不甘获得比赛亚军后，在通往安平煤矿厂的小路上，发现了两具尸体，她又马不蹄停地从郑州市回登封市破案。当任长霞的妹
东京奥运会正式宣布改期，门票可以退 24号迷妹
国际奥委会和东京奥组委30日联合宣布，因新冠肺炎疫情蔓延而决定延期的东京奥运会将于2021年7月23日至8月8日举行，东京残奥会的举办时间定为2021年8月24日至9月5日。此前，东京奥运会计划于今年7月24日开幕。国际奥委会主席巴赫：东京奥运会是“黑暗隧道”前的曙光问：为什么安排在2021年7月23日？巴赫：我们选择这些日期是因为要遵循我们的原则。首先，这是要确保参与奥运会所有人的健康。所有国家
晨间日记（202209050429）锋听慧言曼语
起床：5：30就寝：23：30天气：晴心情：开心一、任务清单（一）昨日完成的任务，最重要的三件事1.完成９月早起学员的招募及目标海报的制作；2.完成党支部骨干成员说明会；3.完成《论语》学习心得分享；（二）未完成事情及原因（三）计划外事（四）习惯养成：做一个长期主义者1.早起第733天2.坚持晨跑480天。3.坚持亲子绘本伴读1659天；4.坚持写晨间日记429天。5.坚持每天阅读至少1小时230
宋秋玲爱自己第209天（3月12日）分享：心理学宋秋玲
1、约练：上午跟三位老师一起捉对练习，我是观察员。辅导老师徐徐引导，一步步进行引导和探索，感觉她内心很稳很笃定，最后案主的困惑得以减缓，效果很好。2、会议：练习结束后紧接着就是小组会议，组长说明了推广段老师直播课程的具体计划和方法，动员大家积极传播。这确实是个超级实惠又有效的课程，大家都马上行动，转发朋友圈并推荐给好友，我也参与其中，推荐给了十几个朋友。3、开营：中午一点举行了网上开课前的说明仪式
2021.04.27总结阿源的成长之路
感恩老爷子专门跑来一趟把送错的外卖还给我们碎念干什么？那尽量冥想吧，然后中途洗漱做事吧，面对人又有点抗拒但是也要往前走嘛。吃自助那天：还是有点胆怯，忙了一天多少有点焦虑，没调节，就来吃饭了，不管怎样，尽量当下觉知当下接受此时此刻我想起来了打坐就好还是决定封上手机，抓紧时间做事。写写阶段复盘然后把今晚计划写一下，然后尽快做事。关于有道云和onenote的结合又思考了很久，主要是在想，一些暂时无法归类
每日一省92女儿骂我你去死吧常燕美
今天早上女儿起床很生气，超乎我的想象，她把门关起来，我听到使劲拍了几下门，然后把屋里的东西都扔了一地，原因是昨天晚上她没有洗澡睡着了，而且本打算写的作业也没写，她勃然大怒。我认为今天周末，也不是大事，今天写一样的，她说她计划好的晚上把作业写写，今天上午就可以去干自己想干的事情了，而且最不能忍受的是身上粘粘的就睡觉了，又怪我没把她叫醒。我没有理她，我知道她在气头上，说什么她也听不进去。不过我知道，我
【DL经典回顾】激活函数大汇总（四）（Softmax & Softplus附代码和详细公式）夺命猪头 python 机器学习人工智能神经网络 numpy
激活函数大汇总（四）（Softmax&Softplus附代码和详细公式）更多激活函数见激活函数大汇总列表一、引言欢迎来到我们深入探索神经网络核心组成部分——激活函数的系列博客。在人工智能的世界里，激活函数扮演着不可或缺的角色，它们决定着神经元的输出，并且影响着网络的学习能力与表现力。鉴于激活函数的重要性和多样性，我们将通过几篇文章的形式，本篇详细介绍两种激活函数，旨在帮助读者深入了解各种激活函数的
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的

【手搓深度学习算法】从头创建卷积神经网络

背景

术语解释

为什么要使用卷积神经网络

任务描述

具体实现

定义一个卷积层

在初始化中定义卷积核*这段代码通过传入的num_filters参数定义输出数据的维度，然后创建随机的3x3的卷积核，

生成感受野的迭代器

定义前向传播的函数

定义反向传播的函数

定义一个最大池化层

不同的区域迭代器

前向传播函数

反向传播函数

定义一个Softmax层

初始化权重和偏差

前向传播函数

反向传播函数

代码详解

训练过程

测试过程

完整代码下载

你可能感兴趣的:(天网计划,深度学习,cnn,人工智能)