AI小白龙*

深度学习入门——卷积神经网络CNN基本原理+实战

CNN基本结构

卷积神经网络（Convolutional Neural Network,CNN）是深度学习技术中最基础的网络结构，模拟人脑工作，具备强大的特征学习能力。CNN结构主要由两部分组成：特征提取部分和分类部分\color{blue}{特征提取部分和分类部分}特征提取部分和分类部分。特征提取部分网络将执行一系列卷积和池化操作。分类部分使用全连接层作为一个分类器，使用特征提取部分提取的特征为图像上的对象分配概率，即算法预测概率。CNN结构如下所示。

卷积层

卷积层是CNN中最基础的结构，由许多卷积核（filter）\color{blue}{卷积核（filter）}卷积核（filter）组成，每个卷积核是一个针对局部区域的滤波模板，模板对应区域称之为感受野\color{blue}{感受野}感受野。卷积核以一定步长在图像矩阵上滑动，每到一个位置，卷积核对这个位置进行卷积操作，用图像矩阵上的值乘以卷积核中对应位置的权重，求和后得到卷积后的值。下图是一个2×22 \times 22×2的卷积核以1为步长在一个3×33 \times 33×3的矩阵上卷积的过程。以蓝色输出的位置为例，0×0+1×1+2×3+3×4=19\color{blue}{0×0+1×1+2×3+3×4=19}0×0+1×1+2×3+3×4=19 ，卷积完成后向右移动一个步长继续卷积，直到所有位置都卷积完毕。这样的结构在图像的不同区域都共享同样的卷积核参数，大大减少了网络的计算开销。

总结：卷积层中的超参数包括卷积核个数、大小尺寸、步长和填充\color{blue}{卷积核个数、大小尺寸、步长和填充}卷积核个数、大小尺寸、步长和填充（尺寸大于1×11×11×1的卷积核或大于1的步长会导致卷积后的特征图小于卷积之前，所以有的网络会利用填充零元素的方法使特征图和卷积之前保持一致），那么输出特征图的大小可表示为：

{W2=W1−F+2×ps+1H2=H1−F+2×ps+1\begin{aligned} \left{ \begin{array}{l} {W_2} = \frac{{{W_1} - F + 2 \times p}}{s} + 1\ \ {H_2} = \frac{{{H_1} - F + 2 \times p}}{s} + 1 \end{array} \right. \end{aligned}⎩⎨⎧W2=sW1−F+2×p+1H2=sH1−F+2×p+1

其中，W1×H1{W_1} \times {H_1}W1×H1代表输入图像的尺寸，W2×H2{W_2} \times {H_2}W2×H2为输出图片的尺寸，FFF为卷积核的尺寸，ppp一般取值为0或1，sss为步长。

看完这个公式我就要考考大家了：如果输入数据是32∗32∗33232332∗32∗3的图像，用10个5∗5∗35535∗5∗3的filter来进行卷积操作，指定步长为1，边界填充为2，那么最终输出的规模是多少腻❓❓❓（先自己动笔算算嗷）答案是：（32−5+2∗2）/1+1=32\color{blue}{（32-5+22）/1+1=32}（32−5+2∗2）/1+1=32，输出规模为32∗32∗103232*1032∗32∗10，经过卷积操作后也可以保持特征图长度、宽度不变。

为了给模型引入非线性，卷积核计算的结果一般需要输入激活函数。激活函数是神经网络结构中的重要元素，通过非线性转换实现自动特征提取，避免了线性输入输出问题，增强了网络非线性学习和处理复杂数据集的能力。激活函数必须具有单调性和可微性才能保证偏导函数的有效性。常用的激活函数有以下几种：

1.Sigmoid函数\color{blue}{1. Sigmoid函数}1.Sigmoid函数

Sigmoid函数将神经网络的输出映射到[0,1]范围内的概率值，这些概率值可以用来表示分类问题中每个类别的置信程度或回归问题中的连续输出。函数的特点是它的输出值在输入值为0时达到最大值0.5，并且在输入值接近正无穷或负无穷时趋近于1或0，使得函数能够对输入进行二元分类。但是❗该函数收敛速度缓慢，在反向传播时会有梯度消失问题。Sigmoid函数如下所示。

f(x)=11+e−x\begin{aligned} f(x) = {1 \over {1 + {e^{ - x}}}} \end{aligned}f(x)=1+e−x1

2.Tanh函数\color{blue}{2. Tanh函数}2.Tanh函数

Tanh函数的取值范围为[-1,1]，形状类似于Sigmoid函数，但Tanh函数在x等于0时，输出值为0，而Sigmoid函数在这点的输出为0.5，因此Tanh函数具有更强的非线性特征。此外，Tanh函数以原点为对称，解决了零均值问题，两端仍会存在梯度消失和幂运算耗时的弊端。表达式如下。

tanh⁡(x)=sinh⁡(x)cosh⁡(x)=ex−e−xex+e−x\begin{aligned} \tanh (x) = {{\sinh (x)} \over {\cosh (x)}} = {{{e^x} - {e^{ - x}}} \over {{e^x} + {e^{ - x}}}} \end{aligned}tanh(x)=cosh(x)sinh(x)=ex+e−xex−e−x

3.Relu函数\color{blue}{3. Relu函数}3.Relu函数

当输入信号小于等于0时，Relu函数的输出为0，当输入信号大于0时，输出等于输入信号本身。此函数的特点就是简单、高效、计算速度非常快。Relu函数的导数恒为1或0，可以减少计算量，加速模型的训练过程，同时能有效避免梯度消失。表达式如下。

f(x)=max(0,x)\begin{aligned} f(x)=max(0,x) \end{aligned}f(x)=max(0,x)

4.LeakyRelu函数\color{blue}{4. Leaky Relu函数}4.LeakyRelu函数

与Relu不同，Leaky Relu在输入值为负数时不会输出0，而是输出一个很小的值a(通常为0.01)，这个小值可以帮助解决Relu的死亡神经元问题，即在训练的过程中，某些神经元可能永远不会被激活，从而导致它们对整个网络的贡献为0。此外，Leaky Relu函数能够更快的收敛，在反向传播中也更加有效。Leaky Relu的表达式如下。

f(x)=max(0.01x,x)\begin{aligned} f(x)=max(0.01x,x) \end{aligned}f(x)=max(0.01x,x)

池化层

池化也叫下采样\color{blue}{下采样}下采样，通常在连续的卷积层之间会插入一个池化层，它的作用是逐渐降低数据单元的尺寸，有效减少网络中的参数数量，降低计算资源的消耗，增强模型的鲁棒性和泛化能力，同时也能有效控制过拟合。常见的池化操作包括最大池化（MaxPooling）和平均池化（AveragePooling）\color{blue}{最大池化（Max Pooling）和平均池化（Average Pooling）}最大池化（MaxPooling）和平均池化（AveragePooling）。最大池化的原理是选取局部区域内的最大值作为输出，这样可以保留输入数据的主要特征。下图是一个2×22 \times 22×2的池化滑窗以2为步长在一个4×44 \times 44×4的矩阵上进行最大池化的过程。以输出结果中的第一个位置为例，max(12,20,8,12)=20max(12,20,8,12)=20max(12,20,8,12)=20，该区域完成池化后向右移动一个步长继续池化，直到所有位置都池化完成。若是平均池化，就可以取平均值而不是最大值啦

全连接层

全连接层的目的是将前面通过卷积、池化等操作提取到的特征图进行分类或回归。这个层次的主要任务是将高维度的特征图转换为一维向量并输出到下一个层级进行处理\color{blue}{将高维度的特征图转换为一维向量并输出到下一个层级进行处理}将高维度的特征图转换为一维向量并输出到下一个层级进行处理。与卷积层、池化层不同，全连接层中每个神经元都与前一层中的所有神经元相连，所以叫做全连接。

该层输入的数据通常是经过展平处理的，因此可以理解为把二维或三维的特征图变成了一维向量，在进行分类或者回归分析时，可以使用常见的多层感知器（MLP）。如此设计的好处在于，全连接层可以学习到各种组合的特征，从而提高模型的表达能力。同时，由于每个神经元之间都有连接，它们能够共享一些重要信息，减小模型参数的数量和计算量。

看完上段话是不是有点一头雾水腻，那就举个栗子\color{blue}{举个栗子}举个栗子：

如下图所示，9×99 \times 99×9的图像经过一系列的卷积、池化、激活函数操作后，即将进入到全连接层中。

到了全连接层时，全连接层是一维数据，所以要将feature map变为一维。提问❓❓❓：它是怎么样把二维的输出，转换成一维形式的呢？\color{blue}{它是怎么样把二维的输出，转换成一维形式的呢？}它是怎么样把二维的输出，转换成一维形式的呢？假设，假设哈，在到达全连接层时是3个2×22 \times 22×2的矩阵，此时这12×112 \times 112×1(平展开)向量中的每一个元素就是输入层的一个神经元，将这3个矩阵变为一维的操作如下图左所示。然后将得到的一维向量送入到网络中以概率（Softmax）\color{blue}{概率（Softmax）}概率（Softmax）的方式判断是X还是非X。粗线表示特征明显的数据，即是X的特征与不是X的特征。根据计算得到的权重矩阵，对其进行加权求和，就得到了每个分类的得分，然后根据softmax函数进行概率计算，得到X的概率为0.92，不是X的概率为0.5，最终得到输出结果，过程如下图右所示。

CNN图像分类实战

学完了卷积神经网络的基本构成之后，咱们就可以愉快的使用它进行分类啦

下图的（a）和（b）分别是煤炭coal和矸石gangue(夹杂在煤炭中的石块杂质)的图像，下面呢咱们就用CNN对这两类图像进行二分类\color{blue}{二分类}二分类，代码非常简单，只有三个文件：model.py、train.py和predict.py\color{blue}{model.py、train.py和predict.py}model.py、train.py和predict.py，相信你看懂之后会对CNN的结构及实现图片分类有更多的认识嗷

在进行任务之前呢，都毫无例外先准备数据集，若是希望效果精度嘎嘎好的话，数据集的图片原则上是越多越好。下面呢咱先上代码，代码中都有详细注释，保你一看就懂。在model.py文件中：

python
复制代码
model.py
import torch.nn as nn

class CNN(nn.Module):
    def __init__(self):
        super(CNN, self).__init__()
        self.covn1 = nn.Sequential(       # 原始图片为（1，224，224）
            nn.Conv2d(1, 8, 5, 2),        # 卷积，卷积核5×5，步长2， (8,110,110)
            nn.ReLU(),                    # ReLU激活函数
            nn.MaxPool2d(2),              # 最大池化，池化核2×2，步长2， (8,55,55)
        )
        self.conv2 = nn.Sequential(
            nn.Conv2d(8, 16, 3, 1),        # (16,53,53)
            nn.ReLU(),
            nn.MaxPool2d(2),               # (16,26,26)
        )
        self.conv3 = nn.Sequential(
            nn.Conv2d(16, 32, 3, 1),       # (32,24,24)
            nn.ReLU(),
            nn.MaxPool2d(2),               # (32,12，12）
        )
        self.conv4 = nn.Sequential(
            nn.Conv2d(32, 64, 3, 1),       # (64,10,10)
            nn.ReLU(),
            nn.MaxPool2d(2),               # (64,5,5)
        )
        self.conv5 = nn.Sequential(
            nn.Conv2d(64, 64, 5, 1),       # (64,1,1)
        )
        self.layer1 = nn.Linear(64*1*1, 2)  # 全连接层将它展平  2类
        # initial weights
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                nn.init.kaiming_normal_(m.weight, mode="fan_out")
                if m.bias is not None:
                    nn.init.zeros_(m.bias)
            elif isinstance(m, (nn.BatchNorm2d, nn.GroupNorm)):
                nn.init.ones_(m.weight)
                nn.init.zeros_(m.bias)
            elif isinstance(m, nn.Linear):
                nn.init.normal_(m.weight, 0, 0.01)
                nn.init.zeros_(m.bias)
#前向传播
    def forward(self, x):
        x = self.covn1(x)
        x = self.conv2(x)
        x = self.conv3(x)
        x = self.conv4(x)
        x = self.conv5(x)
        x = x.view(x.size(0), -1)
        output = self.layer1(x)
        return output

在model.py中定义了一个CNN类\color{blue}{CNN类}CNN类，构造了一个简单的网络结构，包含卷积、激活、池化、全连接层。代码最后的前向传播目前不了解没关系，只需要知道这是一种训练方式就行，这一part可以下节仔细讲讲。由于咱们主要是学习CNN的结构，故这里就不再给出训练和预测\color{blue}{训练和预测}训练和预测的详细代码啦，感兴趣的同学可以访问

Python学习——numpy ToToBe python 学习 numpy
参考资料：numpy官网一、基础NumPy的主要对象是同构多维数组。它是一个元素表（通常是数字），所有类型都相同，由非负整数元组索引。在NumPy维度中称为axes.例如，3D空间中的点的坐标[1,2,1]具有一个轴。该轴有3个元素，所以我们说它的长度为3.在下图所示的例子中，数组有2个轴。第一轴的长度为2，第二轴的长度为3。[[1.,0.,0.],[0.,1.,2.]]NumPy的数组类被叫做n
SpringBoot中运行Yolov5程序 eqa11 spring boot YOLO 后端
文章目录SpringBoot中运行Yolov5程序一、引言二、环境搭建1、SpringBoot项目创建2、YOLOv5环境配置三、SpringBoot与YOLOv5集成1、创建Python服务2、SpringBoot调用Python服务四、使用示例1、创建控制器五、总结SpringBoot中运行Yolov5程序一、引言在人工智能领域，目标检测是一个热门且实用的技术。YOLOv5作为目标检测算法中的
Java中运行Python程序 eqa11 python java 开发语言
文章目录Java中运行Python程序一、引言二、使用Jython运行Python程序1、Jython简介1.1、添加Jython依赖2、编写Java代码调用Python三、使用进程间通信运行Python程序1、原理2、编写Python脚本3、编写Java代码四、使用JNI运行Python程序1、JNI简介2、编写JNI代码3、编写Python脚本4、在Java中调用JNI库五、使用示例六、总结J
python-leetcode-路径总和 Joyner2018 leetcode 算法职场和发展
112.路径总和-力扣（LeetCode）#Definitionforabinarytreenode.#classTreeNode:#def__init__(self,val=0,left=None,right=None):#self.val=val#self.left=left#self.right=rightclassSolution:defhasPathSum(self,root:Optio
大语言模型原理与工程实践：残差连接与层归一化 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着自然语言处理（NLP）的发展，深度学习在过去几年中取得了令人瞩目的成果。其中，循环神经网络（RNN）和卷积神经网络（CNN）在图像和文本分类、语义角色标注、机器翻译等领域表现出色。然而，这些网络在训练过程中经常遭遇梯度消失和梯度爆炸的问题。为了解决这些问题，我们引入了残差连接（ResidualConnections）和层归一化（BatchNormalization）来改善模型性能。
【数据集】——1 花花 Show Python pyecharts—从0到精通信息可视化数据分析 python
解锁数据可视化的魔法钥匙——pyecharts实战指南在这个数据为王的时代，每一次点击、每一次交易、每一份报告背后都隐藏着无尽的故事与洞察。但你是否曾苦恼于如何将这些冰冷的数据转化为直观、吸引人的视觉盛宴？欢迎来到《pyecharts图形绘制大师班》在这里，你将不再受限于单调的表格和图表，而是学会如何运用pyecharts这一强大的Python数据可视化库，将复杂的数据转化为令人惊叹的交互式图形。
python的subprocess模块 weixin_34075551 shell python
subprocess模块是python从2.4版本开始引入的模块。主要用来取代一些旧的模块方法，如os.system、os.spawn*、os.popen*、commands.*等。subprocess通过子进程来执行外部指令，并通过input/output/error管道，获取子进程的执行的返回信息。常用方法：subprocess.call()：执行命令，并返回执行状态，其中shell参数为Fa
2018.9月Flutter优质开源项目 weixin_34408624 移动开发 python
2019独角兽企业重金招聘Python工程师标准>>>2018.9月Flutter优质开源项目转载于:https://my.oschina.net/coderminer/blog/2218697
pytorch实现主成分分析 (PCA)：用于数据降维和特征提取纠结哥_Shrek pytorch 人工智能 python
使用PyTorch实现主成分分析（PCA）可以通过以下步骤进行：标准化数据：首先，需要对数据进行标准化处理，确保每个特征的均值为0，方差为1。计算协方差矩阵：计算数据的协方差矩阵，以捕捉特征之间的关系。特征值分解：对协方差矩阵进行特征值分解，获得主成分。选择主成分：根据特征值的大小选择前几个主成分，通常选择方差最大的主成分。转换数据：将数据投影到选定的主成分上，完成降维。例子代码：importto
模型架构选择：从传统NLP到Transformer AI天才研究院 AI大模型应用入门实战与进阶大数据AI人工智能计算大数据人工智能语言模型 AI 大模型 LLM Java Python 架构设计 Agent RPA
模型架构选择：从传统NLP到Transformer关键词：自然语言处理(NLP),模型架构,传统NLP,Transformer,RNN,CNN,预训练模型文章目录模型架构选择：从传统NLP到Transformer1.背景介绍1.1问题的由来1.2研究现状1.3研究意义1.4本文结构2.核心概念与联系3.核心算法原理&具体操作步骤3.1算法原理概述3.1.1传统NLP模型3.1.2RNN模型3.1.
Python计算【15】 sakura_sea 物理数学与计算 python
文章目录t分布理论基础python参考文献t分布理论基础通常用于样本量较小或总体标准差未知的情况下，进行假设检验和构建置信区间。t分布是一类对称且形状接近正态分布的概率分布，随自由度（(df)）的增加逐渐趋近于标准正态分布。t=Xˉ−μS/n
使用PyTorch实现线性SVM指南余桢钟
使用PyTorch实现线性SVM指南svm-pytorchLinearSVMwithPyTorch项目地址:https://gitcode.com/gh_mirrors/sv/svm-pytorch本指南基于GitHub上的开源项目svm-pytorch，旨在帮助开发者理解和运用这个库来在PyTorch框架下实现支持向量机（SupportVectorMachines,SVM）。项目介绍sparse
深入理解Python中的subprocess模块一休哥助手 python python 网络
目录subprocess模块简介常用函数执行外部命令管道通信子进程管理错误处理实际应用示例最佳实践subprocess模块简介
Python subprocess模块总结 bytxl python与GAE
subprocess最简单的用法就是调用shell命令了,另外也可以调用程序,并且可以通过stdout,stdin和stderr进行交互。subprocess的主类复制代码代码如下:subprocess.Popen(args,bufsize=0,executable=None,stdin=None,stdout=None,stderr=None,preexec_fn=None,close_fds=
阿里巴巴Qwen团队发布AI模型，可操控PC和手机新加坡内哥谈技术人工智能深度学习语言模型学习
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/这周，科技界的目光几乎都被DeepSeek的R1模型吸引，但阿里巴巴并没有袖手旁观。1月
对比DeepSeek、ChatGPT和Kimi的学术写作摘要能力 AIWritePaper官方账号 DeepSeek AIWritePaper ChatGPT 人工智能 chatgpt llama 数据分析论文阅读
摘要摘要是文章的精华，通常在200-250词左右。要包括研究的目的、方法、结果和结论。让AI工具作为某领域内资深的研究专家，编写摘要需要言简意赅，直接概括论文的核心，为读者提供快速了解的窗口。下面我们使用DeepSeek、ChatGPT4以及Kimi辅助编写摘要。提示词：你现在是一名[计算机理论专家]，研究方向集中在[人工智能、大模型、数据挖掘等计算机相关方向]。我现在需要撰写一篇围绕[人工智能在
Transformer架构的GPU并行和之前的NLP算法并行有什么不同？ AI大模型学习不迷路 transformer 自然语言处理大模型深度学习 NLP LLM 大语言模型
1.什么是GPU并行计算？GPU并行计算是一种利用图形处理单元（GPU）进行大规模并行数据处理的技术。与传统的中央处理单元（CPU）相比，GPU拥有更多的核心，能够同时处理数千个线程，这使得GPU在处理高度并行的任务时表现出色。在深度学习中，GPU并行计算被广泛应用于训练神经网络，加速模型训练过程。在2017年之前，自然语言处理（NLP）领域的研究者们通常会从头开始训练模型，那时能够利用GPU进行
Python——Pickle库 Devin01213
pickle是python语言的一个标准模块，安装python后已包含pickle库，不需要单独再安装。那么为什么需要序列化和反序列化这一操作呢？1.便于存储。序列化过程将文本信息转变为二进制数据流。这样就信息就容易存储在硬盘之中，当需要读取文件的时候，从硬盘中读取数据，然后再将其反序列化便可以得到原始的数据。在Python程序运行中得到了一些字符串、列表、字典等数据，想要长久的保存下来，方便以后
Pathlib操作文件IN Python Louis yeap python python 开发语言 pathlib 文件
系列文章目录文章目录目录系列文章目录文章目录前言一、Pathlib是什么？二、使用步骤前言pathlib是Python标准库中用于操作文件和目录路径的模块，自Python3.4起引入。它提供了一种面向对象的方式处理路径，使路径操作更加简洁、可读和跨平台。pathlib取代了传统模块如os.path和部分shutil的功能，成为推荐的路径操作工具。一、Pathlib是什么？pathlib是Pytho
Async协程保姆级教学 Louis yeap python 大数据 python 开发语言协程 async
目录编辑前言二、Async协程使用步骤1.导入标准库2.协程三、协程的应用场景1.网络IO2.数据库IO3.文件IO4.异步任务调度5.Web服务6.设备和串口IO7.队列和管道总结前言介绍：Python协程的概念源于生成器（Generator）。但它通过asyncio和事件循环，进一步扩展了生成器的功能，从而支持异步非阻塞操作。允许程序在执行过程中暂停（挂起），然后在需要时恢复运行。与传统的线程
垃圾回收机制 Louis yeap 算法 python go
系列文章目录文章目录目录系列文章目录文章目录前言一、垃圾回收算法二、golang垃圾回收算法三、python垃圾回收算法前言垃圾回收（GarbageCollection,GC）是一种自动管理内存的技术，用于动态分配内存的编程语言中。当程序运行时，会创建大量的对象和变量，这些对象占用内存。在程序的某些阶段，一些对象不再被需要，或者不再被引用，这些对象占用的内存就可以被释放，以便其他对象使用。垃圾回收
计算机视觉：解锁未来智能的钥匙及其代码实践我的运维人生计算机视觉人工智能运维开发技术共享
计算机视觉：解锁未来智能的钥匙及其代码实践在当今这个数据爆炸的时代，计算机视觉作为人工智能的一个重要分支，正以前所未有的速度推动着科技的边界。它不仅让机器“看懂”世界，更在自动驾驶、医疗影像分析、智能制造、安防监控等众多领域展现出巨大的应用潜力。本文将深入探讨计算机视觉的核心技术、最新进展，并通过一个具体的代码案例，展示如何在实践中应用这些技术，旨在为读者提供一个理论与实践相结合的全面视角。一、计
ImportError: DLL load failed while importing _rust: 找不到指定的程序的解决方案爱编程的喵喵 Python基础课程 python ImportError DLL load failed _rust 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ImportError:DLLloa
python pickle 模块的使用 weixin_30305735 python json 数据结构与算法
用于序列化的两个模块json：用于字符串和Python数据类型间进行转换pickle:用于python特有的类型和python的数据类型间进行转换json提供四个功能：dumps,dump,loads,loadpickle提供四个功能：dumps,dump,loads,loadpickle可以存储什么类型的数据呢？所有python支持的原生类型：布尔值，整数，浮点数，复数，字符串，字节，None。
Rust中奖励函数的实现与应用 AI天才研究院计算 AI大模型企业级应用开发实战大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Rust中奖励函数的实现与应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：Rust,奖励函数,强化学习,机器学习,状态空间1.背景介绍1.1问题的由来在机器学习领域，特别是在强化学习（ReinforcementLearning,RL）中，奖励函数（RewardFunction）扮演着至关重要的角色。它定义了智能体（Agent）在执行任务时
Python中Pickle库 SteveKenny Python python 开发语言后端
文章目录简介函数dumpsloadsdumpload简介Python中有个序列化过程叫作pickle，它能够实现任意对象与文本之间的相互转化，也可以实现任意对象与二进制之间的相互转化。也就是说，pickle可以实现Python对象的存储及恢复。pickle模块的应用很简单，只有四个方法dumps()：将Python中的对象序列化成二进制对象，并返回loads()：读取给定的二进制对象数据，并将其转
《向量数据库指南》——MoE应用：解锁深度学习新境界的钥匙大禹智库《实战AI智能体》《向量数据库指南》深度学习人工智能向量数据库大禹智库低代码 MoE模型
在深度学习的广阔天地里，混合专家（MoE）模型如同一把锐利的钥匙，正逐步解锁着各种复杂应用场景的新境界。作为大禹智库的向量数据库高级研究员，同时也是《向量数据库指南》的作者，我深感MoE模型在推动AI技术向前发展中所扮演的重要角色。今天，我将带大家深入探讨MoE模型在自然语言处理、计算机视觉以及多模态学习等领域的应用，并巧妙引导大家通过《向量数据库指南》获取更多干货和深度实战经验。一、自然语言处理
python中的序列化 fate252 Python python 序列化 pickle json
序列化（picking）把不方便存储或不可传输的对象转换为可存储或可传输的数据的过程称之为序列化。序列化之后，就可以把序列化后的内容写入磁盘，或者通过网络传输到别的机器上。反过来，把从磁盘或网络得到的序列化数据重建为对象的过程称之为反序列化（unpickling）。序列化和反序列化实际是为了通用存储或传输而编码和解码的过程。举例：网络游戏mabi洛奇的存档功能，当每次不想玩的时候就可以存档到服务器
Selenium自动化测试框架入门与使用 Future_yzx selenium 测试工具
目录1.Selenium简介2.使用Selenium2.1Java使用Selenium2.2Python使用Selenium2.3支持的浏览器及WebDriver3.ChromeDriver的安装3.1查看本机Chrome版本3.2匹配对应的ChromeDriver并下载3.3配置ChromeDriver路径3.4在服务器（如CentOS）上安装ChromeJava中使用Selenium的代码示例
小南每日 AI 资讯 | 国产AI之光DeepSeek暴击硅谷？？？ | 25/01/29 小南AI学院人工智能
1.中国AI模型震惊硅谷：DeepSeek为何一夜火出圈？国产AI大模型DeepSeek迅速崛起，引发硅谷关注。2.中国银行支持AI产业：1万亿元金融扶持助推智能化升级中国银行宣布提供1万亿元资金支持人工智能产业链发展，助力智能化升级。3.国产AI大模型DeepSeek惊艳全球：游戏科学冯骥称其为“国运级别科技成果”DeepSeek的AI模型引起全球关注，游戏科学的冯骥高度评价其意义。4.AI产业
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR

深度学习入门——卷积神经网络CNN基本原理+实战

CNN基本结构

卷积层

池化层

全连接层

CNN图像分类实战

你可能感兴趣的:(深度学习,cnn,人工智能,pytorch,神经网络,机器学习,python)