风间琉璃•

Pytorch之SwinTransformer图像分类

文章目录

前言
一、Swin Transformer
- 1.Swin Transformer概览
- 2.Patch Partition
- 3.Patch Merging
- 4.W-MSA
- 5.SW-MSA(滑动窗口多头注意力机制)
- 6.Relative Position bias(相对位置偏移)
- 7.网络结构
- - Swin Transformer Block
  - Architecture
二、网络实现
- 1.构建EfficientNetV2网络
- 2.训练和测试模型
三、实现图像分类
结束语

个人主页:风间琉璃

版权: 本文由【风间琉璃】原创、在CSDN首发、需要转载请联系博主

如果文章对你有帮助、欢迎关注、点赞、收藏(一键三连)和订阅专栏哦

前言

Swin Transformer(Liu et al., 2021) 是一种基于视觉Transformer的层次化模型。与之前的Vision Transformer相比，Swin Transformer采用了层次化构建方法，使用不同倍数的下采样来构建特征图，并在每个窗口内使用Windows Multi-Head Self-Attention(W-MSA)进行注意力计算。这种方法既减少了计算量，尤其是在浅层特征图较大时，又能在相邻窗口之间传递信息。

此外，Swin Transformer在目标检测、实例分割等任务上也具有较好的表现，Swin Transformers 已经被用作当今许多视觉模型架构的主干。

在看本篇之前，建议你有Vision Transformer的相关基础，Transformer和Vision Transformer参考连接：

一、Swin Transformer

1.Swin Transformer概览

将 Transformer 从语言应用到视觉方面主要有两大挑战：
$\star$ 视觉实体变化大，在不同场景下视觉Transformer性能未必很好
$\star$ 图像分辨率高，像素点多，Transformer基于全局自注意力的计算导致计算量较大

Swin Transformer 引入了两个关键的概念来解决原始 ViT 所面临的问题：分层特征图（hierarchical feature maps）和转移窗口注意力（shifted window attention）。Swin Transformer 的名字来源于“Shifted window Transformer”。

Swin Transformer和Vision Transformer对比：

在上图左边是Swin Transformer，右边Vision Transformer，这张图它想表达Swin Transformer的两个核心点：
①Swin Transformer使用层次化构建方法（Hierarchical feature maps），特征图尺寸中有对图像下采样4倍的，8倍的以及16倍的，抽取不同层次的视觉特征，使其更适合分割检测等任务。而ViT中是一直16倍下采样。

Swin Transformer通过从小尺寸 patch开始，逐渐在更深的 Transformer 层中合并相邻 patch，从而构造出一个层次化表示 (hierarchical representation)。通过这些层次化特征图，Swin Transformer 模型可方便地利用先进技术进行密集预测，例如特征金字塔网络 (FPN) 或 U-Net。

②Swin Transformer中使用了Windows Multi-Head Self-Attention(W-MSA)，在上图的4倍下采样和8倍下采样中，将特征图划分成了多个不相交的区域（Window），并且Multi-Head Self-Attention只在每个窗口（Window）内进行。

上图两边红框代表在红框内进行transformer,右边ViT的红框是整张图，而左边Swin Transformer的红框是在小窗口上进行的。相对于ViT中直接对整个特征图进行Multi-Head Self-Attention，这样做的目的是能够减少计算量的，尤其是在浅层特征图很大的时候。

这样做虽然减少了计算量但也会隔绝不同窗口之间的信息传递，所以在论文中作者又提出了 Shifted Windows Multi-Head Self-Attention(SW-MSA)，通过此方法能够让信息在相邻的窗口中进行传递。

为了解决采用W-MSA模块时，只会在每个窗口内进行自注意力计算，窗口与窗口之间是无法进行信息传递的，Swin Transformer引入了一个关键设计元素是它在连续自注意力层之间的窗口分区的移位 (shift)，即Shifted Windows Multi-Head Self-Attention(SW-MSA)，如上图所示。

每一个小块叫做一个patch，每一个深色方块框起来的叫一个local window，在每一个local window中计算self-attention。如果是只计算一次self-attention，每个local window之间是孤立的，会隔绝不同窗口之间的信息传递。但是实际上所有的local window组成一张图片，他们之间是有关联的，所以引入了shifted-window进行了第二次self-attention，使用这个滑动窗口多头注意力机制的目的是为了实现不同windows之间的信息交互。

在Swin Transformer网络结构中一般是先使用W-MSA模块，然后紧跟着使用SW-MSA模块的。在使用完W-MSA模块后再对特征进行分块可以理解为在上一层的基础上将每个windows分别向下后再向右移动了两个像素，经过这样处理后每个窗口都具有了特征图不同块的信息。

2.Patch Partition

对于图像数据，其数据格式为[H, W, C]，不满足Transformer输入要求。所以需要先通过Patch Partition来对图像数据处理，将图像划分为固定大小的patch。然后将每个块沿着通道维度展开，可以用作后续任务的输入。如下图所示，具体细节可以参考前面给的链接文章。

3.Patch Merging

在 ResNet 等卷积神经网络中，特征图的下采样是使用卷积操作完成的，在Swin Transformer 中使用的无卷积下采样技术称为 Patch Merging。

在每个Stage（Stage1除外）开始前通过一个Patch Merging层进行下采样，用于缩小分辨率，调整通道数进而形成层次化的设计，同时也能节省一定运算量。在CNN中，则是在每个Stage开始前用stride=2的卷积/池化层来降低分辨率。

每次降采样是两倍，因此在行方向和列方向上，间隔2选取元素。然后拼接在一起作为一整个张量，最后展开。此时通道维度会变成原先的4倍（因为H,W各缩小2倍），此时再通过一个全连接层再调整通道维度为原来的两倍。

如上图所示，假设输入Patch Merging的是一个8x8大小的单通道特征图（feature map），Patch Merging会将每个4x4的相邻像素划分为一个patch，然后将每个patch中相同位置像素给拼在一起得到4个feature map, 并将这四个feature map在深度方向进行concat拼接。然后在通过一个LayerNorm层和全连接层在feature map的深度方向做线性变化，将feature map的深度由C变成C/2，即减半（上图中不包含最后的全连接层调整）。

该模块主要存在于Stage2-4，作用主要为下采样，即高和宽减半、通道翻倍，其动态处理如图：

4.W-MSA

引入Windows Multi-head Self-Attention（W-MSA）模块是为了减少计算量。如下图所示，左侧使用的是普通的Multi-head Self-Attention（MSA）模块，对于feature map中的每个patch，在Self-Attention计算过程中需要和所有的patch去计算。这导致Patch 数量平方复杂度，使其不适合高分辨率图像。

为了解决这个问题，Swin Transformer 使用了Windows Multi-head Self-Attention（W-MSA）。一个 Window 只是一个 patch 的集合，注意力计算只在每个 Window 内进行。例如，下图右侧使用 2 x 2 块的 Window 大小，然后单独对每个Windows内部进行Self-Attention。。

MSA和W-MSA动态处理过程：

对于普通的MSA模块来说，会对每一个patch去求解它的q，k，v的值，对任意一个patch所求得的q会对特征图中其他像素的k进行一个相似度的匹配，然后再进行一系列的操作，具体细节参考前面ViT的文章。

在W-MSA模块当中，首先会将特征图分成多个Windows后再进行处理，然后再对每个窗口的内部执行多头注意力机制的计算，但是这种方法窗口与窗口之间是无法进行信息交互的，这种缺点也会使得感受野变小，无法看到全局的感受野。

5.SW-MSA(滑动窗口多头注意力机制)

采用W-MSA模块时，只会在每个窗口内进行自注意力计算，导致窗口与窗口之间是无法进行信息传递的。为了解决这个问题，Swin Transformer 在 W-MSA 模块之后使用了 Shifted Windows Multi-Head Self-Attention（SW-MSA）模块，即进行偏移的W-MSA。

左侧使用W-MSA（假设是第L层），一般W-MSA和SW-MSA是成对使用的，那么第L+1层使用是SW-MSA（右侧图）。根据左右两幅图对比能够发现窗口（Windows）发生了偏移，可以看成窗口从左上角分别向右侧和下方各偏移了 $\cfrac{M}{2}$ 个patch。

在L层时每个窗口里的patch只能和同一个窗口里的patch相互学习。在偏移后的窗口（右侧图），由于窗口的移动，导致某些patch进入新的窗口，这些带有上一层窗口信息的patch可以和别的带有上一层前窗口信息的patch相互学习。解决了不同窗口之间无法进行信息交流的问题。

比如对于第一行第2列的2x4的窗口，它能够使第L层的第一排的两个窗口信息进行交流；第二行第二列的4x4的窗口，他能够使第L层的四个窗口信息进行交流。以上解决了不同窗口之间无法进行信息交流的问题。

在SW-MSA方法中，将特征划分为多个不规则的块，则增加了计算量，因为W-MSA模块将模型划分为4个等大小的块，而SW-MSA将模型分为9个块，因此模型计算量加大。为了解决这个麻烦，作者又提出而了Efficient batch computation for shifted configuration，一种更加高效的计算方法。下面是原论文给的示意图:
通过对特征图移位，并给 Attention 设置 Mask 来间接实现 Shift Window Attention (SW-MSA)。从而，在保持原 Window 数不变的情况下，使最后的计算结果等价。

将上图中的区域对应着进行标号，每个块进行了0-8的编号。为了减少计算量，首先将区域第一行移至第三行，然后再将新的的第一列移至第三列。网上另一种移动方式是：首先将1和2两块移到最下方7和8的下面，然后，将3和6移动到右边5和8的右边，最后，将0移动到最右下角。这两种最后得到到的特征图都是一样的。

移动完后，4是一个窗口；将5和3合并成一个窗口；7和1合并成一个窗口；8、6、2和0合并成一个窗口。这样可以间接的划分为新得4x4窗口，所以能够保证计算量是一样的。

但是把不同的区域合并在一起进行MSA，会造成信息错乱，需要设计一种新的计算方式。为了防止这个问题，在实际计算中使用的是masked MSA即带蒙板mask的MSA，可以通过设置蒙板来隔绝不同区域的信息。

关于mask如何使用，可以看下下面这幅图，下图是以上面的区域5和区域3为例。

对于该窗口内的每一个patch在进行MSA计算时，都要先生成对应的query(q)，key(k)，value(v)。假设对于上图的像素0而言，得到 $q^0$ 后要与每一个像素的k进行匹配（match），假设 $\alpha _{0,0}$ 代表 $q^0$ 与像素0对应的 $k^0$ 进行匹配的结果，同理可以得到 $\alpha _{0,0}$ 至 $\alpha _{0,15}$ 。

按照普通的MSA计算，接下来进行SoftMax操作。但对于这里的masked MSA，像素0是属于区域5的，只想让它和区域5内的像素进行匹配。那么可以将像素0与区域3中的所有像素匹配结果 $\alpha$ 都减去100（例如 $\alpha _{0,2}$ , $\alpha _{0,3}$ , $\alpha _{0,6}$ , $\alpha _{0,7}$ …）。

一般 $\alpha$ 的值都很小，一般都是零点几，将其中一些数减去100后在通过SoftMax得到对应的权重基本上为0。所以对于像素0而言实际上还是只和区域5内的像素进行了MSA。对于其他像素也可以采用相同的操作。注意，在计算完后还要把数据给挪回到原来的位置上。

SW-MSA动态过程：在这种Shifted操作之后，一个窗口可能由原始特征图中不相邻的patch组成，因此在计算时使用了 Mask，以限制对相邻 patch 的自注意。

6.Relative Position bias(相对位置偏移)

绝对位置编码是在进行self-attention计算之前为每一个token添加一个可学习的参数，相对位置编码如下式所示，是在进行self-attention计算时，在计算过程中添加一个可学习的相对位置参数。
$softmax(\cfrac{QK^T}{\sqrt{d_k}} + B)V$

计算流程如下：
假设输入的feature map高宽为2，首先可以构建出每个像素的绝对位置，如左下方的矩阵所示，对于每个像素的绝对位置是使用行号和列号表示的。
首先对蓝色像素使用q与所有像素k进行匹配过程中，是以蓝色像素为参考点，使用蓝色像素的绝对位置索引与其他位置索引进行相减，得到其他位置相对蓝色像素的相对位置索引。同理可以得到相对黄色，红色以及绿色像素的相对位置索引矩阵。

接下来将每个相对位置索引矩阵按行展平，并拼接在一起可以得到下面的4x4矩阵。作者为了方便把二维索引给转成一维索引，如下图所示。
首先在原始的相对位置索引上加上M-1(M为窗口的大小，在本示例中M=2)。然后将所有的行标都乘上2M-1。最后将行标和列标进行相加，这样即保证了相对位置关系。

至此相对位置索引计算完毕，但是公式中要的是相对位置偏置参数，可训练参数 $\widehat{B}$ 保存在relative position bias table(相对位置偏置表)里的，由于相对位置索引总共有(2M-1)×(2M-1)种，则表的长度为(2M-1) x (2M-1)，上述公式中的相对位置偏执参数B是根据上面的相对位置索引表根据查relative position bias table表得到的，如下图所示。

最后使用对应的相对位置偏置表（Relative position bias table）进行映射即可得到最终的相对位置偏置B。

7.网络结构

Swin Transformer Block

上图为Swin Transformer Block结构图，一个 Swin Transformer block 由一个基于移位窗口的 MSA 模块构成，且后接一个夹有 GeLU 非线性在中间的 2 层 MLP。LayerNorm (LN) 层被应用于每个 MSA 模块和每个 MLP 前，且一个残差连接被应用于每个模块后。Swin Transformer使用window self-attention降低了计算复杂度，又为了保证不重叠窗口之间有联系，采用了shifted window self-attention的方式重新计算一遍窗口偏移之后的自注意力。

所以Swin Transformer Block都是成对出现的 (W-MSA + SW-MSA为一对) ，先使用一个W-MSA结构再使用一个SW-MSA结构。所以堆叠Swin Transformer Block的次数都是偶数，在整体模型里Swin Transformer Blocks下的×2、×6就是因为成对使用的意思。

两个连续 Swin Transformer Blocks 的计算可表示为计算过程如下：

Architecture

上图展示了 Swin Transformer 架构概览 (tiny 版 SwinT)。它首先将图片输入到Patch Partition模块中进行分块，即每4x4相邻的像素为一个Patch，然后在channel方向展平（flatten）。假设输入的是RGB三通道图片，那么每个patch就有4x4=16个像素，然后每个像素有R、G、B三个值所以展平后是16x3=48，所以通过Patch Partition后图像shape由 [H, W, 3]变成了 [H/4, W/4, 48]。

然后通过Linear Embeding层对每个像素的channel数据做线性变换，由48变成C，即图像shape再由 [H/4, W/4, 48]变成了 [H/4, W/4, C]。在源码中Patch Partition和Linear Embeding直接通过一个卷积层实现的。

然后通过四个Stage构建不同大小的特征图，除了Stage1中先通过一个Linear Embeding层外，剩下三个stage都是先通过一个Patch Merging层进行下采样，像 CNN 一样逐层扩大感受野，以便获取到全局的信息。为产生一个层次化表示 (Hierarchical Representation)，随着网络的加深，tokens 数逐渐通过Patch Meraging被减少，其维度扩大。每个 Stage 都会改变张量的维度，从而形成一种层次化的表征。由此，该架构可方便地替换现有的各种视觉任务的主干网络。

最后对于分类网络，后面还会接上一个Layer Norm层、全局池化层以及全连接层得到最终输出。如下图所示：

下图给出的关于不同Swin Transformer的配置，T(Tiny)，S(Small)，B(Base)，L(Large)：

参数说明：
$\star$ win. sz. 7x7表示使用的窗口（Windows）的大小
$\star$ dim表示feature map的channel深度（或者说token的向量长度）
$\star$ head表示多头注意力模块中head的个数

二、网络实现

1.构建EfficientNetV2网络

2.训练和测试模型

三、实现图像分类

结束语

感谢阅读吾之文章，今已至此次旅程之终站。

吾望斯文献能供尔以宝贵之信息与知识也。

学习者之途，若藏于天际之星辰，吾等皆当努力熠熠生辉，持续前行。

然而，如若斯文献有益于尔，何不以三连为礼？点赞、留言、收藏 - 此等皆以证尔对作者之支持与鼓励也。

大语言模型技术专栏（三）：Attention机制——从RNN到Transformer的惊世一跃！北海yy 大语言模型技术专栏语言模型 rnn transformer
文章目录概要一、Attention机制：让AI学会「划重点」二、Attention机制的核心原理三、Self-Attention：Transformer的核心四、代码实战：用PyTorch实现Attention五、Attention的进化：从Transformer到GPT概要大家好，我是北海yy，继续带来大语言模型技术专栏的深度解析！在上一期《RNN语言模型——让AI真正「记住」上下文的秘密武器》
从opencv-python入门opencv--GUI功能之绘图&鼠标与图像界面的交互这是一个图像 python 计算机外设 opencv GUI 计算机视觉图像处理交互
从opencv-python入门opencv--GUI功能之绘图和鼠标操作一、文章介绍二、opencv绘制直线、矩形、圆形1、cv.line()2、cv.circle()3、cv.rectangle()4、在图像上绘制直线、矩形和圆形5、cv.ellipse()（在空白画布上绘制椭圆）（1）img=cv.ellipse(img,center,axes,angle,startAngle,endAng
计算网络信号信号强度（Java & Python& JS & C++ & C ） lihuhelihu java python javascript 华为od 华为 c++c语言
题目描述网络信号经过传递会逐层衰减，且遇到阻隔物无法直接穿透，在此情况下需要计算某个位置的网络信号值。注意:网络信号可以绕过阻隔物。array[m][n]的二维数组代表网格地图，array[i][j]=0代表i行j列是空旷位置;array[i][j]=x(x为正整数)代表i行j列是信号源，信号强度是x;array[i][j]=-1代表i行j列是阻隔物。信号源只有1个，阻隔物可能有0个或多个网络信号
Transformer 代码剖析7 - 词元嵌入(TokenEmbedding) （pytorch实现） lczdyx Transformer代码剖析 transformer pytorch 深度学习人工智能 python
一、类定义与继承关系剖析1.1代码结构图示神经网络基础模块词嵌入基类自定义词元嵌入构造函数定义基类初始化词汇量参数维度参数填充标识参数1.2代码实现精讲"""@author:Hyunwoong@when:2019-10-22@homepage:https://github.com/gusdnd852"""fromtorchimportnnclassTokenEmbedding(nn.Embeddi
卷积神经网络（Convolutional Neural Network，CNN）详细解释（带示例）浪九天人工智能理论人工智能神经网络深度学习机器学习
目录卷积神经网络示例Python案例代码解释卷积神经网络概述：卷积神经网络是一种专门为处理具有网格结构数据（如图像、音频）而设计的深度学习模型。它通过卷积层、池化层和全连接层等组件，自动提取数据的特征，大大减少了模型的参数数量，降低计算量，同时提高了模型的泛化能力。主要组件卷积层：是CNN的核心组件，由多个卷积核组成。卷积核在数据上滑动，通过卷积操作提取数据的局部特征。卷积操作是将卷积核与数据的局
【Python pro】函数 CH3_CH2_CHO 今天你学Python了嘛 python 网络开发语言
1、函数的定义及调用1.1为什么需要函数提高代码复用性——封装将复杂问题分而治之——模块化利于代码的维护和管理1.1.1顺序式n=5res=1foriinrange(1,n+1):res*=iprint(res)#输出：1201.1.2抽象成函数deffactorial(n):res=1foriinrange(1,n+1):res*=ireturnresprint(factorial(5))#输出
北京大学：2本手册，拓展AI应用深度与广度 2501_90766876 pdf
《DeepSeek与AIGC应用》对DeepSeek-R1进行了详细解读，包括其技术特性、发展历程、应用场景以及在AIGC（人工智能生成内容）领域的定位。深入剖析DeepSeek-R1在复杂逻辑推理、数学和编程任务中的优异表现，揭示其在推理密集型任务、教育、科研、知识应用和文档分析等领域的独特优势，为AIGC领域的从业者和爱好者提供了深入了解DeepSeek的窗口。《DeepSeek提示词工程和落
Python神器PyVISA：5分钟搞定仪器远程控制（附实战代码）新能源汽车--三电老K python 开发语言自动化测试汽车
0.引言：为什么你需要PyVISA？痛点：实验室手动调参数？生产线重复测试效率低？解决方案：用Python+PyVISA实现“一键自动化”，支持GPIB/USB/TCP等多种接口！行业应用：华为/大疆等企业已广泛用于硬件测试，个人开发者也能快速上手！1.PyVISA核心优势（对比LabVIEW/NI-VISA）特性PyVISALabVIEW成本免费开源商业授权（昂贵）开发效率Python语法简洁图
Transformer模型详解 Yuki-^_^ Transformer模型详解人工智能 transformer 深度学习人工智能
导读Transformer在许多的人工智能领域，如自然语言处理(NaturalLanguageProcessing,NLP)、计算机视觉(ComputerVision,CV)和语音处理(SpeechProcessing,SP)取得了巨大的成功。因此，自然而然的也吸引了许多工业界和学术界的研究人员的兴趣。到目前为止，已经提出了大量基于Transformer的相关工作和综述。本文基于邱锡鹏[1]老师近
【复杂网络建模】真实网络数据集的读取和操作钰云空间复杂网络 Python python
文章目录概要1.获取真实网络数据集的常用网址1.1NetworkRepository.1.2StanfordLargeNetworkDatasetCollection1.3KONCET1.4Netzschleuder2.网络分析2.1计算度中心性2.2绘制网络图小结概要在复杂网络建模中，使用真实的网络数据集是理解和分析现实世界网络结构的关键。接下来将介绍如何使用Python中的工具库（如Netwo
AIGC从入门到实战：探秘：ChatGPT 到底是什么 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1人工智能的浪潮近年来，人工智能(AI)发展迅猛，其应用已深入到各个领域，从自动驾驶汽车到智能家居，再到医疗诊断，AI正在改变我们的生活方式。其中，自然语言处理(NLP)作为AI的重要分支，近年来取得了显著进展，而AIGC(AI-GeneratedContent)正是NLP领域的一颗璀璨明珠。1.2AIGC的兴起AIGC指的是利用AI技术自动生成内容，包括文本、图像、音频、视频等。
Python 基础（三）：入门必备知识的思考与对之前内容的总结 AI自学kuke-v Python教学 python 开发语言
1思考前两节我们讲了input,print()还有变量与数据类型的用法，但是我发现可学习性还是比较低。无法让大家系统的掌握Python这门语言的入门语法。那么为什么要系统的掌握语法呢？因为系统的掌握语法后，当我们想要用到这一知识点的时候，我们就可以迅速的找到相应的处理方法，从而更加方便与快捷的解决我们遇到的问题，不至于我们到用到的时候再去寻找相关的处理方法，所以我讲的内容要尽可能的高度地相关性、全
使用深度学习模型U-Net进行训练基于哨兵2的作物分割数据集。PyTorch框架为例，如何构建和训练U-Net模型来完成基于哨兵2的作物分割检测计算机C9硕士_算法工程师分割数据深度学习 pytorch 人工智能
使用深度学习模型如U-Net进行训练基于哨兵2的作物分割。PyTorch框架为例，如何构建和训练U-Net模型来完成基于哨兵2的作物分割检测基于哨兵2的作物分割，共18种作物类型（背景，草地，软冬小麦，玉米，冬季大麦，冬季油菜，春季大麦，向日葵，葡萄藤，甜菜，冬季小黑麦，冬季硬质小麦，水果、蔬菜、花卉，土豆，豆科饲料，大豆，果园，混合谷物，高粱），38到61个不同时间段同一位置10通道多光谱图像，
【网络安全 | 扫描子域+发现真实IP】CloakQuest3r安装使用详细教程秋说网安渗透工具使用教程(全)web安全子域名扫描渗透工具
原创文章，禁止转载。本文仅作学习交流使用，不得用于非法渗透，笔者不承担任何责任。文章目录简介功能介绍执行流程限制安装步骤可选功能：SecurityTrailsAPI使用示例简介CloakQuest3r是一款强大的Python工具，专为揭示受Cloudflare及类似服务保护的网站真实IP地址而设计。Cloudflare作为广泛应用的Web安全与性能优化服务，其防护机制可隐藏网站的实际IP，而Clo
C# 牵手DeepSeek：打造本地AI超能力步、步、为营 c#人工智能开发语言
一、引言在人工智能飞速发展的当下，大语言模型如DeepSeek正掀起新一轮的技术变革浪潮，为自然语言处理领域带来了诸多创新应用。随着数据隐私和安全意识的提升，以及对模型部署灵活性的追求，本地部署DeepSeek成为众多开发者和企业关注的焦点。对于C#开发者而言，将DeepSeek模型本地部署并集成到C#项目中，不仅能充分发挥C#语言在Windows平台开发的优势，还能实现高度定制化的人工智能应用，
Python进程知多少我的身前一尺是我的世界 Python python进程 python多进程 python进程共享内存 python服务器进程 python进程通信
目录目标Python版本官方文档概述进程（Process）的基本概念进程之间的通信方法进程同步进程间共享状态实战创建进程的基本语法创建进程并传递复杂的参数进程同步&进程通信共享内存基于服务器进程实现共享基于队列实现进程安全生产者&消费者模型（基于队列）生产者&消费者模型（基于管道）目标掌握进程的基本概念和使用方法，包括：创建进程、进程同步、进程间共享状态、进程通信。Python版本Python3.
python 开启https服务魔兽-SS python python https 开发语言
importjsonfromflaskimportFlask,Response,requestimportosapp=Flask(__name__)#设置SSL证书路径ssl_cert_path=os.path.join(os.path.dirname(__file__),'certs','self.crt')ssl_key_path=os.path.join(os.path.dirname(__
自动化办公|xlwings与pandas交互游客520 自动化 python从入门到出家实用代码 pandas excel python 自动化
1.介绍在数据分析和Excel自动化中，pandas作为Python处理数据的强大库，而xlwings则可以高效操作Excel。将pandas与xlwings结合使用，可以实现从Excel读取数据到DataFrame、将DataFrame写入Excel以及Excel的自动化处理。2.从Excel读取数据到PandasDataFrame2.1读取整个表格importxlwingsasxwimport
注意力机制：让机器学会“挑重点” 人工智能计算机视觉
注意力机制：让机器学会“挑重点”前言在日常生活中，我们总是无意识地选择性地关注某些信息，而忽略其他部分。比如，听音乐时，我们可能会更关注旋律或歌词；阅读文章时，我们会优先留意标题和核心观点。这种“选择性关注”的能力，正是注意力机制的核心思想。而在人工智能领域，注意力机制则是一种让机器在处理大量数据时，能够自动识别并聚焦于关键信息的技术。注意力机制的工作原理注意力机制的工作流程可以简化为三个主要步骤
AI数据分析：用DeepSeek做数据清洗 atbigapp.com 数据分析大模型应用 AI工具人工智能数据分析数据挖掘 deepseek prompt
在当今数据驱动的时代，数据分析已成为企业和个人决策的重要工具。随着人工智能技术的快速发展，AI驱动的数据分析工具正在改变我们处理和分析数据的方式。本文将着重介绍如何使用DeepSeek进行数据清洗。数据清洗是数据分析的基础，其目的是确保数据的准确性、完整性和一致性。常见的数据问题包括：缺失值：数据中的某些字段为空。重复值：数据中存在重复记录。异常值：数据中存在明显偏离正常范围的数值。不一致性：数据
百度搜索语法羊羊一洋百度
百度搜索作为中国最大的搜索引擎，其搜索语法与谷歌搜索类似，但也有一些特有的功能。以下是一些基本的百度搜索语法：1.双引号(`""`)：用来搜索精确的短语或句子。例如，搜索`"人工智能"`会找到包含完整短语"人工智能"的结果。2.减号(-)：用来排除搜索结果中的特定词汇。例如，搜索`手机-iphone`会找到包含"手机"但不包含"iphone"的结果。3.加号(+)：用来确保搜索结果中包含特定的词汇
如何在VSCode中使用OpenAI WeiLai1112 DeepSeek vscode ide 编辑器
如何在VSCode中使用OpenAI：从集成到应用场景详解人工智能（AI）正在改变软件开发的方式，而OpenAI提供的强大模型可以帮助开发者提升编码效率、优化工作流并自动化繁琐任务。本文将详细介绍如何在VSCode（VisualStudioCode）中使用OpenAI，集成后可以做哪些事情，以及如何充分发挥OpenAI的能力来提高生产力。1.在VSCode中使用OpenAI，可以做什么？将Open
使用Semantic Kernel：对DeepSeek添加自定义插件归-途机器学习 oneapi 机器学习
SemanticKernel介绍SemanticKernel是一个SDK，它将OpenAI、AzureOpenAI等大型语言模型与C#、Python和Java等传统编程语言集成在一起。SemanticKernel通过允许您定义插件来实现这一点。为什么需要添加插件？大语言模型虽然具有强大的自然语言理解和生成能力，但它们通常是基于预训练的模型，其功能受限于训练时所接触的数据和任务。为大语言模型添加插件
关于openAI接口的使用(个人学习总结) 暗雾飘扬 python机器学习_实验项目学习人工智能
文章目录背景OpenAIOpenAI的三种使用方法模型python的openai库根据文档自定义request函数http请求构成接口的响应构成自定义请求和接收函数背景在使用OpenAIAPI接口时遇到了许多问题，在此总结个人的问题（不代表大众），如要深究请看官方OpenAI-API接口文档（中文版）。OpenAIOpenAI的三种使用方法1、使用OpenAIAPI2、使用第三方库3、自己训练模型
pip指令及其用法大侠升指令大全 pip
pip是Python的包管理工具，用于安装、升级和管理Python包。下面是一些常用的pip指令及其用法：1.安装包安装一个包，默认从PyPI安装：pipinstall例如：pipinstallnumpy2.安装指定版本的包安装指定版本的包：pipinstall==例如：pipinstallnumpy==1.19.33.升级包升级已安装的包到最新版本：pipinstall--upgrade例如：p
清华出版 | DeepSeek使用手册（全）艾思科蓝 AiScholar 人工智能（AI）系列人工智能大数据 ai 机器人 AI编程 AI写作算法
在科技迅猛发展的今天，人工智能技术正逐渐渗透到我们生活的每一个角落。清华大学新闻与传播学院-新媒体研究中心-元宇宙文化实验室团队最近发布了一份详尽的DeepSeek使用手册，该手册长达104页，堪称国产AI工具深度使用的标杆指南。这份教程不仅适合新手快速掌握基础操作，也为进阶用户提供了系统性方法论。免费领取104页【清华大学-DeepSeek使用手册】以下是主要内容及要点：一、DeepSeek概述
Python和curl 如何使用OpenAI 接口访问LLM SmallerFL Python相关 python openai llm gpt
文章目录1.安装所需的库2.设置API密钥（可选）3.编写代码4.curl命令1.安装所需的库首先，你需要确保你的环境中安装了openai库。你可以通过pip来安装它：pipinstallopenai2.设置API密钥（可选）如果访问ChatGPT需要设置密钥，如果访问本地模型不需要设置密钥！对于ChatGPT密钥要从OpenAI的官方网站获取，要按token收费。一旦你有了API密钥，可以通过环
爬虫必备数据存储 ylfhpy 爬虫项目入门爬虫 python 开发语言去重数据持久化
一、引言在当今信息爆炸的时代，网络数据的获取与处理变得至关重要。Python凭借其简洁的语法和丰富的库，成为了爬虫开发的首选语言。当爬虫成功获取数据后，如何高效、可靠地存储这些数据，并避免重复数据的干扰，是需要解决的关键问题。不同类型的数据和应用场景需要不同的存储方式，而数据去重则有助于提高数据质量和存储效率。本文将系统地介绍Python爬虫中常见的数据存储方式和数据去重方法。二、文本数据存储方式
多个python打包成exe_多个py文件生成一个可运行exe文件演绎完美身材多个python打包成exe
一、概述目前有一个python脚本，需要在别的电脑中运行，安装python环境太麻烦，封装成exe文件，运行比较方便。二、演示环境说明python版本：3.7.9操作系统：windows10安装模块pip3installerpyinstaller封装新建目录test，目录结构如下：./├──conf.py└──test.pyconf.py#！/usr/bin/python3#-*-coding:u
Slurm作业调度系统常见操作（使用超算运行深度学习）坐在云朵上的kiwi 工程项目 #deep learning 深度学习服务器
1.传输下载文件sftp远程命令cd,pwd等，本地命令lcd,lpwdget远程地址本地地址put本地地址远程地址上传文件夹1.在远程建立和本地一样名称的文件夹如data/2.put-rdata/2.建立虚拟环境moduleloadpython/3.8#加载modulevirtualenv--no-downloadENV#建立一个叫ENV的虚拟环境激活虚拟环境sourceENV/bin/acti
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象