Gaotianer_99

Transformer万字详解

Transformer

一、self-attention
- 1.self-attention的来源
- 2.self-attention的运行原理
- 3.self-attention的实际操作流程
- - step1:求矩阵 $Q$ ， $K$ ， $V$
  - step2:求 $\alpha^{'}$
  - step3:求 $b^{1}$ ， $b^{2}$ ， $b^{3}$ ， $b^{4}$
  - step4:总结
- 4.muli-head self-attention
- - （1）为什么要用mult-head
  - （2）具体操作（以两头为例）
- 5.Positional Encoding（尚待研究的问题）
- 6.self-attention的应用领域
- - （1）NLP
  - （2）音频领域
  - （3）图像领域
- 7.self-attention vs CNN
- 8.self-attention vs RNN
- 9.self-attention用在graph中（GNN中第一种）
二、Transformer
- 1.Transformer简介
- 2.Encoder
- 3.Decoder
- - （1）autoregressive（AT）
  - （2）Non-autoregressive（NAT）
- 4.Encoder - Decoder怎么传递信息

一、self-attention

1.self-attention的来源

现实中有很多情况需要把a set of vectors（may change length）作为输入，比如一段英文“this is a cat”，可以把其进行one-hot encoding（独热编码）也可以对其进行word embedding（给每个词一个向量，这个向量有语义的信息，比如说把word embedding画出来，可能动物分类的都在一块），再比如一段音频（25ms当做一个vector，然后每次移动10ms，再建立一个vector，直到把整段音频覆盖），再比如一张社交图（每个节点当做一个vector），再比如一个分子结构（每个节点当做一个vector）。

其输出可能有三种情况：第一种是每一个vector都有一个对应的输出，也就是说输入和输出的数量是一样的，比如说标注每个单词的词性。第二种是整个只有一个输出，比如说识别每段话是消极还是积极的，再比如说识别出来一段音频的speaker是谁。第三种是不知道要有几个输出，由计算机自己决定（seq2seq任务）。

输入和输出数量一样的情况（sequence labeling）：比如说我现在要输入“I saw a saw”（我看见了一个锯子），我现在要输出每个词的词性，这是一个输入和输出数量一样的情况。平常的想法就是我直接对每个单词的vector来embedding，然后直接输入一个FC层，得到每个的输出，但是这样的问题在于，没有联系上下文，第一个saw明显是动词，第二个明显是名词。所以要考虑上下文来进行推理。所以第二种想法就是说把要识别单词前后的单词（window里面）也放进该FC层，使用上下文来得到输出，这种就可以解决上面的问题，但问题又来了，如果要有个任务不是只靠一个window就能解决，而是要靠整个sequence，那怎么办呢，这时候这样也解决不了这个问题了（因为sequence可大可小，太麻烦了），就引出了self-attention。

引入self-attention module，我们可以把一开始输入的vector通过self-attention module，得到新的vector，这些vector就已经包含了一整个sequence的信息，然后再把包含了一整个sequence信息的vector通过FC层，得到最后的output，这样FC层也考虑了整个sequence的信息。

并且，self-attention module可以用多次，可以先用一个self-attention module来融合整个sequence的信息，然后通过FC专注处理某个位置的信息，然后再通过self-attention融合，再通过FC输出。

2.self-attention的运行原理

self-attention的输入是一串vector{ $a^{1}$ , $a^{2}$ , $a^{3}$ , $a^{4}$ }，其可能是最原始的input，也可能是某个hidden layer的output，输出也是一串vector{ $b^{1}$ , $b^{2}$ , $b^{3}$ , $b^{4}$ }，通过self-attention module之后，每个输出的vector都包括了所有输入vector的信息。

那么如何产生输出的vector呢？以 $b^{1}$ 举例，第一步是根据 $a^{1}$ 找出这个sequence里面跟 $a^{1}$ 相关的其他vector，其他vector与 $a^{1}$ 相关的强弱数值，我们用 $\alpha$ 来表示。

那么self-attention module怎么来决定 $\alpha$ 呢？——用计算attention的模组，以 $a^{1}$ 和 $a^{4}$ 举例，把 $a^{1}$ 和 $a^{4}$ 作为输入，通过计算输出 $\alpha$ 数值。计算 $\alpha$ 的方法有很多种，比较常用的方法是dot-product（点积），就是说把输入的两个vector分别乘上两个不同的矩阵 $W^{q}$ 和 $W^{k}$ ，得到 q 和 k 这两个vector，再把 q 和 k 做dot-product（做element-wise乘法然后再加起来）得到 $\alpha$ 。另一种方式叫additive，见下图右边方式。

知道这个以后，那么我们就可以完成第一步，输出所有关系强弱值 $\alpha$ ，也叫作attention score。以 $a^{1}$ 举例，就是说先用 $W^{q}$ 乘上 $a^{1}$ 得到query $q^{1}$ ，然后用 $W^{k}$ 乘上 $a^{1}$ ， $a^{2}$ ， $a^{3}$ ， $a^{4}$ 得到key $k^{1}$ ， $k^{2}$ ， $k^{3}$ ， $k^{4}$ ，用 $q^{1}$ 对每个 $k$ 做dot-prodcut，得到对应的attention score $\alpha_{1,1}$ ， $\alpha_{1,2}$ ， $\alpha_{1,3}$ ， $\alpha_{1,4}$ 。然后通过一个soft-max（也可以是relu等等），得到 $\alpha^{'}_{1,1}$ ， $\alpha^{'}_{1,2}$ ， $\alpha^{'}_{1,3}$ ， $\alpha^{'}_{1,4}$ 。

我们得到了 $\alpha^{'}$ 以后，就知道了每个vector $a^{1}$ ， $a^{2}$ ， $a^{3}$ ， $a^{4}$ 对这个vector $a^{1}$ 的重要程度（关系程度），然后再把每个vector $a^{1}$ ， $a^{2}$ ， $a^{3}$ ， $a^{4}$ 乘上 $W^{v}$ 得到每个的value $v^{1}$ ， $v^{2}$ ， $v^{3}$ ， $v^{4}$ 。通过把对应的 $\alpha^{'}$ 与 $v$ 相乘，然后加和，得到最终的 $b^{1}$ 。

3.self-attention的实际操作流程

要注意的是， $b^{1}$ ， $b^{2}$ ， $b^{3}$ ， $b^{4}$ 是一起计算产生的。

step1:求矩阵 $Q$ ， $K$ ， $V$

具体实现来说，因为从 $\alpha$ 得到 $q$ ， $k$ ， $a$ 所乘的矩阵 $W^{q}$ $W^{k}$ $W^{v}$ 都是相同的（网络的参数，后期学习得到），所以就可以把 $\alpha$ 拼到一起，拼成一个大矩阵，一起计算。以求query举例，把 $a^{1}$ ， $a^{2}$ ， $a^{3}$ ， $a^{4}$ 拼到一起，得到 $I$ ，然后 $I$ 乘上矩阵 $W^{q}$ 得到 $Q$ 。同理得到 $K$ 和 $V$ 。

step2:求 $\alpha^{'}$

得到了 $Q$ ， $K$ ， $V$ 之后，怎么得到 $\alpha^{'}$ 呢？——也是用矩阵的思想，直接把矩阵 $K$ 转置后乘上矩阵 $I$ ，就能得到所有 $\alpha$ 的矩阵 $A$ ，然后再对矩阵 $A$ 做soft-max，得到 $\alpha^{'}$ 的矩阵 $A^{'}$ 。

step3:求 $b^{1}$ ， $b^{2}$ ， $b^{3}$ ， $b^{4}$

最后要得到 $b^{1}$ ， $b^{2}$ ， $b^{3}$ ， $b^{4}$ ，就是直接用矩阵 $V$ 乘上矩阵 $A^{'}$ 就完事儿了。

step4:总结

最后总结一下，整体步骤就是下图所示，里面唯一要学的参数就是 $W^{q}$ ， $W^{k}$ ， $W^{v}$ 。

4.muli-head self-attention

（1）为什么要用mult-head

因为在找相关性的时候，可能不只有一种相关性，所以，我定义多个 $q$ ， $k$ ， $v$ 来寻找不同的相关性（比如说：翻译时整个句子的语义和关键词周围的语义都很重要，这时候就用两头注意力来学习这两个方面的相关性）。

（2）具体操作（以两头为例）

和前面的self-attention几乎一样，就是在得到 $q$ ， $k$ ， $v$ 之后，根据head数目的不同，分别再乘不同的矩阵，得到 $q^{i,1}$ ， $q^{i,2}$ ； $k^{i,1}$ ， $k^{i,2}$ ； $v^{i,1}$ ， $v^{i,2}$ 。然后1的一组，2的一组，得到自己的 $\alpha$ ，再然后得到 $b^{i,1}$ ， $b^{i,2}$ 。

然后再把 $b^{i,1}$ ， $b^{i,2}$ 通过一个矩阵拼成 $b^{i}$ 。

5.Positional Encoding（尚待研究的问题）

对于之前所说的所有，其都没有考虑位置信息，比如说到底谁是第一个，谁是第二个，它们都是一样的没有区别。但是其实位置信息也很重要，比如说对于词性标记任务来说，第一个位置大概率是名词等等。所以要把位置信息加进去。

为每一个位置设置一个vctor $e^{i}$ ，把 $e^{i}$ 加到 $a^{i}$ 上。最开始的 $e^{i}$ 如下图所示，就是暴力划分（人为设置的），一列是一个。

6.self-attention的应用领域

（1）NLP

（2）音频领域

（3）图像领域

self-attention是对vector set进行操作，但是图像就是width × high，但是把图像看成 width × height × channel，把三个channel当做一个vector。

7.self-attention vs CNN

可以把CNN看做简化版的self-attention，在CNN中只考虑感受野里面的信息，而self-attention考虑的是全局的信息。也可以把self-attention看成复杂版的CNN，可以看成是感受野不是人为规定的大小了，而是自动学出来的，形状大小各异的，和该点相关的。总的来说CNN就是self-attention的一个特例。

根据下图可知，在资料量小的时候CNN的表现比self-attention好，在资料量大的时候self-attention比CNN好。（可以考虑两种都用）

8.self-attention vs RNN

它们的输入都是一个vector sequence（vector set）。
RNN的缺点：很难学习长时的信息，不能并行学习。
self-attention：比较容易学习长时的信息，可以并行学习。

9.self-attention用在graph中（GNN中第一种）

graph有个特点就是有edge，edge就表示两两node之间的关系，所以到时候求Attention Matrix也就是上面的 $\alpha^{'}$ 矩阵的时候，只需要求有边的就可以了。

二、Transformer

1.Transformer简介

Transformer是一个seq2seq模型，input一个sequence，output一个sequence。输出的长度由模型决定。比如说语音识别、语言翻译等等。

并且很多其他任务也可以看成是一个seq2seq任务，比如句子成分解析任务、多标签分类任务、目标识别任务等等。

对于一般的seq2seq任务来说，分成两个大的模块，一个是Encoder，一个是Decoder。所以Transformer也分成encoder和decoder两个模块。

2.Encoder

对于一般的Encoder就是输入一系列vector，输出一系列vector，可以用RNN、CNN、self-attention等等。对于Transformer的Encoder来说就是使用了self-attention的Encoder。

其大体结构如下图所示，encoder里面有很多block，然后每个block内部大体就和self-attention模块一样：先通过self-attention，考虑整体的信息，输出包含了全局信息的vector，然后这些vector通过一个FC层得到输出。但是实际上更为复杂。

实际上，Transformer的Encoder内部的架构是如下图所示：每个vector通过self-attention模块后，还要加上自己一开始的vector（residual残差操作），得到的向量通过Layer Normalization得到输出的vector。（BN和LN的区别详细可以见这个连接），简单来说就是：Batch Normalization 的处理对象是对一批样本， Layer Normalization 的处理对象是单个样本。Batch Normalization 是对这批样本的同一维度特征做归一化， Layer Normalization 是对这单个样本的所有维度特征做归一化。

然后把通过LN得到的vector，通过一个FC层，并且加上自己一开始vector，得到residual的结果后，再通过一次LN，最后得到一个Encoder的输出vector。

上面就是Transformer里面一个Encoder的block详细流程，一共有N个这样的block，所以循环N次。并且在一开始也要假如positional encoding。

3.Decoder

（1）autoregressive（AT）

首先，先把Encoder的输出送入Decoder中，然后通过Decoder得到输出。首先，先给Decoder一个特殊的符号，代表开始（下图中的special token）。然后Decoder会输出一个向量，其长度和定义的vocabulary（与Decoder的输出文字有关）的长度一样长，然后后面还会跟每一个字的distribution（通过一个softmax之后，得到每个字的可能性）。得到这个向量以后，找到里面最大的得分的字，作为输出。

得到第一个输出以后，然后再把该输出当做Decoder的输入，现在Decoder的输入就包括了开始的特殊字符和刚才的第一个输出，再得到输出，依次往复（这样可能会有一个问题，就是一步错步步错）。

其整体架构如下图所示，其和Encoder的结构差不多，要特别注意的一个点是其第一个模块使用的是masked multi-head attention，原因在于：对于输入来说，是一次全部输入的，所以Encoder可以提取所有的vector学习。但是对于输出来说，也就是Decoder，它上一个的输出是下一个输入的一部分，也就是说它不能一下得到所有输出，所以要用masked self-attention，只能看到之前的信息。

最后怎么让Decoder停止翻译呢？在一开始的vocabulary里面加入一个END特殊字符来终止。

（2）Non-autoregressive（NAT）

AT的运行方式是就是上面所说的，一步一步的输出，最后结束。而NAT的运行方式一次就产生出所有的输出（一次输入一排token，一次输出一排token，结束任务）。

那怎么决定输入、输出的长度呢？
第一个方法是：再建一个模型，专门学长度。
第二个方法是：直接输入最大数值，在输出里面找到END，END右边的丢掉。

NAT相比于AT的优点就在于：它可以并行运算（更快），更好的控制输出的长度（直接通过输入的token个数控制）。
但是NAT的效果一般都比AT差。

4.Encoder - Decoder怎么传递信息

通过cross attention传递encoder和decoder的信息。具体运行流程如下图所示：首先Encoder的一些vector输入通过Encoder的模块得到输出 $a^{1}$ ， $a^{2}$ ， $a^{3}$ ，并且乘上对应的矩阵得到 $k^{1}$ ， $k^{2}$ ， $k^{3}$ 和 $v^{1}$ ， $v^{2}$ ， $v^{3}$ 。然后Decoder方面输入开始符号，通过masked self-attention得到输出的vector，然后这个vector乘上一个矩阵，得到 $q$ 。随后就是和之前的操作差不多，用Decoder的 $q$ 和Encoder的 $k$ ， $v$ 求出新的vector $v$ ，然后再通过最上面的Feed Forward模块，得到对应的输出。

得到第一个vector之后，再走一遍这个流程（这个时候masked self-attention就彻底能用上了，因为它就是这样只能考虑之前的输入和输出，和后面没关系），依次往复。

guava loadingCache代码示例 IM 胡鹏飞 Java 工具类介绍
publicclassTest2{publicstaticvoidmain(String[]args)throwsException{LoadingCachecache=CacheBuilder.newBuilder()//设置并发级别为8，并发级别是指可以同时写缓存的线程数.concurrencyLevel(8)//设置缓存容器的初始容量为10.initialCapacity(10)//设置缓存
系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
cvc降噪和主动降噪_音频知识：CVC降噪和ANC主动降噪的区别和应用汪国 cvc降噪和主动降噪
原标题：音频知识：CVC降噪和ANC主动降噪的区别和应用降噪，对于需要长时间戴耳机的人群来讲，起到了很好的保护作用。然而在购买蓝牙耳机时总会听到商家在宣传耳机所具备的CVC、ANC降噪功能，尽管听过很多商家描述，有些小伙伴依然不是很明白这两者之间的区别以及应用。现在简单和大家介绍这两个看不懂的降噪名词。CVC降噪(ClearVoiceCapture)是通话软件降噪技术。工作原理是是通过耳机内置的消
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？ ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 机器学习算法深度学习人工智能
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？在大语言模型（LLM）中，最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息，这是由LLM的核心架构（以Transformer为基础）决定的，具体可以从以下角度理解：1.核心机制：自注意力（Self-Attention）的作用现代LLM（如GPT系列、Qwen等）均基于Transformer架构，其核心是自注意力机制。在
JVM字节码加载与存储中的细节
问题引出：为什么Java定义int型变量为32767时使用的是bipush32767，而定义int型变量为32768时使用的是ldc#4？在Java中，如果这样定义int型变量：publicclassTest{publicstaticvoidmain(String[]args){inti=0;intj=5;intk=6;intm=32768;intn=32767;}}变量对应的字节码文件内容是这样
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
LLM的表征做减法的是什么，自然语言是一个矩阵，怎么进行减法的 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 计算机视觉人工智能机器学习算法深度学习
LLM的表征做减法的是什么，自然语言是一个矩阵，怎么进行减法的有个假设：就是最后一个词语融合了前面词语的信息减法操作主要用于提取模型内部表征中的"诚实性"概念向量。具体来说，这是通过对比诚实和不诚实场景下的模型隐藏状态实现的。importtorchfromtransformersimportAutoModelForCausalLM,AutoTokenizer,AutoConfigimportnum
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
C语言手写简易 DNS 客户端（接收部分）（Charon） c语言开发语言
本文通过纯C语言手动构造DNS请求报文，使用UDP协议发送到公共DNS服务器，并接收响应，完整演示DNS请求流程。主流程：dns_client_commit()这是整个流程的核心函数，下面我们按顺序拆解每一步的逻辑，尤其突出发送sendto与接收recvfrom的设计思路和实现。第一步：创建UDP套接字intsockfd=socket(AF_INET,SOCK_DGRAM,0);if(sockfd
【AI大模型】LLM模型架构深度解析：BERT vs. GPT vs. T5 我爱一条柴ya 学习AI记录 ai 人工智能 AI编程 python
引言Transformer架构的诞生（Vaswanietal.,2017）彻底改变了自然语言处理（NLP）。在其基础上，BERT、GPT和T5分别代表了三种不同的模型范式，主导了预训练语言模型的演进。理解它们的差异是LLM开发和学习的基石。一、核心架构对比特性BERT(BidirectionalEncoder)GPT(GenerativePre-trainedTransformer)T5(Text
Ollama平台里最流行的embedding模型： nomic-embed-text 模型介绍和实践 skywalk8163 人工智能 embedding 人工智能服务器
nomic-embed-text模型介绍nomic-embed-text是一个基于SentenceTransformers库的句子嵌入模型，专门用于特征提取和句子相似度计算。该模型在多个任务上表现出色，特别是在分类、检索和聚类任务中。其核心优势在于能够生成高质量的句子嵌入，这些嵌入在语义上非常接近，从而在相似度计算和分类任务中表现优异。之所以选用这个模型，是因为在Ollama网站查找这个模型，发现
GPT实操——利用GPT创建一个应用狗木马深度学习 gpt-3 gpt
功能描述信息查询：用户可以询问各种问题，如天气、新闻、股票等，机器人会返回相关信息。任务执行：用户可以要求机器人执行一些简单的任务，如设置提醒、发送邮件等。情感支持：机器人可以与用户进行情感交流，提供安慰和支持。个性化设置：用户可以自定义机器人的回复风格和偏好。技术栈前端：React.js后端：Node.js+Express数据库：MongoDB自然语言处理：OpenAIGPT-3API其他工具：
Java多线程吴鹰飞侠 java 开发语言
多线程是指一个程序中有多个执行路径（线程），每个线程并发运行，彼此独立，执行不同的任务。一个线程是程序中的基本执行单位。创建和启动线程1.通过继承Thread类classMyThreadextendsThread{@Overridepublicvoidrun(){System.out.println("线程正在执行...");}}publicclassMain{publicstaticvoidma
OpenCV图像数据处理:convertTo,normalize和scaleAdd luofeiju OpenCV函数实战 opencv
在OpenCV图像处理的世界里，有几个函数进行一些基本数据变换：cv::convertTo()：类型转换与线性缩放；cv::normalize()：归一化处理；cv::scaleAdd()：加权叠加运算。cv::addWeighted():与scaleAdd相似，进行加权叠加运算；一、cv::convertTo()：线性变换+数据类型转换voidcv::Mat::convertTo(OutputA
AWS Terraform 架构指南（二）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/8b2d222956a050c7632b9eee086dadcf译者：飞龙协议：CCBY-NC-SA4.0第七章：7在项目中实现Terraform您准备好开始使用Terraform开发您的AWS基础设施了吗？在本章中，您将学习Terraform的基础知识，并了解如何在AWS中部署您的第一个模板。我们将介绍选择合适的AWS提供商和选择满足您项目需求的
电脑选购的基础知识 hello-hebin 有点杂的笔记电脑
文章目录餐前准备电脑的组成电脑选购餐前准备在选购电脑之前先学习一些电脑的基本知识，即电脑的硬件组成，如果你想diy一台比较便宜的高性能的，或者暂时学习了解一些市场的价格，建议点击这里，跳转太平洋电脑城，那么接下来就开始我们的旅途吧！电脑的组成都知道电脑是由硬件和软件组成的，其中硬件基本决定了我们的电脑性能，所有我们在选购电脑时，更加注重的是对硬件的要求，软件的要求并不高，因为软件基本差不多，而且可
小学计算机基础知识汇总,电脑基础知识：内存条知识大全，看完小学生都了解...
一、基础知识1、定义、作用内存条又叫随机存取存储器，是一种存储技术，但是和硬盘存储不同，内存条一断电，那么所有数据都会丢失。由于CPU处理器速度很快，而硬盘读写速度完全跟不上CPU的速度，即使是固态硬盘也一样，所以一个急着用，一个慢吞吞，因此就需要一个中间者来帮忙，这就是内存条，硬盘中的数据可以先传输到内存条保存着，如果CPU需要，那么可以直接从内存条中快速读取，相反的，CPU快速处理完后，先放到
主板基础知识 bcbobo21cn 硬件主板
主板，又叫主机板（mainboard）、系统板（systemboard）、或母板（motherboard），是计算机最基本的同时也是最重要的部件之一。主板一般为矩形电路板，上面安装了组成计算机的主要电路系统，一般有BIOS芯片、I/O控制芯片、键盘和面板控制开关接口、指示灯插接件、扩充插槽、主板及插卡的直流电源供电接插件等元件。主板制造质量的高低，决定了硬件系统的稳定性。主板与CPU关系密切，每一
【电脑】主板的基础知识 Mike_Wuzy 电脑
主板（Motherboard）是计算机的核心组件之一，它将所有其他硬件部件连接在一起并协调它们的工作。以下是关于主板的详细知识：1.架构组成一个典型的主板通常由以下几个主要部分构成：芯片组（Chipset）：分为南桥和北桥两个部分。北桥（Northbridge）：负责处理高速数据传输，如连接内存控制器、显示接口等。现代CPU集成了北桥的功能，因此许多主板上已经不再有独立的北桥芯片。南桥（South
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
Python爬虫实战：基于最新技术的定时签到系统开发全解析 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言人工智能自动化知识图谱
摘要本文详细介绍了如何使用Python开发一个功能完善的定时签到爬虫系统。文章从爬虫基础知识讲起，逐步深入到高级技巧，包括异步请求处理、浏览器自动化、验证码破解、分布式架构等最新技术。我们将通过一个完整的定时签到项目案例，展示如何构建一个稳定、高效且具有良好扩展性的爬虫系统。文中提供了大量可运行的代码示例，涵盖requests、aiohttp、selenium、playwright等多种技术方案，
Python爬虫实战：使用最新技术爬取新华网新闻数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 scrapy 音视频
一、前言在当今信息爆炸的时代，网络爬虫技术已经成为获取互联网数据的重要手段。作为国内权威新闻媒体，新华网每天发布大量高质量的新闻内容，这些数据对于舆情分析、市场研究、自然语言处理等领域具有重要价值。本文将详细介绍如何使用Python最新技术构建一个高效、稳定的新华网新闻爬虫系统。二、爬虫技术选型2.1技术栈选择在构建新华网爬虫时，我们选择了以下技术栈：请求库：httpx（支持HTTP/2，异步请求
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p