帘卷西风尽

RWKV：在Transformer时代重新定义循环神经网络

论文地址：https://arxiv.org/abs/2305.13048
参考：https://www.zhihu.com/question/602564718/answer/3041307432
RWKV: Reinventing RNNs for the Transformer Era
RWKV：在Transformer时代重新定义循环神经网络

Abstract 摘要

Transformer已经彻底改变了几乎所有自然语言处理（NLP）任务，但其在序列长度上的内存和计算复杂度呈二次方增长。相比之下，循环神经网络（RNN）在内存和计算需求上呈线性扩展，但由于并行化和可扩展性的限制，难以达到Transformer相同的性能。我们提出了一种新颖的模型架构，即Receptance Weighted Key Value（RWKV），将Transformer的高效可并行训练与RNN的高效推理相结合。我们的方法利用了线性注意机制，并使得模型既可以作为Transformer，也可以作为RNN来构建，从而实现了在训练过程中的计算并行化，并在推理过程中保持恒定的计算和内存复杂度，这使得它成为第一个可以扩展到数百亿参数的非Transformer架构。我们的实验结果显示，RWKV的性能与大小相似的Transformer相当，这表明未来的工作可以利用这种架构创建更高效的模型。这项工作在平衡序列处理任务中的计算效率和模型性能之间的权衡方面迈出了重要的一步。

1 Introduction 前言

深度学习技术在人工智能领域取得了重大突破，在各种科学和工业应用中发挥了关键作用。这些应用通常涉及复杂的序列数据处理任务，包括自然语言理解、对话人工智能、时间序列分析，甚至可以被重新构建为序列的间接形式，如图像和图形（Brown等，2020年；Ismail Fawaz等，2019年；Wu等，2020年；Albalak等，2022年）。在这些技术中，循环神经网络（RNNs）、卷积神经网络（CNNs）和Transformer模型（Vaswani等，2017年）占据主导地位。

每种技术都有其独特的缺点，限制了它们在特定场景下的效率。RNNs在训练长序列时容易出现梯度消失问题，使得训练变得困难。此外，在训练过程中无法在时间维度上进行并行化，限制了其可扩展性（Hochreiter，1998年；Le和Zuidema，2016年）。另一方面，CNNs只擅长捕捉局部模式，这限制了它们处理长距离依赖关系的能力，而这对于许多序列处理任务非常重要（Bai等，2018年）。

Transformer模型由于其处理局部和长距离依赖关系的能力以及并行化训练的能力而成为一种强大的替代方案（Tay等，2022年）。最近的模型，如GPT-3（Brown等，2020年），ChatGPT（OpenAI，2022年；Kocon等，2023年），GPT-4（OpenAI，2023年），LLaMA（Touvron等，2023年）和Chinchilla（Hoffmann等，2022年），展示了这种架构的能力，推动了自然语言处理领域的前沿。尽管取得了这些重大进展，Transformer中固有的自注意机制也带来了独特的挑战，主要是由于其二次复杂度。这种复杂度使得架构在涉及长输入序列或资源受限情况下的任务中具有计算成本高和占用内存多的特点。这些限制已经激发了大量的研究，旨在改进Transformer的扩展性能，往往以牺牲其某些有效性为代价（Wang等，2020年；Zaheer等，2020年；Dao等，2022a年）。

为了解决这些挑战，我们引入了Receptance Weighted Key Value（RWKV）模型，这是一种新颖的架构，有效地结合了RNNs和Transformer的优势，同时规避了关键的缺点。RWKV经过精心设计，旨在缓解与Transformer相关的内存瓶颈和二次扩展问题（Katharopoulos等，2020年），以更高效的线性扩展来取而代之，同时仍保留了使Transformer成为该领域主导架构的丰富和表达性质。

RWKV的一个显著特点是其能够提供类似Transformer的并行化训练和强大的可扩展性。此外，我们重新构思了RWKV中的注意机制，引入了一种线性注意的变体，放弃了传统的点积令牌交互方式，而选择更有效的通道导向注意。这种方法与传统的Transformer架构有很大的不同，传统的架构中特定的令牌交互主导了注意力。在RWKV中，线性注意的实现没有进行近似，这在效率上带来了明显的改进，并增强了可扩展性，详见表1。

表 1: 与不同Transformer的复杂度比较：Reformer（Kitaev等，2020）、Linear Transformer（Katharopoulos等，2020）、Performer（Choromanski等，2020）、AFT（Zhai等，2021）、MEGA（Ma等，2023）。这里T表示序列长度，d表示特征维度，c表示MEGA的二次注意力的块大小。

开发RWKV的主要动机是弥合神经网络架构中计算效率和表达能力之间的差距。它为处理涉及数十亿参数的大规模模型的任务提供了一种有前景且可行的解决方案，以较低的计算成本展现出竞争性能。我们的实验结果表明，RWKV可以成为解决跨各个领域的AI模型扩展和部署中持续存在的挑战的有价值工具，特别是涉及序列数据处理的任务。因此，RWKV为下一代更可持续和计算效率更高的序列处理任务的AI模型铺平了道路。

本文的贡献如下：

我们引入了RWKV网络架构，结合了RNNs和Transformer的优点，同时缓解了它们已知的限制。
我们提出了一种新的注意机制改进，得到了线性注意，避免了标准Transformer模型所带来的二次复杂度。
我们在基准数据集上进行了一系列全面的实验，展示了RWKV在处理涉及大规模模型和长距离依赖关系的任务时的性能、效率和扩展能力。
我们发布了在Pile数据集（Gao等，2020年）上训练的预训练模型，参数规模从1.69亿到140亿不等。

2 Related Work相关工作

最近，已经提出了许多技术来解决Transformer的局限性。

2.1 Optimizing Attention Mechanism 优化注意机制

为了降低Transformer的复杂性，引入了许多变体（“x-formers”）（Tay等，2022年），包括稀疏注意力（Beltagy等，2020年；Kitaev等，2020年；Guo等，2022年）、近似全注意力矩阵（Wang等，2020年；Ma等，2021年；Choromanski等，2020年）、将分块注意力与门控相结合（Ma等，2023年）以及其他高效方法（Katharopoulos等，2020年；Jaegle等，2021年）。

一些最近的工作，如FlashAttention（Dao等，2022a年）和其他工作（Rabe和Staats，2022年；Jang等，2019年），与RWKV的分块计算方案类似。尽管它们在内存效率方面表现出色，但其时间复杂度仍然是二次的，或者包含分块大小作为一个隐含因子。相比之下，RWKV通过将线性注意力构建为一个RNN，在推理过程中实现了更好的空间和时间复杂度。

2.2 Attention Free Models 无注意力模型

另一条研究线路是用其他模块替代注意力机制以处理长序列。MLP-Mixer和其他模型（Tolstikhin等，2021年；Liu等，2021年）在计算机视觉任务中提出了用多层感知机（MLPs）替代注意力的方法。Attention Free Transformer（AFT）（Zhai等，2021年）用一个计算效率高的替代方案取代了点积自注意力，可以看作是每个特征维度对应一个头的多头注意力。受到AFT的启发，RWKV采取了类似的方法，但通过修改交互权重以实现RNN的形式来简化。与此同时，递归组件也被修改以增加上下文长度，例如Recurrent Memory Transformer（Bulatov等，2022年；2023年）和线性循环单元（Orvieto等，2023年）。还提出了像S4（Gu等，2022年）及其变体（Dao等，2022b年；Poli等，2023年）这样的状态空间模型（SSM）。

值得注意的是，准循环神经网络（QRNN）（Bradbury等，2017年）在时间步和通道之间使用卷积层和循环汇聚函数。虽然QRNN使用具有固定大小的卷积滤波器，但RWKV使用时间混合模块作为具有时间衰减因子的注意力机制。与QRNN中的逐元素汇聚不同，RWKV包括一个参数化的通道混合模块（见图1c中的绿色块），可以并行化处理。

以上是对相关工作的概述。下一部分将详细介绍背景知识，包括循环神经网络（RNNs）和Transformer及AFT模型的基本原理。

3 Background 背景

在这一部分，我们简要回顾了循环神经网络（RNNs）和Transformer的基础知识。

3.1 循环神经网络（RNNs）

流行的RNN架构，如LSTM（Hochreiter和Schmidhuber，1997年）和GRU（Chung等，2014年），具有以下形式（以LSTM为例，其他类似推导）：

RNN的数据流程如Figure 1 (a)所示。尽管RNN可以分解为两个线性块（W和U）和一个特定于RNN的块（1）-（6），正如Bradbury等人（2017年）所指出的那样，依赖于先前时间步的数据依赖关系禁止对这些典型RNN进行并行化。

图1：RWKV与QRNN和RNN（Vanilla，LSTM，GRU等）架构的计算结构比较。颜色编码：橙色表示时间混合、卷积或矩阵乘法，连续的块表示这些计算可以同时进行；蓝色表示在通道或特征维度上同时进行的无参数函数（逐元素）。绿色表示通道混合。

3.2 Transformer和AFT

Transformer是由Vaswani等人（2017年）引入的一类神经网络，已成为多个NLP任务中的主导架构。与RNN逐步操作序列不同，Transformer依靠注意机制捕捉所有输入和输出令牌之间的关系：

这里为方便起见省略了多头性和缩放因子 1/√dk 。作为核心的 QK^T 乘积是序列中每个token之间的pairwise attention scores的集合，可以分解为向量操作：

在AFT（Zhai等，2021年）的论文中，这个公式可以替换为：

其中 {w_{t,i}} ∈ R^{T×T} 是学习到的逐对位置偏置，每个 w_{t,i} 是一个标量。
受到AFT的启发，我们让RWKV中的每个 w_{t,i} 成为一个channel-wise的时间衰减向量，与从当前时间追溯并衰减的相对位置相乘：

这里 w ∈ (R≥0)^d ，其中 d 是通道数。我们要求 w 是非负的，以确保 e^{w_{t,i}} ≤ 1 ，并且每个通道的权重向后衰减。

4 The Receptance Weighted Key Value (RWKV) Model

RWKV架构的命名源自时间混合和通道混合块中使用的四个主要模型元素：

R：作为过去信息的接受程度的接受向量。
W：位置权重衰减向量。可训练的模型参数。
K：键向量，类似于传统注意力机制中的K。
V：值向量，类似于传统注意力机制中的V。

每个时间步的主要元素之间的交互是乘法形式的，如Figure 2所示。

图2：RWKV模块元素（左）和用于语言建模的RWKV残差块及最终头部（右）架构。

4.1 High-Level Summary 高级摘要

RWKV架构由一系列堆叠的残差块组成，每个残差块由时间混合子块和通道混合子块组成，具有循环结构。
循环性质既可以被表达为当前输入和上一个时间步的输入之间的线性插值（我们将其称为时间偏移混合或令牌偏移，如Figure 3中的对角线所示），对于每个输入嵌入的线性投影（例如，时间混合中的R、K、V以及通道混合中的R、K）可以单独调整，也可以表达为WKV的时间相关更新，其在方程式14中进行了形式化。WKV的计算类似于AFT（Zhai等，2021年），但是W现在是一个通道级向量乘以相对位置，而不是AFT中的pairwise矩阵。我们还引入了向量 U ，用于独立地关注当前令牌，以补偿W的潜在退化（更多详细信息请参见附录G）。

Time Mix块表示如下：

其中 WKV计算， wkv_{t}，在不引入二次复杂度的情况下，扮演了Transformer中 Attn(Q, K, V) 的角色，因为交互是在标量之间进行的。直观地说，随着时间 t 的增加，向量 o_t依赖于一个长的历史，由逐渐增加的项之和表示。对于目标位置 t ，RWKV在位置间隔 [1, t]内进行加权求和，然后乘以接受度 σ®。因此，在给定时间步内，交互是在不同时间步上进行乘法操作并进行求和。

我们采用了平方ReLU激活函数（So等，2021年）。需要注意的是，在时间混合和通道混合中，通过对接受度进行sigmoid操作，我们直观地将其作为“遗忘门”，以消除不必要的历史信息。

4.2 Transformer-like Parallelization 类Transformer的并行化

RWKV可以以我们称之为“时间并行模式”的方式高效地并行化，类似于Transformer。在单个层中处理一批序列的时间复杂度为 O(BTd^2)) ，主要由矩阵乘法W，其中 W ∈ {r, k, v, o} （假设有 B 个序列，T个最大令牌和 d个通道）组成。同时，更新注意力得分 wkv_t需要进行串行扫描（详见附录B），复杂度为 O(BTd) 。

矩阵乘法可以像传统Transformer中的W，其中 W ∈ {Q, K, V, O} 一样进行并行化。逐元素的 WKV计算是时间相关的，但可以沿着其他两个维度轻松并行化（Lei等，2018年）。如果序列非常长，则可以使用更复杂的方法，如Martin和Cundy（2017年），可以在序列长度上进行并行化。

此外，通过使用PyTorch（Paszke等，2019年）库中的nn.ZeroPad2d((0,0,1,-1))，我们将标记的偏移实现为每个块在时间维度上的简单偏移。

4.3 RNN-like Sequential Decoding 类似RNN的序列解码

在循环网络中，通常会将状态 tt的输出作为状态 t+1的输入。这在语言模型的自回归解码推理中尤为常见，要求在将每个标记输入到下一步之前计算它，这使得RWKV可以利用其类RNN的结构，称为时间顺序模式。在这种情况下，RWKV可以方便地在推理过程中以递归的方式进行解码，如附录B所示。该模式利用了每个输出标记仅依赖于最新状态的优势，而最新状态的大小是恒定的，与序列长度无关。

在这种模式下，RWKV的行为类似于RNN解码器，在序列长度方面，它具有恒定的速度和内存占用，从而更高效地处理更长的序列。相比之下，自注意力机制通常需要随着序列长度线性增长的键值缓存，导致效率降低，内存占用和时间消耗随着序列的增长而增加。

4.4 Software Implementation 程序实现

RWKV最初使用PyTorch深度学习库（Paszke等，2019）和用于WKV计算的自定义CUDA核心进行实现。虽然RWKV是一个通用的循环网络，但当前的实现重点是语言建模任务（RWKV-LM）。模型架构包括一个嵌入层，按照第4.7节中描述的设置进行配置，并且多个相同的残差块按顺序应用，如图2和图3所示，遵循第4.6节中概述的原则。在最后一个块之后，使用由LayerNorm（Ba等，2016）和线性投影组成的简单输出投影头来获取用于下一个标记预测任务的logits，并在训练过程中计算交叉熵损失。在后续的NLP任务中，生成在最后一个残差块后的嵌入和logits也可以被使用。训练是在时间并行模式（第4.2节）下进行的，而自回归推理和潜在的对话界面则利用了时间顺序模式（第4.3节）。

4.5 Gradient Stability and Layer Stacking 梯度稳定性和层叠情况

RWKV架构被设计为Transformer和RNN的融合，相比传统RNN，它具有Transformer的梯度稳定性和更深的架构的优势，同时在推理过程中高效。

先前的工作尝试通过多种技术来解决RNN中的梯度稳定性问题，包括使用非饱和激活函数（Chandar等，2019）、门控机制（Gu等，2019）、梯度裁剪（Pascanu等，2012）和添加约束条件（Kanai等，2017；Miller和Hardt，2018）。尽管这些技术的成功较少，但RWKV通过将softmax与RNN风格的更新相结合，从本质上避免了这个问题。

RWKV模型采用了单步更新注意力类似分数的过程，其中包括时间相关的softmax操作，有助于数值稳定性并防止梯度消失（详见附录F的严格证明）。直观地说，这个操作确保梯度沿着最相关的路径传播。层归一化（Ba等，2016）是架构的另一个关键方面，通过稳定梯度来增强深度神经网络的训练动力学，解决梯度消失和梯度爆炸的问题。

这些设计元素不仅有助于RWKV架构的稳定性和学习能力，还能够以超越任何现有RNN的方式堆叠多个层。通过这样做，模型能够在不同的抽象级别上捕捉到更复杂的模式（详见附录G）。

4.6 Harnessing Temporal Structure for Sequential Data Processing 利用时间结构进行序列数据处理

RWKV通过三种机制（循环、时间衰减和标记位移）的组合来捕捉和传播序列信息。

在RWKV的时间混合块中，recurrence是模型捕捉序列元素之间复杂关系并通过时间传播局部信息的基础。

time decay机制（方程式14中的 e^{-w} 和 e^u）保持对序列元素之间的位置关系的敏感性。通过逐渐减小过去信息对时间的影响，模型保留了时间局部性和进展的感知，这对于序列处理至关重要。这种对序列数据中位置信息的处理与Attention with Linear Biases (ALiBi)模型（Press等，2022）类似，其中线性偏差有助于输入长度的外推。在这个背景下，RWKV架构可以被看作是ALiBi的可训练版本，无需显式编码即可无缝地整合位置信息。它也可以被视为Zhai等人（2021）中引入的门控卷积对完整序列长度进行扩展的扩展。

token shift或time-shift mixing（图3中的对角箭头）也有助于模型适应序列数据。通过在当前输入和上一个时间步骤输入之间线性插值，模型自然地聚合和控制输入通道中的信息。时间位移混合的整体结构类似于WaveNet（van den Oord等，2016）中没有扩张的因果卷积，这是一种用于预测时间序列数据的经典架构。

4.7 Additional Optimizations 附加优化

Custom Kernels 自定义核心
为了解决使用标准深度学习框架时，由于任务的顺序性而导致WKV计算的低效问题，我们实现了一个自定义的CUDA核心，以便在训练加速器中启动单个计算核心。模型的所有其他部分都是矩阵乘法和逐元素操作，这些操作已经可以有效地并行化。

FFN with R gate 带有R门的FFN
先前的研究（Tolstikhin等，2021；Liu等，2021；Yu等，2022）表明，在基于Transformer的视觉任务中，自注意力可能并不像之前想象的那样重要。尽管自注意力为我们提供了一些见解，但在自然语言任务中完全替换自注意力可能过于激进。在我们的研究中，我们通过将固定的QKV公式替换为KV，并引入新的时间衰减因子W，部分解构了注意机制。这种方法使我们能够将类似于MLP-mixer（Tolstikhin等，2021）的标记和通道混合组件以及类似于gMLP（Liu等，2021）的门控单元R整合到我们的RWKV模型中，从而提升了性能。

Small Init Embedding 小初始嵌入
在训练Transformer模型（Vaswani等，2017）的初始阶段，我们观察到嵌入矩阵变化缓慢，这给模型摆脱初始噪声嵌入状态带来了挑战。为了缓解这个问题，我们提出了一种方法，即使用较小的值初始化嵌入矩阵，然后再应用额外的LayerNorm操作。通过实施这种技术，我们加速并稳定了训练过程，使得能够对具有后续LayerNorm组件的深层架构进行训练。该方法的有效性在图8中得到了证明，该图表明它能够通过使模型快速从初始小嵌入状态转变，从而促进了更好的收敛性。这是通过在单个步骤之后进行小的变化，进而在LayerNorm操作之后产生重大的方向改变和显著的变化来实现的。

Custom Initialization自定义初始化
在之前的研究基础上（He等，2016；Jumper等，2021），我们将参数初始化为尽可能接近标识映射的值，同时打破对称性，以确保清晰的信息传递路径。大多数权重初始化为零。线性层不使用偏置。具体的公式请参见附录D。我们发现初始化选择对收敛速度和质量具有重要影响（请参见附录E）。

5 Evaluations 评估

在本节中，我们将重点评估以回答以下问题：

RQ1：在参数数量和训练标记数相等的情况下，RWKV是否与二次复杂度的Transformer架构相竞争？
RQ2：当增加参数数量时，RWKV是否仍然与二次复杂度的Transformer架构相竞争？
RQ3：当RWKV模型训练的上下文长度超过大多数开源的二次复杂度Transformer的有效处理范围时，增加RWKV的参数是否会产生更好的语言建模损失？

针对RQ1和RQ2，从图4中可以看出，在六个基准测试（Winogrande、PIQA、ARC-C、ARC-E、LAMBADA和SciQ）上，RWKV与主要的开源二次复杂度Transformer模型（Pythia、OPT和BLOOM）相比具有很强的竞争力（参见附录H中的详细信息）。在四个任务（PIQA、OBQA、ARC-E和COPA）中，RWKV甚至超过了Pythia和GPT-Neo。至于RQ3，图5显示增加上下文长度会导致在Pile数据集上的测试损失降低，这表明RWKV能够有效地利用长上下文信息。

6 Inference Experiments 推理实验

我们根据大小和类型进行推理需求的基准测试。具体而言，我们在典型的计算平台上，包括CPU（x86）和GPU（NVIDIA A100 80GB），评估文本生成速度和内存需求。在所有实验中，我们使用float32精度。参数计数包括嵌入层和非嵌入层的所有模型参数。不同量化设置下的性能留待进一步研究。更多结果请参见附录I。

此外，我们对RWKV-4、ChatGPT和GPT-4进行了比较研究，详见附录J。研究结果显示，RWKV-4对于提示工程非常敏感。当将提示从适用于GPT的提示调整为适用于RWKV的提示时，F1度量性能甚至从44.2%提高到74.8%。

7 Future Work 未来工作

对于RWKV架构，存在几个有前景的未来工作方向：

通过改进时间衰减公式和在保持效率的同时探索初始模型状态，提高模型表达能力。
通过在 wkv_t步骤中应用并行扫描，将计算成本降低到 O(B log(T)d)，进一步提高RWKV的计算效率。
研究将RWKV应用于编码器-解码器架构，并潜在替代交叉注意机制。这对于seq2seq或多模态设置具有适用性，在训练和推理中提高效率。
利用RWKV的状态（或上下文）进行序列数据的可解释性、可预测性和安全性研究。通过操作隐藏状态，还可以指导行为并通过提示调整实现更大的可定制性。
在特定设置中探索微调模型，以增强与人类的交互（Ouyang等，2022）。特别有趣的是在不同数据集和特定用例下的性能表现。
采用LoRA（Hu等，2022）等参数高效的微调方法，并对所提出的架构在不同量化方案下的行为进行表征。

8 Conclusions 结论

我们引入了RWKV，一种利用基于时间的混合组件潜力的新型RNN模型方法。RWKV引入了几个关键策略，使其能够捕捉局部性和长程依赖关系，并通过以下方式解决了当前架构的局限性：
（1）将二次的QK注意力替换为具有线性成本的标量形式，
（2）重新构建递归和顺序归纳偏差，以解锁有效的训练并行化和高效推理，
（3）使用自定义初始化增强训练动力学。

我们在各种自然语言处理任务中对所提出的架构进行了基准测试，并展示了与SOTA相当的性能以及更低的成本。在表达能力、可解释性和扩展性方面的进一步实验展示了模型的能力，并在RWKV和其他LLM之间绘制了行为上的相似之处。

RWKV为在序列数据中建模复杂关系提供了一种可扩展和高效的架构。尽管已经提出了许多与Transformer类似的替代方案，声称具有类似的优势，但我们是第一个通过拥有数百亿参数的预训练模型来支持这些主张的。

9 Limitations 限制

虽然我们提出的RWKV模型在训练和推理过程中展现出了有希望的结果，具有较高的训练和内存效率，但在未来的工作中应该承认并解决一些限制。首先，RWKV的线性注意力虽然带来了显著的效率提升，但也可能限制了模型在需要在非常长的上下文中回忆细节信息的任务上的性能。这是因为相比标准Transformer的二次注意力所保持的全部信息，RWKV通过单个向量表示在许多时间步上进行信息传递。换句话说，相对于传统的自注意机制，模型的循环架构本质上限制了其“回望”之前标记的能力。虽然学习的时间衰减有助于防止信息丢失，但与完全的自注意力机制相比，它在机械上存在一定的限制。

本工作的另一个限制是与标准Transformer模型相比，提示工程的重要性增加了。RWKV中使用的线性注意机制限制了提示中将传递给模型继续处理的信息。因此，精心设计的提示可能对模型在任务上的表现更加关键。

深度学习模块实践手册（第十二期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
56、Ghost模块论文《GhostNet:MoreFeaturesfromCheapOperations》1、作用：Ghost模块是一种轻量级的特征提取模块，旨在通过廉价操作生成更多特征图，减少计算量的同时保持模型性能。传统卷积神经网络在生成特征图时存在大量冗余计算，Ghost模块通过将特征图生成过程分解为两个步骤，有效减少了计算复杂度，特别适合移动端和嵌入式设备部署。2、机制Ghost模块的机
DETR革命：目标检测的Transformer时代加油吧zkf 目标检测 YOLO python 开发语言人工智能图像处理
《DETR从0到1：目标检测Transformer的崛起》为什么会有DETR？在深度学习目标检测发展史上，2014~2019年几乎被基于卷积神经网络（CNN）的检测器统治：两阶段：FasterR-CNN、MaskR-CNN单阶段：YOLO、SSD、RetinaNet这些检测器虽然效果强大，但背后依赖：✅Anchor（先验框）✅NMS（非极大值抑制）✅特征金字塔、手工设计问题：结构复杂、调参困难、不
深度学习模块实践手册（第十一期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
46、缩放点积注意力模块论文《AttentionIsAllYouNeed》1、作用：缩放点积注意力（ScaledDot-ProductAttention）是Transformer模型的核心组件，旨在解决序列建模中长距离依赖关系捕捉的问题。传统的循环神经网络（RNN）在处理长序列时存在梯度消失或爆炸的问题，且并行性较差。该模块通过计算查询（Query）、键（Key）和值（Value）之间的相似度，实
【Java】【力扣】102.二叉树层序遍历
思路一个辅助队列（初始化队列：根节点入队）一个节点出队，他的左右孩子入队循环直到队列为空举例代码publicList>levelOrder(TreeNoderoot){if(root==null){returnnewArrayList>();}Queuequeue=newLinkedList>resultList=newArrayListlevel=newArrayList<>();intcurS
大模型格式
目录大模型格式：ollma可以加载ggufChatGPT说：什么是GGUF？大模型格式：Ollama模型格式只能运行已打包成.gguf格式的模型，或通过其Modelfile方式构建ModelScope模型格式大多使用HuggingFaceTransformers格式，如.bin、.safetensors，与Ollama不兼容模型加载方式不同Ollama自带封装推理引擎（ggml/llama.cpp
基于NanoDet的健身姿势纠正系统开发 YOLO实战营人工智能 NanoDet 深度学习计算机视觉 ui
1.引言在现代健身行业中，正确的运动姿势至关重要，不仅能提升训练效果，还能预防运动损伤。尤其是在进行一些高强度的力量训练时，如深蹲、俯卧撑等，错误的姿势可能导致肌肉不平衡或关节损伤。传统的健身姿势纠正方式依赖教练的人工指导，但随着人工智能技术的发展，使用计算机视觉和深度学习技术来进行姿势纠正，逐渐成为一种高效且可扩展的解决方案。本文将详细介绍如何基于NanoDet（一个轻量化目标检测模型）开发一个
大模型算法工程师技术路线全解析：从基础到资深的能力跃迁 Mr.小海大模型算法数据挖掘人工智能机器学习深度学习机器翻译 web3
文章目录大模型算法工程师技术路线全解析：从基础到资深的能力跃迁一、基础阶段（0-2年经验）：构建核心知识体系与工程入门数学与机器学习基础编程与深度学习框架NLP与Transformer入门二、进阶阶段（2-4年经验）：深化模型技术与工程落地能力大模型预训练与微调技术预训练原理：数据与任务的协同设计微调工具：参数高效适配与工程优化对齐实践：价值观优化与实证效果分布式训练与框架工具并行策略：多维度协同
Go-Redis × 向量检索实战用 HNSW 在 Redis 中索引与查询文本 Embedding（Hash & JSON 双版本） Hello.Reader 数据库运维缓存技术 golang redis embedding
1.场景与思路痛点：把“文本内容”转成向量后，如何在本地Redis里做近似向量搜索（KNN），而不依赖外部向量数据库？方案：利用HuggingFace模型sentence-transformers/all-MiniLM-L6-v2生成384维Float32向量；借助RediSearch的HNSW索引能力，在Hash或JSON文档里存储&查询向量；用go-redisv9的高阶API（FTCreate
Spring AI高级RAG功能查询重写和查询翻译非ban必选 deepseek spring 人工智能 java
1、创建查询重写转换器//创建查询重写转换器queryTransformer=RewriteQueryTransformer.builder().chatClientBuilder(openAiChatClient.mutate()).build();查询重写是RAG系统中的一个重要优化技术，它能够将用户的原始查询转换成更加结构化和明确的形式。这种转换可以提高检索的准确性，并帮助系统更好地理解用户
【深度学习-Day 36】CNN的开山鼻祖：从LeNet-5到AlexNet的架构演进之路吴师兄大模型深度学习入门到精通 python pytorch 开发语言人工智能 CNN 深度学习大模型
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
人脸识别实战：使用Python OpenCV 和深度学习进行人脸识别(2)
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新Python全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课
TensorFlow深度学习实战——DCGAN详解与实现盼小辉丶深度学习 tensorflow 生成对抗网络
TensorFlow深度学习实战——DCGAN详解与实现0.前言1.DCGAN架构2.构建DCGAN生成手写数字图像2.1生成器与判别器架构2.2构建DCGAN相关链接0.前言深度卷积生成对抗网络(DeepConvolutionalGenerativeAdversarialNetwork,DCGAN)是一种基于生成对抗网络(GenerativeAdversarialNetwork,GAN)的深度学
【转】【译】How to Handle Very Long Sequences with LSTM（LSTM RNN 超长序列处理）开始奋斗的胖子机器学习 RNN LSTM 序列深度学习
原文地址http://machinelearningmastery.com/handle-long-sequences-long-short-term-memory-recurrent-neural-networks/一个长的输入序列却只对应一个或者一小段输出就是我们经常说的序列标注和序列分类。主要包括下面一些例子：包含上千个词的文件情感分类（NLP）包含上千个时间状态的脑电痕迹分类（Medici
BEV+Transformer Monkey PilotX 自动驾驶 transformer 深度学习人工智能
在自动驾驶系统中，BEV（Bird’sEyeView）+Transformer主要应用于感知与环境建图（Perception&SceneUnderstanding）环节，尤其是在多传感器融合、目标检测、语义分割、轨迹预测等任务中。在自动驾驶中的关键应用场景应用环节BEV+Transformer的作用感知（Perception）多摄像头图像融合成BEV视角，进行目标检测、语义分割预测（Predict
基于cnn和resnet和mobilenet对比实现驾驶员分心检测深度学习乐园 cnn 人工智能神经网络
演示效果及获取项目源码点击文末名片本项目旨在通过深度学习技术，结合卷积神经网络（CNN）模型、ResNet模型和MobileNet模型，实现对驾驶员分心行为的自动检测。我们通过训练这些模型来识别不同的驾驶员分心行为，包括如发短信、通话、喝水等行为。使用的数据集包含驾驶员行为的图片，并且针对每个行为标注了相应的标签（例如"正常驾驶"、"右手发短信"等）。MobileNetV2是Google于2018
opencv 4.12.0版本发布详解：核心优化与新特性全解析 Risehuxyc #opencv opencv 人工智能计算机视觉
OpenCV4.12.0夏季更新带来核心模块优化、图像处理增强、深度学习支持扩展及新兴硬件适配，全面提升计算机视觉开发效率与性能。引言OpenCV（开源计算机视觉库）作为计算机视觉领域最受欢迎的开源库之一，在2025年7月发布了4.12.0版本。这个夏季更新带来了大量性能优化、新功能和错误修复，覆盖了核心模块、图像处理、3D校准、深度学习等多个领域。本文将详细介绍OpenCV4.12.0的主要更新
如何用深度学习实现图像风格迁移
最近研学过程中发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。下面开始对正文内容的介绍。前言图像风格迁移是人工智能领域中一个非常有趣且富有创意的应用。它能够让一张普通的照片瞬间变成梵高笔下的《星月夜》风格，或者像莫奈的《睡莲》一样充满艺术感。这种技术不仅在
AI人工智能领域TensorFlow的模型训练策略 AIGC应用创新大全人工智能 tensorflow python ai
AI人工智能领域TensorFlow的模型训练策略关键词：TensorFlow、模型训练、深度学习、神经网络、优化策略、分布式训练、迁移学习摘要：本文将深入探讨TensorFlow框架下的模型训练策略，从基础概念到高级技巧，全面解析如何高效训练深度学习模型。我们将从数据准备、模型构建、训练优化到部署应用，一步步揭示TensorFlow模型训练的核心技术，并通过实际代码示例展示最佳实践。背景介绍目的
ROS2 通过相机确定物品坐标位置
要实现通过相机确定物品坐标位置，通常需要相机标定、物体检测和坐标转换几个步骤。下面我将提供一个完整的解决方案，包括相机标定、物体检测和3D坐标估计。1.系统架构相机标定-获取相机内参和畸变系数物体检测-使用OpenCV或深度学习模型检测物品坐标转换-将2D图像坐标转换为3D世界坐标ROS2集成-将上述功能集成到ROS2节点中2.实现步骤2.1创建功能包bashros2pkgcreateobject
【机器学习&深度学习】什么是量化？一叶千舟深度学习【理论】机器学习深度学习人工智能
目录前言一、量化的基本概念1.1量化对比示例1.2量化是如何实现的？二、为什么要进行量化？2.1解决模型体积过大问题2.2降低对算力的依赖2.3加速模型训练和推理2.4优化训练过程2.5降低部署成本小结：量化的应用场景三、量化的类型与实现3.1权重量化（WeightQuantization）3.2激活量化（ActivationQuantization）3.3梯度量化（GradientQuantiz
基于AutoCut实现在文档中按照片段剪辑视频 Mr数据杨 Python 音频技术音视频
本项目致力于通过构建一个具备深度学习支持的多功能视频处理环境，为用户提供高效、智能的视频编辑和字幕生成工具。依托Anaconda环境管理工具和PyTorch的GPU加速能力，用户能够迅速搭建一个符合项目需求的Python环境。结合FunClip的源代码以及相关插件的安装和配置，用户可充分利用项目所支持的图像、音频识别功能，并以极少的配置便获得理想的视频裁剪效果。项目的核心在于简化深度学习项目的环境
基于深度学习的和平精英（吃鸡）内置锁头训练摆烂仙君深度学习人工智能
前言本教程以和平精英为例，主要讲解如何构建深度学习模型对游戏中角色进行头部标注，并控制鼠标对其进行锁定射击，同时围绕其游戏防作弊系统进行算法攻防讲解，该方案对于csgo,cf等游戏也同样适用。请注意，该教程仅供娱乐教学，若本教程评论超过100，将会开源相关代码并对实际的代码部署进行进一步分析。一、和平精英伤害机制分析在《刺激战场》（现为《和平精英》）中，击中头部的伤害远高于身体其他部位，这是由游戏
迁移学习让深度学习更容易城市中迷途小书童
摘要：一文读懂迁移学习及其对深度学习发展的影响！深度学习在一些传统方法难以处理的领域有了很大的进展。这种成功是由于改变了传统机器学习的几个出发点，使其在应用于非结构化数据时性能很好。如今深度学习模型可以玩游戏，检测癌症，和人类交谈，自动驾驶。深度学习变得强大的同时也需要很大的代价。进行深度学习需要大量的数据、昂贵的硬件、甚至更昂贵的精英工程人才。在ClouderaFastForward实验室，我们
股票基金量化开源平台对比 Mr.小海开源开源金融
股票基金量化开源平台对比分析报告引言研究背景与意义在金融科技快速发展的背景下，量化交易已成为现代金融市场中投资者追求高效与精准交易的核心工具。通过程序化方式，投资者能够迅速处理海量市场数据，制定并执行复杂交易策略，其高效性、低情绪干扰及策略多样性等优势显著[1]。特别是随着人工智能技术的深化，2025年基于深度学习与机器学习的开源量化工具持续涌现，推动行业向数据驱动转型——量化交易将决策逻辑从经验
开源基金/股票量化平台调研报告 Mr.小海金融
开源基金/股票量化平台调研报告引言调研背景与目的近年来，随着人工智能技术的持续深化，量化交易领域迎来了深刻变革。2025年，基于深度学习和机器学习的开源工具不断涌现，不仅在技术层面实现突破，更在实际应用中展现出强大竞争优势，推动行业创新与升级[1].作为融合数学、统计与计算机技术的科技驱动型金融策略，量化交易通过自动化与数据驱动方法提升投资决策效率与准确性，已成为金融机构与投资者追求超额收益的重要
Python Gradio：快速搭建人脸识别应用 Python编程之道 Python人工智能与大数据 Python编程之道 python 开发语言 ai
PythonGradio：快速搭建人脸识别应用关键词：Python,Gradio,人脸识别,深度学习,计算机视觉,交互式应用,模型部署摘要：本文详细介绍了如何使用Python的Gradio库快速搭建一个交互式的人脸识别应用。我们将从基础概念出发，逐步讲解人脸识别的核心算法原理、Gradio的界面设计方法，并通过完整的项目实战演示如何将深度学习模型部署为可交互的Web应用。文章包含详细的代码实现、数
Datawhale组队学习打卡-Fun-transformer-Task3Encoder 宇宙第一小甜欣学习 transformer 深度学习
今天的内容主要是Encoder部分的具体流程，多头注意力和交叉注意力，还是会有比较多的公式来厘清每部分的输入和输出以及对应的方法。Encoder如第一篇所说，Encoder是Transformer的第一部分，其主要任务是将输入序列（如文本、词语或字符）编码为一个上下文丰富的表示，Encoder的输出是Decoder的输入的一部分（用作Attention机制中的和）。1.Encoder的整体结构堆叠
DataWhale 二月组队学习-深入浅出pytorch-Task04 －273.15K DataWhale组队学习学习 pytorch 人工智能
一、自定义损失函数1.损失函数的作用与自定义意义在深度学习中，损失函数（LossFunction）用于衡量模型预测结果与真实标签之间的差异，是模型优化的目标。PyTorch内置了多种常用损失函数（如交叉熵损失nn.CrossEntropyLoss、均方误差nn.MSELoss等）。但在实际任务中，可能需要针对特定问题设计自定义损失函数，例如：处理类别不平衡问题（如加权交叉熵）实现特殊业务需求（如对
大模型核心概念 | 嵌入模型（Embedding）、向量模型（Vector Model）
一、核心概念解析1.1嵌入模型（Embedding）作为AI领域的核心基础技术，嵌入模型通过将非结构化数据映射为低维稠密向量，实现语义特征的深度捕捉：文本嵌入：如将语句转换为1536维向量，使"机器学习"与"深度学习"的向量余弦相似度达0.92跨模态嵌入：支持图像与文本的联合向量空间映射，如CLIP模型实现文图互搜1.2向量模型（VectorModel）作为嵌入技术的下游应用体系，主要包含两大方向
Python实现神经网络算法指南代码编织匠人 python 神经网络算法
Python实现神经网络算法指南神经网络是一种模拟人脑神经元结构进行信息处理的机器学习算法。在深度学习领域中，神经网络是最为强大的算法之一。Python作为一门简单易学的编程语言，也成为了许多人选择实现神经网络算法的首选语言。在本篇文章中，我们将通过Python代码来实现神经网络算法。导入必要的库为了实现神经网络算法，我们需要导入一些必要的Python库，包括numpy和matplotlib。其中
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring