满腹的小不甘_静静

《An Attentive Survey of Attention Models》注意力机制的最新综述解读

Abstract

注意力模型(Attention Model，AM)已经成为神经网络中的一个重要概念，并在不同的应用领域进行了充分的研究。这项调查关于attention的发展提供了一个结构化和全面的概述，主要包括：

1. 我们提出了一种分类法，将现有的技术分为几个连贯的类别；

2. 我们回顾了注意力被纳入的不同的神经结构，并展示了注意力如何提高神经模型的可解释性。

3. 最后，我们讨论了在实际应用中，注意力机制取得的重要影响。

我们希望这项调查能够为注意力模型提供一个简明的介绍，并指导实践者为他们的具体应用开发新的方法。

1. Instroduction

注意力模型（AM），最初被用于机器翻译 [Bahdanau et al., 2014]，目前已成为神经网络领域一个主要概念。在人工智能（AI）领域，注意力已成为神经系统结构的重要组成部分，在自然语言处理、统计学习、语音和计算机视觉等领域都有着大量的应用。

注意力机制可以使用人类生态系统进行直观解释。例如，我们的视觉处理系统倾向于选择性地聚焦于图像的某些部分，而以一种有助于感知的方式忽略其他不相关的信息[Xu et al., 2015]。同样，在涉及语言、语音或视觉的问题中，输入的某些部分比其他部分对决策更有帮助。例如，在翻译和自动文摘中，只有输入序列中特定的某些单词可能对预测下一个单词有帮助。同样，在图像描述中，输入图像的某些区域可能对生成下一个单词更有帮助。注意力机制通过允许模型动态地聚焦于输入的特定部分来提高任务的效率而将这种相关性概念结合起来。图1为使用AM对Yelp评论进行情绪分类的示例[Yang et al., 2016]。在这个例子中，AM学习到在五个句子中，第一句和第三句更相关。

注意力机制AM在神经网络领域的迅速发展主要有三个原因：

首先，这些模型现在是解决多任务最先进的模型[Young et al., 2018]，如机器翻译、问题回答、情感分析、词性标记、对话系统。

其次，除了在主要任务上提高性能外，它们还提供了其他几个优势。它们被广泛用于提高神经网络的可解释性，而神经网络之前常常被视为黑盒模型。这是一个显著的好处，因为人们对影响人类生活的应用程序中用到的机器学习模型的公平性、可解释性和透明度越来越感兴趣。

第三，它们有助于克服递归神经网络RNN中的一些挑战，例如随着输入长度的增加性能下降（Section 2），以及对输入的顺序处理导致的计算效率低下（Section 4.3）。因此，在这项工作中，我们的目标是提供一个简短而全面的注意机制的综述。

论文组织结构

首先，第2节中简要解释了Bahdanau等人提出的注意模型[Bahdanau et al.,2014]，并在第3节中描述了我们的分类法；

然后，我们分别在第4节和第5节中讨论了使用注意模型的神经网络结构以及Attention如何促进神经网络的可解释性；

最后，我们在第6节中提出了注意力模型的广泛应用，并在第7节中总结了本文。

相关的综述文献

关于Attention model在计算机视觉[Wang and Tax, 2016]和图形[Lee et al., 2018]方面的应用已经有一些综述，另一个类似的工作由Galassi等人完成的[Galassi et al.,2019]，但是我们进一步综述了可行的分类法、关键网络架构和应用、以及注意力模型的可解释性。我们希望我们的贡献不仅能够促进对注意力模型的更广泛理解，而且能够帮助人工智能开发人员和工程师为他们的应用领域确定正确的方法。

2. Attention Model

如图2(a)所示， sequence-to-sequence模型由encoder-decoder体系结构组成[Cho et al., 2014b]。编码器encoder是一个RNN结构，它接受tokens的输入序列 {x1，x2，…，xT}，其中T是输入序列的长度，并将其编码为固定长度的向量 {h1，h2，…，hT}。解码器decoder也是一个RNN，它以一个固定长度的向量hT作为输入，通过tokens-to-tokens生成一个输出序列 {y1，y2，…，yT'}，其中T'是输出序列的长度。在每个位置t，hT和sT分别表示编码器和解码器的隐状态。

传统encoder-decoder结构的挑战

传统的encoder-decoder框架有两个众所周知的挑战：

（1）首先，编码器encoder必须将所有输入信息压缩成一个固定长度的向量hT中，然后将其传递给解码器decoder。使用一个固定长度的向量去压缩一个长而复杂的输入序列可能会导致信息丢失 [Cho et al., 2014a]。

（2）其次，它无法对输入和输出序列之间的对齐进行建模，这是结构化输出任务（如翻译或文摘）的一个重要方面[Young et al., 2018]。从直觉上看，在sequence-to-sequence的任务中，我们希望每个输出token受到输入序列的某些特定部分的影响更大。然而，解码器缺乏选择性地聚焦于产生输出tokens的相关输入tokens的机制。

关键思想

注意力模型旨在通过允许解码器访问整个编码的输入序列 {h1，h2，…，hT} 来减轻这些挑战。其核心思想是在输入序列上引入注意力权重α，以优先考虑存在相关信息的位置集，以生成下一个输出token。

Attention的使用

如图2(b)所示，为具有注意力机制的encoder-decoder体系结构。网络结构中的注意力模块负责自动学习注意力权重αij，它可以自动捕获hi（encoder隐藏状态，我们称之为候选状态）和sj（decoder器隐藏状态，我们称之为查询状态）之间的相关性。然后，这些注意力权重用于构建内容向量c（context vector），该向量作为输入传递给decoder。在每个解码位置j上，内容向量cj是编码器所有隐藏状态hi及其相应注意力权重αij的加权和，即

这个额外的内容向量使decoder可以使用整个输入序列，并聚焦于输入序列的相关位置。

学习注意力权重

注意力权重是通过在体系结构中加入一个额外的前馈神经网络来学习的。该前馈网络学习一个特殊的注意力权重αij，作为两种状态hi和s(j-1)的函数，hi和s(j-1)作为神经网络的输入。进而，这个前馈神经网络与架构中encoder-decoder一起训练。

3. Taxonomy of Attention 注意力机制的分类

我们将注意力分为四大类，并说明每一类中不同类型的注意力，如表1所示。我们要强调的是，这些类别并不相互排斥。注意力模型可以应用于多个类别的组合，如多层次的、self和soft注意力组合[Yang et al., 2016]。因此，我们可以将这些类别视为维度，将注意力应用于感兴趣的具体应用时，可以考虑这些维度。为了使这一概念易于理解，我们提供了一份关键技术论文列表，并在表2中指定了作者在提出的方法中使用的多种注意类型。

3.1 Number of sequences

迄今为止，我们只考虑了单输入和相应输出序列的情况。这种类型的注意力模型，我们称之为 distinctive模型（区别性），其用于当候选状态(candidate state)和查询状态(query state)分别属于两个不同的输入和输出序列时。大多数用于翻译[Bahdanau et al., 2014]、摘要[Rush et al., 2015]、图像描述[Xu et al., 2015]和语音识别[Chan et al., 2016]的注意力模型都属于distinctive注意力类型。

co-attention模型（共同注意力模型）同时对多个输入序列进行操作，并共同学习它们的注意力权重，以捕获这些输入之间的交互作用。刘等人 [Lu et al.,2016] 使用co-attention模型构建了视觉问答系统。作者认为，除了对输入图像进行视觉注意力建模外，对问题注意力建模也很重要，因为问题文本中的所有单词对问题的答案并不同等重要。此外，基于图像表示的注意力可用于引导问题注意力，反之亦然，这在本质上有助于同时检测问题中的关键短语和与答案相关的图像的相应区域。

相反，对于文本分类和推荐等任务，输入是序列，但输出不是序列。在相同的输入序列中，注意力模型可以用于学习输入序列中每个token的相关tokens。换句话说，对于这类注意力模型，查询和候选状态属于相同的序列。为此，Yang等人[Yang et al. ,2016]提出了 self attention模型，也就是inner attention模型。

3.2 Number of abstraction levels

在最一般的情况下，注意力权重的计算只是为原始输入序列。这种注意力模型称为single-level。另一方面，注意力可以按顺序应用于输入序列的多个抽象层次。较低抽象级别的输出（内容向量）成为较高抽象级别的查询状态。此外，multi level attention 模型（多层次注意力模型）可进一步分类，根据权重的学习方式是自上而下（从较高抽象级别到较低级别）[Zhao and Zhang, 2018] 还是自下而上[Yang et al., 2016]。

关于这一类别，我们举一个关键示例，它在两个不同的抽象级别（即单词级别和句子级别）使用注意力模型来完成文档分类任务[Yang et al., 2016]。因为这个模型捕获了文档的自然层次结构，即文档由句子组成，句子由单词组成，所以称其为“层次注意力模型”（Hierarchical Attention Model，HAM）。多层次的注意力允许HAM模型提取句子中的重要单词和文档中的重要句子，如下所示。首先，建立了一种基于句子表示的attention，其将第一级attention应用于单词嵌入向量（word embedding vectors）序列。然后，它使用第二级attention来聚合这些句子表示，以形成文档表示。（即：将第一级attention应用于单词向量序列，形成句子表示形式；然后将第二级attention应用于这些句子表示，形成文档表示形式）。文档的最终表示形式用作分类任务的特征向量。

要注意的是，第3.1节所述的co-attention工作[Lu et al., 2016]也属于 multi-level 范畴，它在三个层次上共同关注图像和问题：单词级别、短语级别和问题级别。这种co-attention和multi-level attention的组合如图3所示。

[Zhao and Zhang et al., 2018]提议使用“attention-via-attention”模型，即使用 multi-level 注意力模型（较低层次的字母和较高层次的单词），但以自上而下的方式学习注意力权重。

3.3 Number of position

第三类的区别是计算注意力函数的输入序列的位置。Bahdanau等引入的注意力模型也称为soft attention [Bahdanau et al., 2014]。顾名思义，它使用输入序列所有隐藏状态的加权平均值来构建 context向量。soft 加权方法的应用使得神经网络易于通过反向传播进行有效的学习，同时也导致了翻倍的计算代价。

Xu等人提出了一个 hard attention模型 [Xu et al., 2015]，其中 context向量是根据输入序列中随机抽样的隐藏状态计算出来的。这是通过使用由注意力权重参数化的多努利分布来实现的。由于计算成本的降低，hard注意模型是有益的，但是在输入的每一个位置做出一个艰难的决策，使得所得到的框架不可微分且难以优化。因此，为了克服这一局限性，文献中提出了强化学习中的变化学习法和策略梯度法。

在机器翻译任务的背景下，Luong等人提出了两种注意力模型，即 local和global注意力模型[Luong et al. , 2015]。global注意力模型与soft注意力模型相似，local 注意模型介于soft注意和hard注意之间。其关键是，首先检测输入序列中的注意力点或位置，然后在该位置周围选择一个窗口，以创建一个 local soft 注意力模型。输入序列中的位置可以通过设置（单调对齐）或通过预测函数学习（预测对齐）。因此，local模型的优势在于在soft、hard、计算效率、窗口可微性之间提供参数权衡。

3.4 Number of representations

一般来说，很多应用中使用了输入序列的单一特征表示。但是，在某些情况下，使用输入的一个特征表示可能不足以完成下游任务。在这种情况下，一种方法是通过多个特征表示来捕获输入的不同方面。注意力机制可以用来为这些不同的表示分配重要性权重，这些表示可以确定最相关的方面而忽略输入中的噪声和冗余。我们将此模型称为multi-representational注意模型，因为它可以为下游应用确定输入的多个表示的相关性。最终的表示是这些多重特征表示及其注意力权重的加权组合。注意力模型的一个好处是通过检查权重，直接评估哪些embeddings（嵌入）是特定下游任务的首选embeddings。

Kiela等人在同一输入句的不同单词嵌入上学习注意力模型权重，以改进句子表示[Kiela et al. , 2018]。同样地，Maharjan等人也利用注意力来动态权衡books的不同特征表示，通过捕捉词汇、句法、视觉和体裁信息[Maharjan et al., 2018]。

类似地，在multi-dimensional注意力中，引入权重来确定输入嵌入向量的各个维度的相关性。凭直觉，计算向量的每个特征的分数可以选择出特征，在任何给定的内容中，这些选择出的特征能对token的特定含义作最好的描述。这对于自然语言应用程序尤其有用，因为在自然语言中，单词嵌入会遇到一词多义问题。这一方法的典型例子是，更有效的句子嵌入表示[Lin et al. , 2017] 和语言理解问题[Shen et al. 2018]。

4. Network Architectures with Attention

本节中，我们描述了与注意力结合使用的三种神经网络架构：（1）encoder-decoder结构，（2）将注意力扩展到单个输入序列之外的记忆网络，（3）使用注意力机制绕过循环模型的顺序处理组件的结构。

4.1 Encoder-Decoder

注意力机制的最早使用是作为基于encoder-decoder框架的RNN 的组成部分，来编码长输入语句[Bahdanau et al., 2014]。因此，注意力在这种体系结构中得到了最广泛的应用。

一个有趣的事实是，注意力模型可以将任何输入表示减少到一个固定长度的内容向量，以用于解码步骤。因此，它允许将输入表示与输出分离。我们可以利用这一优势来引入混合encoder-decoder，最流行的是卷积神经网络（CNN）作为编码器，RNN或长短期存储器（LSTM）作为解码器。这种类型的体系结构对于multi-model任务特别有用，例如图像和视频标注、视觉问答和语音识别。

然而，并不是所有问题（输入与输出都是有序数据）都能通过上述的方式解决，如排序问题和旅行商问题。Pointer Networks（指针网络）[Vinyals et al., 2015]是另外一种模型，有如下两点不同：

（1）输出是离散的，并指向输入序列中的位置，（因此命名为指针网络）。

（2）输出的每一步的目标类数量取决于输入的长度（因此是变量），这用encoder-decoder框架无法实现（其输出词典是先验已知的）。

作者利用注意力权重来为此建模，在每个输出位置选择第ith个输入符号作为所选符号的概率。这种方法可以应用于离散优化问题，如差旅销售人员问题和排序问题。

4.2 Memory Networks

像问答和聊天机器人这样的应用程序，需要具备从事实数据库的信息中学习的能力。网络的输入是一个知识数据库和一个查询，其中一些事实比其他事实与查询更加相关。

End-to-End Memory Networks端到端记忆网络[Sukhbaatar et al., 2015] 通过使用一组记忆块存储事实数据库来实现这一点，使用注意力机制为记忆中每个事实间的关联进行建模以回答问题。使用注意力还提供了计算优势，通过使目标连续并通过反向传播实现端到端训练。端到端记忆网络可以被看作是注意力模型的一种普遍化，它不是只在一个序列上建模，而是在一个大型的序列数据库上建模。

4.3 Networks without RNNs

RNN结构依赖于编码步骤输入的顺序处理，因为处理无法并行化，这导致计算效率低下[Vaswani et al., 2017]。为了解决这一问题，作者提出了一种 Transformer结构，其中encoder和decoder由带有两个子层的相同层的堆叠组成：位置前馈网络（FFN）层和multi-head自注意层。【position wise Feed Forward Network(FFN) layer and multi-head self attention layer.】

Position-wise FFN：输入是有顺序的，它要求模型利用输入的时间信息，而不使用捕获该位置信息的组件（如RNN/ CNN）。为此，在Transformer的编码阶段使用Position-wise FFN 为输入序列的每个标记token生成content embedding和位置编码。

Multi-Head Self-Attention：在每个子层中使用self-attention来关联token及其在相同输入序列中的位置。此外，注意力机制因multi-head而知名，因为几个注意力层是平行堆叠的，对相同输入序列进行不同的线性变换。这有助于模型捕获输入的各个方面并提高其表达能力。

Transformer结构无需任何循环组件，实现了显著的并行处理、更短的训练时间和更高的翻译精度，这是一个显著好处。然而，位置编码仅弱合并位置信息，可能不适用于对位置变化更敏感的问题。Shen等人利用时间卷积来编码位置信息以及Transformer 的自我注意机制 [Shen et al., 2018]。

此外，还有更直接的方法打破输入的顺序处理。Raffel和Ellis提出了 Feed Forward Attention 前馈注意力模型[Raffel and Ellis, 2015]，他们使用注意力模型来折叠数据的时间维度，并使用FFN代替RNN来解决序列数据问题。在这种情况下，注意力模型用来从可变长度的输入序列中产生一个固定长度的content向量，这个content向量可以作为一个FFN的输入。

5. Attention for Interpretability

由AI模型的性能以及透明性和公平性的趋势，人们对其可解释性产生了极大的兴趣。然而，神经网络，特别是深度学习，因其缺乏可解释性而受到批评[Guidotti et al., 2018]。

从可解释性的角度来看，注意力机制特别有趣，因为它允许我们直接检查深度学习体系结构的内部工作。假设注意力权重的大小与一个特定输入区域的相关性密切相关，用于预测一个序列中每个位置的输出。这可以很容易地通过为一组输入和输出对可视化注意力权重来实现。Li等认为注意力是解释神经模型内部工作的重要途径之一[Li et al. 2016]。

如图4（a）所示，Bahdanau等人将注意力权重形象化，尽管主语-动词-名词的位置在语言之间有所不同，但它清楚地显示了法语和英语中句子的自动对齐[Bahdanau et al., 2014]。特别是，通过将"environnement marin"与"marine environment
" 正确校准，注意模型展示了非单调对齐。图4（b）显示了注意力权重可以帮助识别用户的兴趣。用户1似乎更喜欢“卡通”视频，而用户2更喜欢“动物”视频[He et al., 2018]。最后，如图4（c）所示，在图像字幕任务中，Xu等人提供了相关图像区域的可视化列表（如，高注意力权重），这对生成的脚本具有重要影响[Xu et al. , 2015]。

我们也总结了一些其他有趣的发现，如下所示。De Arteaga等人探讨了职业分类中的性别偏见，并展示了在分类任务中获得更多关注的词汇通常是如何被性别化的[De-Arteaga et al. 2019]。Yang等人注意到，为确定评论的情感，单词good和bad的重要性取决于上下文环境[Yang et al. 2016]。作者考察了这些词的注意权重分布，发现它们的范围从0到1，这意味着模型捕获了不同的上下文，并为这些词分配了与上下文相关的权重。Chan等人注意到，在语音识别中，字符输出和音频信号之间的注意力能够正确识别音频信号中第一个字符的起始位置，对于声学相似的单词，注意力权重相似[Chan et al. 2016]。最后，Kiela等发现多表示注意力给Glo Ve, FastText 单词嵌入，尤其是GloVe低频词汇，分配更高的权重[Kiela et al. 2018]。

作为注意力的另一个有趣的应用，Lee等人[Lee et al.2017]和Liu等人[Liu et al. 2018]提供了一个工具来可视化深层神经网络的注意力权重。目的是解释和干扰注意力权重，以便模拟假设情景并交互观察预测的变化。

6. Applications

注意力模型由于其直观性、通用性和可解释性，已成为研究的一个活跃领域。注意力模型的变体已经被用来处理不同应用领域的独特特性，如总结、阅读理解、语言模型、语法分析等。我们讨论了三个应用领域的注意力建模：（i）自然语言生成NLG,（i i）分类，（i i i）推荐系统。

NLG任务包括生成自然语言文本作为输出。一些NLG应用程序获益于将注意力模型与机器翻译（MT）、问答系统（QAS）和多媒体描述（MD）结合。

MT机器翻译使用算法将文本或语音从一种语言翻译成另一种语言。神经技术中的注意力模型使得不同语言的句子能够更好地对齐，这是机器翻译中的一个关键问题。注意模型的优点在翻译较长的句子时也变得更加明显[Bahdanau et al., 2014]。Britz等人和Tang等人的几项研究表明，使用注意力可以改善MT的性能[Britz et al., 2017] [Tang et al., 2018]。

QA问题利用注意力：（i）通过关注问题的相关部分来更好地理解问题[Hermann et al., 2015]；（i i）使用记忆网络存储大量信息，以帮助找到答案[Sukhbaatar et al., 2015]；（i i i）通过使用co-attention，模拟输入中的多模态，来提高可视化问答任务的性能[Lu et al., 2016]。

MD的任务是生成一个自然语言文本描述的多媒体输入序列，可以是语音，图像和视频[Cho et al., 2015]。与QAS类似，这里的注意力执行在语音输入[Chorowski et al., 2015]或输入图像的相关部分[Xu et al., 2015]中查找相关声音信号的功能，以预测标题中的下一个单词。此外，Li等人利用视频的时间和空间结构，利用多级关注进行视频字幕任务[Li et al. 2017]。较低的抽象级别提取帧内的特定区域，较高的抽象级别选择性地关注帧的小子集。

文件分类：如前面第3节所述，分类问题主要利用自我关注来构建更有效的文件表示。Yang等人使用了多层次的自我关注[Yang et al. 2016]，而Lin等人则提出了多维的自我关注[Lin et al.2017]，Kiela等人则提出了一个多特征表达的自我关注模型[Kiela et al. 2018]。

情绪分析：同样，在情绪分析任务中，自我关注有助于将注意力集中在决定输入情绪的重要词语上。Wang等人和Ma等人提出的基于方面的情感分类方法将与方面相关的概念的额外知识纳入模型 [Wang et al.2016] and [Ma et al. 2018]，并利用关注度来适当权衡概念与内容本身的区别。情感分析应用程序也注意到了多种架构的使用，如记忆网络[Tang et al., 2016]和Transformer [Ambartsoumian and Popowich, 2018] and [Song et al., 2019]。

推荐系统：注意力模型也被广泛应用于推荐系统中，用于用户分析，即将注意力权重分配给用户的交互项目，以更有效地捕捉长期和短期的兴趣。这是直观的，因为用户的所有交互都与物品的建议无关，用户的兴趣在长时间和短时间内都是短暂的，并且是变化的。多篇论文使用自我关注机制来查找用户历史中最相关的物品，以改进物品推荐建议，要么使用协作过滤框架[He et al., 2018;] and [ Shuai Yu, 2019]，要么使用编码器-解码器体系结构来进行推荐[Kang and McAuley, 2018;] and [Zhou et al., 2018]。

近年来，注意力机制以新颖的方式被利用，为研究开辟了新的途径，包括更平滑地整合外部知识库、预训练嵌入、多任务学习、无监督的表示学习、稀疏性学习、原型学习(即样本选择)。

7. Conclusion

本综述，我们讨论了文献中注意力模型的不同使用方式，并试图通过讨论注意力分类法、使用注意力的关键神经网络结构以及受到显著影响的应用领域来概述各种技术。我们讨论了注意力在神经网络中的结合如何显著提高性能，通过促进可解释性，提供了对神经网络内部工作的更深入了解，并通过消除输入的顺序处理提高了计算效率。我们希望本次调查能够更好地了解对这一主题进行研究的不同方向，以及在一个领域中开发的技术如何应用到其他领域。

你可能感兴趣的:(深度学习,自然语言处理,注意力机制,深度学习,自然语言处理,人工智能)

使用 Tokenizers 分割文本：深入了解与实践 AWsggdrg python
在开发应用自然语言处理（NLP）模型时，一个常见的需求是将文本拆分为较小的块，通常称为“tokens”。现代语言模型对tokens的数量有限制，因此在处理长文本时，我们需要仔细计算tokens以避免超过限制。本文将介绍如何使用不同的tokenizer来分割文本，并提供实用代码示例。技术背景介绍自然语言处理中的tokenization是指将文本拆分为更小的、可管理的单元，称为tokens。使用tok
千万年薪招揽AI大牛！罗福莉加盟小米，将如何改变其大模型战略？前端
近年来，人工智能(AI)领域发展迅速，其中大模型技术的突破更是引领着新一轮科技浪潮。AI代码生成器作为AI技术的重要应用，也正逐渐改变着软件开发的模式。1月18日，一则重磅消息震惊业界：DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉将加入小米，并可能领导小米大模型团队，年薪高达千万级别。这一举动不仅体现了小米对AI大模型技术的重视，也预示着小米在大模型领域的战略布局将迎来新
Python数据分析与可视化研究阿尔法星球 python python 数据分析开发语言
Python数据分析与可视化研究摘要随着大数据和人工智能技术的飞速发展，Python数据分析与可视化技术已成为现代科学研究、企业决策等领域不可或缺的工具。本研究全面梳理了Python在数据分析与可视化领域的基本理论框架和关键技术，系统分析了Pandas、NumPy等核心数据分析库以及Matplotlib、Seaborn等可视化库的应用优势与特点。通过实际案例，本研究深入探讨了Python在数据清洗
【AIGC半月报】AIGC大模型启元：2024.07（上） LeeZhao@ AIGC 人工智能 AI Agent
AIGC大模型启元：2024.07（上）(1)AIGVBench-T2V（文生视频基准测评）(2)Gen-3Alpha（Runway）(3)Step-2、Step-1.5V、Step-1X（阶跃星辰开源大模型）(4)InternVL2.0“书生·万象”（上海人工智能实验室）(5)CodeGeeX4-ALL-9B（智谱AI）(6)TTT（全新LLM架构）(1)AIGVBench-T2V（文生视频基准
认知的形式化：数学是建立在明确的公设定理体系之上的高级语言形态 AI架构设计之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
认知形式化，数学语言，公设理体系，高级语言，人工智能，逻辑推理，算法设计1.背景介绍在当今数据爆炸和人工智能飞速发展的时代，如何有效地理解和处理信息成为了一个至关重要的课题。认知科学、人工智能和计算机科学等领域都在积极探索如何将人类的认知能力形式化，并将其转化为可计算的模型。数学作为一种高度抽象和形式化的语言，在认知科学和人工智能领域扮演着至关重要的角色。它为我们提供了描述和推理世界的逻辑框架，并
【cs.AI】25.1.11 arxiv更新速递 hinmer arxiv cs.AI每日更新 chatgpt gpt 人工智能自然语言处理自动驾驶深度学习 aigc
25.1.1012:00-25.1.1112:00共更新75篇—第1篇----=====MultilingualPerformanceofaMultimodalArtificialIntelligenceSystemonMultisubjectPhysicsConceptInventories关键词:多语言,多模态,人工智能,GPT-4,物理教育,物理概念清单链接1摘要:我们研究了一种基于大型语言
【LLM】25.1.11 Arxiv LLM论文速递 hinmer arxiv LLM每日更新 chatgpt gpt 人工智能自然语言处理 ai aigc 深度学习
25.1.1012:00-25.1.1112:00共更新36篇—第1篇----=====Supervisionpoliciescanshapelong-termriskmanagementingeneral-purposeAImodels关键词:通用型人工智能，风险管理，监督政策，模拟框架PDF链接摘要:通用型人工智能（GPAI）模型，包括大型语言模型（LLM）的快速普及和部署，给AI监管实体带来
AI需要的基础数学知识大囚长机器学习大模型人工智能
AI（人工智能）涉及多个数学领域，以下是主要的基础数学知识：1.线性代数矩阵与向量：用于表示数据和模型参数。矩阵乘法：用于神经网络的前向传播。特征值与特征向量：用于降维和主成分分析（PCA）。奇异值分解（SVD）：用于数据压缩和降维。2.微积分导数与偏导数：用于优化算法（如梯度下降）。链式法则：用于反向传播算法。积分：在概率和统计中有应用。3.概率与统计概率分布：如高斯分布、伯努利分布等。贝叶斯定
【包邮送书】你好！Python Mindtechnist 粉丝福利 python 网络开发语言机器学习
欢迎关注博主Mindtechnist或加入【智能科技社区】一起学习和分享Linux、C、C++、Python、Matlab，机器人运动控制、多机器人协作，智能优化算法，滤波估计、多传感器信息融合，机器学习，人工智能等相关领域的知识和技术。关注公粽号《机器和智能》回复关键词“python项目实战”即可获取美哆商城视频资源！博主介绍：CSDN博客专家，CSDN优质创作者，CSDN实力新星，CSDN内容
人工智能与人工计算的发展——孙凝晖院士一位安分的码农大语言模型人工智能
人工智能领域近年来正在迎来一场由生成式人工智能大模型引领的爆发式发展。2022年11月30日，OpenAI公司推出一款人工智能对话聊天机器人ChatGPT，其出色的自然语言生成能力引起了全世界范围的广泛关注，2个月突破1亿用户，国内外随即掀起了一场大模型浪潮，Gemini、文心一言、Copilot、LLaMA、SAM、SORA等各种大模型如雨后春笋般涌现，2022年也被誉为大模型元年。当前信息时代
Python 如何使用 Bert 进行中文情感分析程序员徐师兄 Python 入门专栏 python bert 开发语言情感分析
前言在自然语言处理（NLP）领域，情感分析是一个非常常见且重要的应用。情感分析通常用于识别文本中的情感，例如判断一条微博或评论是正面、负面还是中性。在过去的几年中，随着深度学习的发展，BERT（BidirectionalEncoderRepresentationsfromTransformers）模型迅速成为了处理自然语言的强大工具。BERT是一种基于Transformer架构的预训练模型，它能够
AI时代，需要怎样的架构师？腾讯云架构师峰会来了！架构
引言架构设计对应用有关键性的影响，不仅决定应用的整体品质，还直接影响开发、维护和扩展的难易度。卓越的架构设计不仅能够确保系统的稳定性、高效性和可扩展性，还能大幅提升研发效能，同时显著降低维护成本。在快速变化的技术环境中，架构师们面临业务需求快速迭代、数据量急剧膨胀以及系统复杂性不断提升等挑战。随着云计算、大数据、人工智能等前沿技术的蓬勃发展，一系列创新解决方案如微服务架构、AI大模型、自动化运维工
PyTorch深度学习实战（43）——手写文本识别盼小辉丶深度学习 pytorch 人工智能
PyTorch深度学习实战（43）——手写文本识别0.前言1.手写文本识别1.1基本概念1.2输入和输出格式1.3CTC损失值2.模型与数据集分析2.1数据集分析2.2模型分析3.实现手写文本识别模型小结系列链接0.前言手写文本识别，也称为手写文本的光学字符识别(OpticalCharacterRecognition,OCR)，是计算机视觉和自然语言处理中的一项具有挑战性的任务。与印刷文本不同，手
算法中的时间复杂度和空间复杂度 CM莫问人工智能算法常见概念算法人工智能 python 时间复杂度空间复杂度
一、背景随着人工智能的纵深发展，我们会发现现在做算法很多时候都是通过掉包来解决问题了。Torch或者Tensorflow之类的深度学习库大大减少了算法工程师的工作量，而且在张量运算、反向传播等环节，这些深度学习库的模块设计也尽最大可能地降低了计算的时间和空间复杂度，从而不需要我们额外进行过多的干预。如果不是科班读计算机相关专业的，相信不少朋友第一次听说时间复杂度和空间复杂度的概念是在找工作刷lee
Anthropic 正计划为其聊天机器人 Claude 推出“双向语音模式”和一个新的记忆功能新加坡内哥谈技术人工智能深度学习机器人科技
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/Anthropic正计划为其聊天机器人Claude推出“双向语音模式”和一个新的记忆功能
DeepMind的新突破：GenCast 新加坡内哥谈技术人工智能大数据语言模型
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/如今，人工智能（AI）在天气预报领域的表现已经可以与传统计算方法媲美。然而，AI模型的训
AI跟踪报道第62期-本周AI新闻: 微软推出Copilot的AI Agent和Computer Control 新加坡内哥谈技术人工智能 copilot 大数据
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/油管视频:https://youtu.be/_Egli1MlVWk?si=DIjVm2l
深入理解旋转位置编码（RoPE）及其在大型语言模型中的应用 tangjunjun-owen 语言模型-多模态大模型语言模型人工智能自然语言处理 RoPE 旋转位置编码
文章目录前言一、旋转位置编码原理1、RoPE概述2、复数域内的旋转1、位置编码生成2、应用位置编码二、RoPE的实现细节1、RotaryEmbedding类设计2、apply_rotary_pos_emb函数3、demo_apply_rotary_pos_emb函数三、完整RoPE代码Demo前言随着自然语言处理（NLP）领域的快速发展，预训练的语言模型如BERT、GPT系列、PaLM、Qwen等
360智算中心万卡GPU集群架构分析科技互联人生科技数码人工智能硬件架构系统架构人工智能
360智算中心：万卡GPU集群落地实践 360智算中心是一个融合了人工智能、异构计算、大数据、高性能网络、AI平台等多种技术的综合计算设施，旨在为各类复杂的AI计算任务提供高效、智能化的算力支持。360智算中心不仅具备强大的计算和数据处理能力，还结合了AI开发平台，使得计算资源的使用更加高效和智能化。360内部对于智算中心的核心诉求是性能和稳定性，本文将深入探讨3
ARM Cortex-M3与Cortex-M4权威指南胡妃意
ARMCortex-M3与Cortex-M4权威指南【下载地址】ARMCortex-M3与Cortex-M4权威指南ARMCortex-M3与Cortex-M4权威指南欢迎阅读《ARMCortex-M3与Cortex-M4权威指南（第3版）》，这是一本针对嵌入式系统开发者量身打造的深度学习手册项目地址:https://gitcode.com/Open-source-documentation-tu
python LTP 安装 failed building wheel for pyltp Waldenz NLP Python LTP python ltp wheel failed building wheel
LTP（LanguageTechnologyPlatform）语言技术平台。LTP提供了一系列中文自然语言处理工具，用户可以使用这些工具对于中文文本进行分词、词性标注、句法分析等等工作。主页GitHubpyltpwin10pip直接安装pyltp时的各种报错，Faildbuildingwheelforpyltp或者Runningsetup.pybdist_wheelforpyltp...error
【数据挖掘实战】房价预测机器学习司猫白数据挖掘人工智能 python 机器学习
本次对kaggle中的入门级数据集，房价回归数据集进行数据挖掘，预测房屋价格。本人主页：机器学习司猫白机器学习专栏：机器学习实战PyTorch入门专栏：PyTorch入门深度学习实战：深度学习ok，话不多说，我们进入正题吧概述本次竞赛有79个解释变量（几乎）描述了爱荷华州艾姆斯住宅的各个方面，需要预测每套住宅的最终价格。数据集描述本次数据集已经上传，大家可以自行下载尝试文件说明train.csv-
AI赋能电商：从个性化推荐到智能化运营 w(ﾟДﾟ)w吓洗宝宝了当下编程领域的分析大数据人工智能
引言随着互联网技术的飞速发展，电子商务已经成为人们日常生活的重要组成部分。然而，在激烈的市场竞争中，如何提升销售效率和用户体验成为了电商平台面临的主要挑战。近年来，人工智能（AI）技术的迅猛发展为这一挑战提供了新的解决方案。从个性化推荐到会员分类，从商品定价到供应链管理，AI技术的应用不仅提高了电商平台的运营效率，还极大地提升了用户的购物体验。本文将深入探讨AI技术在电商领域的多种应用场景，分析其
GPT-4对话模型在客服中的应用与前景：开启智能客服新时代 Echo_Wish 前沿技术人工智能 python 人工智能 gpt
GPT-4对话模型在客服中的应用与前景：开启智能客服新时代随着人工智能技术的迅猛发展，基于深度学习的对话模型在各个领域中得到了广泛应用。其中，GPT-4对话模型在客服系统中的应用尤为引人注目。本文将探讨GPT-4在客服中的应用与未来发展前景，并结合具体代码示例进行说明。一、GPT-4对话模型概述GPT-4（GenerativePre-trainedTransformer4）是OpenAI开发的一种
用GANs生成艺术作品的创新探索：人工智能与艺术的奇妙碰撞 Echo_Wish 前沿技术人工智能人工智能 gan python
用GANs生成艺术作品的创新探索：人工智能与艺术的奇妙碰撞随着人工智能技术的飞速发展，生成对抗网络（GenerativeAdversarialNetworks，GANs）在图像生成、视频生成、音频合成等领域展现出了惊人的创造力。特别是在艺术创作方面，GANs以其独特的生成能力，为艺术家和创作者提供了新的灵感和工具。本文将探讨GANs在艺术作品生成中的应用与创新，并通过具体代码示例展示其实现过程。一
【AI日志分析】基于机器学习的异常检测：告别传统规则的智能进阶网罗开发 AI 大模型人工智能机器学习
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
Copilot 概述计算机萍萍学姐 copilot copilot 人工智能机器学习
Copilot是什么？它有什么用途？Copilot是由人工智能公司和GitHub合作开发的一个基于人工智能的代码提示工具，它可以利用机器学习技术和大量训练数据生成高质量的代码。Copilot的目标是在保持代码质量和可读性的前提下，提高开发者的编码效率，使得编码工作更为高效和便捷。Copilot的出现是解决编程过程中可能遇到的一些难点和瓶颈问题，特别是在快速迭代的敏捷开发场景中，提高编码效率和减少编
模型压缩与优化技术——神经架构搜索（Neural Architecture Search, NAS） DuHz 轻量化模型机器学习计算机视觉人工智能神经网络深度学习数据挖掘语音识别
模型压缩与优化技术中的神经架构搜索（NeuralArchitectureSearch,NAS）技术1.引言在深度学习领域，神经网络的架构设计对模型的性能至关重要。传统的手动设计网络架构的过程费时费力，且通常依赖于经验和直觉。为了提升效率与效果，神经架构搜索（NeuralArchitectureSearch,NAS）作为一种自动化的方法，能够通过算法寻找和优化最佳的神经网络架构。NAS可以在图像识别
大模型密度定律：AI代码生成器将迎来爆发式增长？前端
近年来，人工智能（AI）技术飞速发展，尤其是在代码生成领域，涌现出许多强大的AI代码生成器。清华大学刘知远团队近期提出的“大模型密度定律”，为我们理解AI技术的发展速度提供了新的视角，也预示着AI代码生成技术的未来发展趋势。该定律指出，模型能力密度每3.3个月翻倍，这将如何改变我们对AI发展的认知，并对AI代码生成器产生怎样的影响呢？让我们深入探讨。大模型密度定律：能力密度与指数级增长“大模型密度
面向 Data+AI 的统一数据目录探索 | Data Infra NO.22 回顾（含资料发布）数据库
随着生成式人工智能（GenerativeAI）的崛起，从图像生成、自然语言处理到个性化推荐系统，生成式AI技术正迅速改变着各行各业的面貌。而在这场变革背后，数据的管理和治理显得尤为重要。对于企业来说，数据不仅是基础资源，更是构建AI应用和增强业务能力的关键。ApacheGravitino（incubating）与Databend作为数据领域两个知名的开源项目，正通过各自的创新技术和实践，为数据管理
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$