piaocoder

Transfomer XL翻译

翻译：***
审核：yphacker
原论文
论文代码

Transfomer XL翻译

摘要
1.简介
2.相关工作
3.模型

3.1 普通的Transformer模型
3.2 Segment-Level重复使用的情况
3.3 相对位置编码

4.实验

4.1主要成果
4.2 Ablation研究
4.3 Relative Effective Context Length
4.4 Generated Text
4.5评估速度

5. 结论
感谢

摘要

Transformers 具有学习longer-term dependency的潜力，但在语言模型设置中受到固定长度的上下文的限制。我们提出了一种新的 Transformers-XL，它可以在不破坏时间一致性的情况下，使学习 dependency超出固定长度的限制。它包括一种分段recurrence机制和一种新的位置编码方案。我们的方法不仅能够捕获longer-term的 dependency关系，而且还解决了上下文fragmentation问题。因此，TransformerXL学习的 dependency比RNNs长80%，比vanilla Transformers长450%，在短序列和长序列上都获得更好的性能，在评估期间比vanilla Transformers快1800多倍。值得注意的是，我们将enwiki8上的bpc/perplexity的最新结果提高到0.99，text8提高到1.08，WikiText-103提高到18.3，Billion Word提高到21.8，Penn Treebank提高到54.5（无微调）。当只在WikiText-103上进行训练时，Transformer XL设法生成具有数千个标记的合理连贯、新颖的文本文章。我们的代码、预训练模型和超参数在Tensorflow和PyTorch1中都可用。

1.简介

语言模型是需要模型longer-term dependency关系的重要问题之一，成功的应用包括无监督的预训练（Dai and Le，2015；Peters et al.，2018；Radfordtal.，2018；Devlinetal.，2018）。然而，要使神经网络具有对序列数据进行longer-term dependency模型的能力，一直是一个挑战。递归神经网络（RNN），特别是长短期记忆（LSTM）网络（Hochreiter和Schmidhuber，1997），已经成为语言模型的标准解决方案，并在多个基准上获得了很好的结果。尽管RNN具有广泛的适应性，但由于梯度消失和爆炸，很难进行优化（Hochreiter等人，2001），在LSTMs中引入选通和梯度剪裁技术（Graves，2013）可能不足以完全解决这个问题。根据经验，先前的研究发现，LSTM语言模型平均使用200个上下文单词（Khandelwal等人，2018年），表明还有进一步改进的空间。

另一方面，在注意机制中烘焙的长距离词对之间的直接连接可能会简化优化，并使longer-term dependency的学习成为可能（Bahdanau等人，2014；Vaswani等人，2017）。最近，Al-Rfou等人。（2018）设计了一组辅助损耗，用于训练用于字符级语言模型的Transformer 网络，其性能大大优于LSTMs。尽管取得了成功，但在Al-Rfou等人的LM培训。（2018）在几百个字符的独立固定长度段上执行，没有跨段的任何信息流。由于固定的上下文长度，模型无法捕获超出预定义上下文长度的任何longer-term dependency项。此外，固定长度的段是通过选择一个连续的符号块而创建的，而不考虑句子或任何其他语义边界。因此，该模型缺乏必要的上下文信息来很好地预测前几个符号，从而导致效率低下的优化和性能低下。我们把这个问题称为上下文fragmentation。

为了解决上述定长上下文的局限性，我们提出了一种称为Transformer XL（意思是超长）的新架构，我们在arXiv:1901.02860v3[cs.LG]2009年6月2日的self-attention网络中引入了recurrence的概念。特别是，我们不再从头开始计算每个新段的隐藏state，而是重用以前段中获得的隐藏state。重用的隐藏state用作当前段的内存，从而在段之间建立一个循环连接。因此，模型非常longer-term的 dependency成为可能，因为信息可以通过 recurrence 连接传播。同时，从上一个片段传递信息也可以解决上下文fragmentation的问题。更重要的是，我们展示了使用相对位置编码而不是绝对位置编码的必要性，以便在不造成时间混乱的情况下实现state重用。因此，作为一个额外的技术贡献，我们引入了一个简单但更有效的相对位置编码公式，该公式将attention长度开扩到比训练期间观察到的更长的时间。

2.相关工作

在过去几年中，语言建模领域取得了许多重大进展，包括但不限于设计新的架构以更好地编码上下文（Bengioet al.，2003；Mikolov et al.，2010；Merity et al.，2016；al Rfou et al.，2018），改进正则化和优化算法（Gal and Ghahramani，2016），加快Softmax计算（Grave等人，2016a），丰富distribution family产量（Yang等人，2017）。

为了在语言模型中捕获long-range上下文，一行工作直接将更广泛上下文的表示作为附加输入输入输入到网络中。现有的工作包括手动定义上下文表示的工作（Mikolov和Zweig，2012；Ji等人，2015；Wang和Cho，2015）以及 dependency从数据中学习到的文档级主题的其他工作（Dienget al.，2016；Wang等人，2017）。

更广泛地说，在通用序列模型中，如何捕获longer-term dependency关系一直是一个longer-term的研究问题。从这个角度来看，由于LSTM的普遍适应性，人们在消除消失梯度问题上付出了很多努力，包括更好的初始化（Leetal.，2015）、额外的丢失信号（Trinhetal.，2018）、增强的存储结构（Keetal。，以及其他修改RNN内部架构以简化优化的方法（Wu等人，2016；Li等人，2018）。与之不同的是，我们的工作基于Transformer架构，并表明语言模型作为一个真实的任务受益于学习longer-term dependency的能力。

3.模型

给定一个标记x=（x1；：：：；x t）的语料库，语言模型的任务是估计joint概率P（x），它通常被auto-regressively 分解为P（x）=qtp（xtjx

3.1 普通的Transformer模型

为了应用Transformer或self-attention tomlanguage建模，核心问题是如何训练Transformer将任意长的上下文有效地编码成固定大小的表示，一个简单的解决方案是使用一个无条件的unconditional Transformer 来处理整个上下文序列，类似于一个feed-forward neural 网络，但是在实际应用中，由于资源有限，这通常是不可行的。

图1：分段长度为4的vanilla模型的图解。

一种可行但粗糙的近似方法是将整个语料库分割成可接受大小的人的较短片段，并且只在每个片段中训练模型，而忽略以前片段中的所有上下文信息。这是Al-Rfou等人采用的想法。（2018年）。我们称之为vanilla模型，可以在图1a中看到。在这种训练规范下，信息不会在向前或向后的过程中跨段流动。使用固定长度上下文有两个关键限制。首先，最大可能的 dependency项长度由段长度上界，在字符级语言模型中，段长度是几百（Al-Rfou等人，2018）。因此，虽然与RNNs相比，消失梯度问题对self-attention机制的影响较小，但vanilla模型并不能充分发挥这一优化优势。第二，尽管可以使用填充来尊重句子或其他语义边界，但实际上，由于效率的提高，将长文本简单地分块成固定长度的片段一直是标准做法（Peters等人，2018；Devlin等人，2018；al-Rfou等人，2018）。然而，简单地将一个序列分块成固定长度的片段将导致第1节中讨论的上下文fragmentation问题。

在评估过程中，在每个步骤中，vanilla模型也会消耗与训练相同长度的一个片段，但只在最后一个位置进行一次预测。然后，在下一步中，段只向右移动一个位置，新的段必须从头开始处理。如图1b所示，此过程确保每次预测都利用训练期间尽可能长的暴露上下文，并且还缓解训练中遇到的上下文fragmentation问题，这个评估程序非常昂贵。我们将证明我们提出的架构能够显著提高评估速度。

3.2 Segment-Level重复使用的情况

为了解决使用固定长度上下文的局限性，我们建议在Transformer架构中引入vanilla机制。在训练过程中，为前一段计算的隐藏state序列是固定的，并被缓存，以便在模型处理下一个新段时作为扩展上下文重用，如图所示。2a.尽管梯度仍然保持在一个段内，但是这个额外的输入允许网络利用历史中的信息，从而能够使模型longer-term dependency关系并避免上下文fragmentation。形式上，让长度L的两个连续段分别为sτ=[xτ；1；···；xτ；L]和sτ+1=[xτ+1；1；···；xτ+1；L]。用nτ2rl×d表示为τ-th段sτ产生的第n层隐藏state序列，其中d是隐藏维数，然后（示意性地）为sτ+1段产生的第n层隐藏state如下：

其中，函数SG（·）表示停止梯度，符号hu·hv表示两个隐藏序列沿长度维度的串联，W表示模型参数。与标准Transformer相比，关键区别在于，键knτ+1和值vτn+1取决于扩展上下文hen-1τ+1，因此hn-1τ从上一段缓存。我们通过图2a中的绿色路径强调这一特殊设计。

图2：具有4段长度的Transformer-XL模型的图示。

当这种recurrence机制应用于一个语料库的每两个连续的片段时，它实质上在隐藏state下创建了一个segment-level 的 recurrence。因此，所使用的有效上下文可以远远超过两个片段，但是注意，hnτ+1和hnτ-1之间的recurrent dependency使每个片段向下移动一层，这不同于传统RNN LMs中的same-layer recurrence。因此，最大可能的 dependency长度线性增长w.r.t.层的数量和段的长度，即O（N×L），如图2b中阴影区域所示。这类似于之前版本的BPTT（Mikolov等人，2010），一种为训练rnnlm而开发的技术。但是，与之前版本的BPTT不同，我们的方法缓存的是按顺序排列的隐藏state，而不是最后一个state，应该与第3.3节中描述的相对位置编码技术一起应用。

除了实现超长上下文和解决fragmentation问题外，recurrence方案带来的另一个好处是评估速度大大加快。具体来说，在评估过程中，可以重复使用前面部分的表示，而不是像vanilla模型那样从头开始计算。在我们在enwiki8上的实验中，Transformer XL在评估过程中比vanilla模型快1800多倍（见第4节）。

最后，请注意，recurrence方案不需要仅限于前一段。理论上，我们可以在GPU内存允许的情况下缓存尽可能多的先前段，并在处理当前段时将它们全部作为额外上下文重用。因此，我们可以缓存跨越（可能）多个段的预训练长度为M的旧隐藏state，并将其称为内存mnτ2 RM×d，这是由于与内存增强nerve网络的清晰连接（graves et al.，2014；Weston etal.，2014）。在我们的实验中，我们在训练过程中将M设置为分段长度，并在评估过程中多次增加。

3.3 相对位置编码

以便重复使用隐藏的state。也就是说，在重复使用state时，如何保持位置信息的一致性？回想一下，在标准Transformer中，序列顺序信息由一组位置编码提供，表示为U 2 RLmax×d，其中第i行Ui对应于段内的第i绝对位置，Lmax规定了模型的最大可能长度。然后，Transformer的实际输入是单词嵌入和位置编码的元素相加。如果我们简单地将这种位置编码应用于我们的recurrence机制，隐藏state序列将通过
$h τ + 1 = f （ h τ ； E s τ + 1 + U 1 : L ） h τ = f （ h τ - 1 ； E s τ + U 1 : L ）；$

式中，Esτ2rl×d是sτ的字嵌入序列，f表示变换函数。请注意，Esτ和Esτ+1都与相同的位置编码U1:L相关联。因此，对于任何j=1；：：：；L，模型都没有信息来区分xτ；j和xτ+1；j之间的位置差，从而完全导致性能的损失。

为了避免这种失效的state，基本思想是只对隐藏state下的相对位置信息进行编码。从概念上讲，位置编码为模型提供了一个时间线索或关于信息应该如何收集的“bias”，即，在哪里参与。出于同样的目的，我们可以将相同的信息注入到每一层的attention score中，而不是静态地将bias加入到初始嵌入中。更重要的是，用一种相对的方式来定义时间bias更为直观和普遍。例如，当一个查询向量qτ；i在关键向量kτ；≤i上参与时，不需要知道每个关键向量的绝对位置来识别片段的时间顺序。相反，只需知道每个键向量kτ；j与其自身qτ；i，即i-j之间的相对距离就足够了。实际上，可以创建一组相对位置编码R 2 RLmax×d，其中第i行Ri表示两个位置之间i的相对距离。通过将相对距离动态地加入到attention score中，查询向量可以很容易地区分xτ；j和xτ+1；j的不同距离表示，使得state重复使用机制成为可能。同时，我们不会丢失任何时间信息，因为绝对位置可以从相对距离的recurrence找到。

此前，相对位置编码的思想已经在machine translation（Shawetal.，2018）和music generation（Huangetal.，2018）的背景下进行了探索。这里，我们提供了一种不同的推导，得出了一种新的相对位置编码形式，它不仅与绝对位置编码有一对一的对应关系，而且与绝对位置编码也有一对一的对应关系在empirically上有更好的概括（见第4节）。首先，在标准Transformer（Vaswani等人，2017）中，按照只 dependency相对位置信息的思想，将查询qi和同一段内的密钥向量kj之间的attention score进行分解，我们建议的四个reparameterize如下

根据只 dependency相对位置信息的思想，我们建议四个reparameterize如下

我们所做的第一个改变是将用于计算（b）和（d）项中的密钥向量的绝对位置嵌入Uj的所有外观替换为其相对对应的Ri-j。这基本上反映了只有相对距离才对attend有影响。注意，R是一个正弦编码矩阵（Vaswani等人，2017），没有可学习的参数。
其次，我们引入一个可训练的参数U 2 Rd来替换 query U>i Wq>（c）。在这种情况下，由于query向量对于所有query位置都是相同的，因此建议不管query位置如何，对不同单词的 attentive bias 都应该保持不变。通过类似的推理，在术语（d）中添加一个可训练的参数v2rd来代替U>i Wq>。
最后，我们故意将两个权重矩阵Wk；E和Wk；R分开，分别生成基于内容的密钥向量和基于位置的密钥向量。

在新的parameterization 下，每个term 都有一个直观的含义：term（a）表示基于内容的寻址，term（b）bias捕获 dependency内容的位置，term（c）bias控制全局内容，和（d）bias编码全局位置。

相比之下，Shaw等人（2018）中的公式只有（a）和（b）项，去掉了（c）和（d）两个bias项。此外，Shaw等人（2018年）将multiplication WkR合并为单个可训练矩阵R^，从而放弃了原始的sinusoid位置编码中内置的inductive bias（Vaswani等人，2017年）。相比之下，我们的相对位置嵌入R适应sinusoid公式。作为inductive bias的一个优点，在一定长度的存储器上训练的模型在评估过程中可以自动地推广到更长的存储器。

将recurrence机制与我们提出的相对位置嵌入相结合，我们最终得到了Transformer XL架构。为了完整起见，我们总结了一个N层Transformer XL的计算过程。对于n=1；：：；n:

h0τ：=Esτ定义为单词嵌入序列。此外，值得一提的是，计算a的简单方法需要计算所有对（i；j）的Wk；R n Ri-j，其代价是序列长度的二次w.R.t。然而，注意到i-j的值只在0到序列长度之间变化，我们在附录B中给出了一个简单的计算过程，它降低了将序列长度线性化的成本。

4.实验

4.1主要成果

我们将Transformer XL应用于单词级和字符级语言模型的各种数据集，以与当前系统的状态进行比较，包括WikiText-103（Merityetal.，2016）、enwik8（LLC，2009）、text8（LLC，2009）、One Billion Word （Chelba et al.，2013）和Penn Treebank（Mikolov and Zweig，2012）。

图1:WikiText-103上最新结果的比较。表示当代作品。

图2:enwik8的最新结果对比。

WikiText-103是目前最大的具有longer-term dependency的单词级语言模型基础。它包含来自28K篇文章的103M个训练 token，每篇文章的平均长度为3.6K个 token，这允许测试longer-term dependency模型的能力。在训练中我们将attention 长度设置为384，在评估中设置为1600。我们采用了自适应softmax和representations输入（Baevski和Auli，2018；Grave等人，2016a）。如图1所示，Transformer XL将先前的state-of-theart（SoTA）perplexity状态从20.5减少到18.3，这表明Transformer XL架构的优越性。

数据集enwik8包含100M字节未处理的Wikipedia文本。我们将我们的体系结构与图2中先前的结果进行了比较。在模型大小约束下，12层Transformer XL实现了一个新的SoTA结果，其性能优于来自Al-Rfou等人的12层vanilla Transformer。（2018）到0.05，而Transformer variants比传统的RNN-based模型有很大的差距。值得注意的是，我们的12层架构实现了与Al-Rfou等人的64层网络相同的结果。（2018年），仅使用参数预算的17%。为了验证增大模型尺寸是否能获得更好的性能，我们对18层和24层Transformer-XLs进行了模型尺寸增大的训练。训练时的注意长度为784，评估时的注意长度为3800，我们得到了一个新的SoTA结果，并且我们的方法在 widely-studied的特征水平基准上首次突破了1.0。不同于Al-Rfou等人。（2018年），Transformer XL不需要任何辅助损耗，因此所有的好处都归功于更好的架构。

图3:text8与最新结果的比较

图4：与One Billion Word的最新结果的比较。表示当代作品。

与enwik8类似但不同的是，text8包含100个经过处理的Wikipedia字符，这些字符是通过降低文本大小写并删除除26个字母a到z以外的任何字符和空格创建的。由于两者的相似性，我们只需将enwik8上的最佳模型和相同的hyper parameters调整为text8，而无需进一步调整。图3总结了与以往方法的比较。同样，Transformer XL以一个清晰的边距实现了新的SoTA结果。

图5：与Penn Treebank最新结果的比较。y表示使用two-step微调。

One Billion Word 单词不会保留任何longer-term的 dependency，因为句子被重新了。因此，该数据集主要测试仅对短期 dependency模型的能力。Transformer XL与其它方法的比较如图4所示。虽然Transformer XL主要是为了更好地捕获longer-term dependency而设计的，但是它以显著地成绩将单一模型SoTA从23.7改进到21.8。具体来说，Transformer XL明显优于使用vanilla Transformers的当代方法（Baevski和Auli，2018），这表明Transformer XL的优势可以推广到模型短序列。

我们还在图5中报告单词级Penn Treebank的结果。与AWD-LSTM（Merity等人，2017）类似，我们对Transformer XL应用了variational dropout和 weight average 。通过proper regularization，Transformer XL在没有two-step调整的模型之间获得了新的SoTA结果。Penn Treebank只有100万个训练token，这意味着Transformer XL甚至在小数据集上也具有很好的通用性。

4.2 Ablation研究

我们进行了两组ablation研究，以检验两种在Transformer XL中使用的技术的效果：recurrence机制和新的位置编码方案。

第一项研究是在WikiText-103上进行的，它需要对长期 dependency模型，结果见图6。在比较的编码方案中，Shaw等人。（2018）是相对的，而Vaswani等人。（2017）和Al-Rfou等人。（2018）是绝对的。“Full”和“half”损失是指将cross entropy损失应用于该段的所有或最近的半个位置。我们发现绝对编码只适用于half损失，因为half损失排除了训练期间attention长度很短的位置，以便更好地泛化。图6显示了recurrence机制和我们的编码方案对于获得最佳性能以及在评估期间推广到更长的attention序列都是必要的。虽然训练过程中的反向传播长度只有128，但使用这两种技术，测试时的attention长度可以增加到640。在151M参数的标准设置中，随着attention长度的增加，perplexity 降低。

由于recurrence机制需要额外的内存，因此我们还比较了Transformer XL与相同GPU内存约束下的同一代。如附录A中的表10所示，尽管使用较短的反向传播长度，Transformer XL仍然优于同一代。

第二项研究的目标是从捕获更长的上下文长度中分离出解决上下文fragmentation问题的效果。为了实现这一目标，我们特意选择了一个不需要长期 dependency的数据集，这样，从建立recurrence开始的任何改进都可以归因于解决上下文fragmentation。具体来说，我们在One Billion Word的数据集上执行这个控制实验，这只会从移除上下文fragmentation中受益。我们训练了一个20层Transformer XL和∼0.3B参数为400K步。如表7所示，即使不需要long-term dependency，使用segment-level recurrence也能显著提高性能，这与我们之前关于recurrence机制解决上下文 fragmentation问题的讨论是一致的。此外，我们的相对位置编码也优于Shaw等人。（2018）关于短序列。

4.3 Relative Effective Context Length

图6：WikiText-103的Ablation研究。对于前两个模块，我们使用一个稍小的模型（128M参数）。y表示相应的行减少到与中的Transformer 网络相同的设置（Al-Rfou et Al.，2018），只是我们的实验中没有实现两个辅助损耗。“PPL init”是指使用与训练相同的长度，“PPL best”是指使用最佳长度所获得的perplexity。“Attn Len”是评价过程中为达到相应结果（PPL-best）而尽可能短的attention长度。在评估期间增加attention长度仅在使用我们的位置编码时提高性能。“Transformer XL（151M）”设置使用标准参数预算作为先前的工作（Merity等人，2018），在评估期间增加attention长度时我们观察到类似的效果。

表7：One Billion Word的Ablation研究，一个没有long-term dependency的数据集。

图8：Relative effective context length （RECL）比较。RECL和r的定义见正文。在计算RECL时，前三个模型和后四个模型作为两个模型组进行比较（RECL是根据模型组而不是单个模型计算的）。每个组都有相同的budget参数。

图9：评估期间运行时间的减慢。评估基于一个GPU上的每个token时间。

Khandelwal等人。（2018）提出了一种评估序列模型Effective Context Length（ECL）的方法。ECL是增加上下文范围将导致增益超过阈值的最长长度。然而，ECL忽略了这样一个事实，即当一个模型仅使用较短的上下文就已经达到较低的 perplexity时，很难得到改进，因此它不适合在多个模型之间进行公平比较。我们提出了一种新的度量方法，称为 Relative Effective Context Length（RECL）。RECL是在一个模型组而不是单个模型上定义的，长上下文的增益是通过相对于最佳短上下文模型的相对改进来衡量的。因此，模型组共享相同的一代以实现公平比较。RECL还有一个参数r，这意味着限制top-r 示例的比较。如图8所示，Transformer XL在r=0:1的情况下，成功地建立了平均900字长的 dependency模型。Transformer xl的重合度分别比recurrence网络和Transformer 长80%和450%。recurrence机制和我们的位置编码都有助于延长RECL。这进一步证实了我们的论点，即Transformer XL能够对长期 dependency模型。

4.4 Generated Text

只在中等大小的WikiText-103上训练，Transformer XL已经能够用数千个标记生成相对一致的文章，而无需手动挑选，尽管有一些小缺陷。示例见附录E。

4.5评估速度

最后，我们将模型的评估速度与vanilla Transformer模型进行了比较（AlRfou等人，2018）。如图9所示，由于采用了状态重用方案，在评估期间，变Transformer XL的速度提高了1874倍。

5. 结论

Transformer XL获得了很强的perplexity结果，比RNNs和Transformer建立了longer-term的依赖模型，在评估过程中获得了显著的加速，并且能够生成连贯的文本文章。我们展望了Transformer XL在文本生成、unsupervised 特征学习、图像和语音模型等领域的有趣应用。

感谢

ZD和YY部分由国家科学基金会（NSF）在IIS-1546329拨款项下和DOE科学办公室在ASCR-KJ040201拨款项下提供支持。ZY和RS部分由海军研究办公室拨款N000141812861、NSF拨款IIS1763562、Nvidia奖学金和Siebel奖学金资助。

你可能感兴趣的:(论文翻译)

【论文翻译】GOT-OCR论文翻译——General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model 机器白学论文翻译 ocr 论文阅读论文翻译
论文原文链接：https://arxiv.org/abs/2409.01704特别声明，本文不做任何商业用途，仅作为个人学习相关论文的翻译记录。本文对原文内容直译，一切以论文原文内容为准，对原文作者表示最大的敬意。如有任何侵权请联系我下架相关文章。目录通用OCR理论：通过统一的端到端模型迈向OCR-2.00摘要1引言2相关工作2.1传统OCR2.2基于LVLM的OCR3通用OCR理论3.1框架3.
论文翻译：A survey on large language model (LLM) security and privacy: The Good, The Bad, and The Ugly CSPhD-winston-杨帆论文翻译 LLMs-鲁棒性语言模型人工智能自然语言处理
Asurveyonlargelanguagemodel(LLM)securityandprivacy:TheGood,TheBad,andTheUglyhttps://www.sciencedirect.com/science/article/pii/S266729522400014X文章目录关于大型语言模型（LLM）安全性和隐私的调查：好的、坏的和丑陋的摘要1.引言2.背景2.1大型语言模型（L
论文翻译：arxiv-2022 Ignore Previous Prompt: Attack Techniques For Language Models CSPhD-winston-杨帆论文翻译 LLMs-安全 prompt 语言模型人工智能
IgnorePreviousPrompt:AttackTechniquesForLanguageModelshttps://arxiv.org/pdf/2211.09527忽略之前的提示：针对语言模型的攻击技术文章目录忽略之前的提示：针对语言模型的攻击技术摘要1引言摘要基于Transformer的大型语言模型（LLMs）为大规模面向客户的应用程序中的自然语言任务提供了强大的基础。然而，探索恶意用户
论文翻译：arxiv-2024 Data Contamination Quiz: A Tool to Detect and Estimate Contamination in Large CSPhD-winston-杨帆 LLMs-数据污染论文翻译语言模型人工智能深度学习
DataContaminationQuiz:ATooltoDetectandEstimateContaminationinLargeLanguageModelshttps://arxiv.org/abs/2311.06233数据污染测验：一种检测和估计大型语言模型中污染的工具文章目录数据污染测验：一种检测和估计大型语言模型中污染的工具摘要1引言摘要我们提出了数据污染测验（DataContamina
实验DAY5：借假修真放逐997
a.昨日完成情况不佳，起床是9.30，除了报名（一口气报了五门..祝我好运），论文翻译和教育都没有完成；b.明日计划：9点前起床；明天优先复盘教育，以及准备cpa的考试资料；论文、和cpa留到周末做吧c.今天读到一篇讲美团公司战略的文章，对于整体战略搭建的方法论、具体业务的促成、以及更偏意识上层的“借假修真”思想的解读非常佩服，摘录核心如下：美团的增长引擎：1.严明的纪律性：放弃不符合业务逻辑的利
开源Bluespec bsc编译器和可重用示例设计达坦科技DatenLord 硬件加速 fpga fpga开发硬件工程开源
这篇介绍Bluespec以及设计示例的文章，是在2021年ICCAD（InternationalConferenceOnComputer-AidedDesign）发布的论文。达坦科技的open-rdma项目和推广的MIT体系结构学习社区都用到Bluespec，因此将此论文翻译成中文，以便大家了解2020年Bluespec开源后相关的开源项目。摘要：bsc编译器是一个商业可用的编译器，在过去的二十年
论文翻译 - BITE: Textual Backdoor Attacks with Iterative Trigger Injection anniewwy LLM Backdoor Attack
论文链接：https://arxiv.org/pdf/2205.12700.pdf项目代码：https://github.com/INK-USC/BITEBITE:TextualBackdoorAttackswithIterativeTriggerInjectionAbstract1Introduction2ThreatModel3Methodology3.1BiasMeasurementonLa
我做这件事，唯一的目的就是让你开心沉吟大叔
一个男人心里满满的爱意：我做这件事，唯一的目的就是让你高兴，而不是赢得你的好感、证明我的能力、让你对我感恩戴德。所以，我不想让你知道我的付出，不想让你对我怀有歉意和内疚，更不想因此获得什么回报。我只是心甘情愿地想为你做点什么，因为我爱你。这才是真爱吧。以前有个读者，说她男朋友特别小气，还不诚实。请她吃顿饭要念叨很久，给她买礼物，花一百要说成三百，帮她做论文翻译，明明一小时就搞定了，非要说是熬了个通
剖析以太坊上的庞氏骗局：识别、分析和影响卷神
区块链安全防护论文翻译：Bartoletti,Massimo,etal."DissectingPonzischemesonEthereum:identification,analysis,andimpact."FutureGenerationComputerSystems102(2020):259-277.摘要：庞氏骗局是一种以高额利润为诱饵的金融欺诈。实际上，只有新用户加入了庞氏骗局，用户才能得
《 HFContractFuzzer: Fuzzing Hyperledger Fabric Smart Contractsfor Vulnerability Detection》论文翻译 WXF_Security 智能合约安全研究 fabric golang
《HFContractFuzzer:FuzzingHyperledgerFabricSmartContractsforVulnerabilityDetection》（EASE2021）摘要区块链技术以其特有的去中心化、不可变性等优点，近年来被广泛应用于各个领域。运行在区块链上的智能合约在去中心化应用场景中也扮演着越来越重要的角色。因此，自动检测智能合约中的安全漏洞成为区块链技术应用中亟待解决的问题
Data Augmentation and Deep Learning Methods in SoundClassification: A Systematic Review ggqyh 深度学习人工智能
文章为翻译，仅供学习参考论文原地址：DataAugmentationandDeepLearningMethodsinSoundClassification:ASystematicReview作者：OlusolaO.Abayomi-Alli,RobertasDamaševiˇcius,AtikaQazi,MariamAdedoyin-OloweandSanjayMisra4论文翻译地址：https:
因果学习及反因果学习（论文翻译）三分钟湿度
OnCausalandAnti-causalLearning本博文对论文OnCausalandAnti-causalLearning的摘要和模型部分做了翻译和小修改，本论文主要描述因果学习中常见的几类基于函数估计的模型，同时说明了因果与相关性、因果学习与机器学习之间的关系，论文重点在讨论和比较不同模型，内容较为笼统，不做深入探讨，但对不同模型之间的本质关系的讨论值得一看。论文地址：https://
Convolutional Neural Networks for No-Reference Image Quality Assessment 论文翻译亚里论文阅读 NR-IQA 使用卷积网络进行图像质量评价
ConvolutionalNeuralNetworksforNo-ReferenceImageQualityAssessment论文翻译TranslationAbstract1Introduction2RelatedWork3CNNforNR-IQA3.1NetworkArchitecture3.2LocalNormalization3.3Pooling3.4ReLUNonlinearity3.5
有道论文翻译接口，python版和lua版 monsterskiller 手机编程脚本编程 python
论文翻译接口python版importrequestsimporthashlibfromurllib.parseimportquotedefget_md5(s,is_hex=True):md5=hashlib.md5()md5.update(s.encode())ifis_hex:returnmd5.hexdigest()returnmd5.digest()deftranslate(source_
医学论文翻译有哪些要求，应该如何翻译呢？英信翻译公司其他
近年来，随着国内医学水平的不断提高，医学论文翻译的需求也呈现出快速增长的趋势。在国外期刊上发表论文，往往需要将整篇论文翻译成英文。那么，医学论文翻译有哪些要求，应该如何翻译呢？专家指出，医学论文翻译最基本的要求就是准确性，要求翻译者能够准确地将原文的含义传达给读者，不出现歧义或者误解的情况。这要求翻译者具备深厚的医学专业知识和语言能力，能够理解原文的含义，并将其准确地表达出来。除了准确性之外，医学
GPT原始论文：Improving Language Understanding by Generative Pre-Training论文翻译 iKang_dlut gpt 人工智能深度学习
1摘要自然语理解包括文本蕴含、问题回答、语义相似性评估和文档分类等一系列多样化的任务。尽管大量未标注的文本语料库很丰富，但用于学习这些特定任务的标注数据却很稀缺，这使得基于区分性训练的模型难以充分发挥作用。我们展示了通过在多样化的未标注文本语料库上对语言模型进行生成式预训练，随后对每个特定任务进行区分性微调，可以实现这些任务的大幅度改进。与以往的方法不同，我们在微调过程中使用了任务感知的输入转换，
【论文翻译】Generation of Non-Deterministic Synthetic Face Datasets Guided by Identity Priors（21.12）联系丝信计算机视觉
文章目录读后感Abstract1Introduction1.1Ourcontributions2RelatedWorks2.1SyntheticImageGeneration2.2MatedSampleGeneration2.3LimitationsinState-of-the-art3PCA-FR-GuidedSampling4SyntheticMatedFace(SymFace)Dataset
ORB-SLAM2代码学习1 rgdb_tum.cc Dziwu SLAM 学习计算机视觉人工智能
论文翻译参考1参考2rgdb_tum.cc的框架代码大致思路LoadImages()加载图像——判断rgb图是否存在——判断rgb图与depth图数量是否对应相同。ORB_SLAM2::SystemSLAM()初始化，创建SLAM系统，并初始化各个线程。遍历每一对RGB图和depth图【读取RGB图和depth图，读取时间戳（vTimestamps存储了时间戳，实际上就是存储了数据文件的每一幅图像
GFS--Google File System论文翻译和理解不争_900c
一、系统设计目标高可用的大文件分布式文件系统。二、关键点Architecture-架构：有哪些Server，每个Server的功能。Master存储的MetaData的结构。client写数据流程。client读数据流程。启动时Master和ChunkServer的交互。ChunkServer发生故障时，Master和ChunkServer的交互。三、核心设计概述2.Master中存储的MetaD
翻译 5765f3fa240e
对于论文翻译，大家要极其重视阅读平行文本和查资料的重要性。我平时经常做论文翻译和润色，每一次都是如履薄冰。需要阅读核心参考文献，查资料消除术语，彻底领会论文背后的逻辑。这些都解决了，才轮到运用语言基本功。假如大家接论文翻译，请认真对待查资料和阅读平行文本这两件事，如果做不到，暂时不要接论文翻译。
BERT论文翻译 TheHonestBob NLP 自然语言处理
一、写在前面在Transformer和BERT大行其道的时代，搞懂这两种基础模型结构很有必要，在网上没有搜索到满意的论文翻译结果，最近刚好有时间，把BERT的论文在个人英语水平基础上最大程度的保留原作者的本意翻译一遍，如有翻译不到位的地方请各位指出，觉得不错的点个赞鼓励一下，Tansformer的论文我之前已经翻译了，可以查看我的这篇博客attentionisallyouneed论文翻译。查看be
ImageNet Classification with Deep Convolutional Neural Networks论文翻译——中英文对照 SnailTyan 深度学习 Deep Learnig
文章作者：Tyan博客：noahsnail.com|CSDN|简书翻译论文汇总：https://github.com/SnailTyan/deep-learning-papers-translationImageNetClassificationwithDeepConvolutionalNeuralNetworksAbstractWetrainedalarge,deepconvolutionaln
2021-02-05 碰撞检测GJK算法详解（初学者慎入） MathPhilosophy
碰撞检测有2个经典算法，一个是分离轴算法SAT,还有一个就是本文要介绍的GJK，GJK是三个人的名字首写大字母；这个算法的数学推导有点复杂，目前网上只有这篇https://blog.csdn.net/u010016421/article/details/104788769/相对比较详细的介绍了算法，其主要也是参考原始论文翻译的；考虑到原始论文比较难读，博主特地专门写一篇文章介绍，博主的这篇文章会必
YoloV8改进策略：BackBone改进|DCNv4最新实践|高效涨点|多种改进教程|完整论文翻译静静AI学堂 YOLO
摘要涨点效果：在我自己的数据集上，mAP50由0.986涨到了0.993，mAP50-95由0.737涨到0.77，涨点明显！DCNv4是可变形卷积的第四版，速度和v3相比有了大幅度的提升，但是环境搭建有一定的难度，对新手不太友好。如果在使用过程遇到编译的问题，请严格按照我写的环境配置。论文：《DCNv4：对视觉应用的动态和稀疏算子的重新思考》https://arxiv.org/pdf/2401.
论文翻译 SVSGAN: Singing Voice Separation Via Generative Adversarial Network 夏HL
文章主要是将混合音频的声谱作为输入，人声,bgm的声谱作为标签，通过GAN来完成近似过程，生成器最后一层用的output_voice=[z_voice/(z_voice+z_bgm)]*x,output_bgm=[z_bgm/(z_voice+z_bgm)]*x而且文章中的生成器是经过预先训练后的。我在MKR-100上用SVSGAN时难以训练(以后换成wgan)。0.摘要从混合音频中分离出两种来源
ALOHA论文翻译：Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware baidu_huihui 精细双手操作低成本硬件
学习用低成本硬件进行精细双手操作MobileALOHA论文翻译：LearningFine-GrainedBimanualManipulationwithLow-CostHardware论文翻译@[TOC]在这里插入图片描述图1：ALOHA：一种用于双手远程操作的低成本开源硬件系统。整个系统使用现成的机器人和3D打印组件，总成本不到20,000美元。左图：用户通过反向驱动领导机器人进行远程操作，从而
手把手教你用GPT写提示词；进行文献综述；论文翻译/润色及写作 asyxchenchong888 gpt4 GPT gpt chatgpt 人工智能 python
2023年随着OpenAI开发者大会的召开，最重磅更新当属GPTs，多模态API，未来自定义专属的GPT。微软创始人比尔盖茨称ChatGPT的出现有着重大历史意义，不亚于互联网和个人电脑的问世。360创始人周鸿祎认为未来各行各业如果不能搭上这班车，就有可能被淘汰在这个数字化时代，如何能高效地处理文本、文献查阅、PPT编辑、编程、绘图和论文写作已经成为您成功的关键。而ChatGPT，作为一种强大的自
【Linux系统下论文翻译软件Zotero】 Dymc 安装笔记 linux 服务器论文翻译软件
Linux系统下论文翻译软件Zotero1下载安装包2建立快捷方式3插件安装4翻译插件出现报错1下载安装包Linux系统下的论文翻译软件Zotero，下载地址：https://www.zotero.org/download/2建立快捷方式解压后，创建快捷方式，即创建软链接：sudomkdir/opt/zoterosudomvZotero_linux-x86_64/*/opt/zotero/cd/o
KGCapsAN论文翻译毕一
摘要：基于方面(方面级)的情感分析是在细粒度情感分析中非常重要的子任务，旨在自动推断出某一方面在其上下文中的情绪。之前的研究已经表明，利用注意力为基础的方法可以有效地提高基于方面的情感分析的精度。尽管有了卓越的进步,基于方面的情绪分析现实中几个方面挑战。(1)目前基于注意力的方法可能会导致某一方面的注意力不正确地集中在与句法无关的词上。(2)传统的方法无法将情感与特殊的句子结构区分开来，如双重否定
记你我的第一次相遇易美编校
Hi大家好！今天是易美编校在与你们的第一次相遇，让我想到了白落梅的《世间所有的相遇都是久别重逢》,人和人的缘分真的很深，可以维系千年，任凭风尘起落，情怀不改。人和人的缘分真的很浅，只不过是相逢刹那，转身便成了永远的陌路。不知道你我之间将会有怎样的一个开始？先做个自我介绍吧，Emate易美编校是北京龙华全科教育科技有限公司旗下学术服务品牌，旨在为非英语国家的科学家提供专业化的论文翻译、润色、修改及其
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option