nanobobo

大语言模型(LLMs)综述调研

大语言模型

why ？->当模型参数超过一定规模时，大模型不仅取得了显著性能提升，并表现出了一些小规模语言模型不具备的特殊能力（emergent abilities）

LLM->显著规模的PLM

LLM的四个阶段：预训练、调优、使用、评估

pre-training: how to pre-train a capable LLM
adaptation tuning: how to effectively adapt pre-trained LLMs for better use
utilization: how to use LLMs for solving various downstream tasks
capacity evalution: how to evaluate the abilities of LLMs and existing empirical findings

区别于小型PLMs，访问LLM的主要方式是通过prompting interface(e.g. API)

LLMs的发展限制：

关于仅出现在LLMs中的emergent abilities 缺乏解释性
capable LLMs很难培养。LLMs需要巨大的计算需求，带来了昂贵的成本
LLMs业内培训细节并未公开（如数据收集、数据清洗等）
LLMs alignment具有挑战性

(本文内容来源于论文A Survey of Large Language Models 部分内容阅读笔记，如有阅读不理解之处可参照原论文arxiv地址）

Database

现有LLMs主要利用多种公众文本数据集混合作为预训练语料

现有LLMs预训练数据中各种数据源的比例

现有预训练语料数据集大致可分为两种类型：通用数据与专业数据

通用数据：网页、书籍、会话文本（优势：庞大、多样、易获取，增强模型泛化能力）
- 网页文本：质量参差不齐，既包含优质文本，又包含无意义的低质量文本，故对网页进行过滤和处理对提高数据质量至关重要
- 会话文本：用于增强LLMs的会话能力。但是当把对话数据过度整合到语言模型中时陈述性指令或直接的疑问句错误地识别成对话的开始，从而导致指令有效性下降
- 书籍：提供正式的长文本来源，帮助模型学习语言知识、建模长期依赖关系，生成叙事性和连贯长文本
专业数据：多语言数据、科学数据、代码等（优势：赋予LLMs解决特定性专业任务的能力）
- 小语种文本：增强模型在翻译、多语种摘要和多语种问答方面的能力
- 科学文本：增强模型对科学知识的理解能力。目前科学技术数据的主要来源一般是arxiv论文、科学教材、教学网页等。（预处理：由于科学领域中数据的复杂性（数学符号、蛋白质序列等），需要通过特定标记与预处理来把这些数据进行格式转换）
- 代码：数据来源一般有两种，一是编程社区（如Stack Exchange），二是来自Github等公共软件库。代码是一种具备远程依赖关系与精确执行逻辑的文本，所以也有研究推测在代码上进行训练可能是模型复杂推理能力的来源，也有研究表明将推理任务格式化为代码可以帮助LLMs生成更准确的结果

数据预处理

大语言模型数据预处理pipeline

一般包括去噪、降低冗余、去除不相关内容、删除潜在有害数据

数据集过滤：一般有基于分类器的方法和基于启发式的方法来进行数据过滤。
- 分类器的方法一般是基于一个高质量文本来训练一个选择分类器，从而利用它来识别低质量数据并进行剔除。坏处是这种方法可能会造成一些方言、口语等高质量文本被删除，造成语料偏见，并降低语料多样性
- 启发式的方法一般是通过一组精细设置的规则来消除低质量文本。这种规则一般大致可分类为基于语种的过滤、基于指标的过滤(生成文本的评价指标，如困惑度)、基于统计特征的过滤（比如标点符号分布、符号词比、句子长度等）和基于关键词的过滤（如html标签、超链接、攻击性词语等）
数据集去重：重复数据会导致在建模过程中引入重复模式，降低语言模型多样性，也可能使训练过程变得不稳定。去重手段的区分主要是不同细粒度，包括句子级别、文档级别和数据集级别的去重
- 文档层面一般是依赖文档间的表面特征重叠率来进行去重
- 数据集层面的去重主要是为了避免数据集污染问题，一般是通过从训练集中移除可能的重复文本来防止训练集与验证集的重合。
隐私修正：因为大部分预训练文本来自网络，包括用户生成的涉及敏感或个人信息的内容，可能会增加隐私泄露的风险，故需要剔除个人身份信息
- 基于规则的方法来检测与修正：一般是关键词检测，用于移除姓名、地址、电话号码等
- 去重：有研究表明LLMs在隐私攻击中的脆弱性主要可归因于预训练语料中存在的重复PII(personally identifiable information)数据
tokenization：主要的分词方法有BPE tokenization、WordPiece tokenization、Unigram tokenization。虽然使用现有的分词器较为方便，但如果能专门地针对预训练语料来设置分词器能达到更好的效果。目前LLMs多使用SentencePiece库来专门为预训练语料训练定制专门的tokenizer，这个库包括BPE tokenization 和Unigram tokenization。不过定制化tokenizer也是有副作用的，如一个专门针对英文文本训练的tokenizer在处理别的语种时会表现较差
- BPE tokenization(Byte-Pair Encoding tokenization): 它从一组基本符号(例如,字母表和边界字符)开始，迭代地将语料库中连续两个tokens的频繁对组合为新的token(称为合并)。对于每一次合并，选择标准是基于两个相邻的tokens的共现频率：顶端的频繁对将被选择。合并过程一直持续到它达到预定义的大小。通过将字节作为合并的基本符号，字节级BPE被用于提高多语种语料库(如包含非ASCII字符的文本)的标记化质量。采用这种标记化方法的代表性语言模型包括GPT - 2、BART和LLaMA
- WordPiece tokenization: WordPiece通过迭代合并连续的tokens，与BPE有着非常相似的思想，但对合并采取了略有不同的选择标准。为了进行合并，它首先训练一个语言模型并使用它对所有可能的对进行评分。然后，在每次合并时，它选择导致训练数据的可能性增加最多的一对。由于Google尚未发布WordPiece算法的官方实现，HuggedFace在其在线NLP课程中给出了一个更为直观的选择衡量标准：基于训练语料，通过将共现次数除以词对中两个标记出现次数的乘积来对词对进行评分。
- Unigram tokenization: 与BPE和WordPiece不同，单元词特征标记化从语料库中足够大的一组可能的子串或子标记开始，迭代地移除当前词汇表中的tokens，直到达到预期的词汇量。作为选择准则，它通过假设从当前词汇中删除一些tokens来提升训练语料的似然概率。该步骤基于训练好的单元词特征语言模型进行。为了估计单元词特征语言模型，它采用了期望最大化( EM )算法：在每次迭代中，我们首先在旧语言模型的基础上找到当前最优的词标记化，然后重新估计单元词特征的概率来更新语言模型。在这个过程中使用Viterbi算法在给定语言模型的基础上找到最优的单词分解方法

预训练语料的质量与分布对LLM的性能影响

混合数据源：LLMs的预训练数据来自不同领域不同场景，基于这样的数据进行预训练能扩大LLMs的知识范围，增强模型的泛化能力。在进行数据混合时，需尽量包含高质量数据源，并仔细设置预训练数据的分布。如果来自某个领域的数据过多，可能会影响LLMs在其他领域的泛化能力
预训练数据规模：随着LLM中参数规模的不断增大，也需要更多的数据来训练模型，在数据规模中也有类似的缩放规律。
预训练数据质量：低质量、冗余、有害的语料会降低模型的表现能力

Architecture

三种主流架构的比较其中蓝色、绿色、黄色和灰色圆角矩形分别表示前缀标记之间的注意力、前缀与目标标记之间的注意力、目标标记之间的注意力和掩蔽注意力

encoder-decoder

vanilla transformer:

encoder由多头自注意力层堆叠而成，用于对输入编码生成latent representation
decoder由交叉注意力层组成，用于处理latent representation并自动生成目标序列

decoder-only:一般包括causal decoder与prefix decoder,但是一般说起decoder-only模型时，一般指的是causal decoder

causal decoder

使用单向注意力掩码，输入的每个token只能关注过去的token和本身。输入和输出tokens通过decoder以相同的方式进行处理。
prefix decoder

对causal decoder的掩码机制进行修改，使其能对前置tokens使用双向注意力，并对生成的tokens使用单项注意力。在实际训练中可先训练causal decoder，再把它转换成prefix decoder来加速收敛。

Transformer的归一化、位置嵌入、激活函数、注意力偏置

下表展示了这几项配置的种类及其对应的计算方式

综合上表得到的结论是：在训练LLMs时建议选择Pre RMSNorm进行归一化、选择SwiGLU或GeGLU作为激活函数。此外，LN在嵌入层后可能不会立即使用，这很可能导致性能下降。对于位置嵌入，RoPE或ALiBi更好，因为它们在长序列上表现更佳。

预训练任务

一般有语言建模和去噪自编码两种任务

语言建模（Language Modeling)：一般是only-decoder最常用的目标。对于一个给定的tokens序列x = {x_1,x_2,…,x_n}，LM任务旨在根据之前的token(x_

$L_{LM}(x) = \sum ^n _{i=1}logP(x_i|x_{LLM(x)=i=1∑nlogP(xi∣x<i)$

$L_{DAE}(x)=logP(\tilde{x}|x_{ \tilde{x}})$
由于DAE在执行上比LM更为复杂，所以并没有被广泛应用于LLMs的训练

混合去噪器（Mixture-of-Denoisers, MoD）：也被称为UL2 loss，它被引入作为预训练语言模型的统一目标。MoD把LM与DAE都视作不同类型的去噪任务，其中S-denoiser->LM, R-denoiser->DAE, short span and low corruption, X-denoiser->DAE,long span or high corruption

对于这三种去噪器，S-denoiser与LM目标类似，R-denoiser 和X-denoiser与DAE类似，只不过二者在文本的跨度长度和损坏文本的比例上有细微不同。对于使用不同的特殊token([R]、[S]、[X])开始的输入语句将使用相对应的去噪器对模型进行优化

总结

架构选择：

使用LM目标进行预训练时，casual decoder架构可以实现出色的零样本和少样本泛化能力，并表现出优于其他架构的零样本性能。此外，指令调整和对齐调整已经被证明可以进一步增强大型casual decoder模型的能力。
根据scaling law，选择更大模型与更大的数据集能获得更好的表现能力
LLMs支持长文本上下文建模，主要原因可归结于以下两点
- Extrapolation capability: LLM编码较长文本的能力。一些位置嵌入方法（如RoPE、T5 bias）已经被验证具有一定的Extrapolation capability。具体来说，配备ALiBi的语言模型已经被证明能在序列上保持相对稳定的困惑度，甚至比用于训练的语言模型长10倍。也有学者通过改进旋转矩阵的设计来增强RoPE的外推能力（xPos）
- efficiency：主要指一些为了降低二次计算成本的高效注意力方法。除去常见的几种高效注意力，FlashAttention从系统级的角度（GPU内存和IO效率）提高注意力效率。其他还有一些利用非transformer的新架构来进行语言建模，例如参数化的状态空间模型

模型训练

优化器设置：

Batch Training: 对于目前LLMs的训练，Batch size一般会设计成一个较大的值（比如2048 examples或者是4M个tokens）以提高训练稳定性和模型吞吐量。在GPT-3和PaLM中引入了在训练过程中动态增加batch size大小的策略，最终达到百万规模，这种策略能使得训练过程更加稳定
Learning Rate:现有的LLMs通常采用与预训练中的warm-up和衰减策略类似的学习速率调度。具体来说，在初始的0.1 %到0.5 %的训练步中，采用线性的warm-up逐步增加学习速率，使其达到最大值，其范围大约为5 × 10-5到1 × 10 - 4(例如GPT - 3为6 × 10 - 5)。然后，在后续步骤中采用余弦衰减策略，将学习率逐渐降低到其最大值的10 %左右，直到训练损失收敛。
Opimizer:Adam优化器和Adam W优化器被广泛用于训练LLMs (例如GPT3)，它们基于低阶矩的自适应估计进行一阶梯度优化。通常，其超参数设定如下：β1 = 0.9，β2 = 0.95和ε = 10 - 8。同时，Adafactor优化器也被用于训练LLMs (如PaLM和T5)，它是Adam优化器的一个变体，专门为在训练过程中保存GPU内存而设计。Adafactor优化器的超参数设置为：β1 = 0.9，β2 = 1.0-k-0.8，其中k表示训练步数。
stable training：为了防止在训练过程中遇到模型崩溃的问题，一般会使用权重衰减和梯度裁剪的方法。现有的研究通常将梯度裁剪的阈值设置为1.0，权重衰减率设置为0.1。然而，随着LLMs的缩放，训练损失尖峰也更容易出现，导致训练不稳定。为了缓解这个问题，PaLM和OPT 使用了一种简单的策略，即在尖峰出现之前从较早的检查点重新启动训练过程，并跳过可能导致问题的数据。另外，GLM 发现嵌入层的异常梯度通常会导致锋电位，并提出收缩嵌入层梯度来缓解锋电位。

训练技巧：

两个主要问题：提高训练吞吐量&将大模型加载到GPU内存中

3D Parallelism:三维并行主要由三种训练策略组成，分别是数据并行、pipeline并行、和张量并行
- data parallelism: 数据并行是增加训练吞吐量的方法之一。数据并行是把model paramenters 和optimizer states跨多个GPU进行复制，然后再把整个训练语料分发到这些GPU中，每个GPU只处理分配给自己数据并获得梯度，然后再进一步聚合获得整个批次的梯度用于更新所有GPU中的模型
- Pipeline parallelism: pipeline并行主要是把LLM的不同层分布到多个GPU中，对于transformer来说，pipeline并行是把连续的层加载到同一个GPU中来降低GPU之间传输计算隐藏状态或梯度的成本。由于每个GPU都需要等待上一个GPU来完成计算，pipeline并行化可能会导致GPU利用率降低，从而导致不必要的bubbles overhead。为了减少pipeline并行中的这些气泡，有方法提出了多批次数据填充和异步梯度更新技术来提高流水线效率
  
  bubbles overhead:在计算机科学和工程领域，“bubbles overhead"指的是资源（GPU、CPU或内存）的浪费，因为系统中存在不必要的空闲，故降低了系统的效率。
- tensor parallelism: 区别于pipeline并行，张量并行侧重于分解LLM中的张量（参数矩阵）。对于LLM中的矩阵乘法运算Y = XA，参数矩阵A可以按列拆分为A1和A2两个子矩阵，可以表示为Y = [ XA1、XA2]。通过将矩阵A1和A2放置在不同的GPU上，矩阵乘法运算将在两个GPU上并行调用，最后通过跨GPU通信将两个GPU的输出进行合并得到最终结果。
ZeRO：ZeRO主要是针对数据并行中的内存冗余问题。在模型训练过程中，并不是所有数据都需要保存在每个GPU上（比如某个时刻只需要调用某一小部分数据），故导致了内存冗余。ZeRO技术的目标是在每个GPU上只保留一小部分数据，而其余的数据可以在需要时从其他GPU中检索。

具体而言，ZeRO提供了3种解决方案，这取决于数据的3个部分是如何存储的，即优化器状态划分、梯度划分和参数划分。实验结果表明，前两种方案并没有增加通信开销，第三种方案增加了约50 %的通信开销，但节省了与GPU数量成正比的内存。PyTorch实现了与ZeRO类似的技术，称为FSDP
mixed precision trainning：在以往的PLMs中，FP32(32位浮点数)主要用于预训练。为了降低大模型训练的开销，会使用FP16来进行训练，且NVIDIA GPUs的FP16计算单元数量是FP32的两倍，故计算效率会进一步提高。但是单使用FP16会造成一定的精度损失从而影响模型性能，为了缓解这种情况，一种叫做brain floating point( BF16 )的替代品被用于训练，它比FP16分配更多的指数位和更少的有效位，在预训练阶段，BF16在表示精度上总体表现优于FP16。

在实际的应用中，通常联合使用上述训练技术来进行训练，例如，研究人员将8路数据并行、4路张量并行和12路流水线并行结合起来，实现了在384个A100 GPU上训练BLOOM。目前，Deep Speed、Colossal - AI、Alpa等开源库可以很好地支持这3种并行训练方法。此外也可以利用BF16混合精度训练来提高效率。

由于训练大型模型是一个时间密集型的过程，因此在早期阶段预测模型性能和发现异常问题是非常有用的。为此，GPT-4最近引入了一种建立在深度学习堆栈上的可预测缩放的新机制，实现了用更小的模型预测大模型的性能，这对于开发LLMs可能非常有用。在实践上，可以进一步利用主流深度学习框架的支撑训练技术。例如，PyTorch支持数据并行训练算法FSDP (fully sharded data parallel)，该算法允许在需要时将训练计算部分卸载到CPU。

adaptation tuning

为了使得LLMs能针对具体目标获得更优的能力，一般有两种调优方式，分别是指令调优（instructoin tuning）和对齐调优（alignment tuning）

instruction tuning：增强LLMs的能力

从本质上说，指令微调是以自然语言的形式在格式化实例集合（collection of formatted instances）上对预训练的LLM进行微调的方法，与有监督的微调和多任务提示训练高度相关。

为了进行指令调优，我们首先需要收集或构造指令格式化的实例。然后，我们使用这些格式化的实例以监督学习的方式(例如,使用序列到序列的损失进行训练)对LLM进行微调。经过指导语调优后，LLMs即使在多语言环境下也能表现出泛化到看不见的任务的卓越能力。
- 格式化实例构建
  - 构成：一个指令格式的实例由任务描述(称为指令)、可选输入、对应输出和少量演示(可选)组成
  - 任务数据集的格式化：在提出指导语调优之前，一些早期的研究从不同范围的任务(如文本摘要、文本分类和翻译等)中收集实例，以创建有监督的多任务训练数据集。它们是指令调优实例的主要来源，用自然语言任务描述来格式化这些多任务训练数据集是很方便的
    
    众包平台：PromptSource 用于有效地创建、共享和验证不同数据集的任务描述以更好地生成用于指令调优的标注实例
  - 日常聊天数据格式化：增强模型的指令多样性&匹配真实人类多样性。InstructGPT把真实用户提交给OpenAI API的查询用做任务描述来激发LLM的指令跟随能力。具体来说，为了丰富任务的多样性，人类标注者被要求编写真实任务的指导语，包括开放式生成、开放式问答、头脑风暴和聊天等。然后，他们让另一组标注者直接回答这些指令作为输出。最后，将一条指令(即收集到的用户查询)和期望输出(即人类书写的答案)配对作为训练实例。另外，GPT-4也设计了潜在高风险指令，并通过针对安全问题的有监督微调来引导模型拒绝这些指令
  - 合成数据格式化：该方法主要是为了减少人工标注或降低人工收集的负担而提出的半自动化构建方法。主要是将已有的实例输入LLMs来合成多样化的任务描述和实例。Self - Instruct方法只需要100个左右的实例作为初始任务池，然后再从池中随机选择几个实例作为示范，并提示LLM生成新的指令和相应的输入输出对。经过质量和多样性过滤后，新生成的实例将被添加到任务池中。因此，该合成方法是生成大规模LLM指令数据的一种有效且经济的方法
  - 实例构建的关键要素：
    - 指令定量：缩减任务数量能在很大程度上增强LLMs的泛化能力。有研究表明随着任务数量的增加，模型性能最初呈现持续增长的模式，当达到一定量时，增益变得微乎其微，而且在某些任务上实例数量剧增可能会带来过拟合
    - 格式化设计：在数据集的输入输出对中添加任务描述和可选演示。任务描述是LLMs理解任务中最关键的部分，同时适当数量的指令示例作为示范能为模型带来实质性的改进
- 指令微调策略：指令微调可以看作一个有监督的训练过程，相较预训练来说，指令微调的训练目标和优化配置都是不一样的。另外，在指令微调中需要特别关注以下两个问题：
  - 平衡数据分布：由于指令微调涉及不同任务的混合，因此在微调过程中平衡不同任务的比例非常重要。
    - 样例比例混合策略(examples-proportional mixing stratege)：合并所有的数据集并从混合数据集中均匀地采样每个样例。
      
      根据最近的研究结果，增加优质实例集合(例如FLAN 和P3 )的抽样比例通常可以带来性能的提高。此外，在指令调优过程中，通常会设置一个最大上限来控制数据集所能包含的最大样例数，以防止更大的数据集压倒整个分布。在实际应用中，通常根据不同的数据集，将最大上限设置为几千或几万
  - 指令调优与预训练结合：
    - 把预训练数据看作正则化加入指令调优过程。
    - 不使用两阶段，而是把预训练数据与指令调优数据混合使用多任务学习从头开始训练。
指令调优在不同规模的模型上都体现了普适性，基本都能带来性能提升。此外，指令调优大大增强了大模型的任务泛化能力，在跨语言任务中也表现良好。指令调优还能增强模型在某特定领域的专业能力（如金融、医学、法律等）。

实验：

下表展示了基于LLaMA ( 7B )模型在聊天和QA设置下的指令调整实验结果(均为单话轮会话)。在Self - Instruct - 52K数据集上采用了4种指令改进策略，即增强复杂度( w /复杂度)、增加多样性( w /多样性)、平衡难度( w /难度)和缩放指令数量( w /缩放)

LLaMA - 7B是一种流行的LLM主干，已被广泛用于指令调优

Chat:

AlpacaFarm: 一个评价集，用于对聊天设置进行评价

w->win rate: 来自两个比较模型的响应哪个更适合用户查询

QA: 基于MMLU和BBH3k两个基准通过启发式规则来解析来自LLM答案的准确性

MMLU:

BBH3k: Yu-Lan Chat 发布的BBH基准的一个子集

结论：
- Task-formatted 指令相较Chat更适合QA
- 多种指令混合使用对于提高LLMs的综合能力很有帮助
- 增加指令的复杂性和多样性会造成模型性能提升
- 单纯增加指令数量或对指令难度进行均衡不一定能带来比较好的性能提升
  
  作者关于指令调优的建议：
  
  为了对LLMs进行指令调优，可以根据上表中关于所需GPU数量和调优时间的基本统计信息来准备计算资源。在搭建好开发环境后，我们推荐初学者遵循Alpaca Reposita的代码进行指令调优。随后，我们应该选择基本模型并构建本节中讨论的指令数据集。当用于训练的计算资源受到限制时，用户可以利用LoRA进行参数高效的调优。在推理方面，用户可以进一步使用量化方法在更少或更小的GPU上部署LLM
alignment tuning：将LLMs与人类价值观或偏好对齐

1、alignment training

对齐训练的核心思想是通过引入对齐信息来指导模型的学习过程，主要是在模型训练过程中对输入和输出之间的对应关系进行建模，以便能更好地捕捉输入与输出之间的关联

human alignment被引入使得LLMs的行为符合人类的预期（减少虚假有害信息、符合人类偏好）

alignment tax:alignment可能会在一定程度上损害LLMs的一般能力

三种代表性的人工对齐指标：

helpful：引导LLMs尽可能以简洁高效的方式来帮助用户解决任务或回答问题
honest：引导LLMs向用户提供准确的内容而非编造信息，另外LLMs需要学会在输出中传达适当程度的不确定性，以避免欺骗或误导，这需要模型知道自身的能力与知识水平
harmless：规范LLMs产生的语言不具备攻击性或歧视性，在最佳的情况下模型能够检测出一些以恶意回答为目的的隐蔽提问（避免被诱导回答危险信息）

Human Feedback的选取：

目前还是主要依赖人工标注来生成反馈数据，所以如何选取human labelers至关重要。

现在一般来说为了获取高质量的feedback会要求人工标注者需要具备合适的教育水平与英语数量程度。同时需要尽量保证人工标注者和研究者之间意图的一致性。（目前一致性的保证主要是通过研究者先对少量数据进行标注，再衡量自己的标注与其他人工标注者之间的一致性来对人工标注者进行筛选。或者是研究者选择一批"super raters"(一批具有良好性能的人工标注者)来为其他人工标注人员提供说明与指导）

Human Feedback的收集：

基于排序的方法：引入Elo评分系统通过比较候选输出得到偏好排序
基于问题的方法：human labelers通过回答研究人员设计的某些问题来提供更加详细的反馈（对齐标准、附加约束）
基于规则的方法：在选择标注者最好的响应的基础上使用一系列规则来测试模型生成的响应是否符合对齐标准。（Sparrow)

RLHF(Reinforcement learning from human feedback, 基于人类反馈的强化学习)在LLMs中的应用

定义：RLHF使用强化学习(RL)算法通过学习一个奖励模型来使得LLMs适应人类的反馈

RLHF System = a pre-trained LM to be aligned + a reward model learning from human feedback + RL training the LM
- 预训练LM：一般是由一个已有的预训练LM参数初始化的生成模型
- 奖励模型(RM)：提供了反映人类对LM生成的文本偏好的(学习到的)指导信号，通常以标量值的形式出现。RM一般有两种形式：微调的LM或使用人类偏好数据从头训练的LM。目前的工作通常采用与对齐LM不同参数规模的模型来用作奖励模型
- RL算法：近似策略优化（PPO）是目前工作中最为广泛使用的对齐RL算法
RLHF的关键步骤：
- 有监督微调：通过监督数据集（包含输入与期望输出）对LM进行微调
- RM的训练：使用LM采样提示作为输入生成一定量输出，再依赖人工标注者对这些配对的偏好进行标注，基于此训练RM预测符合人类偏好的输出
- RL微调：把alignment LM看作RL问题。预训练的LM充当策略，作为输入提示符并返回输出文本，其动作空间为词汇表，状态为当前生成的token序列，奖励由RM提供。为了避免显著偏离初始(调优前) LM，惩罚项通常被纳入到奖赏函数中。

参数高效微调办法(Parameter-Efficient Fine-Tuning，PEFT)：

Adapter Tuning：指将小型神经网络（adapter）纳入transformer模型。通常是在一个transformer层的两个核心部分（注意力层和前馈层）之后的串行插入，也可以在transformer层中使用并行adapter,将其与注意力层与前馈层并行放置。在微调过程中原始语言模型中的参数会被冻结，只adapter的参数根据目标进行迭代优化
Prefix Tuning：前缀调优是指在语言模型的每个Transformer层上预先加载一系列的前缀，这些前缀是一组可训练的连续向量。这些前缀向量是任务特定的，可以被认为是虚拟token嵌入。在调优时也只有这个prefix得到更新和优化
Prompt Tuning：在输入层融入可训练提示向量。主要基于离散提示方法通过增加一组软提示tokens（自由形式或前缀形式存在）对输入文本进行增强，基于增强的输入来解决特定的下游任务。实现上特定任务的提示嵌入与输入文本嵌入结合，随后输入到语言模型中
Low-Rank Adaptation(LoRA)：LoRA通过在每个dense layer上施加低秩约束来逼近更新矩阵，从而减少可训练参数以适应下游任务。

四种参数调优方法(其中MSA和FFN分别表示transformer中的多头注意力和前馈神经网络)

有实证研究表明，LoRA在所有的调优方法中表现相对较好，使用的可训练参数明显较少

LoRA：对于一个优化参数矩阵W，它的更新过程可以表示为W<–W+ΔW，LoRA的基本思想是将原始矩阵W∈R_mxn冻结，同时用低秩分解矩阵近似参数更新ΔW，，即∆W = A · B⊤，其中A∈Rm × k和B∈Rn × k为任务自适应的可训练参数，k⋅min( m , n)为降秩。LoRA的主要优点是可以在很大程度上节省内存和存储使用量(VRAM)。此外，为了适应不同的下游任务，只能保持单个大的模型拷贝，同时保持多个特定任务的低秩分解矩阵。

在LLMs的训练中，应该对transformer中的哪些权重矩阵应用LoRA->适配更多的权重矩阵比适配具有较大秩的单一类型矩阵更可取（适配{W_q, W_v}比只适配W_q更有竞争力）

LoRA的最佳秩->LoRA在一个很小的r下已有很好表现了，增加秩并不一定能够覆盖一个更有意义的子空间，所以一个低秩的适配矩阵就足够

矩阵的秩&低秩近似

矩阵的秩：矩阵中线性无关的列（列秩）或行（行秩）的数量

低秩近似：用秩小于原始矩阵M的矩阵M *来表示M信息的过程。为了达到降低M *秩的效果，可以尝试将矩阵进行分解，即M = LR^T ≈ L_kR^T_k ≈M *。这样的变换能使得一个通常由m×n表示的矩阵可以由k(m+n)个值表示。当矩阵M中包含可以忽略的信息时，低秩近似通常有用。

构造低秩近似矩阵的方法最常用的为奇异值分解

将矩阵M进行奇异值分解，有M = USV^T = (US)V^T = LR^T，其中L=(US), R=V

不局限于矩阵的精确分解，使用Uk、Sk、Vk分别替换上述方程中的U、S、V(只使用分解矩阵的前k列，kkS_kV_k^T ≈M *

你可能感兴趣的:(nlp,语言模型,人工智能,自然语言处理)

微软人工智能证书AI-102 | 如何快速通过？全球认证考试中心人工智能微软
微软AI-102考试，全称“DesigningandImplementingaMicrosoftAzureAISolution”，是微软推出的用于验证考生在Azure平台上设计和实施AI解决方案核心能力的认证考试。以下是具体介绍：考试描述：考试主要衡量考生实施计划和管理Azure认知服务解决方案、计算机视觉解决方案、自然语言处理解决方案、知识挖掘解决方案、对话式AI解决方案的能力。考试题型通常包括
Bagel: 开源协作式AI数据管理平台的使用指南 llzwxh888 人工智能 python
Bagel:开源协作式AI数据管理平台的使用指南引言在人工智能和机器学习领域，高质量的数据集对于模型训练和推理至关重要。Bagel作为一个开源的协作式AI数据管理平台，为开发者和研究人员提供了一个强大的工具，用于创建、共享和管理推理数据集。本文将深入探讨Bagel的特性、安装方法以及如何使用它来处理和管理向量数据。Bagel简介Bagel（OpenInferenceplatformforAI）可以
Midscene.js介绍和使用望华笙测试工具 ui 前端
Midscene.js介绍和使用由于课程任务的需要，本人去寻找了AI+软件测试的相关应用，发现了Midscene这一便利的UI自动化测试工具。本篇博客主要对Midscene作了介绍，也给出了本人在使用Midscene过程中遇到的问题及摸索到的解决方案。Midscene.js是一个开源的基于多模态大型语言模型的UI自动化测试工具，它是由字节的web-infra团队开发。它能够智能地“解析”用户界面并
Python开发AI智能体(三)———Langchain定义提示词模板【本人】 Agent智能体 python 人工智能 langchain 语言模型
前言上篇文章给大家介绍AI项目检测平台LangSmish以及开源框架Langchain的使用，并且带领大家编写了一个案例。这篇文章将介绍在Langchain框架中如何定义提示词模板一、什么是提示词模板？提示词模板（PromptTemplate）是大语言模型（LLM）应用开发中的核心概念，本质是预定义的提示结构框架。它通过将静态文本与动态变量结合，实现标准化、可复用的提示生成机制。它提示词可以是一个
使用LangChain构建智能应用：从入门到实战 afTFODguAKBF langchain python
引言在当今的人工智能时代，构建智能应用程序已经成为越来越多开发者的目标。LangChain是一个强大的工具，可以帮助我们快速开发基于大型语言模型（LLM）的应用。本篇文章将带你了解如何从零开始使用LangChain，构建一个简单的LLM应用程序，并逐步探索更复杂的功能。主要内容构建简单的LLM应用使用LangChain，我们可以快速构建一个简单的LLM应用程序。接下来，我将带你一步步实现。什么是L
端侧开发详解初赛收官盛宴 | 2025高通边缘智能创新应用大赛第九场公开课来袭！阿加犀智能人工智能智能硬件
各位开发者、技术爱好者，2025高通边缘智能创新应用大赛即将迎来初赛阶段的最后一堂重磅公开课！诚邀大家于7月3日（星期四）晚8点，准时收看由瑞莎的嵌入式开发工程师张子烽（Morgan）带来的专题分享，共同探索端侧智能应用开发的创新技术路径。聚焦前沿平台掌握端侧智能开发流程本次课程将聚焦基于瑞莎DragonQ6A开发板的端侧人工智能应用开发。该开发板搭载高通跃龙™QCS6490平台（由阿加犀提供开发
论文阅读：2025 arxiv Qwen3 Technical Report
https://arxiv.org/pdf/2505.09388https://www.doubao.com/chat/9918384373236738文章目录论文翻译Qwen3技术报告摘要1引言论文翻译Qwen3技术报告Qwen团队摘要在这项工作中，我们介绍了Qwen模型家族的最新版本Qwen3。Qwen3包含一系列大型语言模型（LLM），旨在提升性能、效率和多语言能力。Qwen3系列包括密集型
SpringBoot生态全景图：从SpringCloud到云原生技术栈演进 fanxbl957 Web spring boot spring cloud 云原生
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot生态全景图：从S
干货！大模型时代一定要收藏的 20 个LLM 中文数据集 OpenBayes 资源上新人工智能语言模型数据库机器学习
自ChatGPT重磅推出以来，大语言模型(largelanguageModel,LLM)以其卓越的学习能力在各个领域引起轰动。大模型的训练和调优离不开优质庞大的数据支撑，精心构建的数据集不仅为大模型提供了充分的燃料，还为大模型在垂直领域的应用和性能提升提供了可能。本文整理了一些适用于大模型训练调优的热门中文公开数据集（按照首字母A-Z顺序排列），以供大家了解和使用。温馨提示：本文列举的所有数据集，
基于AFM注意因子分解机的推荐算法深度学习乐园深度学习实战项目深度学习科研项目推荐算法算法机器学习
关于深度实战社区我们是一个深度学习领域的独立工作室。团队成员有：中科大硕士、纽约大学硕士、浙江大学硕士、华东理工博士等，曾在腾讯、百度、德勤等担任算法工程师/产品经理。全网20多万+粉丝，拥有2篇国家级人工智能发明专利。社区特色：深度实战算法创新获取全部完整项目数据集、代码、视频教程，请进入官网：zzgcz.com。竞赛/论文/毕设项目辅导答疑，v：zzgcz_com1.项目简介项目A033基于A
Tair向量数据库：阿里云原生内存数据库服务的高性能向量检索解决方案 mmlihaio 数据库云原生 python
Tair向量数据库：阿里云原生内存数据库服务的高性能向量检索解决方案1.引言在当今的人工智能和大数据时代，高效的向量检索已成为许多应用场景的关键需求。Tair作为阿里云开发的云原生内存数据库服务，不仅提供了丰富的数据模型和企业级能力，还引入了基于非易失性内存(NVM)存储介质的持久内存优化实例。本文将深入探讨如何利用Tair向量数据库功能，实现高性能的向量存储和检索。2.Tair向量数据库概述Ta
阿里云魔搭社区AIGC专区：中国AI创作的革命性平台 Liudef06小白阿里云 AIGC 人工智能
在生成式人工智能重塑全球数字创作版图的浪潮中，中国首个一站式AIGC开发平台——阿里云魔搭社区AIGC专区于2024年9月杭州云栖大会正式亮相。这一突破性进展不仅填补了国内全流程AI创作工具的空白，更以157款多模态开源模型和全免费GPU算力的开放姿态，为超过690万开发者提供了从模型调用到应用落地的完整生态支持。一、魔搭社区：中国AI模型生态的奠基者魔搭社区（ModelScope）作为阿里云在2
探秘阿里云Tair KVCache：大模型推理的加速引擎云资源服务商阿里云云计算人工智能
一、引言近年来，人工智能领域发展迅猛，大语言模型（LLM）不断取得突破，其应用场景也日益广泛。从智能客服到内容生成，从智能写作到智能翻译，大语言模型正在深刻地改变着我们的生活和工作方式。随着模型规模的不断扩大和推理需求的日益增长，大模型推理过程中的显存瓶颈问题逐渐凸显，成为制约其发展和应用的关键因素。在大模型推理中，KVCache技术作为一种优化手段，通过缓存历史Token的Key/Value向量
AI正在偷偷取代这10种职业，你的工作安全吗？
近年来，人工智能（AI）的飞速发展正在悄然改变我们的工作方式。从自动化客服到AI生成内容，许多传统职业正面临被取代的风险。虽然AI带来了更高的效率和便利，但也让不少人开始担忧：我的工作会被AI抢走吗？今天，我们就来盘点10种最容易被AI取代的职业，并探讨如何在这个AI时代保持竞争力。1.客服代表取代指数：★★★★★AI驱动的聊天机器人（如ChatGPT、GoogleBard）已经能够处理大部分基础
直播预告！探讨生成模型中的极简概念擦除青稞社区. 青稞Talk 人工智能图像处理
主页：http://qingkeai.online/原文：https://mp.weixin.qq.com/s/yc4whKbnVY8ho1w7rgFVGg6月16日20:00，青稞Talk第55期，新加坡国立大学博士生张扬，将直播分享《生成模型中的极简概念擦除》。分享嘉宾张扬，慕尼黑工业大学计算机专业硕士，新加坡国立大学人工智能专业博士。曾于牛津大学进行学术访问，并在微软亚洲研究院及美国运通新加
embedding模型有哪些？如何选择合适的embedding模型？行云流水AI笔记 embedding
embedding模型是一种将数据映射到低维空间的模型，常用于自然语言处理、推荐系统、图像识别等领域。以下是一些常见的embedding模型：Word2Vec：CBOW（ContinuousBag-of-Words）：通过上下文预测中心词。Skip-Gram：通过中心词预测上下文。GloVe（GlobalVectorsforWordRepresentation）：结合了词频统计和Word2Vec的
【DeepSeek实战】3、Ollama实战指南：LobeChat+多网关架构打造高可用大模型集群无心水 Ollama实战指南 LobeChat实战 DeepSeek实战 DeepSeek全栈应用开发 AI入门大模型 CSDN技术干货
一、企业级大模型集群架构全景解析在人工智能落地应用的过程中，大模型服务的高可用性、成本控制和灵活扩展能力成为企业关注的核心痛点。本方案通过LobeChat前端、AI网关层和Ollama模型集群的三层架构设计，实现了无需复杂运维即可部署的生产级大模型服务体系。该架构不仅支持负载均衡、故障转移和模型热切换等企业级特性。还通过量化技术将硬件成本降低60%以上，为中小企业提供了与商业云服务相当的性能体验。
生成式人工智能实战 | 深度卷积生成对抗网络（Deep Convolutional Generative Adversarial Network, DCGAN）盼小辉丶生成式人工智能实战150讲人工智能生成对抗网络神经网络
生成式人工智能实战|深度卷积生成对抗网络0.前言1.模型与数据集分析1.1模型分析1.2数据集介绍2.构建DCGAN生成人脸图像2.1数据处理2.2模型构建2.3模型训练0.前言深度卷积生成对抗网络(DeepConvolutionalGenerativeAdversarialNetworks,DCGAN)是基于生成对抗网络(ConvolutionalGenerativeAdversarialNet
2024年AI 智能助手（大模型）产品市场分析｜商派徐礼昭｜商派软件市场负责人人工智能
一、引言人工智能的浪潮不断向前推进，智能助手作为其中的重要应用，已经逐渐渗透到我们生活的各个方面。它们以其便捷性和个性化的特点，改变了我们与世界的互动方式。本报告将对AI智能助手进行全面的行业分析，包括行业概况、主要玩家、用户数据、发展要素以及未来趋势等方面，并通过具体案例分享，帮助读者深入了解这一领域的现状和未来发展潜力。二、行业概览（一）智能助手的定义和发展阶段智能助手是利用人工智能技术为用户
高通 QCS8550 大模型性能深度解析：从算力基准到场景实测的全维度 Benchmark 伊利丹~怒风 Qualcomm 人工智能 AI编程 python arm 自然语言处理
前言在人工智能技术狂飙突进的时代，大模型正以前所未有的速度重塑各行业生态，从智能客服到多模态交互，从边缘推理到端侧部署，其应用场景不断拓展。而这一切革新的背后，离不开底层硬件的强力支撑。高通QCS8550作为面向下一代智能设备的旗舰级计算平台，凭借高达48TOPS的AI算力与先进的第七代高通AI引擎，在大模型性能表现上极具竞争力。其异构多核架构不仅能高效处理复杂的神经网络计算，还通过软硬件协同优化
从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
Prompt Engineering for Large Language Models 三月七꧁ ꧂ 论文合集llm+prompt prompt 语言模型人工智能自然语言处理 pdf javascript 前端
题目大型语言模型的快速工程简介随着OpenAI的ChatGPT和Google的Bard等软件的普及，大语言模型（LLM）已经渗透到生活和工作的许多方面。例如，ChatGPT可用于提供定制食谱，建议替换缺失的成分。它可用于起草研究提案、用多种编程语言编写工作代码、在语言之间翻译文本、协助政策制定等等（Gao2023）。用户通过“提示”或自然语言指令与大型语言模型进行交互。精心设计的提示可以带
[Python]-基础篇1- 从零开始的Python入门指南踏雪无痕老爷子 Python python 开发语言
无论你是尚未接触编程的新手，还是想从其他语言转向Python的开发者，这篇文章都是你的入门课。一、Python是什么？Python是一种解释型、高级、通用型编程语言，以简洁明了、简单易用着称。它可以应用于网站开发、自动化脚本、数据分析、人工智能、系统操作等多种场景。二、如何安装Python步骤：访问Python官方网站选择目前最新的Python3.x版本下载Windows用户请务必勾选“AddPy
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
潜入思维的海洋：SoftCoT++如何让语言模型更聪明步子哥智能涌现语言模型人工智能自然语言处理
在人工智能的浩瀚星空下，大型语言模型（LLMs）如同一颗颗璀璨的恒星，照亮了从文本生成到复杂推理的广阔领域。然而，这些模型在推理任务中往往像是在迷雾中航行——尽管它们能抵达目的地，却常常因为固定的思维路径而错过更优的航线。2025年5月，一篇题为《SoftCoT++:Test-TimeScalingwithSoftChain-of-ThoughtReasoning》的论文如同一盏明灯，照亮了如何让
BI+AI实战：我们如何用3秒完成车企供应链推演 qq_43696218 人工智能
一、BI+AI引领财务分析新纪元在财务数据分析领域，奥威BI+AI正以革命性的姿态颠覆传统。当金蝶、用友等工具仍深陷报表泥潭时，奥威BI+AI通过深度融合商业智能（BI）与人工智能（AI），实现了从滞后报表到实时洞察的飞跃。这不仅极大地提升了财务分析的效率，更为企业的战略决策提供了前所未有的精准支持。二、BI+AI的核心技术优势‌实时动态分析‌o奥威BI+AI摒弃了静态数据集，依托原始科目余额表实
DeepSeek-V3 通俗详解：从诞生到优势，以及与 GPT-4o 的对比码事漫谈 AI ai
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站1.DeepSeek的前世今生1.1什么是DeepSeek？DeepSeek是一家专注于人工智能技术研发的公司，致力于打造高性能、低成本的AI模型。它的目标是让AI技术更加普惠，让更多人能够用上强大的AI工具。1.2DeepSeek-V3的诞生DeepSeek-V3是DeepSeek公司推出的最新一代A
企业级AI开发利器：Spring AI框架深度解析与实战_spring ai实战 AI大模型-海文人工智能 spring python 算法开发语言 java 机器学习
企业级AI开发利器：SpringAI框架深度解析与实战一、前言：Java生态的AI新纪元在人工智能技术爆发式发展的今天，Java开发者面临着一个新的挑战：如何将大语言模型（LLMs）和生成式AI（GenAI）无缝融入企业级应用。传统的Java生态缺乏统一的AI集成方案，开发者往往需要为不同AI供应商（如OpenAI、阿里云、HuggingFace）编写大量重复的接口适配代码，这不仅增加了开发成本，
图扑软件智慧云展厅，开启数字化展馆新模式智慧园区可视化 5g 人工智能大数据安全云计算
随着疫情的影响以及新兴技术的不断发展，展会的发展形式也逐渐从线下转向线上。通过“云”上启动、云端互动、双线共频的形式开展。通过应用大数据、人工智能、沉浸式交互等多重技术手段，构建数据共享、信息互通、精准匹配的高精度“云展厅”，突破时空壁垒限制。图扑软件运用HT强大的渲染功能，数字孪生“云展位”，1:1复现实际展厅内部独特的结构造型和建筑特色。也可以第一人称视角漫游，模拟用户在展厅内的参观场景，在保
转行要趁早！网络安全行业人才缺口大，企业招聘需求正旺！
网络安全行业具有人才缺口大、岗位选择多、薪资待遇好、学历要求不高等优势，对于想要转行的人员来说，是一个非常不错的选择。人才缺口大网络安全攻防技术手段日新月异，特别是现在人工智能技术飞速发展，网络安全形势复杂严峻，人才重要性凸显。教育部《网络安全人才实战能力白皮书》数据显示，到2027年，我国网络安全人员缺口将达327万。近期发布的《2024年网络安全产业人才发展报告》中提到，沿用ISC2的人才缺口
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end