dra_p0p3n

大语言模型(LLMs)综合调研

简介
现象
- 涌现能力
- 关键技术
相关资源
- 开源模型或API
- 数据集
- 开源库
预训练
- 数据选择
- 数据预处理
- 模型架构
- 模型训练
模型微调
- 指令微调 Instruction Tuning
- 人机对齐 Alignment Tuning
下游任务
- 上下文学习（In-Context Learning，ICL）
- 思维链提示（Chain-of-Thought Prompting）
效果评估
未来
- 研究方向
- 几个有趣的东西
- - AutoGPT
  - 生成式智能体

最近大语言模型就像雨后春笋一样涌现出来，让人有点应接不暇，这里就写篇博客汇总一下近期发展情况，主要参考若干survey以及相关技术论文，截至2023.4

简介

语言是人类表达和通信的一种突出能力，它在儿童早期发展，并在一生中进化。而对于机器，它们不能自然地掌握以人类语言形式理解和交流的能力，除非配备强大的人工智能 (AI) 算法。为了实现这一目标，一直是一个长期的研究挑战，它使机器能够像人类一样阅读、写作和交流。从技术上讲，语言建模 (LM) 是推进机器语言智能的主要方法之一。一般来说，LM 旨在对单词序列的生成似然进行建模，以预测未来（或缺失）标记的概率。LM的研究在文献中受到了广泛的研究关注，大致可分为四大发展阶段：

统计语言模型 (SLM)，通过统计来预测上下文（ n-gram 语言模型）
神经语言模型 (NLM)，通过浅层神经网络预测（word2vec）
预训练语言模型(PLM)，设置了“预训练和微调”学习范式（LSTM ,BERT,GPT-2）
大型语言模型 (LLM)，在前者基础上缩放模型参数并对模型输出进行人机对齐，涌现出意想不到的能力（GPT-3,ChatGPT,GPT-4)

看似LLM和PLM训练方式大同小异，但呈现出来的效果却天差地别，这对我们的研究有以下几点改变：
1、LLM显示出一些令人惊讶的涌现能力，这在以前的较小PLM中可能没有观察到。这些能力是语言模型在复杂任务中表现的关键，使人工智能算法变得前所未有的强大和有效。
2、LLM彻底改变了人类开发和使用人工智能算法的方式。与小型PLM不同，访问LLM的主要方法是通过提示接口（例如GPT-4API）。人类必须了解LLM是如何工作的，并以LLM可以遵循的方式格式化他们的任务，输入和输出都变为了自然语言，有任务大一统的趋势，在自然语言处理领域，LLM可以作为通用的语言任务求解器。
3、LLM的发展不再明确区分研究和工程。LLM的训练需要在大规模数据处理和分布式并行训练方面有丰富的实践经验。为了开发有能力的LLM，研究人员必须解决复杂的工程问题，与工程师合作或成为工程师。

transformers家族如日中天：下图是transformer的大模型发展图，左边NLP，中间多模态，右边CV，最近还有个Segment Anything Model (SAM)分割一切的CV模型，让CV领域也迎来了ChatGPT时刻

大型语言模型效果这么好，但是为什么好，原理研究不是很清楚，现在只能从现象尝试去一窥大模型神奇的一角，下图是截至现在出现的LLM，有底色的是开源模型，真的像雨后春笋一样。

现象

涌现能力

LLM的涌现能力被正式定义为“不存在于小模型中但出现于大模型中的能力”，这是LLM与以前的PLM区别开来的最显著特征之一。当涌现能力出现时，它还引入了一个显著的特征：当规模达到一定水平时，表现显著高于随机。通俗来说就是参数量超过某个阈值，有些神奇的东西就会出现，拿FLAN的论文里的图来简单表示为：

涌现的主要有以下能力：

上下文学习 In-context learning（ICL）在不调整模型参数的情况下，根据用户输入的上下文结合模型输出更加符合上下文的答案，严格定义如下

其中C为上下文，为当前输入，通过模型f、上下文参数C和输入x共同预测下一句话，而不是只通过输入和模型进行预测,对话连贯度大幅增加
指令跟随 Instruction following（IF）理解问题能力明显增强，指令调优使LLM能够通过理解任务指令来执行新任务，而无需使用明确的示例，这可以在很大程度上提高泛化能力
思维链 chain of throught (COT) 对于小型语言模型，通常很难解决涉及多个推理步骤的复杂任务，例如数学单词问题。而通过思维链推理策略，LLM可以通过利用提示机制来解决这些任务，该机制涉及推导最终答案的中间推理步骤。据推测，这种能力可能是通过对代码进行训练而获得的

关键技术

这里简要列出了（可能）导致LLM成功的几个重要技术

模型缩放：缩放是提高LLM模型容量的关键因素。作为最初的尝试，GPT-3首先将模型大小增加到175B参数的超大规模。稍后，PaLM进一步将参数刻度提高到540B的新记录，如前所述，大的模型尺寸对于涌现能力至关重要。
训练和优化：分布式训练算法来学习LLM的网络参数，其中经常联合使用各种并行策略。优化技巧对训练稳定性和模型性能也很重要，出现了很多PLM时代不具有的新方法
能力启发。经过大规模语料库的预训练，LLM有了解决通用任务的潜在能力。然而，当LLM执行某些特定任务时，这些能力可能不会明确表现出来。合适的任务指令或特定的上下文策略来激发这种能力是有用的。例如，思维链提示已被证明通过包括中间推理步骤来解决复杂的推理任务是有用的。然而，这些技术主要对应于LLM的涌现能力，这可能在小型语言模型上没有表现出相同的效果。
人机对齐：使 LLM 能够遵循预期的指令，该方法利用具有人类反馈的强化学习技术，避免低质量数据导致的可能产生对人类生成有毒、有偏见的甚至有害的内容
外部规则：ChatGPT 启用了使用外部插件（现有或新创建的应用程序）的机制，这些插件类似于 LLM 的“眼睛和耳朵”。这种机制可以广泛扩大 LLM 的容量范围，例如调用计算器进行数值计算，调用搜索引擎检索未知信息

预训练

预训练建立了 LLM 能力的基础。通过对大规模语料库进行预训练，LLM 可以获得基本的语言理解和生成技能。在这个过程中，预训练语料库的规模和质量对于 LLM 获得强大功能至关重要。此外，为了有效地预训练 LLM、模型架构、加速方法和优化技术需要很好地设计。

数据选择

预训练通常采用上述数据集，根据目的不同，不同数据集占比不同，使用的总量也不尽相同，具体占比如下

数据预处理

一般使用上图流程，分为以下几步

语言过滤，度量过滤（困惑度等），静态过滤以及关键词过滤
重复数据删除。语料库中的重复数据会减少语言模型的多样性，这可能会导致训练过程不稳定，从而影响模型性能，进行不同级别的重复数据删除（句子级，文档级以及数据集级）。
脱敏，大多数预训练文本数据是从网络资源中获得的，包括涉及敏感或个人信息的用户生成内容，这可能会增加隐私泄露的风险。因此，有必要从预训练语料库中删除个人身份信息。一种直接有效的方法是使用基于规则的方法，例如关键字发现，检测和删除名称、地址和电话号码等
tokenization，是数据预处理的关键步骤，有些用的原来的技术，有些利用字节级字节对编码 (BPE) 算法等等

最终数据影响模型性能有三方面：数据来源，数据数量，数据质量，都很好理解产生影响的原因

模型架构

主流的LLM架构分为以下三种

Encoder-Decoder 很少有模型采用这个（Flan-T5 )，可能是现在大部分都是生成式模型
Casual Decoder 主流架构（GPT系列）
Prefix Decoder 前缀解码器，Casual Decoder的改进版，可以双向编码，加速收敛

上述三种方式可以混合以达到性能改进

下图是各个主流模型的架构

其中PE 表示位置嵌入，#L 表示层数，#H 表示注意力头的数量，dmodel 表示隐藏状态的大小，MCL 表示最大上下文长度

规范化：几种先进的技术作为 LN 的替代方案。RMS Norm 因其在训练速度和性能方面的优越性而使用。与 LN 相比，DeepNorm显示出更好的能力来确保训练的稳定性，GLM-130B 采用后归一化。此外，在嵌入层之后添加额外的LN也可以稳定llm的训练，但是消耗巨大
激活函数。为了获得良好的性能，激活函数也需要在前馈网络中正确设置。在现有的llm中，GeLU激活被广泛使用。此外，在最新的LLM(如PaLM和LaMDA)中，还使用了GLU激活的变体。特别是SwiGLU和GeGLU，在实践中通常取得了更好的性能。然而，与 GeLU 相比，它们在前馈网络中需要额外的参数
位置嵌入。相比于学习，ALiBi和RoPE是相对位置嵌入，对于模型的泛化性能提升更明显
偏差，最新的研究表明，去除偏差可以提升训练的稳定性

综上所述。为了更强的泛化和训练稳定性，建议选择Pre RMS Norm进行层归一化，将SwiGLU或GeGLU作为激活函数。对于位置嵌入，RoPE 或 ALiBi 是一个更好的选择，因为它在长序列上表现更好。

预训练任务主要是语言建模和去噪自动编码，如下公式也是语言建模的自回归解码器的通用目标

去噪自动编码任务（DAE）也被广泛用于预训练语言模型，DAE任务的输入x是带有随机替换跨度的损坏文本。然后，对语言模型进行训练，以恢复被替换的token x，其任务目标如下图所示

总的来说，Casual Decoder 的zero-shot和few-shot的性能更强，而缩放定律在Casual Decoder中也得到了很好的印证，通过缩放模型大小、数据集大小和总计算量，可以显著提高随机解码器的性能，相比之下，对于encoder-decoder的上述研究却很缺乏。

模型训练

训练有以下要素

批量训练 Batch Training：对于语言模型预训练，现有工作通常将批量大小设置为大量（8,196 tokens或 1.6M tokens），以提高训练稳定性和吞吐量。对于 GPT-3 和 PaLM 等 LLM，他们引入了一种新的策略，在训练期间动态增加批量大小，最终达到一百万个规模。具体来说，GPT-3 的批量大小从 32K 逐渐增加到 3.2M tokens。实证结果表明，批大小的动态调度可以有效地稳定llm的训练过程
学习率 Learning Rate:现有的llm在训练前通常采用类似的学习率计划和热身(warm-up)和衰减策略,和PLM差不多
优化器 Optimizer：Adam 优化器和 AdamW 优化器，或者是前者的变体Adafactor 优化器，节省GPU内存
稳定训练 Stabilizing the Training：梯度截断以及权重衰减等防止不稳定的事情出现的技术

下面是主流模型训练参数，中间一列为权重衰减方式，最后三个为衰减率，梯度截断和丢弃率

接下来是加速方法用于提高训练吞吐量和大型模型加载，主要有：

3D Parallelism（3D并行）

数据并行、张量并行、管道并行

混合精度训练
ZeRO技术：优化计算消耗（Pytorch的FSDP）
INT8量化和INT4量化：降低精度换取推理速度

GPT-4 最近引入了一种新的机制，称为基于深度学习堆栈的可预测缩放，从而能够使用更小的模型预测大型模型，对开发LLM应该有一定的借鉴作用

模型微调

主要分为指令微调和人机对齐两部分，前一种方法主要旨在增强或解锁llm的能力，而后一种方法旨在将llm的行为与人类值或偏好对齐

指令微调 Instruction Tuning

指令微调是在自然语言形式的格式化实例集合上微调预先训练的llm的方法，和监督微调与多任务提示训练高度相关，其实就是通过自然语言描述任务使模型提高理解输入的能力，从而增加模型的泛化性能，在上一篇chatgpt的调研博客中FLAN论文部分也写了这方面的内容，本质上是一个理解能力和生成能力同时提高的过程。

指令格式的实例由任务描述（称为指令）、输入输出对和少量演示（可选）组成，这里的来源主要分为两方面：

格式化现有数据集：通过编写模板描述不同任务的现有数据集，编写为指令的输入和输出
格式化人类需求：为避免前面一种缺乏指令多样性，或者与真实人类需求不匹配，还需要通过API收集真实用户的提问或者人工标注者进行头脑风暴，并要求另一组标注员对上述指令进行回答，由此生成指令微调训练对。还有一些半监督方式：通过将现有实例输入 LLM 以生成不同的任务描述和实例来构建实例。

影响指令微调质量的关键因素：

指令的数量和多样性：扩展任务的数量可以在很大程度上提高 LLM 的泛化能力，但是某一类任务过多会导致过拟合，需要平衡数据分布，通常同一任务最大上限通常设置为几千或数万个，任务的长度，结构或者创造性均会影响模型性能，模型性能总体随着指令数量增长而增长，最终会达到收敛。
指令的模板设计：可选指令示例加入，思维链（CoT）等同样可以提高微调质量

总而言之，指令的多样性比实例的数量更重要，因为性能良好的 InstructGPT 使用比 Flan 系列 LLM 更少但更多样化的指令（或实例）。此外，邀请标签者组成人类需求任务比使用数据集特定任务更有用。为了减少人力，可以重用现有的格式化数据集或使用现有的llm自动构建指令。

可用指令微调数据集如下：

当然，中文数据质量不敢恭维，现在国内更多人使用GPT-4去生成指令答案微调自己的模型（哈哈）

最终指令微调的效果有如下几个：

性能提升：在没有微调的情况下，具有指令微调的较小模型甚至可以比更大的模型表现更好，其提供了一种提高现有语言模型能力的通用方法。此外，它也比预训练成本低得多，因为 LLM 所需的指令数据量明显小于预训练数据
泛化性能提升。指令调整训练模型理解任务的自然语言指令。使其能够遵循人类的指令执行特定的任务，而不需要一些示例，即使是不可见任务同样表现优秀

BLOOMZ-P3基于Bloom[68]使用纯英语任务集合P3进行微调。有趣的是，与Bloom相比，BLOOMZ-P3在多语言句子补全任务上可以提高50%以上，这表明指令调整可以帮助LLMS从只有英语的数据集中获得一般任务技能，并将这些技能迁移到其他语言

人机对齐 Alignment Tuning

LLM在几乎所有的NLP任务中表现出了超强的能力。然而，这些模型有时可能会表现出意想不到的行为，例如，捏造虚假信息，追求不准确的目标，并产生有害、误导和有偏见的表达，因为其采用词预测的方法对模型参数进行预训练。为了避免这些意想不到的行为，人机对齐被提出使LLM的行为符合人类的期望。

人机对齐有自己的一套标准，其实就是对人类价值观的定量描述，其实是比较主观的，现有的工作主要是通过对抗和学习的方式防止这类输出，现行主流的方法是人类反馈强化学习(Reinforcement Learning from Human Feedback，RLHF)这种行为学习的方法

RLHF系统主要包括三个关键部分：待对齐的预训练LM、从人的反馈中学习的奖励模型和训练LM的RL算法。具体地，预训练的LM通常是用现有的预训练的LM参数初始化的生成性模型，奖励模型可以采取两种形式：微调的LM或使用人类偏好数据训练的LM从头开始训。现有的工作通常使用具有不同于对齐的LM的参数尺度的奖励模型。例如，OpenAI使用6B GPT-3，DeepMind使用7B Gopher作为奖励模型。最后，为了利用来自奖励模型的信号来优化预先训练算法，近邻策略优化(PPO)是现有工作中广泛使用的用于比对的RL算法。

上述过程有三步：

第一步就是上一部分的指令微调
通过人类的偏好训练一个奖励模型，常用的是标注者由好到坏进行排序，减小不同人之间的主观不一致
强化学习微调，对齐(即微调)LM被形式化为RL问题。在此设置中，预先训练的LM充当将提示作为输入并返回输出文本的策略，其动作空间是词汇，状态是当前生成的文本序列，奖励由RM提供。（PPO）

这个RHLF是行为模拟，所以极其考验标注者的水平，高质量的标注也是OPENAI成功的原因之一，也不怪百度比不过，数据是一方面，标注也是一方面。

下游任务

使用LLM做下游任务的时候主要通过上下文学习（In-Context Learning，ICL），利用思维链提示（chain-of-thought prompting CoT）来增强前者的效果，以达到下游任务的目的。

上下文学习（In-Context Learning，ICL）

其过程如上图所示：首先，从任务描述开始，从任务数据集中选择了一些示例作为演示。然后，它们以特定顺序组合，以使用专门设计的模板形成自然语言提示。最后，将测试实例附加到演示中作为 LLM 的输入以生成输出。基于任务演示，LLM 可以识别并执行新任务，而无需显式梯度更新。，执行过程如下：

当在 GPT-3 的论文中引入 ICL 时，它最初被定义为任务描述和演示示例的组合，其中任一组件是可有可无的。按照这个定义，当 LLM 只需要仅使用任务描述来解决不可见的任务时，也可以考虑执行 ICL 来解决任务解决，而 ICL 能力可以通过指令调整来增强。

影响ICL性能的主要有以下两个方面（每个方面都有很多人研究）：

演示设计：包括演示选择、格式和顺序。
- 演示选择可使用KNN,RL等方式，主打一个自动找出与提问最相关的示例（信息量最大）
- 演示的格式可使用预定义模板，也可使用添加任务描述和使用思维链提示等一大堆方法
- 演示顺序可采用熵度量排序，与查询语句相似性等一大堆信息论方法，主打一个提示最有效。
底层机制：经过预训练后，llm可以在不更新的情况下表现出有趣的ICL能力
- 预训练如何影响ICL：研究表明，ICL 的性能在很大程度上取决于预训练语料库的来源，而不是比例。另一项研究对训练数据分布的影响进行了深入分析。他们发现当训练数据可以聚集成许多不常见的类时，就会出现 ICL，而不是均匀分布的
- LLM怎么执行ICL：在推理阶段，研究人员专注于分析 ICL 能力如何根据给定的示例运行，因为不涉及显式学习或更新。他们通常从梯度下降的角度进行分析，并将ICL视为隐式微调，通过前向计算，LLM 生成关于演示的元梯度，并通过注意力机制隐式执行梯度下降。

思维链提示（Chain-of-Thought Prompting）

CoT 不是简单地用 ICL 中的输入输出对构建提示，而是将中间推理步骤合并到提示中，从而导致最终输出。

CoT性能影响因素以及相关研究：

CoT复杂度：越复杂越详细越能激发模型能力
多路径CoT：为相同问题设计多条CoT路径也可以提高能力，不同推理路径集成学习，提高准确率
零样本CoT：Let’s think step by step，自动生成思维链，取得了较好的效果

现象：CoT 只对足够大的模型产生了积极影响（例如，通常包含 10B 或更多参数 [33]），但对小型模型没有影响，其通过中间推理步骤增强了提示，因此改进需要逐步推理的任务（例如算术推理、常识推理和符号推理）主要是有效的。然而，对于不依赖复杂推理的其他任务，它可能显示出比标准提示更差的性能。

原因：关于 CoT 能力的来源，人们普遍认为它归因于代码的训练，因为在其上训练的模型显示出强大的推理能力。直观地说，代码数据通过算法逻辑和编程流程组织得很好，这对于提高 LLM 的推理性能可能很有用，这个观点缺乏验证，能力还跟给的模式，即推理路径和提示文本组织方式有关。

效果评估

GLUE数据集，结论如下：

ChatGPT 在自然语言推理任务（即 MNLI 和 RTE）上超越了所有 BERT 风格的模型，表明它在推理/推理方面具有优势
ChatGPT 在释义和相似性任务上的表现很差，即 MRPC 和 STS-B，性能下降高达 24% 分
ChatGPT 在单个句子分类任务上与 BERT-base 相当，即情感分析 (SST-2) 和语言可接受性 (CoLA) 和 QA 相关任务，即 QNLI

算数推理（下图）强于普通大模型，理解问题能力更强

ChatGPT 在七个常识、符号和逻辑推理数据集上与流行的 LLM 相比的准确性(下图):

常识和符号推理差
逻辑推理基本持平

后面是GPT-4的评估效果，可以看到大幅提升：（基本上秒杀）

上图是ChatGPT和GPT-4在逻辑多项选择机器阅读理解任务上的表现（准确率%）

上图是ChatGPT和GPT-4在自然语言推理任务上的表现（准确性%）

上图是GPT-4的性能，在有/没有上下文的情况下

GPT-4在所有任务上基本达到了SOTA，评估部分就不多赘述，一大堆评估的论文

未来

研究方向

大模型原理，涌现能力的原因和缩放定律的原理
模型架构，堆叠的多头自注意力层组成的 Transformer，稀疏注意力，上下文窗口等
模型训练与微调，更高效，加速机制，减小资源占用等（Lora加速）
模型利用，ICL,CoT等
人机对齐，RLHF或其它方式
下游应用，生成式智能体和医疗法律等领域专用模型

几个有趣的东西

AutoGPT

AutoGPT最大的特点是突破了现有的GPT只能做文本方面的任务的限制，可以利用各种工具来完成目标

AutoGPT原名是EntreprenurGPT，Significant Gravitas在2023年3月16日表达了他想创造一个实验项目，看看GPT-4能否在人类商业世界中生存，简单来说就是是否可以挣钱。其核心思想就是不停的向GPT-4发送请求，让其做商业决策，最后根据这个决策执行，看GPT-4给的策略能挣多少钱。Significant Gravitas发现，为了挣钱AutoGPT甚至抛弃了一些所谓的“道德”标准，在寻找新的挣钱机会的时候，AutoGPT敏锐地发现了加州洪水淹没农田，造成食物价格上涨，可以从这个背景寻找投资机会！

AutoGPT主要特性如下：

获取搜索和信息的互联网接入
长期和短期内存管理
使用 GPT-4 实例进行文本生成
访问流行的网站和平台
使用 GPT-3.5 进行文件存储和摘要

与hugging GPT的区别

HuggingGPT的目的是使用所有的AI模型接口完成一个复杂的特定的任务，更像解决一个技术问题的方案。而AutoGPT则更像一个决策机器人，它可以执行的动作范围比AI模型要更多样，因为它集成了谷歌搜索、浏览网页、执行代码等能力。从这个角度说，AutoGPT可以完成的任务或者决策比HuggingGPT更强，但是AI的能力却主要依赖GPT系列

生成式智能体

Generative Agents: Interactive Simulacra of Human Behavior

论文中提出的生成式智能体，可以以复杂且引人入胜的方式互动，形成观点，发起对话，甚至自主计划和参加活动。这项工作进一步支持了智能体机制在AI发展中具有前景的论点。

在一次评估中，这些生成代理产生了可信的个人和突发的社会行为：例如，从只有一个用户指定的概念开始，即一个代理想举办一个情人节聚会，这些代理在接下来的两天里自主地传播聚会的邀请，结识新朋友，互相约会参加聚会，并协调在正确的时间一起出现在聚会上。

amazing，未来已来

你可能感兴趣的:(语言模型,人工智能,自然语言处理,深度学习)

高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？ ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 机器学习算法深度学习人工智能
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？在大语言模型（LLM）中，最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息，这是由LLM的核心架构（以Transformer为基础）决定的，具体可以从以下角度理解：1.核心机制：自注意力（Self-Attention）的作用现代LLM（如GPT系列、Qwen等）均基于Transformer架构，其核心是自注意力机制。在
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
AI MCP教程之什么是 MCP？利用本地 LLM 、MCP、DeepSeek 集成构建您自己的 AI 驱动工具知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 mcp deepseek
介绍利用模型上下文协议(MCP)的工具吸引了我们的注意力—将AI变成触手可及的生产力引擎。它们巧妙、高效，让人难以抗拒。但如果您可以将这样的功能添加到自己的工具中，会怎么样呢？在本指南中，我将引导您构建一个具有本地运行的大型语言模型(LLM)和MCP集成的AI工具-让您以类似的方式自动执行利用MCP的工具您喜欢的任务。推荐文章《AnythingLLM教程系列之12AnythingLLM上的Olla
24GB GPU 中的 DeepSeek R1：Unsloth AI 针对 671B 参数模型进行动态量化知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介最初的DeepSeekR1是一个拥有6710亿个参数的语言模型，UnslothAI团队对其进行了动态量化，将模型大小减少了80%（从720GB减少到131GB），同时保持了强大的性能。当添加模型卸载功能时，该模型可以在24GBVRAM下以低令牌/秒的推理速度运行。推荐文章《本地构建AI智能分析助手之01快速安装，使用PandasAI和Ollama进行数据分析，用自然语言向你公司的数据提问为决策
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
【AI大模型】LLM模型架构深度解析：BERT vs. GPT vs. T5 我爱一条柴ya 学习AI记录 ai 人工智能 AI编程 python
引言Transformer架构的诞生（Vaswanietal.,2017）彻底改变了自然语言处理（NLP）。在其基础上，BERT、GPT和T5分别代表了三种不同的模型范式，主导了预训练语言模型的演进。理解它们的差异是LLM开发和学习的基石。一、核心架构对比特性BERT(BidirectionalEncoder)GPT(GenerativePre-trainedTransformer)T5(Text
[论文阅读]Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smal 0x211 论文阅读语言模型人工智能自然语言处理
中文译名：逐步蒸馏！以较少的训练数据和较小的模型规模超越较大的语言模型发布链接：http://arxiv.org/abs/2305.02301AcceptedtoFindingsofACL2023阅读原因：近期任务需要用到蒸馏操作，了解相关知识核心思想：改变视角。原来的视角：把LLMs视为噪声标签的来源。现在的视角：把LLMs视为能够推理的代理。方法好在哪？需要的数据量少，得到的结果好。文章的方法
GPT实操——利用GPT创建一个应用狗木马深度学习 gpt-3 gpt
功能描述信息查询：用户可以询问各种问题，如天气、新闻、股票等，机器人会返回相关信息。任务执行：用户可以要求机器人执行一些简单的任务，如设置提醒、发送邮件等。情感支持：机器人可以与用户进行情感交流，提供安慰和支持。个性化设置：用户可以自定义机器人的回复风格和偏好。技术栈前端：React.js后端：Node.js+Express数据库：MongoDB自然语言处理：OpenAIGPT-3API其他工具：
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
【实战AI】macbook M1 本地ollama运行deepseek 东方鲤鱼 chat AI macos ai llama AIGC chatgpt
由于deepseek官网或者Aapi调用会有网络延迟或不响应的情况，故在本地搭建部署；前提条件1.由于需要拉取开源镜像，受网络限制，部分资源在前提中会下载的更快！请自行；2.设备macbookM132G下载ollamaOllama是一款跨平台推理框架客户端（MacOS、Windows、Linux），专为无缝部署大型语言模型（LLM）（如Llama2、Mistral、Llava等）而设计。通过一键式
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
Python爬虫实战：使用最新技术爬取新华网新闻数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 scrapy 音视频
一、前言在当今信息爆炸的时代，网络爬虫技术已经成为获取互联网数据的重要手段。作为国内权威新闻媒体，新华网每天发布大量高质量的新闻内容，这些数据对于舆情分析、市场研究、自然语言处理等领域具有重要价值。本文将详细介绍如何使用Python最新技术构建一个高效、稳定的新华网新闻爬虫系统。二、爬虫技术选型2.1技术栈选择在构建新华网爬虫时，我们选择了以下技术栈：请求库：httpx（支持HTTP/2，异步请求
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
LLaMA-Omni 深度解析：打开通往无缝人机语音交互的大门 kakaZhui 前沿多模态大模型：论文与实战 llama 交互 LLM TTS 语音识别语音合成人工智能
一、引言：语音交互大模型今天我们来看语音交互大模型LLaMA-Omni，它由中国科学院计算技术研究所的研究者们推出，是一个基于强大的Llama-3.1-8B-Instruct构建的语音语言模型。LLaMA-Omni不仅实现了低至226ms的惊人交互延迟，还能同时生成高质量的文本与语音回复，真正意义上让大语言模型（LLM）具备了“听说”的能力。这篇博客将带你由浅入深，全方位地探索LLaMA-Omni
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL