机器学习社区

开源 LLM 微调训练指南：如何打造属于自己的 LLM 模型

一、介绍

今天我们来聊一聊关于LLM的微调训练，LLM应该算是目前当之无愧的最有影响力的AI技术。尽管它只是一个语言模型，但它具备理解和生成人类语言的能力，非常厉害！它可以革新各个行业，包括自然语言处理、机器翻译、内容创作和客户服务等，成为未来商业环境的重要组成部分。

我相信很多人在领略了GPT等大语言模型的魅力之后，都希望迫不及待的考虑能将模型能力集成到自己的产品中去，提升产品竞争力，由于LLM天然具备强大的语义理解能力，使得我们原来在用尝试用NLP去解决一些比较困难的问题突然变得迎刃而解，非常简单，甚至超出你的想象。此刻，我脑海里已经想到了很多可以借助LLM来实现的场景。

但是，我们也要面对一个很现实的问题，那就是在生产中使用LLM的成本和收益。说白了，就是要讨论钱的问题，老板可能更关心你的ROI比。那目前这些炒的火热的LLM是否一定就适合我们呢，一起看看它存在什么样的缺点。

1.1、商用模型在企业应用的劣势

投入成本：像OpenAI的GPT-4和Google的PaLm 2模型这样的LLM提供商是LLM性能的顶尖者，但是他们的顶级模型相当昂贵。GPT-4以及Google PaLm 2每1000个令牌（约600个单词）的费用在3到6美分之间。想象一下，如果你有一家有1000名员工的公司——每个员工每天发送大约25个提示——你每天就要花费750到1500美元！这还不算有成千上万的客户与你的LLM增强的应用程序互动了。
数据隐私：Google和OpenAI都不是在数据隐私保护方面做的特别不错的公司。从去年GPT模型爆发开始，大家的关注点都被模型本身的能力吸引了，没有太关注数据本身的安全问题，实际上经过这么一段时间全球用户的使用正好在给OpenAI做免费模型训练，虽然官方说的是通过API接口调用不会存储和训练你传输的数据。但如果你的数据保密要求高，显然放在别人那里总归是不够踏实的。
模型训练数据。虽然现有的LLM在日常语言任务方面非常精通，但它们仍然是基于广泛、庞大的数据集进行训练，这些数据集可能与你的数据不重叠。一旦你想让模型根据你自己的数据或特定用例表现出特定的行为或回答特定问题，你就需要考虑拥有自己微调过的模型。

所以，为了避免这些问题，我们有一个选择，那就是运行我们自己完全可控制的LLM模型。我们可以决定什么被审查，我们可以根据我们自己公司非常特定的知识来决定如何回答特定问题。那怎么做呢？这就需要用到“迁移学习”的基础知识。它是一种使用已经预先训练、测试过的模型，并添加你特定需求到它们上面的技术。此外，我们还将演示如何使用迁移学习来微调我们的模型，使其表现出我们需要它表现出来的行为。别担心——我们不需要大量的数据——也可以使用较小的数据集。

总之，LLM虽然很厉害，但是成本和数据隐私问题确实需要我们思考。如果你想要更低成本地做LLM微调，并且保护好自己的数据隐私，那么自己训练LLM就是一个不错的选择！

二、什么是迁移学习？

迁移学习是一种利用预先训练好的机器学习模型来解决新问题的技术，通常涉及不同领域的原始模型训练。在迁移学习中，我们不从头开始训练新模型，而是使用预先训练好的模型作为起点，这样可以节省时间和资源。

大型语言模型（LLM）是最强大的预先训练好的模型之一，例如_GPT、BERT、MPT、XLNet_等。这些LLM在海量文本数据上进行训练，从中学习了很多关于语言的知识。然而，它们对于特定资源的了解相对较少。

微调一个预先训练好的LLM涉及将预先训练好的模型适应一个新的任务，通过在特定任务的数据集上进行训练。这包括使用反向传播来更新预先训练好的模型的参数。基本思想是，预先训练好的模型已经学习了很多关于语言结构和语义的知识，我们只需要对其进行微调，以适应我们感兴趣的特定领域或任务。

微调预先训练好的LLM通常包括三个主要步骤：

初始化预先训练好的模型 ：首先，我们下载并初始化预先训练好的LLM。初始化模型涉及加载之前在大量文本语料上训练过的预先训练好的权重和架构。
微调预先训练好的LLM ：接下来，我们使用较小的、特定任务的数据集来微调预先训练好的LLM，以适应特定任务。这涉及使用反向传播和梯度下降来更新预先训练好的LLM的权重，同时保持模型下层的权重固定。
评估微调后的LLM ：最后，我们在测试集上评估微调后的LLM，以确定其在任务上的性能。

2.1、QLoRA：高效地微调LLM

通常，微调LLM是一个资源消耗较大的过程，需要进行许多参数调整。然而，开源社区已经开发出一种名为QLoRA的方法，它是一种高效的微调方法，可以减少内存使用量，并能够在单个48GB GPU上微调一个65B参数模型，同时保持完整的16位微调任务性能。

第一个使用QLoRA进行训练的模型家族是Guanaco模型，在Vicuna基准测试中超过了之前所有公开发布的模型，达到了与ChatGPT性能水平相当的99.3%，而只需要在单个GPU上进行24小时的微调。

与GPT模型训练所需的几个月和数百万美元的成本相比，QLoRA是一个胜利者。

因此，我们选择使用QLoRA微调技术。我们不会提供对QLoRA如何实现这些惊人结果的技术进行深入分析，而是更关注应用方面，找到如何利用它来实现我们自己的模型训练目标。

三、选择合适的基础模型

根据前面的讨论，我们不打算从头开始训练LLM模型，而是利用QLoRA微调方法来增强一个已有的泛化基础模型，使其具备我们自己的能力。

因此，我们需要选择一个可用的基础模型，有两个主要选择：

（1）、使用经过微调的GPT模型：由于GPT是目前表现最好的模型，并且OpenAI提供了强大的微调API，为什么不使用它作为基础呢？然而，正如前面提到的，由于隐私和成本的原因，我们目前不做考虑，如果大家有兴趣，可以点关注，后续会专门介绍针对OpenAI的模型做微调训练。

（2）、选择一个开源的LLM模型：除了商用模型的选择，其实开源社区一直在不断提供更优秀的模型。有数百个性能与GPT相当的开源模型。虽然目前还没有一个与GPT同样好的模型，但通过微调，我们可以轻松超越GPT的性能。

在这种情况下，我们需要选择一个性能良好的开源模型。Hugging Face是一个不错的选择。他们开发了流行的开源工具、库和模型，供NLP和AI爱好者使用。特别值得一提的是他们的Transformers库，它为目前所有可用的LLM提供了基础。此外，Hugging Face还建立了一个令人惊叹的、非常活跃的社区，多年来一直推动着机器学习和人工智能领域的创新。

Hugging Face方便地提供了当前最佳开源LLM模型的排行榜，您可以点击以下链接查看：

https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard

Hugging Face 的LLM排行榜提供了几个基准以及基准的平均值。以下是使用的不同基准：

ARC（AI推理挑战）：包含7787个自然的、小学科学水平的问题，旨在评估模型的知识和推理能力。
HellaSwag：评估常识语言推断能力，模型得分越高，说明其更好地理解语言的含义和意图。
MMLU（大规模多任务语言理解能力）：涵盖57个任务，包括初等数学、美国历史、计算机科学、法律等，要在这个测试中获得高准确率，模型必须具备广泛的世界知识和问题解决能力。
TruthfulQA：包含817个问题，涵盖38个类别，包括健康、法律、金融和政治等，用于判断模型输出的真实性。

根据您的具体任务，您可以按照任何一个基准对排行榜进行排序。例如，如果您需要处理许多推理类型的交互，那么ARC可能是一个不错的选择。

其实通常情况下，优秀的模型在所有基准上表现良好，并没有专门针对某个基准的模型。目前，通过简单地按照平均值排序，您几乎可以得到适用于任何用例的最佳模型。

除了以上的几个基准之外，还有三个因素需要考虑：

"指令"模型：例如 falcon-40b-instruct 模型，这些模型是专门为指令/聊天场景进行大量训练的，不适合进一步训练和微调。
模型大小：LLM模型由层和参数组成，参数越多，模型越复杂。较小的模型更容易进行微调，并且运行成本更低。根据经验法则，目前65亿参数的模型需要大约48GB或更多的GPU内存。出于经济原因，建议选择最小的能够满足您用例需求的模型。
许可证：与任何软件一样，我们需要注意可以做什么和不能做什么。要找到适用的许可证，请点击基准中的模型，并查找许可证部分。一般而言，Hugging Face上的模型可以用于研究目的。所有基于Llama的模型都禁止商业用途。而"falcon"模型家族是在宽松的Apache 2.0许可证下发布的，对于商业应用来说也是一个不错的起点。

3.1、模型选择的基本原则

使用hugging face排行榜并按平均基准结果排序。
排除任何"指导"模型。
检查模型的许可证以及它是否适合您的商业用例。
使用参数较少的模型，以便更容易地训练和降低成本。

虽然LLM模型排行榜每天都在变化，但截至目前，falcon模型依然还是开源模型中的最佳选择。它提供了两种大小（400亿和70亿），具备出色的基准结果，并且在Apache 2.0许可证下发布，这对于商业应用来说就非常友好了。更具体地说，由于它相对于其它同类的模型具有相当出色的性能，falcon-7b模型似乎是一个好的和经济合理的选择。

四、如何准备模型训练数据

现在我们已经选择好了基础模型，是时候选择训练数据进行训练了。这个步骤应该算是最复杂、最耗时、也是最重要的步骤了，因为我们提供给LLM的数据越好，我们得到的输出就越好。为了理解我们需要提供什么样的训练数据，首先需要了解模型训练的过程。

在非常高的层次上，模型训练涉及向现有的基础模型提供示例对话，包括问题和答案。然后，模型会学习并理解您希望参与的对话类型以及您期望它提供的答案类型和形式。

例如，如果您想让模型创建一种爆款小红书的文案风格，您需要提供用户问题和您认为正确输出的示例。

如果需要训练您的模型成为一个专家 Q&A 聊天机器人，提供用户问题和相应答案的示例。

4.1、应该准备多少组数据集示例？

数据集所需示例的数量没有一个非常通用的标准，但有一些经验可供参考。

对于较简单的任务，例如 FAQ 聊天机器人，通常 100 个示例已经足够好。
对于任务和输出更复杂的情况，就需要提供更多的示例。例如，如果你想改变模型的写作风格，比如总是鲁迅的风格写作，那么你可能需要提供数千个示例。
一般而言，示例越多越好，只要这些示例之间不重复。但也不要过度。对于许多任务来说，拥有数百个示例可能就足够了。

此外，你不需要提供所有可能的问题或交互，这几乎是不可能做到的，LLM 只需要能够“识别并理解”到你示例中的总体意图，并且为类似但不完全匹配的问题找到合适的答案即可。

4.2、如何创建数据集？

根据训练的任务，一般有几种方法可以考虑用于半自动地创建数据集。

1）、一种方法是创建一个 FAQ 聊天机器人的数据集。导出系统中最常见的问题以及客户支持团队提供的答案，并将其导出到 Excel 或 CSV 格式中。

2）、另一种方法是创建一个能够回答您知识库中大部分问题的模型。可以使用现有模型（如 GPT-4）来自动创建问题和答案。首先，将你的知识库分割成最多 3,000 个单词的块，然后将这些块发送给 GPT-3.5-16k，要求它根据这些文本块创建新用户可能提出的问题。最后，将所有输出合并以生成单个数据集。这个过程可以通过脚本高度自动化，只需几分钟即可生成数千个问题和答案。

3）、可能已经有一些预定义的数据集可用，它们可能对您的用例有用。Hugging Face Dataset Hub 是一个很好的起点，目前提供超过42000个数据集可供使用。你可以使用强大的过滤和搜索功能来查找适合您的数据集。

4.3、数据集需要遵循什么格式？

LLM的优势在于它们能够理解人类语言，而不受结构化数据的限制。因此，你的训练数据集不需要遵循特定的格式要求。但是，根据经验，最佳的做法是使用一个简单的两列数据集，其中一列是问题或提示，另一列是完美的答案，就像前一节中的例子一样。

选择这种格式的原因是它的简洁性，同时两列之间的分隔使我们能够将其格式化为后续训练步骤中可能需要的任何格式。这种灵活性使我们能够轻松地适应不同的数据处理和训练需求。

五、如何选择模型训练环境

在选择了基础模型和准备好训练数据集之后，我们需要选择一个执行模型训练过程的环境。

虽然我们可以在任何机器上进行模型训练，但高性能的 GPU 可以显著提高训练速度。一些现代的训练方法也需要 GPU 环境，因为在 CPU 上运行训练会非常耗时。因此，我们需要一个 GPU，具体来说，我们需要一款英伟达（NVIDIA）的 GPU。目前，英伟达的 CUDA 架构是最广泛使用的选项。尽管英特尔和 AMD 正在迎头赶上，但在未来几年内，我们仍然会受限于英伟达的选择。在选择 GPU 时，内存也是一个关键因素。

以下是几种不同规模的 GPU 选项：

小型 GPU，如 Nvidia’s RTX series 的 GPU，适合模型开发、测试和小规模项目部署，或者用于初期实验。它们通常具有小于 24GB 的内存。
中型 GPU，如 Nvidia A40 GPU，适用于中到大型项目。这些 GPU 在成本和计算能力之间提供了平衡，通常是大多数 LLM 训练任务的理想选择。它们具有约 48GB 的内存。
大型 GPU，如 Nvidia A100 GPU，非常适合大规模和内存密集型的训练任务，如 LLM 所需的训练。这些 GPU 价格昂贵，但在关键项目中加速训练速度往往是值得的。A100 旗舰型号提供了 80GB 的内存。
GPU 集群：如果以上选项仍然不够，现代训练框架允许并行地利用多个 GPU，从而可以加载和训练庞大的 LLM。

根据上述 GPU 选项列表，我们需要选择一个适应我们模型并且价格合理的 GPU。大多数模型并没有提供所需的训练内存大小，因此这是一个试错的过程。根据以往的经验，在使用 QLoRA 进行训练时：

70亿参数的模型可以在具有 12GB 内存的 GPU 上进行训练
300亿参数的模型适合在具有 24GB 内存的 GPU 上进行训练
650亿参数的模型可以在具有 48GB 内存的 GPU 上进行训练

具体如何选择，请根据你的训练需求和预算选择适合的 GPU。

5.1、具体在哪里获取这些 GPU？

要获取所需的 GPU，有几个选项，从免费到昂贵都有：

Google Colab：由 Google 提供，Colab 是一个运行 Jupyter Notebook 的平台。由于我们的模型训练将在 Python 中完成，因此这是一个不错的选择。Colab 提供了强大的硬件资源，免费用户可以获得带有 12GB RAM 的 NVIDIA T4 GPU，足以训练 7 亿参数的模型。如果需要更好的硬件和更多内存，可以选择付费计划，每月费用为 12 美元。请参考 Google 的 Colab GPU 指南，了解如何启用 GPU。
RunPod：RunPod 是一个按需提供多种 NVIDIA GPU 的服务商，以非常具有吸引力的每小时价格提供服务。启动一个支持 GPU 的虚拟机非常简单，并提供 SSH 访问权限、功能强大的 Web 控制台和预安装的 Jupyter 服务器。尽管无法与 Google Colab 的免费定价相比，但 RunPod 提供了相当低廉的 GPU 价格和易用性，是训练模型的理想选择。
云服务提供商：大型云服务提供商如 Azure、GCP 和 AWS 都提供 GPU 机器。请参考它们的虚拟机页面以获取更多详细信息。对于模型训练而言，它们相对于 Colab 和 RunPod 这样的解决方案稍显复杂，而且您可能不需要长时间运行机器。
自建服务器：最后一个选项是购买 GPU 并在家里或公司运行。虽然这可能需要一开始的大量投资（例如，NVIDIA RTX 3080 被认为是进行真正的 LLM 训练的最低要求，价格约为 1000 美元，而 A100 的价格约为 4000 美元），但如果您计划进行大量的训练操作，这可能是值得的。请注意，考虑到您是否真的需要全天候进行模型训练，RunPod 的价格可能会高达每月 1300 欧元。

对于大多数任务来说，训练过程通常只需要一两天的高性能 GPU。因此，在经济上，前面提到的解决方案通常更具优势。

本文我们将使用 Google Colab，因为我们要训练一个具有 70 亿参数的模型。然而，我们将使用 Colab Pro，因为我们需要超过 13GB 的系统内存（免费 Colab 的内存限制为 13GB）。

请记住，更大、更快的 GPU 可以加速训练和推理性能，所以如果预算允许，考虑使用其他方法。

六、开始训练你的LLM模型

前面的训练环境准备好之后，现在开始进行模型训练了。请确保您拥有一台至少具有 13GB GPU 内存的专用 GPU，并通过使用前面提到的任何一种方法来实现。

您还需要具备 16GB 系统内存，并且需要一个 Python 3.9+ 环境来运行训练代码步骤。

1）、首先，安装所需的依赖项。

pip install -qqq bitsandbytes 
pip install -qqq datasets 

!pip install-qqq git+https://github.com/huggingface/transformers@de9255de27abfcae4a 1f816b904915f0b1e2 
!pip install-qqq git+https://github.com/huggingface/peft.git 

!pip install -qqq git+https://github.com/huggingface/accelerate.git 

!pip install -qqq einops 
!pip install -qqq scipy 

# 我们需要这个特定版本的transformers，因为当前的主分支存在一个bug，导致无法成功训练: 
!pip install git+https://github.com/huggingface/transformers@de9255de27abfcae4a 1f816b904915f0b1e2

2）、导入所需的模块：

import bitsandbytes as bab 
import torch
import torch.nn as nn 
import transformers 
from datasets import load_dataset

from peft import LoraConfig, PeftConfig, postmedial, \ 
prepare_model_for_kbit_training, get_peft_model 

from transformers import AutoTokenizer, BitsAndBytesConfig, \ AutoModelForCausalLM

3）、初始化模型：

model_name = "tiiuae/falcon-7b" 
bnb_config = BitsAndBytesConfig( 
    load_in_4bit=True, 
    bnb_4bit_use_double_quant=True, 
    bnb_4bit_quant_type="nf4", 
    bnb_4bit_compute_dtype=torch.bfloat16 
) 

model = AutoModelForCausalLM.from_pretrained( 
    model_name,
    trust_remote_code=True, 
    quantization_config=bnb_config, 
    device_map="auto" 
)

model_name：要使用的模型名称。请参考 Hugging Face 获取确切的模型名称。
load_in_4bit：以 4 位量化模式加载模型，以便在有限的 GPU 内存下进行训练。使用 QLoRA 技术，我们不会损失模型性能。
bnb_4bit_quant_type：fp4 或 nf4 之一。这设置了量化数据类型。nf4 是 QLoRA 特定的浮点类型，称为 NormalFloat。
bnb_4bit_compute_dtype：这设置了计算类型，它可能与输入类型不同。例如，输入可能是 fp32，但计算可以设置为 bf16 来加速。对于 QLoRA 调优，请使用 bfloat16。
trust_remote_code：为了加载 falcon 模型，需要执行一些 falcon 模型特定的代码（使其适合 transformer 接口）。涉及到的代码是configuration_RW.py和modelling_RW.py。
device_map：定义将工作负载映射到哪个 GPU 设备上。设置为 auto 以最佳方式分配资源。

4）、初始化分词器（负责从提示和响应中创建令牌的对象）：

tokenizer = AutoTokenizer.from_pretrained(model_name) 
tokenizer.pad_token = tokenizer.eos_token

AutoTokenizer：是一个Hugging Face Transformer Auto Class，它会根据模型架构自动创建正确的分词器实例

pad_token：一个特殊令牌，用于将令牌数组调整为相同大小以便进行批处理。设置为句子结束（eos）令牌。

5）、启用梯度检查点并调用准备方法：

model.gradient_checkpointing_enable()
model = prepare_model_for_kbit_training(model)

Gradient Checkpointing ： 是一种用于在训练深度神经网络时减少内存占用的方法，代价是计算时间略有增加。更多细节可以在这里找到：

https://github.com/cybertronai/gradient-checkpointing

prepare_model_for_kbit_training：这个方法包装了在运行参数高效微调训练（QLoRA是这种训练范式的一种方法）之前准备模型的整个协议。

6）、初始化我们的LoRA训练配置：

config = LoraConfig( 
    r=8, 
    lora_alpha=32, 
    target_modules=["query_key_value"], lora_dropout=0.05,
    bias="none",
    task_type="CAUSAL_LM" 
)
 model = get_peft_model(model, config)

r, lora_alpha和lora_dropout是LoRA超参数。可以根据需要进行更改。对于 falcon 家族来说，上述参数通常是一个很好的起点。阅读Hugging Face QLoRA博客文章以了解更多细节。

task_type：描述语言建模类型，是因果的还是掩码的。对于像 GPT、LLama 或 Falcon 这样的 Transformer，它是因果的。更多细节请参考这里。

target_modules：变压器模型中应该用QLoRA进行训练的目标模块。根据这篇文章，实际上总是查询/键值模块。

6.1、加载数据集

接下来要做的是加载数据集。Hugging Face 的 datasets 模块提供了一个方便的方法 load_dataset，可以从本地路径或 Hugging Face 数据集中心加载数据集。该方法还将数据集拆分为特征，以供模型训练使用。

为了训练我们的模型，我将使用一个著名的电子商务 FAQ 数据集，其中包含关于一个假设的电子商务产品的信息。原始文件可以在这里找到：

https://www.kaggle.com/datasets/saadmakhdoom/ecommerce-faq-chatbot-dataset

我已经对文件进行了修改，以符合之前描述的问题/答案对数组的格式。该文件以 JSON 格式包含以下信息：

[{
 "question": "我应该怎么创建账号?",
 "answer": "创建账号，在网站右上角点击[注册]按钮完成注册流程" 
},...]

如果您想按照本示例进行操作，请从

https://datascienceengineer.com/datasets/ecommerce_faq.json 下载准备好的数据集。但您也可以使用自己的数据集，只要保持原始格式即可。

# 加载JSON文件并将其转换为训练特征
data = load_dataset("json", data_files="ecommerce_faq.json")

接下来，我们希望为我们的数据集添加一些提示格式。模型训练应该向模型展示在生产环境中可能看到的提示样式。因此，我们可能会得到以下内容：

：一些问题？

：LLM 的答案

为了实现这一点，我们用 “” 前缀标记我们的问题，用 “” 前缀标记我们的答案。

def generate_prompt(question_answer): 
    return f""" 
: {question_answer["question"]} 
: {question_answer["answer"]} 
    """.strip() 
    
def tokenize_prompt(question_answer):
    prompt = generate_prompt(question_answer)
    tokenized_prompt = tokenizer(prompt, padding=True, truncation=True) 
    return tokenized_prompt 
    
# 使用 shuffle 来重新排序列表，以消除潜在的排序偏差
data_prompt = data["train"].shuffle().map(tokenize_prompt)

6.2、训练配置和执行

我们到了最后一步 - 配置训练器并运行模型训练。

下面的训练器对象参数是超参数，可以（也应该）根据需要进行更改以获得更好的结果。对于 falcon-7b 模型训练，下面的参数非常有用，我在各种数据集上都获得了良好的结果。但是，对于其他类型的模型，您可能需要调整这些参数以获得更好的结果。

请参考 Hugging Face Trainer API 文档了解更多细节：

https://huggingface.co/transformers/v3.0.2/main_classes/trainer.html

trainer = transformers.Trainer( 
    model=model, 
    train_dataset=data_prompt, 
    args=transformers.TrainingArguments( per_device_train_batch_size=1,
    gradient_accumulation_steps=4, 
    num_train_epochs=1, 
    warmup_ratio=0.05, 
    max_steps=80, 
    learning_rate=2e-4, 
    fp16=True,
    logging_steps=1, 
    output_dir="outputs", 
    optim="paged_adamw_8bit", 
    lr_scheduler_type="cosine" 
), data_collator=transformers.DataCollatorForLanguageModeling(tokenizer, 
mlm=False),) 

model.config.use_cache = False trainer.train()

在调整模型参数的时候，注意不要修改这个参数 optim=“paged_adamw_8bit”，这是一种优化技术，可以避免内存峰值，从而防止 GPU 内存超载。

max_steps 参数不应该比你的训练数据集中的行数高太多。监控你的训练损失，以检查是否需要减少或增加这个值。

等待几分钟后，你的模型就成功训练好了！将你的模型保存在磁盘上，你就完成了！

model.save_pretrained("my-falcon")

参数（本例中为“my-falcon”）决定了你的模型文件将存储到哪个文件夹路径。

七、模型推理

现在我们已经创建并保存了我们的模型，接下来展示如何加载模型并对我们新训练的 LLM 模型进行查询。

首先，让我们加载配置并加载我们的模型：

# 从我们微调的模型中加载LoRA配置
lora_config = PeftConfig.from_pretrained('my-falcon') 

# 实例化一个Transformer模型类，根据我们的模型自动推断
my_model = AutoModelForCausalLM.from_pretrained( 
    lora_config.base_model_name_or_path, return_dict=True,
    quantization_config=bnb_config, device_map="auto", 
    trust_remote_code=True,
    load_in_8bit=True #这个设置可能会将量化减少到8位
    speed up inference and reduces memory footprint. 
) 

tokenizer=AutoTokenizer.from_pretrained( lora_config.base_model_name_or_path) 
tokenizer.pad_token=tokenizer.eos_token 

# 根据LoRA配置和权重实例化一个LoRA模型
my_model = PeftModel.from_pretrained(my_model, "my-falcon")

然后，让我们创建提示。请记住，我们专门训练了我们的 LLM 来使用 “/” 提示语法。因此，我们也可以将其添加到提示中。（这不是一个硬性要求，因为 LLM 大多能够自己找到 human/assistant 的角色。然而，由于我们在训练中包含了它，如果我们在提示中也包含它，性能可能会更好）。

prompt = f"""
 : 我应该怎么创建账号?
 :
 """.strip()

配置模型推理参数：

gen_conf=my_model.generation_config 
gen_conf.temperature=0
gen_conf.top_p=0.7 
gen_conf.max_new_tokens=200 
gen_conf.num_return_sequences=1 
gen_conf.pad_token_id=tokenizer.eos_token_id gen_conf.eos_token_id=tokenizer.eos_token_id

temperature: 介于 0 和 1 之间，用于决定模型输出的 “创造力”。值越高，对相似问题的回答越多样化。值越低，输出越确定性。
top_p: 介于 0 和 1 之间，用于决定考虑下一个输出 token 的数量。例如，如果设置为 0.5，则只考虑概率质量最高的 50% 的 token。
max_new_tokens: 输出应该生成多少个 token
num_return_sequences: 每个输入返回的序列候选数

接下来，使用我们的提示准备模型的输入，并将张量发送到推理设备。在此示例中，使用 “cuda:0” 进行 GPU 推理。

inputs = tokenizer(prompt, return_tensors="pt").to("cuda:0")

最后，让我们进行实际的推理：

with torch.inference_mode(): 
outputs = my_model.generate( 
    input_ids=inputs.input_ids, 
    attention_mask=inputs.attention_mask, 
    generation_config=gen_conf, 
    do_sample=False, 
    use_cache=True 
) 

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

到此，您的模型将需要几秒钟来生成 token，它会利用您训练它时使用的微调数据。

八、总结

迁移学习和 QLoRA 框架为我们提供了强大的工具，可以高效地利用预训练的语言模型（LLM）来解决特定任务。通过根据基准评估选择合适的基础 LLM 模型，我们可以确保我们微调工作的最佳性能。

生成高质量的训练数据非常重要，因为它有助于捕捉目标任务特定的细微差别。我们已经了解到了应该遵循哪种格式，并且我们看到并不需要大量的数据 - 数百个左右就足够了。

使用 Hugging Face Transformer 和 PEFT 库，我们对基础 LLM 进行了微调，使其专门适应期望的任务。

最后，通过使用经过微调的 LLM 进行模型推理，我们能够部署一个强大的语言模型，在实际应用中进行准确的预测并生成有价值的洞察力。

你可能感兴趣的:(大模型,自然语言,语言模型,人工智能,自然语言处理,AIGC,多模态大模型)

【机器学习】算法分类 CH3_CH2_CHO 什么？！是机器学习！！机器学习算法有监督学习无监督学习半监督学习强化学习
1、有监督学习1.1定义使用带标签的数据训练模型。有监督学习是机器学习中最常见的一种类型，它利用已知的输入特征和对应的输出标签来训练模型，使模型能够学习到特征与标签之间的映射关系。在训练过程中，模型会不断地调整自身的参数，以最小化预测值与真实标签之间的误差，从而提高预测的准确性。1.2回归问题1.2.1目标预测连续值。回归问题的目标是预测一个连续的数值结果，模型的输出是一个实数值。1.2.2解释回
Linux------Redis(软件安装，Linux下和Windows下)，NoSQL（简单了解） .墨迹. Linux redis 大数据 java
文章目录NoSql1.历史1.单机MySql2.Memcached(缓存)+MySql+垂直拆分(读写分离)3.分库分表+水平拆分+MySql集群4.如今最近的年代5.为什么要使用NoSQL2.什么是NoSQL1.NOSQL2.特点3.3v+3高3.NoSQL的四大分类1.kv键值对：2.文档型数据库（bson和json一样）：3.列存储数据库：4.图关系型数据库Redis1.初始redis1.简
硬核项目 KV 存储，轻松拿捏面试官！程序员老舅 C++Linux后端 KV存储 C++C++后端开发 Redis 内存索引 C++数据结构
硬核项目KV存储，轻松拿捏面试官！在简历上如何写这个项目？项目概述基于Bitcask模型，兼容Redis数据结构和协议的高性能KV存储引擎设计细节采用Key/Value的数据模型，实现数据存储和检索的快速、稳定、高效存储模型：采用Bitcask存储模型，具备高吞吐量和低读写放大的特征持久化：实现了数据的持久化，确保数据的可靠性和可恢复性索引：多种内存索引结构，高效、快速数据访问并发控制：使用锁机制
如何使用Langchain加载AZLyrics网页到可用文档格式 dgay_hua langchain python
##技术背景介绍在处理歌词数据时，尤其是从网页上获取歌词文本内容，用于自然语言处理或文本分析是常见的需求。AZLyrics是一个提供歌词的主要平台，为我们提供了大量的歌词数据。如果我们可以将这些网页内容自动加载到结构化的文档格式中，将极大地提升我们处理和分析歌词的效率。##核心原理解析Langchain提供了一种简单的方式来将网页内容转换为可用的文档格式。通过使用其文档加载器（DocumentLo
图神经网络实战——分层自注意力网络盼小辉丶图神经网络从入门到项目实战神经网络人工智能深度学习
图神经网络实战——分层自注意力网络0.前言1.分层自注意力网络1.1模型架构1.2节点级注意力1.3语义级注意力1.4预测模块2.构建分层自注意力网络相关链接0.前言在异构图数据集上，异构图注意力网络的测试准确率为78.39%，比之同构版本有了较大提高，但我们还能进一步提高准确率。在本节中，我们将学习一种专门用于处理异构图的图神经网络架构，分层自注意力网络(hierarchicalself-att
Python 爬虫实战：舞台剧与演出信息获取西攻城狮北 python 爬虫开发语言
作为一名对文化艺术活动和数据获取感兴趣的内容创作者，我决定利用Python爬虫技术抓取舞台剧与演出信息。这对于文艺爱好者、文化活动组织者以及相关研究人员来说，是一个极具价值的探索。一、项目背景舞台剧和各类演出活动丰富了人们的精神文化生活。许多城市都有专业的演出场馆，如国家大剧院、上海大剧院等，它们会定期发布演出信息。通过爬虫技术，我们可以自动化地获取这些演出信息，方便用户查询和分析。二、技术选型在
假如我有一台新电脑, 我要做些什么? t.y.Tang 随笔闲谈经验分享
有时候我要重装系统,或者买了一台新电脑,或者帮别人清理电脑,我个人感觉是有一条还算清晰的整理思路的.今天把它写下来做个备份,方便以后年龄大了记不清事情了还能查阅.所以以后想到什么补充的也会添加进来.本人常用的是windows系统,所以说的也是windows系统.目录安装过程中电脑分区分区方案初始设置进入系统后更新系统处理一些设置项更新MicrosoftStore应用卸载不用的预装应用文件资源管理器
AsyncHttpClient使用说明书有梦想的攻城狮 netty学习专栏 Java asynchttpclient 异步处理 netty
[[toc]]AsyncHttpClient（AHC）是一个高性能、异步的HTTP客户端库，广泛用于Java和Scala应用中，特别适合处理高并发、非阻塞的HTTP请求。它基于Netty或Java原生的异步HTTP客户端实现，支持HTTP/1.1和HTTP/2协议，适用于微服务、API调用、爬虫等场景。1.核心特性特性说明异步非阻塞基于事件驱动模型，避免线程阻塞，支持高并发（如每秒数千请求）。HT
基于 PyTorch 的 MNIST 手写数字分类模型欣然～ pytorch 分类人工智能
一、概述本代码使用PyTorch框架构建了一个简单的神经网络模型，用于解决MNIST手写数字分类任务。代码主要包括数据的加载与预处理、神经网络模型的构建、损失函数和优化器的定义、模型的训练、评估以及最终模型的保存等步骤。二、依赖库torch：PyTorch深度学习框架的核心库，提供了张量操作、自动求导等功能。torch.nn：PyTorch的神经网络模块，包含了各种神经网络层、损失函数等。torc
使用Couchbase实现高效的AI应用缓存与数据存储 scaFHIO 人工智能缓存 python
在当今AI应用的开发中，除了模型本身的性能，数据存储和缓存的效率也至关重要。Couchbase作为一款分布式NoSQL云数据库，其性能、可扩展性以及对AI、边缘计算应用的支持能力，使其成为优秀的选择。在本文中，我们将探讨如何通过Couchbase来实现高效的数据存储与缓存，尤其是在AI应用中。技术背景介绍随着AI应用规模的扩大和复杂度的增加，我们需要可靠的数据存储解决方案来满足实时性要求，同时减少
使用Titan Takeoff进行高效的自然语言处理模型推理 scaFHIO 自然语言处理人工智能 python
在自然语言处理(NLP)领域，每一家企业都在寻求更高效的模型训练和推理解决方案。TitanML的平台通过训练、压缩和推理优化帮助企业构建和部署更佳、更小、更便宜、更快速的NLP模型。特别是其推理服务器TitanTakeoff，使得在本地硬件上轻松部署大语言模型(LLMs)成为可能。技术背景介绍TitanTakeoff是TitanML提供的一项服务，它允许用户在本地硬件上运行推理工作负载。支持大多数
无再暴露源站！群联AI云防护IP隐匿方案+防绕过实战群联云防护小杜安全问题汇总人工智能 tcp/ip 网络协议网络安全 http 服务器
一、IP隐藏的核心原理群联AI云防护通过三层架构实现源站IP深度隐藏：流量入口层：用户访问域名解析至高防CNAME节点（如ai-protect.example.com）智能调度层：基于AI模型动态分配清洗节点，实时更新节点IP池回源层：防护节点通过加密隧道与源站通信，源站仅接受来自群联节点的流量二、IP隐藏配置全流程1.DNS配置（域名指向群联CNAME）#域名DNS记录示例@CNAMEai-pr
25道Python练手题（附详细答案），赶紧收藏！_python题库字节全栈_rJF python 开发语言
importrandomasrdnumber=rd.randint(0,100)foriinrange(10):choice=int(input("请输入你要猜测的数字："))ifchoice>number:print("你猜大了")elifchoice0and5*x+3*y+z/3==100:count+=1print("="*60)print(f'第{count}种买法，公鸡买了{x}只，母鸡
使用 Baseten 部署和运行机器学习模型的指南 shuoac 机器学习人工智能 python
随着机器学习模型在各个行业中的广泛应用，如何高效地部署和运行这些模型成为一个关键问题。本文将介绍如何使用Baseten平台来部署和服务机器学习模型。Baseten是LangChain生态系统中的一个重要提供者，它提供了所需的基础设施来高效地运行模型。无论是开源模型如Llama2和Mistral，还是专有或经过微调的模型，Baseten都能在专用GPU上运行。技术背景介绍Baseten提供了一种不同
探索Google AI聊天模型的集成和使用 qahaj 人工智能 python
随着人工智能的飞速发展，GoogleAI的聊天模型提供了强大的自然语言处理能力，可以应用于多种场景中。本文将为你介绍如何通过GoogleAI和LangChain库来使用这些聊天模型。技术背景介绍GoogleAI提供了一系列强大的聊天模型，这些模型具备不同的功能和参数设置。它们不仅可以通过GoogleAI服务访问，还可以通过GoogleCloudVertexAI以企业级功能使用。在本文中，我们将重点
Windows 图形显示驱动开发-WDDM 2.7功能- 支持跨适配器资源扫描 (CASO) 程序员王马 windows图形显示驱动开发 windows 驱动开发
Microsoft计算驱动程序模型概述在Windows10版本1903（WDDM2.6）及更高版本中，Microsoft计算驱动程序模型（MCDM）可用于为支持仅计算功能的设备编写驱动程序。MCDM驱动程序或仅计算驱动程序是Windows显示驱动程序模型2.0+（WDDM）的缩减子集。在WDDM术语中，驱动程序必须将自身播发为“仅呈现”设备，而无需显示功能。“呈现设备”的内核支持很灵活，因为设备执
Java高频面试之集合-02 牛马baby java 面试开发语言
hello啊，各位观众姥爷们！！！本baby今天来报道了！哈哈哈哈哈嗝面试官：说说队列queueJava队列（Queue）详解队列（Queue）是Java集合框架中一种先进先出（FIFO）的线性数据结构，广泛应用于生产者-消费者模型、任务调度、线程池等场景。Java提供了丰富的队列实现，涵盖线程安全、阻塞、优先级等特性。一、队列的核心接口与操作Java队列的顶层接口是java.util.Queue
“租赁业务ERP+deepseek”模式的应用软件研究员汽车 DeepSeek 汽车租赁系统
汽车租赁业务从上世纪90年代发展至今，从传统的人工管理到软件辅助，随着互联网的发展，业务公司对汽车租赁系统提出了更高的要求，比如自助订单，业务推广、客户资质评估，车辆风控，风险预警等，又随着近期人工智能的出现，业务公司对业务系统的期望更高，期望都节约更多人工成本，让管理变得简单快捷高效和智能。所以就引发人们新的启发：“业务系统ERP+deepseek”，但业务系统ERP+deepseek能否满足业
加快推进工业互联网，图扑“智”绘发展新蓝图智慧园区数字孪生 3d 网络人工智能物联网前端
当前，智能制造已成为我国实现从制造大国走向制造强国的战略目标，在迈向“钢铁强国”的征程上，“智慧”正成为钢铁产业的鲜明特征。图扑软件-构建先进2D和3D可视化所需要的一切方大九钢公司围绕钢铁企业管理模式变革的需求，借力能源绿色低碳转型的契机，以信息技术广泛应用为主导，大力推进“智能制造”，“淬炼”智慧钢铁。并与图扑软件合作，率先将5G、可视化、GIS相关技术引入钢铁行业。打造基于5G+云平台的智慧
基于NanoDet的无人机交通违规监控系统设计与实现深度学习&目标检测实战项目 NanoDet 无人机目标检测人工智能计算机视觉深度学习
1.引言随着无人机技术的发展，无人机在交通监控领域的应用逐渐增多。无人机能够提供空中视角，具有更高的视野覆盖范围，能够帮助交通管理部门实时监控交通违规行为。本博客将介绍如何使用NanoDet模型实现无人机交通违规监控系统，并结合PyQt5设计一个UI界面来实时展示检测结果。通过该系统，能够检测交通违规行为并做出实时预警，确保交通安全。本博客详细介绍了数据集的构建、模型的训练与推理、碰撞检测算法的实
高效快速教你DeepSeek如何进行本地部署并且可视化对话大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
科技文章：高效快速教你DeepSeek如何进行本地部署并且可视化对话摘要：随着自然语言处理（NLP）技术的进步，DeepSeek作为一款基于深度学习的语义搜索技术，广泛应用于文本理解、对话系统及信息检索等多个领域。本文将探讨如何高效快速地在本地部署DeepSeek，并结合可视化工具实现对话过程的监控与分析。通过详尽的步骤、案例分析与代码示例，帮助开发者更好地理解和应用DeepSeek技术。同时，本
机器学习——分类、回归、聚类、LASSO回归、Ridge回归（自用）代码的建筑师模型学习模型训练机器学习机器学习分类回归正则化项 LASSO Ridge 朴素
纠正自己的误区：机器学习是一个大范围，并不是一个小的方向，比如：线性回归预测、卷积神经网络和强化学都是机器学习算法在不同场景的应用。机器学习最为关键的是要有数据，也就是数据集名词解释：数据集中的一行叫一条样本或者实例，列名称为特征或者属性。样本的数量称为数据量，特征的数量称为特征维度机器学习常用库：Numpy和sklearn朴素的意思是特征的各条件都是相互独立的机器学习（模型、策略、算法）损失函数
《AI医疗系统开发实战录》第6期——智能导诊系统实战骆驼_代码狂魔程序员的法宝人工智能 django python neo4j 知识图谱
关注我，后期文章全部免费开放，一起推进AI医疗的发展核心主题：如何构建95%准确率的智能导诊系统？技术突破：结合BERT+知识图谱的混合模型设计一、智能导诊架构设计python基于BERT的意图识别模型（PyTorch）fromtransformersimportBertTokenizer,BertForSequenceClassificationimporttorchclassTriageMod
量化交易系统中如何处理机器学习模型的训练和部署？ openwin_top 量化交易系统开发机器学习人工智能量化交易
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位量化交易系统中，机器学习模型的训练和部署需要遵循一套严密的流程，以确保模型的可靠性、性能和安全性。以下是详细描述以及相关的示例：1.数据收集和预处理数据收集在量化交易中，数据是最重要的资产。收集的数
异步编程中的并发编程优化 AI天才研究院架构师必知必会系列自然语言处理人工智能语言模型编程实践开发语言架构设计
文章目录1.简介2.基本概念术语说明什么是异步编程？为什么要异步编程？浅谈异步编程模型基于事件驱动的模型基于消息队列的模型基于协程的模型为什么要进行并发优化？3.基本算法原理和具体操作步骤1.串行执行2.并行执行3.任务分片4.超时重试5.异步回调6.消息队列7.缓存8.异步框架9.模型选择4.具体代码实例和解释说明模块划分1.串行执行2.并行执行3.任务分片4.超时重试5.异步回调6.消息队列7
深入了解 ArangoDB 的图数据库应用与 Python 实践 eahba 数据库 python 开发语言
在当前数据驱动的时代，对连接数据的高效处理和分析需求日益增长。ArangoDB作为一个可扩展的图数据库系统，能够加速从连接数据中获取价值。本文将介绍如何使用Python连接和操作ArangoDB，并展示如何结合图问答链来获取数据洞察。技术背景介绍ArangoDB是一个多模型数据库，支持文档、图和键值类型的数据存储。其强大的图形存储和查询能力使其成为处理复杂数据关系的理想选择。通过JSON支持和单一
不懂英语可以学编程吗?,不懂英文可以学编程吗 P5688346 人工智能
大家好，给大家分享一下英语不好能学python编程吗，很多人还不知道这一点。下面详细解释一下。现在让我们来看看！Sourcecodedownload:本文相关源码提到人工智能，就不得不提Python编程语言，大多数人觉得编程语言肯定会涉及到很多代码，满屏的英文字母，想想就头疼，觉得自己不会英语，肯定学不好Python，但是不会英语到底能不能够学习Python呢，下面小编给大家分析分析。其实各位想要
众多主播都在用的超有趣桌面小宠物！开开心心_Every 宠物 virtualenv eclipse python django pygame java
BongocatMver是一款主播直播必备萌系插件，是一款开源软件。软件由国外一个高中生kuroni开发出来，让手鼓猫中的手臂可以跟随鼠标，按键的操作而发生动作。萌系的猫咪造型以及键盘映射的交互动画，十分适合游戏主播、绘画主播、音游主播在直播时使用的虚拟造型插件，可以给你的直播间或视频带来无限的元气。软件采用Live2d模型来实现自定义形状，用户可以根据自己的设定来更换不同形状的猫。精准的面部捕捉
鸿蒙特效教程06-可拖拽网格苏杰豪鸿蒙特效教程 HarmonyOS Next harmonyos 鸿蒙华为
鸿蒙特效教程06-可拖拽网格实现教程本教程适合HarmonyOSNext初学者，通过简单到复杂的步骤，一步步实现类似桌面APP中的可拖拽编辑效果。效果预览我们要实现的效果是一个Grid网格布局，用户可以通过长按并拖动来调整应用图标的位置顺序。拖拽完成后，底部会显示当前的排序结果。实现步骤步骤一：创建基本结构和数据模型首先，我们需要创建一个基本的页面结构和数据模型。我们将定义一个应用名称数组和一个对
LangChain组件Tools/Toolkits详解（5）——返回产出artifact 龙焰智能 langchain artifact ToolCall BaseTool 工具产物 ToolMessages
LangChain组件Tools/Toolkits详解（5）——返回产出artifact本篇摘要14.LangChain组件Tools/Toolkits详解14.5返回产出artifact14.5.1定义工具14.5.2使用ToolCall调用工具14.5.3与模型一起使用14.5.4从子例化BaseTool返回参考文献本章目录如下：《LangChain组件Tools/Toolkits详解（1）—
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc