江小皮不皮

PEFT微调方式总结

PEFT微调方式总结
- PEFT介绍
- - 安装peft
  - 支持的微调方法和任务
  - - SEQ_CLS
    - SEQ_2_SEQ_LM
    - CAUSAL_LM
    - TOKEN_CLS
- 模型加载
- 微调加载
- - PROMPT_TUNING
  - - 简介
    - 源码
    - demo
  - P_TUNING
  - - 简介
    - 源码
    - demo
  - PREFIX_TUNING
  - - 简介
    - 源码
    - demo
  - LORA
  - - 简介
    - demo
  - ADALORA
  - - 简介
    - demo
- 微调模型合并
- 模型推理

PEFT微调方式总结

PEFT介绍

PEFT 是 Huggingface 开源的一个参数高效微调库，它提供了最新的参数高效微调技术，并且可以与 Transformers 和 Accelerate 进行无缝集成。

安装peft

pip install peft

支持的微调方法和任务

class PeftType(str, enum.Enum):
    PROMPT_TUNING = "PROMPT_TUNING"
    P_TUNING = "P_TUNING"
    PREFIX_TUNING = "PREFIX_TUNING"
    LORA = "LORA"
    ADALORA = "ADALORA"
    ADAPTION_PROMPT = "ADAPTION_PROMPT"


class TaskType(str, enum.Enum):
    SEQ_CLS = "SEQ_CLS"
    SEQ_2_SEQ_LM = "SEQ_2_SEQ_LM"
    CAUSAL_LM = "CAUSAL_LM"
    TOKEN_CLS = "TOKEN_CLS"

SEQ_CLS

序列分类（Sequence Classification），对整个句子进行分类。如: 获取评论的情绪，检测电子邮件是否为垃圾邮件，确定句子在语法上是否正确或两个句子在逻辑上是否相关等

SEQ_2_SEQ_LM

条件生成任务，根据给定的输入（可能是文本、图片等）生成符合条件的输出。

与因果语言建模任务不同，条件生成不仅仅关注于给定上下文的连贯性，还关注于满足预定的任务要求。因果语言建模仅关注于根据给定的上下文生成文本序列。

条件生成的应用包括但不限于机器翻译、文本摘要、图像描述等。这些任务通常需要模型在输入和输出之间建立复杂的映射关系。

CAUSAL_LM

因果语言建模任务（CLM），在这种建模方法中，模型试图预测给定上下文中的下一个单词，该上下文通常包括在当前单词之前的所有单词。这种建模方法遵循因果原则，即当前单词只受到其前面单词的影响，而不受后面单词的影响。代表模型有GPT2、Bloom、OPT、GPT-Neo、GPT-J、LLaMA、ChatGLM。

TOKEN_CLS

Token 分类任务（Token Classification），对句子中的每个词进行分类。如: 识别句子的语法成分（名词、动词、形容词）或命名实体（人、地点、组织）。

模型加载

import transformers
model = transformers.AutoModelForCausalLM.from_pretrained(
            model_args.model_name_or_path,
            cache_dir=training_args.cache_dir,
            device_map='auto',
            torch_dtype='auto',
            trust_remote_code=True
        )
tokenizer = transformers.AutoTokenizer.from_pretrained(
        model_args.model_name_or_path, trust_remote_code=True)

微调加载

PROMPT_TUNING

简介

它为每个任务定义了独特的提示（Prompt），并将这些提示与数据拼接以作为输入，但仅在输入层添加提示标记。

源码

class PromptEmbedding(torch.nn.Module):
    """
    The model to encode virtual tokens into prompt embeddings.

    Args:
        config ([`PromptTuningConfig`]): The configuration of the prompt embedding.
        word_embeddings (`torch.nn.Module`): The word embeddings of the base transformer model.

    **Attributes**:
        - **embedding** (`torch.nn.Embedding`) -- The embedding layer of the prompt embedding.

    Example:

    ```py
    >>> from peft import PromptEmbedding, PromptTuningConfig

    >>> config = PromptTuningConfig(
    ...     peft_type="PROMPT_TUNING",
    ...     task_type="SEQ_2_SEQ_LM",
    ...     num_virtual_tokens=20,
    ...     token_dim=768,
    ...     num_transformer_submodules=1,
    ...     num_attention_heads=12,
    ...     num_layers=12,
    ...     prompt_tuning_init="TEXT",
    ...     prompt_tuning_init_text="Predict if sentiment of this review is positive, negative or neutral",
    ...     tokenizer_name_or_path="t5-base",
    ... )

    >>> # t5_model.shared is the word embeddings of the base model
    >>> prompt_embedding = PromptEmbedding(config, t5_model.shared)
    ```

    Input Shape: (`batch_size`, `total_virtual_tokens`)

    Output Shape: (`batch_size`, `total_virtual_tokens`, `token_dim`)
    """

    def __init__(self, config, word_embeddings):
        super().__init__()

        total_virtual_tokens = config.num_virtual_tokens * config.num_transformer_submodules
        self.embedding = torch.nn.Embedding(total_virtual_tokens, config.token_dim)
        if config.prompt_tuning_init == PromptTuningInit.TEXT and not config.inference_mode:
            from transformers import AutoTokenizer

            tokenizer_kwargs = config.tokenizer_kwargs or {}
            tokenizer = AutoTokenizer.from_pretrained(config.tokenizer_name_or_path, **tokenizer_kwargs)
            init_text = config.prompt_tuning_init_text
            init_token_ids = tokenizer(init_text)["input_ids"]
            # Trim or iterate until num_text_tokens matches total_virtual_tokens
            num_text_tokens = len(init_token_ids)
            if num_text_tokens > total_virtual_tokens:
                init_token_ids = init_token_ids[:total_virtual_tokens]
            elif num_text_tokens < total_virtual_tokens:
                num_reps = math.ceil(total_virtual_tokens / num_text_tokens)
                init_token_ids = init_token_ids * num_reps
            init_token_ids = init_token_ids[:total_virtual_tokens]
            init_token_ids = torch.LongTensor(init_token_ids).to(word_embeddings.weight.device)

            word_embedding_weights = word_embeddings(init_token_ids).detach().clone()
            word_embedding_weights = word_embedding_weights.to(torch.float32)
            self.embedding.weight = torch.nn.Parameter(word_embedding_weights)

    def forward(self, indices):
        # Just get embeddings
        prompt_embeddings = self.embedding(indices)
        return prompt_embeddings

demo

from peft import PromptTuningConfig,PromptTuningInit

peft_config = PromptTuningConfig(
task_type=TaskType.CAUSAL_LM,
prompt_tuning_init=PromptTuningInit.TEXT,
num_virtual_tokens=8,
prompt_tuning_init_text="Classify if the tweet is a complaint or not:",
tokenizer_name_or_path=model_args.model_name_or_path,
)
model = get_peft_model(model, peft_config)
model.print_trainable_parameters()

PromptTuningConfig配置类参数说明：

task_type：指定任务类型。如：条件生成任务（SEQ_2_SEQ_LM），因果语言建模（CAUSAL_LM）等。
prompt_tuning_init：提示嵌入的初始化方法。PEFT支持文本（TEXT）和随机（RANDOM）两种初始化方式。Prompt token 的初始化方法和长度对于模型性能有一定影响。与随机初始化和使用样本词汇表初始化相比，Prompt Tuning 采用类标签初始化模型的效果更佳。然而，随着模型参数规模的提升，这种差距最终会减小。因此，若需同时使用类标签和样本词汇表初始化，请指定为TEXT。
prompt_tuning_init_text：用于文本初始化提示嵌入时的方法。
num_virtual_tokens：指定虚拟 Token 数。当提示虚拟 Token 的长度在20左右时，性能表现良好。超过20后，增加 Prompt token 长度对模型性能提升影响不大；同样，这个差距会随着模型参数规模的提升而减小。

P_TUNING

简介

该方法将 Prompt 转换为可以学习的 Embedding 层，并用MLP+LSTM的方式来对Prompt Embedding进行一层处理。

源码

class PromptEncoder(torch.nn.Module):
    """
    The prompt encoder network that is used to generate the virtual token embeddings for p-tuning.

    Args:
        config ([`PromptEncoderConfig`]): The configuration of the prompt encoder.

    Example:

    ```py
    >>> from peft import PromptEncoder, PromptEncoderConfig

    >>> config = PromptEncoderConfig(
    ...     peft_type="P_TUNING",
    ...     task_type="SEQ_2_SEQ_LM",
    ...     num_virtual_tokens=20,
    ...     token_dim=768,
    ...     num_transformer_submodules=1,
    ...     num_attention_heads=12,
    ...     num_layers=12,
    ...     encoder_reparameterization_type="MLP",
    ...     encoder_hidden_size=768,
    ... )

    >>> prompt_encoder = PromptEncoder(config)
    ```

    **Attributes**:
        - **embedding** (`torch.nn.Embedding`) -- The embedding layer of the prompt encoder.
        - **mlp_head** (`torch.nn.Sequential`) -- The MLP head of the prompt encoder if `inference_mode=False`.
        - **lstm_head** (`torch.nn.LSTM`) -- The LSTM head of the prompt encoder if `inference_mode=False` and
        `encoder_reparameterization_type="LSTM"`.
        - **token_dim** (`int`) -- The hidden embedding dimension of the base transformer model.
        - **input_size** (`int`) -- The input size of the prompt encoder.
        - **output_size** (`int`) -- The output size of the prompt encoder.
        - **hidden_size** (`int`) -- The hidden size of the prompt encoder.
        - **total_virtual_tokens** (`int`): The total number of virtual tokens of the
        prompt encoder.
        - **encoder_type** (Union[[`PromptEncoderReparameterizationType`], `str`]): The encoder type of the prompt
          encoder.


    Input shape: (`batch_size`, `total_virtual_tokens`)

    Output shape: (`batch_size`, `total_virtual_tokens`, `token_dim`)
    """

    def __init__(self, config):
        super().__init__()
        self.token_dim = config.token_dim
        self.input_size = self.token_dim
        self.output_size = self.token_dim
        self.hidden_size = config.encoder_hidden_size
        self.total_virtual_tokens = config.num_virtual_tokens * config.num_transformer_submodules
        self.encoder_type = config.encoder_reparameterization_type

        # embedding
        self.embedding = torch.nn.Embedding(self.total_virtual_tokens, self.token_dim)
        if not config.inference_mode:
            if self.encoder_type == PromptEncoderReparameterizationType.LSTM:
                lstm_dropout = config.encoder_dropout
                num_layers = config.encoder_num_layers
                # LSTM
                self.lstm_head = torch.nn.LSTM(
                    input_size=self.input_size,
                    hidden_size=self.hidden_size,
                    num_layers=num_layers,
                    dropout=lstm_dropout,
                    bidirectional=True,
                    batch_first=True,
                )

                self.mlp_head = torch.nn.Sequential(
                    torch.nn.Linear(self.hidden_size * 2, self.hidden_size * 2),
                    torch.nn.ReLU(),
                    torch.nn.Linear(self.hidden_size * 2, self.output_size),
                )

            elif self.encoder_type == PromptEncoderReparameterizationType.MLP:
                encoder_num_layers_default = PromptEncoderConfig.encoder_num_layers
                if config.encoder_num_layers != encoder_num_layers_default:
                    warnings.warn(
                        f"for {self.encoder_type.value}, the argument `encoder_num_layers` is ignored. "
                        f"Exactly {encoder_num_layers_default} MLP layers are used."
                    )
                layers = [
                    torch.nn.Linear(self.input_size, self.hidden_size),
                    torch.nn.ReLU(),
                    torch.nn.Linear(self.hidden_size, self.hidden_size),
                    torch.nn.ReLU(),
                    torch.nn.Linear(self.hidden_size, self.output_size),
                ]
                self.mlp_head = torch.nn.Sequential(*layers)

            else:
                raise ValueError("Prompt encoder type not recognized. Please use one of MLP (recommended) or LSTM.")

    def forward(self, indices):
        input_embeds = self.embedding(indices)
        if self.encoder_type == PromptEncoderReparameterizationType.LSTM:
            output_embeds = self.mlp_head(self.lstm_head(input_embeds)[0])
        elif self.encoder_type == PromptEncoderReparameterizationType.MLP:
            output_embeds = self.mlp_head(input_embeds)
        else:
            raise ValueError("Prompt encoder type not recognized. Please use one of MLP (recommended) or LSTM.")

        return output_embeds

demo

from peft import PromptEncoderConfig,get_peft_config,TaskType

peft_config = PromptEncoderConfig(task_type=TaskType.CAUSAL_LM, num_virtual_tokens=20, encoder_hidden_size=128)
model = get_peft_model(model, peft_config)
model.print_trainable_parameters()

PromptEncoderConfig配置类参数说明：

task_type：训练的任务类型，如：序列分类（SEQ_CLS），因果语言建模（CAUSAL_LM）等。
num_virtual_tokens：虚拟token的数量，换句话说就是提示（prompt）。
encoder_hidden_size：编码器的隐藏大小，用于优化提示参数。
encoder_reparameterization_type：指定如何重新参数化提示编码器，可选项有：MLP 或 LSTM，默认值为 MLP。

PREFIX_TUNING

简介

在输入token之前构造一段任务相关的virtual tokens作为Prefix；然后，在训练的时候只更新Prefix部分的参数，而 PLM 中的其他部分参数固定。同时，为了防止直接更新 Prefix 的参数导致训练不稳定和性能下降的情况，在 Prefix 层前面加了 MLP 结构，训练完成后，只保留 Prefix 的参数。

源码

class PrefixEncoder(torch.nn.Module):
    r"""
    The `torch.nn` model to encode the prefix.

    Args:
        config ([`PrefixTuningConfig`]): The configuration of the prefix encoder.

    Example:

    ```py
    >>> from peft import PrefixEncoder, PrefixTuningConfig

    >>> config = PrefixTuningConfig(
    ...     peft_type="PREFIX_TUNING",
    ...     task_type="SEQ_2_SEQ_LM",
    ...     num_virtual_tokens=20,
    ...     token_dim=768,
    ...     num_transformer_submodules=1,
    ...     num_attention_heads=12,
    ...     num_layers=12,
    ...     encoder_hidden_size=768,
    ... )
    >>> prefix_encoder = PrefixEncoder(config)
    ```

    **Attributes**:
        - **embedding** (`torch.nn.Embedding`) -- The embedding layer of the prefix encoder.
        - **transform** (`torch.nn.Sequential`) -- The two-layer MLP to transform the prefix embeddings if
          `prefix_projection` is `True`.
        - **prefix_projection** (`bool`) -- Whether to project the prefix embeddings.

    Input shape: (`batch_size`, `num_virtual_tokens`)

    Output shape: (`batch_size`, `num_virtual_tokens`, `2*layers*hidden`)
    """

    def __init__(self, config):
        super().__init__()
        self.prefix_projection = config.prefix_projection
        token_dim = config.token_dim
        num_layers = config.num_layers
        encoder_hidden_size = config.encoder_hidden_size
        num_virtual_tokens = config.num_virtual_tokens
        if self.prefix_projection and not config.inference_mode:
            # Use a two-layer MLP to encode the prefix
            self.embedding = torch.nn.Embedding(num_virtual_tokens, token_dim)
            self.transform = torch.nn.Sequential(
                torch.nn.Linear(token_dim, encoder_hidden_size),
                torch.nn.Tanh(),
                torch.nn.Linear(encoder_hidden_size, num_layers * 2 * token_dim),
            )
        else:
            self.embedding = torch.nn.Embedding(num_virtual_tokens, num_layers * 2 * token_dim)

    def forward(self, prefix: torch.Tensor):
        if self.prefix_projection:
            prefix_tokens = self.embedding(prefix)
            past_key_values = self.transform(prefix_tokens)
        else:
            past_key_values = self.embedding(prefix)
        return past_key_values

demo

from peft import PrefixTuningConfig,get_peft_config,TaskType

peft_config = PrefixTuningConfig(task_type=TaskType.CAUSAL_LM, num_virtual_tokens=30)
model = get_peft_model(model, peft_config)
model.print_trainable_parameters()

PrefixTuningConfig 配置类参数说明：

task_type：指定任务类型。如：条件生成任务（SEQ_2_SEQ_LM），因果语言建模（CAUSAL_LM）等。
num_virtual_tokens：虚拟token的数量，换句话说就是提示（prompt）。
inference_mode：是否在推理模式下使用Peft模型。
prefix_projection：是否投影前缀嵌入(token)，默认值为false，表示使用P-Tuning v2，如果为true，则表示使用 Prefix Tuning。

Prefix Tuning 与 P-Tuning v2 最主要的差别就是是否进行重新参数化编码,包含两个线性层的多层感知机（MLP）。

LORA

简介

该方法的核心思想就是通过低秩分解来模拟参数的改变量，从而以极小的参数量来实现大模型的间接训练。

demo

from peft import LoraConfig, get_peft_model

LORA_R = 32
LORA_DROPOUT = 0.05
TARGET_MODULES = [
"o_proj","gate_proj", "down_proj", "up_proj"
]

config = LoraConfig(
    r=LORA_R,
    target_modules=TARGET_MODULES,
    lora_dropout=LORA_DROPOUT,
    bias="none",
    task_type="CAUSAL_LM",
    )
model = get_peft_model(model, config)
model.print_trainable_parameters()

LoraConfig配置类参数说明：

task_type：指定任务类型。如：条件生成任务（SEQ_2_SEQ_LM），因果语言建模（CAUSAL_LM）等。
inference_mode：是否在推理模式下使用Peft模型。
r： LoRA低秩矩阵的维数。关于秩的选择，通常，使用4，8，16即可。
lora_alpha： LoRA低秩矩阵的缩放系数，为一个常数超参，调整alpha与调整学习率类似。
lora_dropout：LoRA 层的丢弃（dropout）率，取值范围为[0, 1)。
target_modules：要替换为 LoRA 的模块名称列表或模块名称的正则表达式。针对不同类型的模型，模块名称不一样，因此，我们需要根据具体的模型进行设置，比如，LLaMa的默认模块名为[q_proj, v_proj]，我们也可以自行指定为：[q_proj,k_proj,v_proj,o_proj]。在 PEFT 中支持的模型默认的模块名如下所示：

ADALORA

简介

● Adalora，即自适应 LORA，主要通过在不同的 Transformer Block 层中动态分配原生 LORA 中的秩，确保这些秩在微调过程中能够随着 block 重要性的变化而变化。

● Adalora 的效果通常比 LORA 更好，原因在于 LORA 使用两个矩阵 BA 来拟合满秩张量，而 Adalora 使用三个矩阵 PAQ，并在损失函数中限制 P 和 Q 正交。这种拟合方式符合奇异值分解（SVD）的原理。

● 在微调训练的每一步，根据 block 中参数对损失的影响计算其重要性，取 top N 为秩进行下一步的正向计算。然后在接下来的反向传播中重新计算重要性，以此实现动态分配。

demo

from peft import AdaLoraConfig, get_peft_model

LORA_R = 32
LORA_DROPOUT = 0.05

config = LoraConfig(
    r=LORA_R,
    target_modules=TARGET_MODULES,
    lora_dropout=LORA_DROPOUT,
    bias="none",
    task_type="CAUSAL_LM",
    )
config = AdaLoraConfig(
                peft_type="ADALORA", task_type="CAUSAL_LM", r=LORA_R, lora_alpha=32, target_modules=["q", "v"],
                lora_dropout=LORA_DROPOUT,
            )
model = get_peft_model(model, config)
model.print_trainable_parameters()

微调模型合并

加载微调模型

base_model_name_or_path = "internlm-7b"
lora_model_name_or_path = "/checkpoint-9695"


model = AutoModelForCausalLM.from_pretrained(
    base_model_name_or_path,
    torch_dtype="auto",
    trust_remote_code=True,
).cuda(0)

model =PeftModel.from_pretrained(model,model_id=lora_model_name_or_path)
model.eval()
tokenizer = AutoTokenizer.from_pretrained(
    base_model_name_or_path, trust_remote_code=True, padding_side="left"
)

合并模型

model = model.merge_and_unload()
model.save_pretrained("internlm-7b-lml")
tokenizer.save_pretrained("internlm-7b-lml")

模型推理

加载微调模型

base_model_name_or_path = "internlm-7b"
lora_model_name_or_path = "/checkpoint-9695"


model = AutoModelForCausalLM.from_pretrained(
    base_model_name_or_path,
    torch_dtype="auto",
    trust_remote_code=True,
).cuda(0)

model =PeftModel.from_pretrained(model,model_id=lora_model_name_or_path)
model.eval()
tokenizer = AutoTokenizer.from_pretrained(
    base_model_name_or_path, trust_remote_code=True, padding_side="left"
)

定义批量推理函数

def batch_generate_data(
    text_input: List[str], use_train_model: bool = True, temp: float = 0.7
):
    text_input_format = [generate_input(i) for i in text_input]
    batch_inputs = tokenizer.batch_encode_plus(
        text_input_format, padding="longest", return_tensors="pt"
    )
    batch_inputs["input_ids"] = batch_inputs["input_ids"].cuda()
    batch_inputs["attention_mask"] = batch_inputs["attention_mask"].cuda()

    if use_train_model:
        # with model.disable_adapter():
        outputs = model.generate(
            **batch_inputs,
            max_new_tokens=256,
            do_sample=True,
            temperature=temp,
            top_p=0.8,
        )
    else:
        with model.disable_adapter():
            outputs = model.generate(
                **batch_inputs,
                max_new_tokens=256,
                do_sample=True,
                temperature=temp,
                top_p=0.8,
            )
    outputs = tokenizer.batch_decode(
        outputs.cpu()[:, batch_inputs["input_ids"].shape[-1] :],
        skip_special_tokens=True,
    )

    return outputs

调用推理

text_input = ["工作压力太大怎么办\n"] * 32
batch_generate_data(text_input, use_train_model=True, temp=0.8)
# 原来的模型
batch_generate_data(text_input, use_train_model=False, temp=0.8)

探秘智能指令的奇幻大陆：ULTRAIF引领模型自我进化之旅步子哥 AGI通用人工智能人工智能
在浩瀚的人工智能领域中，每一次技术革新都犹如在无垠星空中挖掘出一颗璀璨的新星。而最近，一项名为ULTRAIF的技术方案正悄然崛起，成为指令跟随领域的一股清流。本文将以通俗易懂、风趣幽默的叙述方式，带你走进这片奇幻大陆，探索ULTRAIF如何在开放数据与自我校准中引领智能大模型的进化。接下来，就让我们踏上这段妙趣横生的探索之旅吧！初识ULTRAIF：指令跟随的变革曙光当人们第一次尝试教会计算机理解复
【Swift 算法实战】利用 KMP 算法高效求解最短回文串网罗开发 Swift vue.js leetcode 算法
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
Python面向对象 jay丿 python 开发语言
#面向对象在编程领域中，有多种开发模式/风格，比较常见的有面向过程、面向对象、函数式编程等手段。在Python语言中，支持面向过程、面向对象和函数式编程的。面向过程面向过程目的性很强、为了完成某个特定的功能而通过函数、判断、循环等手段编写的代码。面向对象面向对象将一个任务进行拆解、每一部分的任务由特定的类/函数等完成、最终将每一部分任务的结果合并到一块、最终完成整个任务。面向对象的三大基石封装继承
Python基础知识点全面总结 jay丿 python windows 开发语言
Python基础知识点全面总结Python作为一种简洁、易读且功能强大的编程语言，已经成为编程学习和应用领域中的热门选择。本文将对Python的基础部分进行全面总结，涵盖数据类型、条件判断、循环、函数、数据结构等重要知识点，并附上相关代码示例。一、数据类型Python中的数据类型主要分为五大类：数值、布尔、字符串、容器、None。数值类型整型（int）：在Python3中，int表示长整型，没有l
JS DOM详解 jay丿 javascript 开发语言 ecmascript
DOM(文档对象模型)文档对象模型主要的职责是处理网页中的标签(元素)获取标签（元素）对象document.getElementById(“id”)根据标签的ID属性值获取指定的元素、该方法只能返回一个标签。document.getElementsByTagName(“tag”):根据标签名获取所对应的多个元素组成的对象（形似数组的对象）。document.getElementsByClassNa
Python 进阶特性深度解析：从语法糖到内存管理的统一视角 Neo Evolution Python python windows 开发语言算法数据结构
生成式（推导式）的用法与内存效率分析Python的推导式不仅仅是语法糖，它们在内存管理和性能方面有着深刻的影响。理解推导式的工作原理，有助于我们写出更高效的代码。推导式的内存模型分析列表推导式在CPython解释器中的实现实际上比等价的for循环更为高效：#列表推导式的内存分配模式squares_list=[x**2forxinrange(1000)]#等价for循环的内存分配模式squares_
探索Omniglot：一个无尽的手写字符集合宋溪普Gale
探索Omniglot：一个无尽的手写字符集合omniglotomniglot-一个包含大量不同语言手写字符图像的数据集，用于机器学习模型的训练和评估。项目地址:https://gitcode.com/gh_mirrors/om/omniglot项目简介Omniglot是由BrendenLake等人创建的一个开源项目，其目标是提供一个广泛的手写字符集，用于研究人类和机器的学习能力。这个项目不仅仅是一
docker安装Open WebUI详解-遇到的坑OSError: We couldn‘t connect to ‘https://huggingface.co‘ to load this file 坚定信念，勇往无前 AI docker 容器运维
一、OpenWebUI简介OpenWebUI（https://openwebui.com）是一个用户友好的Web界面，专为本地大语言模型（LLMs）设计。它支持多种模型，包括Ollama和OpenAI兼容的API，并允许用户通过图形界面轻松调试和调用模型。OpenWebUI的功能丰富，包括代码高亮、数学公式支持、网页浏览、预设提示词、本地RAG集成、对话标记、模型下载、聊天记录查看以及语音支持等。
大模型学习完整路径（一站式汇总），从零基础到精通！新手友好级指南 Python程序员罗宾学习语言模型知识图谱人工智能数据库 java
如果读者朋友不想深入学习大模型，则了解提示词的使用原则也可以了。要是既不想深入学习，又要做大模型相关的项目，则对于工程同学来说，学习RAG也能把大模型玩转起来。前排提示，文末有大模型AGI-CSDN独家资料包哦！先来一张整体结构图，越是下面部分，越是基础：可以按以下步骤学习：1.理解基础概念需要了解深度学习的基本原理和常见术语，如神经网络、梯度下降、反向传播、监督学习、无监督学习、分类、回归、聚类
2024下半年软考——软件设计师30天冲刺学习指南！！！ winin2024 经验分享软件设计师
距离2024下半年软件设计师考试已经只剩一个多月了，还没有开始备考的小伙伴赶紧行动起来。为了帮助大家更好的冲刺学习，特此提供一份考前30天学习指南。本指南包括考情分析、学习规划、冲刺攻略三个部分，可以参考此指南进行最后的复习要领，相信小伙伴们，在这一过程中所付出的努力，都能得到回报~第一部分考情分析1、综合知识知识点分数说明比例软件工程基础知识13开发方法与开发模型、数据流图与数据字典、结构化设计
一文讲清楚 AI Agent（智能体）网络风云人工智能
AIAgent（人工智能代理，一般直接叫做智能体）以各种形态存在于我们生活的方方面面，大家比较熟知的有Siri、小爱同学等虚拟助手，但其实在自动驾驶、教育、娱乐、医疗、科研、智能家居等等到处都有它们的身影。它是能够感知环境、做出决策并执行行动以实现特定目标的智能实体。AIAgent的核心特点是自主性、适应性和交互性，它可以在复杂的环境中独立完成任务，并根据环境变化调整策略。AIAgent广泛应用于
2025年计算机工程与3D技术国际会议（ICCEDT 2025） s_academic 理科会议 3d 计算机网络
2025年计算机工程与3D技术国际会议（ICCEDT2025）2025InternationalConferenceonComputerEngineeringand3DTechnology会议将聚焦计算机工程与3D技术在各个领域的深度融合与创新应用。在主题演讲环节，行业领军人物将分享他们对未来发展的前瞻性见解，探讨如何利用3D技术为计算机工程领域带来新的突破和机遇。如在人工智能与3D技术的结合方面
模型蒸馏：让 AI 模型 “轻装上阵”，开启无限可能东锋1.3 人工智能人工智能模型蒸馏
模型蒸馏：让AI模型“轻装上阵”，开启无限可能在当今AI技术蓬勃发展的时代，大模型宛如一位无所不能的“超级智者”，深度融入到我们生活的每一个角落。无论是手机上精准的语音助手，还是购物平台个性化的推荐系统，又或是医疗领域辅助诊断的智能工具，大模型都展现出了令人惊叹的能力。然而，这位“超级智者”却有着不为人知的烦恼。随着应用场景不断拓展，它在运行效率和资源消耗方面的局限性逐渐暴露出来。就像一个体型庞大
测试模型概述此方konata python java 功能测试
V模型、W模型和H模型都是软件开发生命周期中用于管理和集成测试活动的方法论。V模型特点顺序化测试：开发过程从需求分析到编码，测试过程则从编码到需求分析对等进行。阶段明确：包括需求分析、设计、编码、测试和维护等阶段，每个阶段都有对应的测试活动。文档驱动：每个开发阶段完成后需要生成详细的文档，以供下一阶段使用。优点结构化：提供了清晰的项目结构和明确的阶段划分，便于项目管理和监控。文档完整：生成详细的文
MySql必知必会(持续修改) 快下雨了L MySql mysql 数据库
1.MySql是关系型数据库2.数据库三大范式第一范式：属性不可分割(列不可分割)第二范式：满足第一范式，非主属性(主键)必须依赖主属性(主键)第三范式：满足第二范式，且不存在依赖传递3.数据库事务事务：指一个或多个数据库操作组成的逻辑单元或代表单个工作单元的一组SQL语句特性：ACIDA：原子性--事务被视为一个不可分割的操作单元要么成功要么失败回滚C：一致性--事务在执行前后，数据库从一个一致
SpringBoot 接入豆包火山方舟大模型 java15655057970 面试学习路线阿里巴巴 spring boot 后端 java
火山方舟控制台开通模型推理、知识库应用入口；文档中心各类接口说明及SDK获取；向量数据库VikingDB文档下翻找到有java操作案例；实现目标功能效果：通过SDK调用豆包大模型，在代码内实现问答的效果；官方示例通过使用知识库，自己上传文档。让豆包大模型可以回答你文档中的内容数据（即自定义属于你自己（自身业务领域）的大模型）；前置步骤：点击右上角头像处去创建API访问密钥；控制台内模型推理-在线推
基于Python开发的使用多个单视图特征融合的基于图卷积网络（GCN）的肺结节检测系统的示例 go5463158465 python 深度学习算法 python 迁移学习开发语言
以下是一个基于Python开发的使用多个单视图特征融合的基于图卷积网络（GCN）的肺结节检测系统的示例。我们将使用PyTorch和torch_geometric库来实现图卷积网络，并模拟数据进行演示。步骤概述数据准备：模拟生成多个单视图的肺结节特征数据，并构建图数据。特征融合：将多个单视图特征进行融合。图卷积网络构建：构建一个简单的图卷积网络模型。模型训练：使用训练数据对模型进行训练。模型评估：使
能力模型迁移：专业教育从「知识掌握度」转向「提示工程能力」由数入道 AI辅助教学提示词工程人工智能
概念：“能力模型迁移：专业教育从「知识掌握度」转向「提示工程能力」”这句话深刻地揭示了在人工智能（AI）技术飞速发展的时代背景下，专业教育领域正在经历一场重要的范式转变。它指出，传统的专业教育模式主要关注学生对知识的掌握程度，例如事实、理论、概念等，并通过考试和评估来衡量。然而，随着以大型语言模型（LLMs）为代表的生成式AI技术的崛起，仅仅掌握知识已经远远不够，提示工程能力逐渐成为更核心、更关键
MongoDB 查询文档 wjs2024 开发语言
MongoDB查询文档引言MongoDB是一款流行的开源NoSQL数据库，以其灵活的数据模型和强大的查询功能而闻名。本文将深入探讨MongoDB的查询文档，包括其基本概念、常用查询操作以及高级查询技巧。MongoDB查询基础数据模型MongoDB使用文档模型来存储数据。每个文档都是一个键值对集合，类似于JSON对象。文档存储在集合（Collection）中，集合是数据库中的容器。查询操作符Mong
在 Centos7 上部署 ASP.NET 8.0 + YOLOv11 的踩坑实录桑榆肖物 ASP.NET 运维 asp.net YOLO 后端
本文将详细记录我在CentOS7上部署ASP.NET8.0结合YOLOv11目标检测项目过程中遇到的问题及解决方案，旨在为有类似需求的开发者提供参考。1.背景随着人工智能技术的迅猛发展，目标检测成为了众多应用场景中的核心技术之一。YOLO（YouOnlyLookOnce）系列作为实时目标检测领域的代表，已经发展到了YOLOv11版本。同时，.NET平台也在不断迭代升级，最新版本已发布至.NET9。
(java/Spring boot)使用火山引擎官方推荐方法向大模型发送请求 PXM的算法星球 java spring boot 火山引擎
首先在maven里面引入官方依赖com.volcenginevolcengine-java-sdk-ark-runtimeLATEST然后我们编写测试类packagecom.volcengine.ark.runtime;importcom.volcengine.ark.runtime.model.completion.chat.ChatCompletionRequest;importcom.vol
安全见闻笔记 freesec 安全笔记
安全见闻包含了网络安全，网络技术，拓展知识面“不识庐山真面目，只缘身在此山中”编程语言:C语言：一种通用的、面向过程的编程语言，广泛应用于系统软件和嵌入式开发。C++：在C语言基础上发展而来，支持面向对象编程，常用于游戏开发、高性能计算等领域。Java：一种广泛使用的面向对象编程语言，具有跨平台性，应用于企业级应用开发等。Python：简洁易学，拥有丰富的库，适用于数据分析、人工智能、Web开发等
ssm091校园自助洗衣系统的分析与设计(文档+源码)_kaic 码上星辰毕业设计计算机毕业设计科技 java 前端
摘要互联网发展至今，无论是其理论还是技术都已经成熟，而且它广泛参与在社会中的方方面面。它让信息都可以通过网络传播，搭配信息管理工具可以很好地为人们提供服务。针对校园洗衣信息管理混乱，出错率高，信息安全性差，劳动强度大，费时费力等问题，采用校园自助洗衣系统可以有效管理，使信息管理能够更加科学和规范。校园自助洗衣系统在Eclipse环境中，使用Java语言进行编码，使用Mysql创建数据表保存本系统产
MongoDB学习 jiugie mongodb 数据库 python
MongoDB是一种流行的NoSQL数据库，以文档存储为核心，适用于高灵活性、高扩展性的场景。本文将从基础概念到实际应用，带你快速掌握MongoDB的核心操作。1.MongoDB简介什么是MongoDB？MongoDB是一个基于分布式文件存储的数据库，采用BSON（类似JSON）格式存储数据，支持动态schema（无固定表结构）。核心特性文档模型：数据以键值对形式存储在文档中，类似JSON对象。高
【Python爬虫(70)】Python爬虫实战：房产数据大揭秘奔跑吧邓邓子 Python爬虫 python 爬虫开发语言房产数据
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、引言二、爬取准备2.1目标网站选择2.2开发环境搭建2.3反爬
基于YOLOv5、FaceNet与KNN的人脸识别系统 reset2021 人脸识别系统 YOLO facenet knn 人脸检测
步骤1：环境配置安装依赖库：安装Python3.x安装TensorFlow、Keras、OpenCV等深度学习库获取数据集：收集训练用的多个人脸图像（每个用户至少几十张）将图像按用户分类存放在data/train/user1,user2等文件夹中步骤2：训练YOLO模型配置YOLO数据集：创建一个data.yaml文件，配置您的数据集路径和标签train:./data/train/images/v
星环科技无涯·问知 AI PC版接入DeepSeek，一键部署让你的AI永不掉线星环科技人工智能
近日，星环科技（688031.SH）“无涯·问知AIPC版”接入DeepSeek，实现DeepSeek大模型在个人电脑端的本地化流畅运行，让普通用户能够轻松便捷地使用AI技术。无涯Infinity-星环科技无涯Infinity，是一款基于星环大模型底座，结合个人知识库、企业知识库、法律法规、财经等多种知识源的企业级垂直领域问答产品https://www.wuya-ai.com/download/a
小米、小鹏、蔚来等宣布切入「人形机器人」赛道，车企为什么纷纷下场造机器人？有哪些新机会？日记成书热门实事机器人
车企集体跨界人形机器人赛道的核心逻辑与机遇一、车企“造人”的底层驱动力技术复用与降维打击车企在电动化与智能化领域积累的核心技术（如电机、传感器、AI算法、动力电池等）可直接迁移至人形机器人研发，形成“技术溢出”效应。例如：小鹏Iron的端到端大模型与自动驾驶算法同源，触控反馈技术源自智能座舱交互系统；广汽GoMate的“可变轮足移动结构”基于汽车底盘技术优化，实现高速运动与精细操作；特斯拉Opti
【中项】系统集成项目管理工程师-第5章软件工程-5.6软件质量管理与5.7软件过程能力成熟度日记成书【中项】系统集成项目管理工程师软件工程学习职场和发展
前言：系统集成项目管理工程师专业，现分享一些教材知识点。觉得文章还不错的喜欢点赞收藏的同时帮忙点点关注。软考同样是国家人社部和工信部组织的国家级考试，全称为“全国计算机与软件专业技术资格（水平）考试”，目前涵盖了计算机软件、计算机网络、计算机应用技术、信息系统、信息服务5大领域，总共27个科目，也是分为初、中、高三个级别。通信专业主要需要关注“计算机网络”这个专业类别，可以考的科目有初级资格的“网
量子位招聘 | DeepSeek帮我们改的招聘启事量子位
关注前沿科技量子位未来同事，你好~这是一则招聘帖。如果你与我们志同道合，对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣，我们正在招聘这些领域的原创作者。以下岗位均为全职，工作地点：北京中关村。岗位面向：社招、应届毕业生，所有岗位均可实习——表现出色均可转正加分项：乐于探索AI新工具，善用AI新工具；拥有解读论文的能力，能深入浅出讲解原理；有写代码能力；量子位长期读者。加入我们，你可以获得：
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul

PEFT微调方式总结

PEFT微调方式总结

PEFT微调方式总结

PEFT介绍

安装peft

支持的微调方法和任务

SEQ_CLS

SEQ_2_SEQ_LM

CAUSAL_LM

TOKEN_CLS

模型加载

微调加载

PROMPT_TUNING

简介

源码

demo

P_TUNING

简介

源码

demo

PREFIX_TUNING

简介

源码

demo

LORA

简介

demo

ADALORA

简介

demo

微调模型合并

模型推理

你可能感兴趣的:(人工智能,大模型,深度学习,peft,lora,p-tuning)