FF-Studio

【大模型LoRa微调】Qwen2.5 Coder 指令微调【代码已开源】

本文需要用到的代码已经放在GitHub的仓库啦，别忘了给仓库点个小心心~~~
https://github.com/LFF8888/FF-Studio-Resources
第001个文件哦~

一、引言：大语言模型与指令微调

1.1 大语言模型发展简史

随着深度学习的飞速发展，特别是Transformer架构在自然语言处理（NLP）领域的成功，大语言模型（LLM, Large Language Model）成为近年来最受关注的热点方向之一。从最初的基于LSTM的语言模型，到基于Attention机制的Transformer，再到不断在规模和数据上进行扩展的GPT系列、BERT系列、T5系列以及最新的Qwen、Llama等，这些模型在各种任务（如语言理解、生成、翻译、代码生成等）上都展示了强大的能力。

然而，面对这些规模庞大、参数动辄上亿乃至上百亿的模型，若要让它们在特定任务（如客服对话、特定领域问答、代码生成等）上发挥更大价值，就需要进行微调（Fine-tuning）。传统微调往往需要在大模型的所有参数上做反向传播和更新，这对于硬件资源和数据存储都有相当高的要求。为解决这一问题，一些参数高效微调（PEFT, Parameter-Efficient Fine-Tuning）的技术应运而生，例如 LoRA（Low-Rank Adaptation）、Prefix Tuning、Adapter等。这些方法大大降低了微调所需的训练成本，使得在有限的算力资源下进行指令微调成为可能。

1.2 指令微调（Instruction Tuning）

指令微调（Instruction Tuning）的核心思想是：通过给模型添加某种“指令”或“提示”（prompt），让模型学会根据特定的指令来回答问题或完成任务。与普通的微调相比，指令微调更强调**模型对指令（Prompt）**的理解，以及在不同的情景下如何生成符合指令要求的回答。如今，大量研究都表明，进行指令微调后的模型更适合应用于真实场景，对话风格更自然，也更倾向于服从或理解用户的指令。

1.3 Qwen2.5 Coder 32B 指令微调简介

Qwen2.5 Coder 是一款基于阿里云开源的 Qwen (千万亿级别Token训练规模) 系列模型所衍生的代码生成/理解模型。这里的“32B”代表它拥有 320亿左右的可训练参数量级。由于Qwen2.5 Coder具备很好的代码理解和生成能力，非常适合在例如编程问题解答、代码生成、代码修正、与代码相关的上下文理解等场景下应用。

本篇教程的目标，是利用LoRA微调技术，对Qwen2.5 Coder 32B模型进行指令微调。通过这样的微调，我们可以获得一个在限定领域（如某些编程任务）或有特定风格指令（如以对话形式要求回答编程问题）的模型，而且微调所需要的成本也相对较低。

二、环境准备

在本文示例中，可使用Google Colab环境（笔者使用的是 Tesla L4 GPU 24G显存 ），或者其他有GPU的环境也可以。需要准备的步骤包括：

登录/连接到具有GPU支持的Notebook环境。
确保安装了pip等常用工具。
运行时类型选择GPU（在Google Colab中可以选择“运行时”->“更改运行时类型”->“硬件加速器：GPU”）。
安装所需依赖，例如unsloth、transformers、datasets、peft、trl等。

三、代码结构与主要流程介绍

以下示例代码已经以notebook形式给出，主要包含以下几个部分：

安装依赖：安装unsloth等库，它包含了简化训练和推理的工具函数。
模型初始化：加载Qwen2.5 Coder 32B模型（支持4位量化，以降低显存占用）。
LoRA适配器配置：对模型添加LoRA层，指定需要训练的权重、秩、缩放因子等。
数据准备：通过datasets库加载数据集，并转换为Qwen2.5特定的聊天格式（对话模板）。
数据格式转换：如有需要，将ShareGPT格式的对话转换成Hugging Face通用形式。
模型训练：使用HuggingFace的SFTTrainer进行微调，可指定训练批次大小、学习率、步数等。
推理测试：利用微调好的模型进行推理，尝试问答、代码生成，或者对话式测试。
模型保存：保存LoRA权重或将微调后的完整模型合并并输出，以便后续部署或分享。

接下来，我们会对上述各步骤进行更详细的讲解。

四、理论基础：LoRA与指令微调背后的原理

4.1 LoRA原理简述

LoRA（Low-Rank Adaptation）是参数高效微调的一种方法，核心思想是：假设大模型中的某些矩阵（例如Attention中的Q、K、V等投影矩阵）在需要进行更新时，可以分解成低秩矩阵的形式，并只在这部分低秩矩阵上进行训练更新。这样一来，可以显著减少需要训练的参数量。例如：

原始全量微调：可能需要更新数十亿甚至上百亿参数。
LoRA微调：只需要更新百余万甚至更少的参数。

由于更新的参数量大幅减少，我们也能降低对计算资源的需求，使得在消费级GPU上对大模型进行微调成为可能。

4.2 指令微调与对话格式

对于Qwen2.5 Coder这种对话风格或代码生成风格的模型，通常使用“系统提示 + 用户输入 + 模型回答”这样一个多轮对话的格式。通过指令微调，让模型更擅长理解在对话上下文中所传递的意图或问题，并给出合理的回答。
在“Qwen-2.5”的对话格式示例中，我们会使用类似的标记：

<|im_start|>system
You are Qwen, created by Alibaba Cloud. You are a helpful assistant.<|im_end|>
<|im_start|>user
What is 2+2?<|im_end|>
<|im_start|>assistant
It's 4.<|im_end|>

在实际训练时，我们会将所有对话数据按照这种格式进行拼接，从而让模型学会“当role=system时如何处理，当role=user时如何处理，以及当role=assistant时如何回答”。

4.3 数据掩码（Mask）与只训练回答部分

在对话式微调中，通常希望模型只对“assistant”部分的文本负责，用户或系统的提示部分不计入损失梯度。这可以通过在序列标签中设置-100来对非回答部分进行掩码。这样，就能在训练中只让模型“关注”自己的回答，减少不必要的干扰，并且能够更好地学习回答风格。

五、详细代码与实操流程

下面的代码片段已经在Notebook中给出。为方便阅读，这里会对关键点进行分段说明，并插入部分代码片段做演示。读者可以在Google Colab或者其他Jupyter Notebook环境中拷贝运行。

5.1 安装依赖

!pip install unsloth

unsloth 是一个整合了参数微调、模型量化、对话格式处理等多功能的Python库，内部封装了一些快捷API，可显著简化模型微调和推理流程。

安装完成后，可使用 import unsloth 测试是否成功。

5.2 模型初始化

在这一步，我们指定要加载的模型名称、最大序列长度、数据类型等。考虑到Colab等环境普遍显存有限，我们把 load_in_4bit 设置为 True 来使用4位量化形式。

from unsloth import FastLanguageModel
import torch

# 基础配置参数
max_seq_length = 2048 # 最大序列长度
dtype = None # 自动检测数据类型
load_in_4bit = True # 使用4位量化以减少内存使用

# Qwen系列模型列表(这里选用Qwen2.5-Coder-32B-Instruct)
qwen_models = [
    "unsloth/Qwen2.5-Coder-32B-Instruct",
    "unsloth/Qwen2.5-Coder-7B",
    "unsloth/Qwen2.5-14B-Instruct",
    "unsloth/Qwen2.5-7B",
    "unsloth/Qwen2.5-72B-Instruct",
]

# 加载预训练模型和分词器
model, tokenizer = FastLanguageModel.from_pretrained(
    model_name = "unsloth/Qwen2.5-Coder-32B-Instruct",
    max_seq_length = max_seq_length,
    dtype = dtype,
    load_in_4bit = load_in_4bit,
)

完成后，你就获得了一个可以进行前向推理的Qwen2.5 Coder 32B模型以及对应的分词器。此时如果你运行一下nvidia-smi，会看到显存占用比不使用4bit量化时要低不少。

5.3 LoRA适配器配置

要进行参数高效微调，我们需要给模型“注入”LoRA层。这里指定LoRA的秩 r=16，目标模块包括Attention部分的Q、K、V、O，以及一些MLP层；同时指定use_gradient_checkpointing选项可进一步节省显存。

model = FastLanguageModel.get_peft_model(
    model,
    r = 16, # LoRA秩
    target_modules = ["q_proj", "k_proj", "v_proj", "o_proj",
                      "gate_proj", "up_proj", "down_proj",],
    lora_alpha = 16,
    lora_dropout = 0,
    bias = "none",
    use_gradient_checkpointing = "unsloth",
    random_state = 3407,
    use_rslora = False,
    loftq_config = None,
)

完成后，你的模型就携带了可训练的LoRA权重。在微调过程中，主要会更新LoRA新增的权重，不会对原始大模型权重做修改，从而极大地减少需要反向传播和存储的参数量。

5.4 数据准备与对话格式化

加载数据集：示例中使用了Maxime Labonne的FineTome-100k。读者也可以换成自己准备的对话数据或者ShareGPT格式数据。
Qwen对话模板：使用 unsloth.chat_templates.get_chat_template() 来设定分词器的对话模板为“qwen-2.5”，从而在数据预处理中可直接调用 tokenizer.apply_chat_template()。
格式转换：如果你的数据是ShareGPT格式，可以先用 unsloth.chat_templates.standardize_sharegpt 标准化为Hugging Face常规格式后，再用 formatting_prompts_func 配置对话格式。

示例代码：

from unsloth.chat_templates import get_chat_template

# 配置分词器使用qwen-2.5对话模板
tokenizer = get_chat_template(
    tokenizer,
    chat_template = "qwen-2.5",
)

def formatting_prompts_func(examples):
    """格式化对话数据的函数"""
    convos = examples["conversations"]
    # 将对话结构映射成qwen-2.5形式的文本
    texts = [tokenizer.apply_chat_template(convo, tokenize=False, add_generation_prompt=False) for convo in convos]
    return { "text" : texts, }

# 加载数据集
from datasets import load_dataset
dataset = load_dataset("mlabonne/FineTome-100k", split="train")

随后进行标准化与格式化：

from unsloth.chat_templates import standardize_sharegpt
dataset = standardize_sharegpt(dataset)
dataset = dataset.map(formatting_prompts_func, batched=True,)

5.5 仅对助手回复进行训练

在对话式数据中，我们往往只想优化模型回答时的部分。可以借助 unsloth.chat_templates.train_on_responses_only() 来自动创建标签掩码，让用户输入部分不参与损失计算：

from unsloth.chat_templates import train_on_responses_only

trainer = train_on_responses_only(
    trainer,
    instruction_part = "<|im_start|>user\n",      # 用户输入区分符
    response_part = "<|im_start|>assistant\n",    # 模型回答区分符
)

在训练前可以查看 trainer.train_dataset[5]["input_ids"] 以及对应的 trainer.train_dataset[5]["labels"]，发现用户部分在labels中会被替换为-100，从而不计算损失。

5.6 配置并开始训练

这里用SFTTrainer来进行微调，核心参数包括：

per_device_train_batch_size：每张卡上的batch大小
gradient_accumulation_steps：梯度累积步数
warmup_steps：学习率预热
max_steps：总训练步数
learning_rate：初始学习率
fp16/bf16：是否使用16位或bf16混合精度
optim="paged_adamw_8bit"：8bit Adam优化器，可进一步节省显存

示例代码如下：

from trl import SFTTrainer
from transformers import TrainingArguments, DataCollatorForSeq2Seq
from unsloth import is_bfloat16_supported

trainer = SFTTrainer(
    model=model,
    tokenizer=tokenizer,
    train_dataset=dataset,
    dataset_text_field="text",
    max_seq_length=max_seq_length,
    data_collator=DataCollatorForSeq2Seq(tokenizer=tokenizer),
    dataset_num_proc=4,
    packing=False,
    args=TrainingArguments(
        per_device_train_batch_size=1,
        gradient_accumulation_steps=4,
        warmup_steps=5,
        max_steps=100,
        learning_rate=2e-4,
        fp16=not is_bfloat16_supported(),
        bf16=is_bfloat16_supported(),
        logging_steps=1,
        optim="paged_adamw_8bit",
        weight_decay=0.01,
        lr_scheduler_type="linear",
        seed=3407,
        output_dir="outputs",
        report_to="none",
    ),
)

然后开始训练：

trainer_stats = trainer.train()

训练过程中可以随时使用nvidia-smi监控GPU显存，以及查看日志中打印的loss值。若显存不足，可再次减小batch size或其他超参数。

5.7 查看训练结果及显存

训练完成后，可查看一些简单的训练统计信息，以及显存消耗情况：

used_memory = round(torch.cuda.max_memory_reserved() / 1024 / 1024 / 1024, 3)
...
print(f"Peak reserved memory = {used_memory} GB.")

若你看到显存大概在几GB左右，说明LoRA微调确实有效地减少了显存使用。

六、模型推理：测试微调效果

在完成LoRA微调后，可以直接调用微调好的模型进行推理，或做进一步测试。

6.1 基本推理

利用FastLanguageModel.for_inference(model)来开启推理模式，并在生成时可以配置temperature、min_p等参数。示例代码：

from unsloth.chat_templates import get_chat_template

# 配置推理用的分词器
tokenizer = get_chat_template(
    tokenizer,
    chat_template = "qwen-2.5",
)
FastLanguageModel.for_inference(model)

# 构造测试输入（对话形式）
messages = [
    {"role": "user", "content": """Here is a programming problem for testing:

    **Matrix Chain Multiplication Optimization**

    ### Problem:
    Given a chain of matrices `A1, A2, ..., An`...
    """}
]
inputs = tokenizer.apply_chat_template(
    messages,
    tokenize=True,
    add_generation_prompt=True,
    return_tensors="pt",
).to("cuda")

outputs = model.generate(
    input_ids = inputs,
    max_new_tokens = 64,
    use_cache = True,
    temperature = 1.5,
    min_p = 0.1
)
print(tokenizer.batch_decode(outputs))

如果一切正常，你会看到一段模型生成的文本，用来解答这个矩阵连乘优化问题。

6.2 流式推理

为了更好地观察模型的生成过程，可以使用TextStreamer实现token-by-token的流式输出：

from transformers import TextStreamer

text_streamer = TextStreamer(tokenizer, skip_prompt=True)
_ = model.generate(
    input_ids=inputs,
    streamer=text_streamer,
    max_new_tokens=128,
    use_cache=True,
    temperature=1.5,
    min_p=0.1
)

你会在控制台或Notebook下看到模型一字一句地生成文本的过程，非常直观。

七、模型保存与部署

7.1 保存LoRA适配器

如果只想保存LoRA微调后的权重，可以执行：

model.save_pretrained("lora_model")
tokenizer.save_pretrained("lora_model")

这样就会在本地生成一个lora_model文件夹，里面包含LoRA权重和分词器文件。需要注意的是：这并不包含原始基础模型，后续加载时需要合并到相同或兼容的基础模型上。

7.2 合并并保存完整模型

若希望使用合并后的完整模型（例如，在推理时只加载一个权重文件），可以使用save_pretrained_merged或其他类似的方法，将LoRA权重与原模型权重进行合并，然后得到一个新的完整模型：

if False:
    model.save_pretrained_merged("model", tokenizer, save_method="merged_16bit")

上面示例中使用save_method="merged_16bit"即保存成16位浮点格式。若想节省空间，也可保存成4位量化格式。然后，就可在加载时直接使用from_pretrained一次性加载。

7.3 上传到Hugging Face Hub

如果你希望与他人分享模型，可以将本地的LoRA权重或合并后的完整模型上传至HuggingFace Hub。
示例（假设你已经在 HuggingFace 上创建了一个仓库 your_name/lora_model）：

model.push_to_hub("your_name/lora_model", token="YOUR_HF_TOKEN")
tokenizer.push_to_hub("your_name/lora_model", token="YOUR_HF_TOKEN")

这样就能在任何地方直接使用类似 model = AutoPeftModelForCausalLM.from_pretrained("your_name/lora_model") 的方式加载了。

八、常见问题与解答

Q：显存不够怎么办？
A：可以尝试以下方案：
- 减小r、lora_alpha等LoRA配置，减少可训练的参数量。
- 缩小max_seq_length，减少每次处理的序列长度。
- 减少batch size或增加gradient_accumulation_steps。
- 使用更低精度的量化（如4位或8位）来加载基础模型。
Q：为什么要只对assistant部分计算loss？
A：在对话任务中，系统提示和用户输入并不是由模型来预测的部分，只计算模型回答部分的loss才能让模型专注于回答输出，减少不必要的干扰，从而收敛更快且质量更好。
Q：我有自己的对话数据，怎么转换格式？
A：如果是自定义的对话数据集，可以先对每一轮对话做角色标注（system/user/assistant），并尽量整理成类似ShareGPT或Hugging Face对话格式，然后再用standardize_sharegpt()或自定义的函数进行转换。最后用apply_chat_template()生成最终的可训练文本。
Q：LoRA微调后模型推理速度会变慢吗？
A：理论上有一点开销，因为LoRA层在推理时也要与原模型层合并计算。但由于LoRA规模远小于原模型，通常这部分开销较小。同时，如果在推理前进行了权重合并（merged weights），那么推理速度和原模型基本相同。
Q：如何验证模型是否真的学到了指令风格？
A：可以准备一批简单的对话测试集，比如让用户在对话中提出一些不在训练集里的问题，或要求模型以特定口吻回答。若模型能正确理解指令风格，并给出合理答复，说明指令微调有效。

九、展望

在实际应用中，Qwen2.5 Coder 32B的微调成果可应用于以下场景：

交互式编程问答：在IDE或在线平台中为开发者提供编程调试建议、错误解释等。
代码生成与完善：根据自然语言描述，生成可运行的示例代码，并根据反馈修正错误或优化性能。
教育场景：在编程教学中，为学生提供自动答疑与演示示例，提升教学效率。
文档与注释自动化：对已有代码自动生成详细的注释或文档说明，减少文档编写工作量。

随着更多数据涌现以及LoRA和其他参数高效微调技术的不断演进，大模型在各自领域的落地能力将会越来越强。指令微调已经成为让模型完成特定任务、体现特定个性与风格的一项关键手段。

十、后续可探索的方向

多语言或跨模态微调：若你想让模型支持多语言对话或处理多模态信息（如图像、音频），可以在LoRA层上进一步扩展，并准备对应领域的数据集。
RLHF（Human Feedback）：在指令微调的基础上，可以接入人类反馈强化学习（RLHF），从而在多轮对话和复杂场景中获得更人性化、对齐度更高的回答。
更大规模的训练数据：如果能获取到更多带有指令标签的高质量对话数据，指令微调的效果可能更显著。
量化和加速：继续研究如何在4位甚至更低精度上保持模型可用的同时，进一步降低部署成本，实现超大模型的本地实时推理。

十一、参考与致谢

unsloth GitHub Repo：提供了许多封装好的LoRA训练、模型量化、对话模版处理等API。
Hugging Face Transformers：大语言模型的重要基础库，在社区中极具影响力。
TRL (Transformer Reinforcement Learning)：一个用于对GPT等语言模型进行强化学习调优的库，也提供SFTTrainer等模型微调功能。
Maxime Labonne’s FineTome-100k 数据集：用于对话形式的训练数据集示例。

若各位读者在阅读此篇教程或者动手实践的过程中遇到任何疑问，可在评论区留言。希望本篇博客文章能够帮助你快速上手Qwen2.5 Coder 32B的指令微调，并在实际应用中灵活运用这种高效微调技术，打造出更智能、更符合需求的大模型应用！

祝各位在大模型与NLP道路上不断精进、学有所成！

你可能感兴趣的:(大语言模型,开源)

大单元教学反思之三 248广州刘在丽
2.没能兼顾学生教辅作业上的部分题目，像修辞手法的判断、课外文章的理解与分析等题目，一直带上来的班级学生做题稍微能结合模糊的旧知识答题，新接班的基础薄弱的学生基本上属于乱做，连修辞手法的判断都没有积累到方法。只好在讲解的时候再次渗透方法。3.学生的书写也容易忽略。因为上生字词基本上一课时完成，既要抓过关又要抓重难点生字的笔画笔顺间架结构，感觉时间不够用。只能依靠学生一二年级积累的书写经验和对写作业
大语言模型应用指南：网页实时浏览 AGI大模型与大数据研究院 AI大模型应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型应用指南：网页实时浏览作者：禅与计算机程序设计艺术1.背景介绍1.1大语言模型的崛起1.1.1自然语言处理的发展历程1.1.2Transformer模型的突破1.1.3预训练语言模型的优势1.2网页浏览的痛点1.2.1信息过载与检索困难1.2.2内容理解与知识提取1.2.3个性化与智能化需求1.3大语言模型与网页浏览的结合1.3.1智能问答与对话系统1.3.2知识图谱与语义搜索1.3.3
大模型部署的整体架构 flyair_China 人工智能云计算架构
一、大模型部署架构1.1部署架构大模型部署的整体架构是一个多层次、软硬件协同的系统工程，旨在解决模型规模庞大、计算资源密集、延迟敏感等挑战。1.1.1、基础架构层：硬件资源与网络算力集群GPU/NPU阵列：如NVIDIAA100/H100/H200/H800、华为昇腾、昆仑芯等，支持FP16/INT8量化计算，显存带宽需达TB级（如HBM3e显存带宽达3.35TB/s）。异构计算：CPU+GPU/
中原焦点团队焦点初级26期纪小伦2021-5-19坚持分享第107天，坚持读书第115天幽谷兰兮
中原焦点团队焦点初级26期纪小伦2021-5-19坚持分享第107天，坚持读书第115天。[爱心]原创——《‘重复’为大》今天清晨我4点50醒来，鸟儿在5点钟在窗外准时“鸣啾啾”，发现鸟儿在5点开始“鸣啾啾”已经不是第一次了，这让我无比佩服鸟儿的“重复”——准时有规律。“剩者为王，重复为大”，对于人们来说，想做事容易，每天坚持重复做一件事尤其不容易，能坚持下来的，都得有多大毅力和勇气。和孩子关系不
优惠券返利大揭秘：如何利用优惠券返利平台赚取额外收入高省APP大九
在当今的消费社会中，优惠券返利平台正成为越来越多消费者节省开支、增加收入的新途径。这些平台不仅为消费者提供了大量的优惠券，还能在购物后返还一部分金额，实现了真正意义上的“购物即赚钱”。那么，如何利用这些优惠券返利平台赚取额外收入呢？下面就来为您揭秘。大家好！我是高省APP最大团队&联合创始人蓓蓓导师！【高省】APP网购优惠券免费领，分享还能赚钱。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台。
除了FastJson,你还有选择: Gson简易指南闻人的技术博客
前言这个周末被几个技术博主的同一篇公众号文章fastjson又被发现漏洞，这次危害可导致服务瘫痪！刷屏，离之前漏洞事件没多久，fastjson又出现严重Bug。目前项目中不少使用了fastjson做对象与JSON数据的转换，又需要更新版本重新部署，可以说是费时费力。与此同时，也带给我新的思考，面对大量功能强大的开源库，我们不能盲目地引入到项目之中，众多开源框架中某个不稳定因素就足以让一个项目遭受灭
正月14 burenjirigala
正月14日，天气格外暖和。一大早晨4点多我和爱人起床喂牛挤奶。今天比平常起的早些因为今我们要上我舅舅和啊姨他们家去拜年。大概8点左右从家里赶往县城，再从县城赶40多里地到我大姨家，大姨父今年73大寿就现到他们家拜年，大姨头发依然苍白，见我们过来拜年那高兴的，亲子下厨炒了几个菜给我们吃。吃完上我老舅家，老舅今天也出门，只有我妹妹在家就没逗留多长时间，赶往我三舅家。三舅前几年脑出血身体出些问题，但现在
一路书香快乐成长紫罗兰_c06d
一路书香快乐成长-----小蜜蜂班读书记事在这百花争艳、万紫千红的季节我们与新教育邂逅。由此认识并了解了新教育十大行动之-----营造书香校园。作为语文教师的我积极响应学校营造书香班级的号召，带领孩子们在书海中畅游。新教育主张，把最美好的童书给最美丽的童年。在新教育的光芒指引下，62位可爱的孩子在阳光的照耀下，像辛勤的小蜜蜂扑在书香中采花、酿蜜，收获颇多。今天记下与孩子们一起走过的每一个平凡而又幸
python爬虫-国家企业信用信息公示系统_GitHub - yong771/Crack-JS: Python3爬虫项目进阶实战、JS加解密、逆向教程 - 犀牛数据 | 美团美食 | 企名片 | 七麦... 日向夕阳
Crack-JSPython3爬虫实战、JS加解密、逆向教程犀牛数据|美团美食|企名片|七麦数据|淘大象|梦幻西游藏宝阁|漫画柜|财联社|中国空气质量在线监测分析平台|66ip代理|零度ip|国家企业信用信息公示系统|中国产品大目录Author咸鱼微信公众号咸鱼学PythonIntroduce数据解密、反爬处理、逆向教程一、代码配套说明目录JS解密案例│├──lingduip//-----零度ip
一招解决!第七届内部操盘群伍戈被骗不靠谱，low carbon-碳中和提不了现!可追回! 昌龙律法
当我们在投资理财的时候，骗子们的“罪恶”之手或许已经在慢慢伸向我们的“钱袋子”。因此，豆豆钱提醒广大消费者，需要高度警惕此类诈骗，谨防财产损失。如何在众多投资项目中辨真伪，识别并防范虚假网络投资理财诈骗，守护好自己的血汗钱，成为当务之急。我公司最近帮助到的一位该平台的受害者委托曝光此平台恶劣行径!望广大投资者引以为戒，谨慎投资！(重点提示；此类平台的所谓老师大多数都冒充知名牛散大咖或者企业知名人物
“套子”式的生活让别里科夫输掉了爱情，输掉了生命！引以为戒语过添晴sunny323
与法国莫泊桑，美国欧·享利并称“世界三大家短篇小说家”的俄国批判现实主义著名作家契诃夫在小说中创造了众多具有典型性人物的小人物形象。今天我们一起回顾他的小说《装在套子里的人》的课文选段，寻找有价值的写作素材。这篇小说写于1898年，那是俄国有史以来最为阴暗的年代。农奴制虽然取消了，但是它的残余仍然顽固存在着，再加上资本主义发展所带来的新形式剥削使广大人民群众深陷苦难之中。此时反动沙皇政府变本加厉推
用立省邀请码是多少？用立省app邀请码是什么？用立省官方邀请码怎么填写？知行导师
说实话，今年真是最难就业季，应届生难找工作，往届生还要被辞退，如今失业潮夸张。上个月流行“失业博主”，大家都在做关于失业的内容，收获了一大批人的赞赏，“失业”这个关键词也成为一代流量密码，只要写失业，就有人看，读者有共鸣，就有代入感。打造失业的人设，也是颇有勇气。过去是因为大环境不好，经济下行导致少部份行业不景气，现在影响力波及到了很大一部份人群。20年开始，戴上口罩的那段时间，我们的生活已经被打
【新年好•和亲家】经典龙
图片发自App图片发自App《爱心❤️》大爱无疆菩萨心，忠义孝悌礼智信。英君彰显真善美，亲家奉献爱心行。哺育斯羽健康长，培养胜蓝有出息。张家门第俊秀才，武陵源里尽朝晖。
宝爸一本经典的书
这几天陈娜在广州学习，家里我操持。以前家里陈娜做的事情，现在全部我来做。照顾孩子，买菜做饭，打扫卫生等等。买菜是一件让人头痛的事情，不知道吃什么。一大堆琐碎的事情不想弄，比如凉好的衣服丢在沙发上，不想叠。平时如果我看到沙发上有没叠的衣服，卫生不好，我就会指责陈娜不会打理。现在自己当家两天，做着这些事情有点烦，瞬间就觉得自己平时对陈娜太苛刻。宝妈也不容易。
为什么别人套利赚钱，而你套利亏钱云梦量化科技后端
1.价差计算大多数套利者喜欢做高波动的小市值币种，并且计算价差是以A所的mid_price-B所的mid_price。这种计算方式在大所的主流币种上问题可能不大。但是因为大家喜欢高波动小币种，那么这样做存在一个问题，因为小币种的bid_askspread很大，你算出来的价差在下单时可能被盘口价差抵消掉，从理论上还有可能亏钱。小币种正确的做法应该用bid-ask，这样的价差至少从理论上你去taker
5月19日謝奕鋒
投射：1投射執到4000分大客！2投射業績到達490萬！3投射新姻緣出現！感恩：1感恩業績達到450萬！2感恩5天拼博努力工作！3感恩很多貴人一直支持我！成長：1你要讓潛意識開心才最重要！2潛意識可以發揮無限可能！3潛意識是創造奇蹟的重要關鍵！優點：1情緒管理2情緒就是我的導航3情緒心情好可以願望實現！
我在纽约的第四天 emma佳小佳
昨儿走了两万多步累到不行一路吃停不下来因为太累放弃牛排馆我就这点出息昂～图片发自App开销1、第七大街pretcafe约30刀图片发自Apppret我真心爱有机轻食咖啡不贵酸奶好吃第一份草我买了两份诺给你看纯素的咖喱味丸子有点像鸡肉丸子柴柴的咖喱味儿做的不错有松子香那个黄色酱我也不知道是啥就觉得好吃不腻图片发自App这个貌美的杯子更像酸奶酪微咸嗯～我想好了今天再去买一只图片发自App2、填坑God
《调色师手册：电影和视频调色专业技法（第2版）》——布置调色工作间
本节书摘来自异步社区《调色师手册：电影和视频调色专业技法（第2版）》一书中的第2章，布置调色工作间，作者【美】AlexisVanHurkman（阿列克谢·凡·赫克曼），译者高铭，陈华，更多章节内容可以访问云栖社区“异步社区”公众号查看。布置调色工作间观众观看节目所处的观影环境对于图像视觉效果的影响几乎与监视器质量带来的影响一样大。另一方面，你所使用的监视器种类也决定了你需要怎样布置房间。如果你在对
2020-09-07 心花怒放心理咨询
吸引力法则90天线上践行班四期三阶4战队打卡第47天记录D3林菲一.亿万富翁制造机——照镜子练习和感悟:早上好，美女，我爱你，你每天都要微笑面对这个世界，我爱你。你是平衡，理智。担当。负责，你是职业，自信，动感，喜悦！你是最棒的！二、朗读十大人生哲学感悟:今天是我人生中最好的一天。我是富裕健康开心。我积极的感恩一切来到我的生命里。要成事由我做起。我的生命我负全责。我时刻都会爱戴我自己。我是积极主动
开源模型应用落地-全能音频新纪元-Kimi-Audio-7B-Instruct-重塑多模态交互边界开源技术探险家开源模型-实际应用落地开源音视频 AIGC agi
一、前言在AI技术持续突破的2025年，音频交互正从单一任务处理迈向全场景融合的新阶段。4月27日，月之暗面（MoonshotAI）开源的Kimi-Audio-7B-Instruct，以“全能音频通才”之姿，为这一进程树立了里程碑式标杆。这款基于70亿参数架构的模型，首次在单一框架内整合语音识别（ASR）、情感分析（SER）、跨语言对话、语音生成（TTS）等十余项任务，并通过12.5Hz混合标记器
[密码学实战]密评相关题库解析曼岛_ 成长之路密评题库
[密码学实战]密评相关题库解析一、背景依据《密码法》第二十二条，关键信息基础设施（关基）运营者必须开展商用密码应用安全性评估，且需定期进行（不少于每年一次）。二、核心解析2.1测评标准框架（依据GM/T0115）考试围绕四大技术层面和三大管理维度展开：评估维度核心测评内容常见考点案例物理和环境安全电子门禁身份鉴别、视频记录存储完整性门禁系统使用SM3-HMAC判定合规性网络和通信安全VPN通道加密
只因4个字，40多岁的新媒体从业者，报名了第五期剽悍个人品牌特训营要瘦的孙小米
本周，又一位第24期剽悍财富行动营老铁成功付费，入驻第五期剽悍个人品牌特训营。这位老铁是一名新媒体从业者，创办了自己的线上产品，也是某新媒体大咖训练营的常驻分享嘉宾，在社群里分享近300场。今年3月，她报名参加了剽悍财富行动营。她说，这期间的学习，不仅让自己的行动力提升了很多倍、养成诸多好习惯，更让自己明白了“圈子”和“连接”的重要性，于是，还没结营，她就申请报名第五期剽悍个人品牌特训营。她说，终
DDD深度解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
领域驱动设计核心解析 Java开发廖志伟 Java场景面试宝典 Domain-Driven Design Software Architecture Strategic and Tactical Design
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
ShardingSphere技术解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
2019-04-06 Emily金金
傍晚把小猫咪再次接回了家，他们好乖呀，在盒子里睡的很熟，也不太吵。梨花弟弟是体型最大的，虽然这么说，但还是只有我的巴掌大。小白真的很文静啊，和梨花比简直就是一个多动症，一个文静娇羞孩子。经历一番周折后，明天终于可以把阿喵带回苏州啦。在家里快被念叨死了。。
微服务架构核心技术解析 Java开发廖志伟 Java场景面试宝典 Microservices Service Discovery API Gateway
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
今日市场有三大看点 MK赵先森
上周五大盘最后一小时缩量下跌，外围股市普遍上涨，消息面偏向利好。今天大盘应该高开，上攻时关注3530点附近的压力，强压力在3550点附近；回落时关注3470点附近的支撑，强支撑在3456点附近。上周大盘上蹿下跳，涨一天，跌一天，蓝筹股全线下挫，而小盘股，业绩极差股全线反弹，大盘虽然调整，但两市3200多只个股红盘，只有不到750只个股下跌，个股上涨中位数是7%，周五美股出现800点的惊天逆转，国内
《内在动机》：奖励会伤人，从何而来秋子碎碎念
有个妈妈问连岳：沪漂的她，是单亲家庭，养育两个女孩。有房，但没落户。大女儿在市重点高中就读，成绩优异，马上面临高考。女儿表示想报香港中文大学（深圳）这个学校，但因为这所大学是中外合作办学的，学费加开销，一年15万打底。如果想满足大女儿的愿望，必须把目前所住的两居室换成一居室。妈妈比较犹豫，因为房子是她们娘仨唯一值钱的资产，置换后，不仅生活质量会变得很低，生活也会很被动，没有退路。妈妈内心很抗拒，但
Spring Cloud架构解析 Java开发廖志伟 Java场景面试宝典 Spring Cloud Service Governance Distributed Systems
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Maven Array_06 eclipse jdk maven
Maven Maven是基于项目对象模型(POM)，信息来管理项目的构建，报告和文档的软件项目管理工具。 Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法，许多 Apache Jakarta 项目发文时使用 Maven，而且公司
ibatis的queyrForList和queryForMap区别 bijian1013 java ibatis
一.说明 iBatis的返回值参数类型也有种：resultMap与resultClass，这两种类型的选择可以用两句话说明之： 1.当结果集列名和类的属性名完全相对应的时候，则可直接用resultClass直接指定查询结果类
LeetCode[位运算] - #191 计算汉明权重 Cwind java 位运算 LeetCode Algorithm 题解
原题链接：#191 Number of 1 Bits 要求：写一个函数，以一个无符号整数为参数，返回其汉明权重。例如，‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。汉明权重：指一个字符串中非零字符的个数；对于二进制串，即其中‘1’的个数。难度：简单分析：将十进制参数转换为二进制，然后计算其中1的个数即可。 “
浅谈java类与对象 15700786134 java
java是一门面向对象的编程语言，类与对象是其最基本的概念。所谓对象，就是一个个具体的物体，一个人，一台电脑，都是对象。而类，就是对象的一种抽象，是多个对象具有的共性的一种集合，其中包含了属性与方法，就是属于该类的对象所具有的共性。当一个类创建了对象，这个对象就拥有了该类全部的属性，方法。相比于结构化的编程思路，面向对象更适用于人的思维
linux下双网卡同一个IP 被触发 linux
转自： http://q2482696735.blog.163.com/blog/static/250606077201569029441/ 由于需要一台机器有两个网卡，开始时设置在同一个网段的IP，发现数据总是从一个网卡发出，而另一个网卡上没有数据流动。网上找了下，发现相同的问题不少：一、关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
安卓按主页键隐藏程序之后无法再次打开肆无忌惮_ 安卓
遇到一个奇怪的问题，当SplashActivity跳转到MainActivity之后，按主页键，再去打开程序，程序没法再打开（闪一下），结束任务再开也是这样，只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity 本来代码： // 销毁这个Activity fin
通过cookie保存并读取用户登录信息实例知了ing JavaScript html
通过cookie的getCookies()方法可获取所有cookie对象的集合；通过getName()方法可以获取指定的名称的cookie；通过getValue()方法获取到cookie对象的值。另外，将一个cookie对象发送到客户端，使用response对象的addCookie()方法。下面通过cookie保存并读取用户登录信息的例子加深一下理解。（1）创建index.jsp文件。在改
JAVA 对象池矮蛋蛋 java ObjectPool
原文地址： http://www.blogjava.net/baoyaer/articles/218460.html Jakarta对象池 ☆为什么使用对象池恰当地使用对象池化技术，可以有效地减少对象生成和初始化时的消耗，提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
ArrayList根据条件+for循环批量删除的方法 alleni123 java
场景如下： ArrayList<Obj> list Obj-> createTime, sid. 现在要根据obj的createTime来进行定期清理。（释放内存） ------------------------- 首先想到的方法就是 for(Obj o:list){ if(o.createTime-currentT>xxx){
阿里巴巴“耕地宝”大战各种宝百合不是茶平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”，“耕地宝”由阿里巴巴投入一亿，主要是用来进行农业方面，将农民手中的散地集中起来不仅加大农民集体在土地上面的话语权，还增加了土地的流通与利用率，提高了土地的产量，有利于大规模的产业化的高科技农业的发展，阿里在农业上的探索将会引起新一轮的产业调整，但是集体化之后农民的个体的话语权将更少，国家应出台相应的法律法规保护
Spring注入有继承关系的类（1） bijian1013 java spring
一个类一个类的注入 1.AClass类 package com.bijian.spring.test2; public class AClass { String a; String b; public String getA() { return a; } public void setA(Strin
30岁转型期你能否成为成功人士 bijian1013 成功
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
[Velocity三]基于Servlet+Velocity的web应用 bit1129 velocity
什么是VelocityViewServlet 使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中，以Servlet+Velocity的方式实现web应用 Servlet + Velocity的一般步骤 1.自定义Servlet，实现VelocityViewServl
【Kafka十二】关于Kafka是一个Commit Log Service bit1129 service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解？ A message is considered "committed" when all in sync replicas for that partition have applied i
NGINX + LUA实现复杂的控制 ronin47 lua nginx 控制
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-14.输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字 bylijinnan java
public class TwoElementEqualSum { /** * 第 14 题：题目：输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字。要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字，输出任意一对即可。例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder bylijinnan java netty
今天看Netty如何实现一个Http Server org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory： pipeline.addLast("decoder", new HttpRequestDecoder()); pipeline.addLast(&quo
java敏感词过虑-基于多叉树原理 cngolon 违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包，用于java中的敏感词过滤 1、工具包自带敏感词词库，第一次调用时读入词库，故第一次调用时间可能较长，在类加载后普通pc机上html过滤5000字在80毫秒左右，纯文本35毫秒左右。 2、如需自定义词库，将jar包考入WEB-INF工程的lib目录，在WEB-INF/classes目录下建一个 utf-8的words.dict文本文件，
多线程知识 cuishikuan 多线程
T1，T2，T3三个线程工作顺序，按照T1，T2，T3依次进行 public class T1 implements Runnable{ @Override
spring整合activemq dalan_123 java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分： a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
MySQL时间字段究竟使用INT还是DateTime？ dcj3sjt126com mysql
环境：Windows XPPHP Version 5.2.9MySQL Server 5.1 第一步、创建一个表date_test（非定长、int时间） CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
Parcel: unable to marshal value dcj3sjt126com marshal
在两个activity直接传递List<xxInfo>时，出现Parcel: unable to marshal value异常。在MainActivity页面（MainActivity页面向NextActivity页面传递一个List<xxInfo>）： Intent intent = new Intent(this, Next
linux进程的查看上（ps） eksliang linux ps linux ps -l linux ps aux
ps:将某个时间点的进程运行情况选取下来转载请出自出处：http://eksliang.iteye.com/admin/blogs/2119469 http://eksliang.iteye.com ps 这个命令的man page 不是很好查阅，因为很多不同的Unix都使用这儿ps来查阅进程的状态，为了要符合不同版本的需求，所以这个
为什么第三方应用能早于System的app启动 gqdy365 System
Android应用的启动顺序网上有一大堆资料可以查阅了，这里就不细述了，这里不阐述ROM启动还有bootloader，软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来（包括wifi, power, rild, surfaceflinger, mediaserver等等）-> 启动Dalivk中的第一个进程Zygot
App Framework发送JSONP请求(3) hw1287789687 jsonp 跨域请求发送jsonp ajax请求越狱请求
App Framework 中如何发送JSONP请求呢? 使用jsonp,详情请参考:http://json-p.org/ 如何发送Ajax请求呢? (1)登录 /*** * 会员登录 * @param username * @param password */ var user_login=function(username,password){ // aler
发福利，整理了一份关于“资源汇总”的汇总 justjavac 资源
觉得有用的话，可以去github关注：https://github.com/justjavac/awesome-awesomeness-zh_CN 通用 free-programming-books-zh_CN 免费的计算机编程类中文书籍精彩博客集合 hacke2/hacke2.github.io#2 ResumeSample 程序员简历
用 Java 技术创建 RESTful Web 服务 macroli java 编程 Web REST
转载：http://www.ibm.com/developerworks/cn/web/wa-jaxrs/ JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API，可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项超声波 oracle linux
前言：这两天项目要上线了，由我负责往服务器部署整个项目，因此首先要往服务器安装oracle，服务器本身是CentOS6.5的64位系统，安装的数据库版本是11g，在整个的安装过程中碰到很多的坑，不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。安装过程中可能遇到的问题（注
HttpClient 4.3 设置keeplive 和 timeout 的方法 supben httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() { @Override public long getKeepAliveDuration(HttpResponse response, HttpContext context) { long keepAlive
Spring 4.2新特性-@Import注解的升级 wiselyman spring 4
3.1 @Import @Import注解在4.2之前只支持导入配置类在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean 3.2 示例演示java类 package com.wisely.spring4_2.imp; public class DemoService { public void doSomethin