残星流影

书生·浦语大模型实战营04课堂笔记

一、Finetune简介

1.LLM下游应用中，两种微调模式

一种是增量预训练：使用场景是让基座模型学习到一些新知识，如某个垂类领域的常识。其训练数据包括文章、书籍、代码等

另一种是指令跟随，其使用场景是让模型学会对话模板，根据人类指令进行对话。训练数据为高质量对话、问答数据。

2.指令跟随微调

2.1 原理

①一问一答的数据完成对话模板的角色构建；

②构建完成的数据输入到模型来计算损失；

③只对答案部分进行损失的计算

2.2 角色指定

指令跟随微调中包含多个角色，可以分为system、user、assistant三个角色。

system：给定上下文信息，比如：你是一个安全的AI助手/你是一位医生，你的回答是正确且耐心的

user:实际用户提出问题，比如：世界第一高峰是？

assistant:根据user的输入，结合system的上下文信息，做出回答，例如：珠穆朗玛峰。

不同的语言模型由不同的单位或组织发行，使用的对话模板也不相同.

LlaMa2以INST和方括号来包裹user，以双尖括号和SYS大写字符来包裹system角色内容。

InternLM的主要结构如下：

<|System|> System上下文开始

<|User|> User指令开始

End of Human User指令结束

<|Bot|>Assistant开始回答

End of Assistant Assistant回答结束

注意：部署模型进行预测阶段，即真正和模型对话：不需要进行角色分配，用户输入内容默认被放到User部分，System部分由模板自动添加的。具体什么模板，在启动预测的时候，可以进行自定义

3.增量预训练

①增量预训练的数据不需要一文一答，他都是一个一个的陈述句，陈述事实；

②system和User的角色留空，增量预训练的数据放入到Assistant角色中，计算损失时，只计算Assistant部分的损失。

4.LORA&QLORA

4.1 LORA简介

①LORA全称：LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS；

②LLM的参数量主要集中在模型的Linear，训练这些参数时会消耗大量的显存。而LORA通过在原本的Linear旁，新增一个支路，包含两个连续的小Linear，新增的这个支路通常叫做Adapter。Adapter参数量远小于原本的Linear，能大幅降低显存

4.2 全参数微调、LORA和QLORA的区别

全参数微调：

①Base Model参数与训练并更新参数；②需要保存Base Model中参数的优化器状态

LORA：

①Base Model只参与Forward；②只有Adapter部分Backward更新参数；③只需要保存Adapter中参数的优化器状态

QLORA：

①Base Model 量化为4-bit；②优化器状态在CPU和GPU间Offload；③Base Model只参与Forward；④只有Adapter部分Backward更新参数；⑤只需要保存Adapter中参数的优化器状态。

详见下列示意图

二、xTuner简介

xtuner是一款打包好的大模型微调工具箱，支持从huggingface和modelspace加载数据。支持InternLM，llama，通义千问，百川，Mistral等多种语言大模型

三、8GB显卡玩转LLM

Flash Attention和DeepSpeed ZeRO是xTuner最重要的两个优化技巧：

Flash Attention：将Attention计算并行化，避免了计算过程中Attention ScoreNxN的显存占用

DeepSpeed ZeRO：①ZeROu优化，用过将训练过程中参数、梯度和优化器状态切片保存，能够在多GPU训练时显著节省显存；③除了将训练中间状态切片，DeepSpeed训练时使用FP16权重，相较于Pytorch的AMP训练，单GPU上也能大幅减少显存。

四、动手实战环节

1.快速上手

平台说明：Ubuntu + Anaconda + CUDA/CUDNN + 8GB nvidia显卡

2.安装依赖

1.使用InternStudio可以很简单创建环境

/root/share/install_conda_env_internlm_base.sh xtuner0.1.9

2.激活环境

conda activate xtuner0.1.9

3.创建并进入目录

mkdir xtuner019 && cd xtuner019

4.拉取源码

git clone -b v0.1.9  https://github.com/InternLM/xtuner

5.进入源码目录后，安装源码

pip install -e '.[all]'

安装完成后，准备在 oasst1 数据集上微调 internlm-7b-chat

3.微调

1.拷贝配置文件至当前目录

cd ~/ft-oasst1
xtuner copy-cfg internlm_chat_7b_qlora_oasst1_e3 .

2.模型下载

因为在InternStudio中已经由对应文件，我们这里可以直接拷贝

cp -r /root/share/temp/model_repos/internlm-chat-7b ~/ft-oasst1/

不用 xtuner 默认的从 huggingface 拉取模型，而是提前从 ModelScope 下载模型到本地

# 创建一个目录，放模型文件，防止散落一地
mkdir ~/ft-oasst1/internlm-chat-7b

# 装一下拉取模型文件要用的库
pip install modelscope

# 从 modelscope 下载下载模型文件
cd ~/ft-oasst1
apt install git git-lfs -y
git lfs install
git lfs clone https://modelscope.cn/Shanghai_AI_Laboratory/internlm-chat-7b.git -b v1.0.3

3.数据集下载

InternStudio已经下载好的数据，我们直接拷贝

cd ~/ft-oasst1
# ...-guanaco 后面有个空格和英文句号啊
cp -r /root/share/temp/datasets/openassistant-guanaco .

4.修改配置文件

cd ~/ft-oasst1
vim internlm_chat_7b_qlora_oasst1_e3_copy.py

减号代表删除，加号代表增加

# 修改模型为本地路径
- pretrained_model_name_or_path = 'internlm/internlm-chat-7b'
+ pretrained_model_name_or_path = './internlm-chat-7b'

# 修改训练数据集为本地路径
- data_path = 'timdettmers/openassistant-guanaco'
+ data_path = './openassistant-guanaco'

5.开始微调

xtuner train ./internlm_chat_7b_qlora_oasst1_e3_copy.py

应为ssh连接的特性,很容易断开连接，我们这里使用tmux进行操作

首先更新apt

然后使用apt安装tmux

安装完成后，使用tmux new -s finetune 创建一个新sesstion，进入后我们将bash命令重新运行，这样就不会终端了

同时按CTRL+B 松开后再按D，会重新回到终端页面中

这里输入 tmux attach -t finetune会重新回到创建的tmux的session

6.完成训练

训练结果如下图所示

7.将得到的 PTH 模型转换为 HuggingFace 模型

mkdir hf
export MKL_SERVICE_FORCE_INTEL=1

使用xtuner转换

xtuner convert pth_to_hf ./internlm_chat_7b_qlora_oasst1_e3_copy.py ./work_dirs/internlm_chat_7b_qlora_oasst1_e3_copy/epoch_1.pth ./hf

转换完成

4.部署与微调

1.将 HuggingFace adapter 合并到大语言模型

运用以下命令合并

xtuner convert merge ./internlm-chat-7b ./hf ./merged --max-shard-size 2GB

2.与合并之后的模型对话

# 加载 Adapter 模型对话（Float 16）
xtuner chat ./merged --prompt-template internlm_chat

# 4 bit 量化加载
# xtuner chat ./merged --bits 4 --prompt-template internlm_chat

float16模式下，输出答案会“一个一个单词蹦出来”，速度较慢；4bit量化输出答案会有些损失，但生成结果很快。

以下是4bit量化后的数据，生成速度比之前快很多

五、自定义微调

1.概述

以 Medication QA 数据集为例

基于 InternLM-chat-7B 模型，用 MedQA 数据集进行微调，往医学领域对齐。

问题	答案
What are ketorolac eye drops?（什么是酮咯酸滴眼液？）	Ophthalmic ketorolac is used to treat itchy eyes caused by allergies. It also is used to treat swelling and redness (inflammation) that can occur after cataract surgery. Ketorolac is in a class of medications called nonsteroidal anti-inflammatory drugs (NSAIDs). It works by stopping the release of substances that cause allergy symptoms and inflammation.
What medicines raise blood sugar? （什么药物会升高血糖？）	Some medicines for conditions other than diabetes can raise your blood sugar level. This is a concern when you have diabetes. Make sure every doctor you see knows about all of the medicines, vitamins, or herbal supplements you take. This means anything you take with or without a prescription. Examples include: Barbiturates. Thiazide diuretics. Corticosteroids. Birth control pills (oral contraceptives) and progesterone. Catecholamines. Decongestants that contain beta-adrenergic agents, such as pseudoephedrine. The B vitamin niacin. The risk of high blood sugar from niacin lowers after you have taken it for a few months. The antipsychotic medicine olanzapine (Zyprexa).

问题

答案

What are ketorolac eye drops?（什么是酮咯酸滴眼液？）

Ophthalmic ketorolac is used to treat itchy eyes caused by allergies. It also is used to treat swelling and redness (inflammation) that can occur after cataract surgery. Ketorolac is in a class of medications called nonsteroidal anti-inflammatory drugs (NSAIDs). It works by stopping the release of substances that cause allergy symptoms and inflammation.

What medicines raise blood sugar? （什么药物会升高血糖？）

Some medicines for conditions other than diabetes can raise your blood sugar level. This is a concern when you have diabetes. Make sure every doctor you see knows about all of the medicines, vitamins, or herbal supplements you take. This means anything you take with or without a prescription. Examples include: Barbiturates. Thiazide diuretics. Corticosteroids. Birth control pills (oral contraceptives) and progesterone. Catecholamines. Decongestants that contain beta-adrenergic agents, such as pseudoephedrine. The B vitamin niacin. The risk of high blood sugar from niacin lowers after you have taken it for a few months. The antipsychotic medicine olanzapine (Zyprexa).

2.将数据转为 XTuner 的数据格式

[{
    "conversation":[
        {
            "system": "xxx",
            "input": "xxx",
            "output": "xxx"
        }
    ]
},
{
    "conversation":[
        {
            "system": "xxx",
            "input": "xxx",
            "output": "xxx"
        }
    ]
}]

3.开始微调

新建一个文件夹来玩“微调自定义数据集”

mkdir ~/ft-medqa && cd ~/ft-medqa

把前面下载好的internlm-chat-7b模型文件夹拷贝过来。

cp -r ~/ft-oasst1/internlm-chat-7b .

将自定义数据集转移

git clone https://github.com/InternLM/tutorial
cp ~/tutorial/xtuner/MedQA2019-structured-train.jsonl .

4.准备配置文件

# 复制配置文件到当前目录
xtuner copy-cfg internlm_chat_7b_qlora_oasst1_e3 .
# 改个文件名
mv internlm_chat_7b_qlora_oasst1_e3_copy.py internlm_chat_7b_qlora_medqa2019_e3.py

# 修改配置文件内容
vim internlm_chat_7b_qlora_medqa2019_e3.py

# 修改import部分
- from xtuner.dataset.map_fns import oasst1_map_fn, template_map_fn_factory
+ from xtuner.dataset.map_fns import template_map_fn_factory

# 修改模型为本地路径
- pretrained_model_name_or_path = 'internlm/internlm-chat-7b'
+ pretrained_model_name_or_path = './internlm-chat-7b'

# 修改训练数据为 MedQA2019-structured-train.jsonl 路径
- data_path = 'timdettmers/openassistant-guanaco'
+ data_path = 'MedQA2019-structured-train.jsonl'

# 修改 train_dataset 对象
train_dataset = dict(
    type=process_hf_dataset,
-   dataset=dict(type=load_dataset, path=data_path),
+   dataset=dict(type=load_dataset, path='json', data_files=dict(train=data_path)),
    tokenizer=tokenizer,
    max_length=max_length,
-   dataset_map_fn=alpaca_map_fn,
+   dataset_map_fn=None,
    template_map_fn=dict(
        type=template_map_fn_factory, template=prompt_template),
    remove_unused_columns=True,
    shuffle_before_pack=True,
    pack_to_max_length=pack_to_max_length)

5.训练

xtuner train internlm_chat_7b_qlora_medqa2019_e3.py --deepspeed deepspeed_zero2

同样的按照上面步骤将其转换为huggingface模型，再拼接即可

部署与测试同上

六、用 MS-Agent 数据集赋予 LLM 以 Agent 能力

1.概述

MSAgent 数据集每条样本包含一个对话列表（conversations），其里面包含了 system、user、assistant 三种字段。其中：

system: 表示给模型前置的人设输入，其中有告诉模型如何调用插件以及生成请求
user: 表示用户的输入 prompt，分为两种，通用生成的prompt和调用插件需求的 prompt
assistant: 为模型的回复。其中会包括插件调用代码和执行代码，调用代码是要 LLM 生成的，而执行代码是调用服务来生成结果的。

2.微调

从国内的 ModelScope 平台下载 MS-Agent 数据集

# 准备工作
mkdir ~/ft-msagent && cd ~/ft-msagent
cp -r ~/ft-oasst1/internlm-chat-7b .

# 查看配置文件
xtuner list-cfg | grep msagent

# 复制配置文件到当前目录
xtuner copy-cfg internlm_7b_qlora_msagent_react_e3_gpu8 .

# 修改配置文件中的模型为本地路径
vim ./internlm_7b_qlora_msagent_react_e3_gpu8_copy.py

3.开始微调：训练

xtuner train ./internlm_7b_qlora_msagent_react_e3_gpu8_copy.py --deepspeed deepspeed_zero2

4.使用

由于 msagent 的训练非常费时，大家如果想尽快把这个教程跟完，可以直接从 modelScope 拉取咱们已经微调好了的 Adapter。如下演示。

下载adapter

cd ~/ft-msagent
apt install git git-lfs
git lfs install
git lfs clone https://www.modelscope.cn/xtuner/internlm-7b-qlora-msagent-react.git

添加环境变量

export SERPER_API_KEY=abcdefg
# 其中abcdefg为apikey

启动xtuner

xtuner chat ./internlm-chat-7b --adapter internlm-7b-qlora-msagent-react --lagent

如果出现错误：

xtuner chat 增加 --lagent 参数后，报错 TypeError: transfomers.modelsauto.auto factory. BaseAutoModelClass.from pretrained() got multiple values for keyword argument "trust remote code"

注释掉已安装包中的代码：

vim /root/xtuner019/xtuner/xtuner/tools/chat.py

支持向量机 SVM 简要介绍 _夜空的繁星_ 机器学习 svm 支持向量机拉格朗日对偶机器学习
那些我从来没有理解过的概念（1）下面是我在学习过程中遇到的对我很难理解的概念和我抄下来的笔记主要资料来源：《统计学习方法》，维基百科拉格朗日对偶问题是什么假设f(x),ci(x),hj(x)是定义在Rn上的连续可微函数，考虑以下最优化问题：$$\min_{x\inR^n}{f(x)}\c_i(x)\leq0,i=1,2,\dots,k\h_j(x)=0,j=1,2,\dots,l$$是一个凸优化问
【笔记】nodejs中使用axios获取binary文件流并转换成base64 痞老板2 笔记 vue.js 前端 javascript node.js
awaitaxios.get('http://aaa.com/xxxx.jpg'+Date.parse(newDate()),{responseType:'arraybuffer'}).then(res=>{console.log('成功')returnBuffer.from(res.data,'binary').toString('base64')}).catch(e=>{returne})把t
Stm32学习笔记2-中断系统-对射式红外传感器计次 Anon_Tokoyo stm32 学习笔记
一.中断系统：1.中断条件：当主程序运行时，出现了特点的中断条件，此时程序暂停运行当前直到处理完中断程序后再继续执行操作。2.中断优先级：当有多个中断时，cpu会根据中断轻重优先选择加急的中断程序。3.参考nvic基本结构：可以看出stm32中的许多外设像EXTI、TIM等都有中断通道。通过NVIC统一管理。经过NVIC裁决后可向中断CPU当前程序转而执行这些外设的中断程序。二.EXTI外设：1.
Vite 打包后Nginx部署配置 winyh5 nginx 运维
自我简介：4年导游，10年程序员，最近6年一直深耕低代码领域，分享低代码和AI领域见解。vite.config.js配置文件—纯笔记记录,没有阅读价值～exportdefault{base:"/mywebsite",//开发或生产环境服务的公共基础路径}当base修改后nginx部署时需要做相应调整location/{root/usr/share/nginx/html;indexindex.htm
杂乱笔记（一）五块钱三个 java 数据库前端
一、嵌套定义在Spring中，一个Bean的属性值可以是基本数据类型（如字符串、整数等），也可以是另一个Bean的实例。当使用嵌套定义时，就是在告诉Spring，当前属性的值是一个新创建的Bean实例entityManagerFactory的persistenceProvider属性需要一个PersistenceProvider类型的实例，通过嵌套定义创建了一个org.hibernate.jpa.
JavaScript学习笔记一跨界科技汇前端 javascript 学习笔记
web三大标准：HTML(结构)+CSS（样式）+JavaScript(行为)JavaScript的作用：动态效果+数据交互编程语言编程让计算机为解决某个问题而使用某种程序设计语言编写程序代码，最终得到结果是什么？世界上最流行的语言之一，是一种运行在客户端的脚本语言脚本语言不需要编译，运行过程中由**js解析器(js引擎)**逐行来进行解释并执行现在也可以基于Node.js技术来进行服务器端编程作
【Flutter入门】1. 从零开始的flutter跨平台开发之旅（概述、环境搭建、第一个Flutter应用）西辰Knight flutter入门 flutter
前言随着移动互联网的发展，跨平台开发已经成为一个不可忽视的技术方向。本文将带领读者从零开始学习Flutter，循序渐进地掌握这个强大的跨平台开发框架。截至2024年12月，Flutter已经发展到了3.27版本。在学习和使用的过程中，我发现国内现在网上可以找到的Flutter相关文章教程等并不多，且很多都是比较过时的。因此，我计划从2025年开始，分享自己平时做的笔记以及工作上积累的经验，希望能对
【搞机】黑群晖SA6400安装笔记菜萝卜子 NAS 服务器 linux
环境介绍注意事项：本次使用rr项目搭建黑群晖，项目地址：https://github.com/RROrg/rr前提知识：1.rr引导系统必须占用一个存储设备，不管是硬盘还是U盘，所以得准备至少两个存储设备！一个用作RR的刷入（可u盘或者sata硬盘），一个SATA硬盘用作数据盘（必须sata），安装完成后不能取走刷入RR的存储设备（比如U盘中装RR引导，那么U盘以后都要一直插到电脑，当作黑群晖启动
[论文笔记] LLaMA3.1与Qwen2与Apple 技术报告中预训练方案对比心心喵论文笔记论文阅读深度学习人工智能
https://arxiv.org/pdf/2407.21075https://arxiv.org/pdf/2407.10671https://arxiv.org/pdf/2407.21783LLaMA3.1LLaMA3.1技术报告：https://ai.meta.com/blog/meta-llama-3-1/
【5】单调队列学习笔记 W9095 学习笔记 c++算法
前言鸽了很久，2023/1/52023/1/52023/1/5开始，2023/1/212023/1/212023/1/21才完工。中途去集训了，没时间来补漏洞。单调队列单调队列是一种非常实用的数据结构，可以用于查询一个定长区间在以一定速度向后滑动，并查询区间内最值的问题（具体见例题111）。时间复杂度非常低，总体是O(n)O(n)O(n)，均摊到每个元素是O(1)O(1)O(1)，所以常用来优化其
C语言笔记（郝斌） cndsdss c语言单片机 stm32 开发语言笔记 linux 改行学it
二次复习做的笔记，很基础，适合新手入门，复习巩固C语言前言1.为什么学习c语言优点：代码量小速度快功能强大可移植性较好缺点：危险性高开发周期长应用领域广：系统软件应用软件为学习数据结构C++打基础2.怎样学C语言多思考多上机多上机多上机目标：能看懂程序，能调试程序3.学习的目标熟练掌握C语言的语法规则理解面向过程的思想4.学习重点流程控制函数指针动态内存分配1.基本编程知识1.1CPU内存条硬盘显
侯捷 C++ 课程学习笔记：C++面向对象开发『六哥』 C++学习笔记
学习C++面向对象开发需要具备一些基础。学习过某种proceduurallanguage（C语言最佳）了解变量（variables）、类型（types）、作用域（scope）、循环（loops）、流程控制。知道一个程序需要编译才能被执行。以良好的方式编写C++class是一种基于对象（ObjectBased）classwithoutpointermembers——Complex带指针classwi
微服务设计模式--概述（笔记）微服务设计模式
模式分为三组：基础设施相关模式：基础设施相关；应用基础设施相关：应用层面基础设施；应用相关模式组；各模式分解服务拆分模式根据业务能力分解模式根据子域分解模式通信相关通信风格服务发现可靠性事务性消息外部API数据一致性解决分布式日志，以及数据一致性；查询数据解决多个服务数据源获取数据；CQRS：命令查询职责隔离服务部署解决微服务如何部署；可食用虚拟机，容器，serverless技术；可观测性理解和诊
RHCE——笔记 tan & 笔记 linux 服务器
Web服务器1，web服务器简介（1）什么是www是全球信息广播的意思。通常说的上网就是使用www来查询用户所需要的信息。www可以结合文字、图形、影像以及声音等多媒体，并通过可以让鼠标单击超链接的方式将信息以Internet传递到世界各处去（2）网址及HTTP简介web服务器提供的这些数据大部分都是文件，那么我们需要在服务器端先将数据文件写好，并且放置在某个特殊的目录下面，这个目录就是我们整个网
js 开发笔记我是陈大大笔记
什么时候用如下代码：letthat=this;this的指向问题，如果methods中的方法中使用的是function而不是箭头函数，则this的指向是对象，并不是最外层的顶层对象，所以获取不到data中的数据，要用letthat=this;暂存this中的内容；数组对象中只想获取某一个字段的值，并且返回一个新的数组，方法如下：//模拟数组对象letdata=[{name:"李白",age:18,
『大模型笔记』强烈推荐OpenAI官方：推理模型最佳实践！ AI大模型前沿研究大模型笔记人工智能 OpenAI 推理模型 GPT GPTo1 GPTo3 ChatGPT
『大模型笔记』强烈推荐OpenAI官方：推理模型最佳实践！文章目录一.OpenAI官方：推理模型最佳实践推理模型vs.GPT模型选择指南二.何时使用我们的推理模型1.处理模糊不清的任务2.从海量信息中精准提取关键信息3.在海量数据集中发现关系和细微差别4.多步骤自主规划5.视觉推理6.代码审查、调试与质量提升7.评估与基准测试其他模型的响应如何有效提示推理模型其他资源一.OpenAI官方：推理模型
C++文件读写操作(自学笔记三) zgdk0204 c++
C++中对文件的操作的三个大类：写操作：ofstream读操作：ifstream读写操作：fstream要想实现对文件的读写操作，头文件中需要包含#include文件操作中的mode对于文件操作的mode有多种，分别为以下几种：文件操作手段对应mode代码为读文件而打开文件ios::in为写文件而打开文件ios::out初始位置,文件尾ios::ate追加方式写文件ios::app如果文件存在先删
Linux学习笔记--shell脚本（二）运维派C shell脚本学习 Linux shell脚本
20.1什么是shell脚本shell脚本并不能作为正式的编程语言，因为它是在linux的shell中运行的，所以称为shell脚本。事实上，shell脚本就是一些命令的集合。假如完成某个需求需要一口气输入10条命令，对于简单的命令，我们可以直接在shell窗口中输入，但如果是比较长且复杂的命令，一次一次敲就会显得很麻烦。我们可以把这10条命令都记录到一个文档中，然后去调用文档中的命令，这样就能一
[C/C++笔记] 文件读写操作fstream LPS爱玩Linux C/C++c语言 c++
[C/C++笔记]文件读写操作fstream1.简介2.打开文件3.写入文件4.读取文件4.1getline()和fstream.getline()1.简介fstream是C++标准库中用于文件读写的类。它提供了比底层C语言库更为高级的文件读写接口，因此使用起来更为方便和安全。在使用fstream时，需要包含头文件。fstream类有三个派生类：ifstream：用于从文件中读取数据。fstrea
C++笔记 01文件流操作 nedaf C++c++
1基本概念文件(file)存储在磁盘上的数据集合，可以是文本、二进制等格式，具有名称、大小、类型等属性。流(stream)一连串的字节，是一种抽象的数据传输方式。在C++中，文件操作是基于流的概念，有3种主要类型的流：输入流(istream)：允许程序从源(如键盘、文件)读取数据。输出流(ostream)：允许程序将数据发送到目标(如显示器、文件)。输入/输出流(iostream)：结合了输入流和
C++文件操作笔记无衣秦风 c++
笔记：C++程序产生的数据保存文件文章目录一、C++文件读写打开关闭文件读写文件检测EOF读写文件状态标识符验证文件指针定位二、例子一、C++文件读写fstream可同时读写的文件类ofstream写操作(out输出)文件类ifstream读文件(in输入)文件类打开关闭文件voidopen(constchar*filename，openmodemode,intaccess)；filename：要
Linux and Shell笔记梳理是蛋蛋吖~ linux and shell linux shell
#!是一个约定的标记，它告诉系统这个脚本需要什么解释器来执行，即使用哪一种Shellecho命令用于向窗口输出文本。chmod权限控制：第1个字符有两种情况：如果是“d”则代表这是一个文件夹，如果是“—”代表这是一个文件；d代表的是目录(directroy)-代表的是文件(regularfile)s代表的是套字文件(socket)p代表的管道文件(pipe)或命名管道文件(namedpipe)l代
Linux笔记---调试工具GDB(gdb) 大筒木老辈子 linux 笔记运维
1.gdb的概念GDB，全称GNUDebugger，是一个功能强大的开源调试工具，广泛用于Unix和类Unix系统，以及MicrosoftWindows和macOS平台。GDB允许开发者在程序执行过程中查看内部运行情况，帮助定位和修复程序中的错误。gdb的主要功能：启动和控制程序执行：gdb可以按照自定义要求运行程序，并在指定的断点处暂停执行。检查程序状态：当程序暂停时，gdb允许开发者检查程序中
《Operating System Concepts》阅读笔记：p208-p227 操作系统
《OperatingSystemConcepts》学习第24天，p208-p227总结，总计20页。一、技术总结1.vmstatLinux系统上vmstat命令的作用是“Reportvirtualmemorystatistics”。2.schedulingalgorithms(1)FCFS(first-comefirst-serve)(2)SJF(shortest-job-first)准确的叫法应
sqlite3 学习笔记某风吾起 work sqlite 学习笔记
文章目录前言SQL的概念与表格相关的操作i.创建表格（增）ii删除表格（删）iii更改表格（改）iv查询表格（查）与记录相关的操作i插入记录ii删除记录iii查询记录iv修改记录Linux中使用sqlite3前言SQLite，是一款轻型的数据库，是遵守ACID的关系型数据库管理系统。SQLite非常适合用于嵌入式系统、物联网设备、移动应用程序和客户端应用程序，它不需要服务器，简单易用。SQL的概念
Datawhale AI夏令营第四期 AIGC方向 task02学习笔记流火_授衣 AI 人工智能 AIGC 学习
探探前沿：了解一下AI生图技术的能力&局限今天我们的任务是对baseline的代码有一个更加细致的理解，然后我们会学习如何借助AI来提升我们的自学习能力，从而帮助大家在后面的学习工作中如何从容迎接各种挑战。授人以鱼不如授人以渔，你可以从中学大模型的提问技巧来实现快速学习，学会如何制作一个话剧连环画。‘自其不变者而观之，则物与我皆无尽也’，拥抱AI、学习AI、运用AI解决各种变化的问题，一起加油！！
LLM时代的小模型思考：《What is the Role of Small Models in the LLM Era: A Survey》论文笔记 FrancisQiu learning nlp paper reading 论文阅读
论文：WhatistheRoleofSmallModelsintheLLMEra:ASurvey作者：LihuChenetal.单位：ImperialCollegeLondonAbstract问题：扩大模型大小会导致计算成本和能耗呈指数级增长，这使得这些模型对于学术研究人员和资源有限的企业来说不切实际小型模型（SMs）经常用于实际环境中，引发了关于小模型在LLM时代的作用的重要问题，且关注有限方法
Python笔记之多线程与多进程人间酒中仙 python笔记 python 笔记
Python笔记之多线程与多进程一、简介二、线程基础（`threading`模块）1、概念说明2、代码示例(1)创建与启动线程(2)使用`threading`模块创建多个线程三、进程基础（`multiprocessing`模块）1、概念说明2、代码示例(1)创建与启动进程(2)创建多个进程四、GIL与线程池1、概念说明2、代码示例(1)GIL影响演示(2)使用线程池管理线程五、小结一、简介本章节详
c语言笔记数组进阶题目的理解我是大咖 c语言笔记算法数据结构 leetcode
题目：声明一个二维int型数组a，再声明另一个一维数组指针数组b，使该数组b的每一个指针分别指向二维数组a中的每一个元素(即每一个一维数组)，然后利用数组b计算数组a的和。图解：画图帮助理解我们要清楚什么是指针数组和数组指针，我们先要有知识储备才能完美的做好这道题目.//定义一个指针数组int*p[3];指针数组：数组的元素是一个个指针，[]的元素优先级高于*；指针数组跟其他的普通数组的区别在于数
【笔记】记一次easyExcel中注解ExcelProperty映射字段赋值无效问题 Root0624 java 笔记开发语言
背景最近在开发一个导入excel文件解析数据并入库的功能，导入过程中出现一个BUG：后端映射实体字段pType没有被赋值，但是导入的excel源文件是有数据。定位问题经过debug源码发现最终创建对象并赋值使用的是net.sf.cglib.beans.BeanMap类中的create方法，BeanMap中创建实体对象并赋值使用类中字段的setter方法，其中pType字段使用的Setter方法为s
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

书生·浦语大模型实战营04课堂笔记

一、Finetune简介

1.LLM下游应用中，两种微调模式

2.指令跟随微调

2.1 原理

2.2 角色指定

3.增量预训练

4.LORA&QLORA

4.1 LORA简介

4.2 全参数微调、LORA和QLORA的区别

二、xTuner简介

三、8GB显卡玩转LLM

四、动手实战环节

1.快速上手

2.安装依赖

1.使用InternStudio可以很简单创建环境

2.激活环境

3.创建并进入目录

4.拉取源码

5.进入源码目录后，安装源码

3.微调

1.拷贝配置文件至当前目录

2.模型下载

3.数据集下载

4.修改配置文件

5.开始微调

6.完成训练

7.将得到的 PTH 模型转换为 HuggingFace 模型

4.部署与微调

1.将 HuggingFace adapter 合并到大语言模型

2.与合并之后的模型对话

五、自定义微调

1.概述

2.将数据转为 XTuner 的数据格式

3.开始微调

4.准备配置文件

5.训练

六、用 MS-Agent 数据集 赋予 LLM 以 Agent 能力

1.概述

2.微调

3.开始微调：训练

4.使用

你可能感兴趣的:(笔记)

六、用 MS-Agent 数据集赋予 LLM 以 Agent 能力