桂花很香,旭很美

ChatGLM-6B模型微调实战（以 ADGEN (广告生成) 数据集为例，序列长度达 2048）

kingglory/ChatGLM-6B 项目地址

1 介绍

对于 ChatGLM-6B 模型基于 P-Tuning v2 的微调。P-Tuning v2 将需要微调的参数量减少到原来的 0.1%，再通过模型量化、Gradient Checkpoint 等方法，差不多需要 7GB或则8GB 显存即可运行。

2 环境

2.1 python 环境

conda create -n py310_chat python=3.10       # 创建新环境    
source activate py310_chat                   # 激活环境

或者

# 创建虚拟环境
conda create -n xxx python=3.8
# 进入虚拟环境
conda activate xxx
# 退出当前虚拟环境
conda deactivate
# 查看本地虚拟环境
conda info --env
# 删除虚拟环境
conda remove -n xxx --all

2.2 下载代码

git clone https://github.com/THUDM/ChatGLM-6B.git    
cd ChatGLM-6B

2.3 安装依赖

运行微调需要4.27.1版本的transformers。除 ChatGLM-6B 的依赖之外，还需要按照以下依赖

# torch cuda 安装要匹配cuda 驱动版本：
pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113
# 安装gradio用于启动图形化web界面
pip install gradio
pip install -r requirements.txt    
pip install rouge_chinese nltk jieba datasets

验证pytorch是否为GPU版本

import torch
torch.cuda.is_available()  ## 输出应该是True

2.4（选做）

在运行前，可以修改一些文件内容

# web_demo.py
# 1. 新增mirror='https://mirrors.tuna.tsinghua.edu.cn/hugging-face-models,下载模型使用清华源
tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True, mirror='https://mirrors.tuna.tsinghua.edu.cn/hugging-face-models')
model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True, mirror='https://mirrors.tuna.tsinghua.edu.cn/hugging-face-models').half().cuda()
# 2. 增加server_name和server_port参数
demo.queue().launch(share=True,server_name="0.0.0.0",server_port=9234)

3 运行

#基于 Gradio 的网页版 Demo
python web_demo.py
#命令行 Demo
python cli_demo.py

值得注意的是：显存够用下面这些不用管，当显存不够时（即GPU 显存有限低于13GB），尝试以量化方式加载模型的，需要添加代码.quantize(8) .quantize(4) ：
int8精度加载，需要10G显存；
int4精度加载，需要6G显存；

#将句子对列表传给tokenizer，就可以对整个数据集进行分词处理
tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True) #将文本转换为模型能理解的数字# 自动加载该模型训练时所用的分词器

model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().quantize(6).cuda()#从checkpoint实例化任何模型,下载预训练模型

4 微调

https://github.com/THUDM/ChatGLM-6B/tree/main/ptuning

4.1 数据集

从 Google Drive或Tsinghua Cloud 下载处理好的 ADGEN 数据集，将解压后的 AdvertiseGen 目录放到本目录下（ptuning/AdvertiseGen）

4.2 模型下载

Huggingface 平台下载

git lfs install
git clone https://huggingface.co/THUDM/chatglm-6b

4.3 微调训练

cd ptuning/
bash train.sh

注 train.sh 脚本如下

PRE_SEQ_LEN=128                      # soft prompt 长度，P-tuning v2 参数
LR=1e-2                            # 训练的学习率，P-tuning v2 参数

CUDA_VISIBLE_DEVICES=0 python main.py \
--do_train \                                # 训练
    --train_file AdvertiseGen/train.json \      # 训练集地址
    --validation_file AdvertiseGen/dev.json \   # 验证集地址
--prompt_column content \              # 训练集中prompt 的key名称【可以理解为输入值的key】
--response_column summary \            # 训练集中response的key名称【可以理解为生成值的key】
--overwrite_cache \                    # 是否覆盖 缓存
--model_name_or_path THUDM/chatglm-6b \ # chatglm-6b 模型地址
--output_dir output/adgen-chatglm-6b-pt-$PRE_SEQ_LEN-$LR \    # 模型保存地址
--overwrite_output_dir \
--max_source_length 64 \
--max_target_length 64 \
--per_device_train_batch_size 1 \
--per_device_eval_batch_size 1 \
--gradient_accumulation_steps 16 \
--predict_with_generate \
--max_steps 3000 \
--logging_steps 10 \
--save_steps 1000 \
--learning_rate $LR \
--pre_seq_len $PRE_SEQ_LEN \
--quantization_bit 8               # 模型 量化方式，P-tuning v2 参数

train.sh 中的 PRE_SEQ_LEN 和 LR 分别是 soft prompt 长度和训练的学习率，可以进行调节以取得最佳的效果。P-Tuning-v2 方法会冻结全部的模型参数，可通过调整 quantization_bit 来被原始模型的量化等级，不加此选项则为 FP16 精度加载。

在默认配置 quantization_bit=4、per_device_train_batch_size=1、gradient_accumulation_steps=16 下，INT4 的模型参数被冻结，一次训练迭代会以 1 的批处理大小进行 16 次累加的前后向传播，等效为 16 的总批处理大小，此时最低只需 6.7G 显存。若想在同等批处理大小下提升训练效率，可在二者乘积不变的情况下，加大 per_device_train_batch_size 的值，但也会带来更多的显存消耗，请根据实际情况酌情调整。

4.4 模型推理

将 evaluate.sh 中的 CHECKPOINT 更改为训练时保存的 checkpoint 名称，运行以下指令进行模型推理和评测：

bash evaluate.sh

注 evaluate.sh 脚本如下

PRE_SEQ_LEN=128
CHECKPOINT=adgen-chatglm-6b-pt-8-1e-2
STEP=3000
CUDA_VISIBLE_DEVICES=0 python3 main.py \
--do_predict \
    --validation_file AdvertiseGen/dev.json \
    --test_file AdvertiseGen/dev.json \
--overwrite_cache \
--prompt_column content \
--response_column summary \
--model_name_or_path ./output/$CHECKPOINT/checkpoint-$STEP  \
--output_dir ./output/$CHECKPOINT \
--overwrite_output_dir \
--max_source_length 64 \
--max_target_length 64 \
--per_device_eval_batch_size 1 \
--predict_with_generate \
--pre_seq_len $PRE_SEQ_LEN \
--quantization_bit 4

4.5 生成结果分析

评测指标为中文 Rouge score 和 BLEU-4。生成的结果保存在 ./output/adgen-chatglm-6b-pt-8-1e-2/generated_predictions.txt。

示例1

Input: 类型#上衣*材质#牛仔布*颜色#白色*风格#简约*图案#刺绣*衣样式#外套*衣款式#破洞

Label: 简约而不简单的牛仔外套,白色的衣身十分百搭。衣身多处有做旧破洞设计,打破单调乏味,增加一丝造型看点。衣身后背处有趣味刺绣装饰,丰富层次感,彰显别样时尚。

Output[微调前]: 这件上衣的材质是牛仔布,颜色是白色,风格是简约,图案是刺绣,衣样式是外套,衣款式是破洞。

Output[微调后]: 这是一款简约的牛仔外套,破洞设计,将牛仔布破洞,带来一种随意与个性。破洞的牛仔外套,展现出时尚气息,带来一种休闲感。同时,刺绣图案,让整件外套更加立体。

示例2

Input: 类型#裙*版型#显瘦*风格#文艺*风格#简约*图案#印花*图案#撞色*裙下摆#压褶*裙长#连衣裙*裙领型#圆领

Label: 文艺个性的印花连衣裙,藏青色底蕴,低调又大气,撞色太阳花分布整个裙身,绚丽而美好,带来时尚减龄的气质。基础款的舒适圆领,简约不失大方,勾勒精致脸庞。领后是一粒包布扣固定,穿脱十分方便。前片立体的打褶设计,搭配后片压褶的做工,增添层次和空间感,显瘦又有型。

Output[微调前]: 类型#裙版型#显瘦风格#文艺风格#简约图案#印花图案#撞色裙下摆#压褶裙长#连衣裙裙领型#圆领 1. 连衣裙:简约风格,裙长为膝盖以上,裙领型为圆领。2. 裙下摆:压褶设计,使裙摆呈现出流畅的褶皱效果。3. 裙领型:裙领型为圆领,使穿上连衣裙后更加有型。4. 版型:采用显瘦设计,让连衣裙看起来更加苗条。5. 风格:文艺风格,让连衣裙更加有内涵和品味。6. 图案:印花设计,在连衣裙上印有独特的图案。7. 撞色:采用撞色设计,让连衣裙在色彩上更加鲜明、富有层次感。

Output[微调后]: 这是一款文艺范的连衣裙,以印花为元素,采用简约的印花,既能够突出文艺气质,又能够展现简约风。在印花的同时又有领子和裙摆的压褶设计,更加凸显文艺气质。简约而不会过于单调,搭配出街,穿着十分舒适。

4.6 模型部署

将对应的demo或代码中的THUDM/chatglm-6b换成经过 P-Tuning 微调之后 checkpoint 的地址（在示例中为 ./output/adgen-chatglm-6b-pt-8-1e-2/checkpoint-3000）。注意，目前的微调还不支持多轮数据，所以只有对话第一轮的回复是经过微调的。
默认情况下，模型以 FP16 精度加载（无量化），需要大概 13GB 显存。如果你的 GPU 显存有限，可以尝试以量化方式加载模型，使用方法如下：

模型量化

# 按需修改，目前只支持 4/8 bit 量化 
model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).quantize(8).half().cuda()

8-bit 量化下 GPU 显存占用约为 10GB，4-bit 量化下仅需 6GB 占用

随着对话轮数的增多，对应显存消耗也随之增大
理论上 ChatGLM-6B 支持无限长的 context-length，但总长度超过 2048 后性能会逐渐下降
量化模型会带来一定的性能损失

量化模型加载方式

# INT8 量化的模型将"THUDM/chatglm-6b-int4"改为"THUDM/chatglm-6b-int8" 
model = AutoModel.from_pretrained("THUDM/chatglm-6b-int4", trust_remote_code=True).half().cuda()

CPU 部署（需要 32G 内存）
在 32G 内存的机器上经过测试，推理速度很慢

model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).float()

友情链接

以下是部分基于本仓库开发的开源项目：

SwissArmyTransformer: 一个Transformer统一编程框架，ChatGLM-6B已经在SAT中进行实现并可以进行P-tuning微调。
ChatGLM-MNN: 一个基于 MNN 的 ChatGLM-6B C++ 推理实现，支持根据显存大小自动分配计算任务给 GPU 和 CPU。
ChatGLM-Tuning: 基于 LoRA 对 ChatGLM-6B 进行微调。类似的项目还包括 Humanable ChatGLM/GPT Fine-tuning | ChatGLM 微调
langchain-ChatGLM：基于本地知识的 ChatGLM 应用，基于LangChain
bibliothecarius：快速构建服务以集成您的本地数据和AI模型，支持ChatGLM等本地化模型接入。
闻达：大型语言模型调用平台，基于 ChatGLM-6B 实现了类 ChatPDF 功能
JittorLLMs：最低3G显存或者没有显卡都可运行 ChatGLM-6B FP16，支持Linux、windows、Mac部署

5 遇到的问题

报错1

ERROR: Could not find a version that satisfies the requirement protobuf<3.20.1,>=3.19.5 (from versions: none)
ERROR: No matching distribution found for protobuf<3.20.1,>=3.19.5

可能换了国内的镜像源，所以只需要指定装包路径（源）即可

pip install -r requirements.txt -i https://pypi.Python.org/simple/

报错 2

ImportError: Using SOCKS proxy, but the 'socksio' package is not installed. Make sure to install httpx using `pip install httpx[socks]`.

因为在命令行设置了“科学上网”，关掉即可

# 因为我设置的是临时的，所以在命令行输入如下代码即可
unset http_proxy
unset https_proxy

报错 3

RuntimeError: CUDA out of memory. Tried to allocate 128.00 MiB (GPU 0; 7.93 GiB total capacity; 7.40 GiB already allocated; 53.19 MiB free; 7.40 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation.  See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

默认情况下，模型以 FP16 精度加载，运行上述代码需要大概 13GB 显存。如果你的 GPU 显存有限，可以尝试以量化方式加载模型，使用方法如下：

# int4精度加载，需要6G显存
# web_demo.py
model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().quantize(4).cuda()

报错 4

RuntimeError: Library cudart is not initialized

用conda管理的环境，此时应该是cudatoolkit有问题，参考此issues

# 使用conda安装cudatoolkit
conda install cudatoolkit=11.3 -c nvidia

报错 5 （windows 系统）

# ModuleNotFoundError: No module named 'chardet'

# ImportError: cannot import name 'COMMON_SAFE_ASCII_CHARACTERS' from 'charset_normalizer.constant' (C:\Users\123\miniconda3\envs\chatglm6b\lib\site-packages\charset_normalizer\constant.py)

pip install chardet

# 仍然报错

# AttributeError: partially initialized module 'charset_normalizer' has no attribute 'md__mypyc' (most likely due to a circular import)

pip install --force-reinstall charset-normalizer==3.1.0

报错 6 已经下载huggingface文件到本地，并更换目录，但报需下载到本地的错

tokenizer = AutoTokenizer.from_pretrained("/home/wws/ChatGLM-6B/chatglm_6b_int4")
model = AutoModel.from_pretrained("/home/wws/ChatGLM-6B/chatglm_6b_int4").half().cuda()

报错

Traceback (most recent call last):
  File "/home/wws/ChatGLM-6B/run.py", line 3, in 
    model = AutoModel.from_pretrained("/home/wws/ChatGLM-6B/chatglm_6b_int4").half().cuda()
  File "/home/anaconda3/envs/llm/lib/python3.8/site-packages/transformers-4.29.0.dev0-py3.8.egg/transformers/models/auto/auto_factory.py", line 445, in from_pretrained
    config, kwargs = AutoConfig.from_pretrained(
  File "/home/anaconda3/envs/llm/lib/python3.8/site-packages/transformers-4.29.0.dev0-py3.8.egg/transformers/models/auto/configuration_auto.py", line 928, in from_pretrained
    raise ValueError(
ValueError: Loading /home/wws/ChatGLM-6B/chatglm_6b_int4 requires you to execute the configuration file in that repo on your local machine. Make sure you have read the code there to avoid malicious use, then set the option `trust_remote_code=True` to remove this error.

解决办法：设置trust_remote_code=True就可以

CPU 占用过高的或者GPU显存不够都可能被killed 掉

量化模型加载方式

model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).quantize(8).half().cuda()

应该改成

model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().quantize(8).cuda()

更省显存

局限性

由于ChatGLM-6B的小规模，其能力仍然有许多局限性。以下是目前发现的一些问题：

模型容量较小：6B的小容量，决定了其相对较弱的模型记忆和语言能力。在面对许多事实性知识任务时，ChatGLM-6B可能会生成不正确的信息；它也不擅长逻辑类问题（如数学、编程）的解答。
产生有害说明或有偏见的内容：ChatGLM-6B只是一个初步与人类意图对齐的语言模型，可能会生成有害、有偏见的内容。（内容可能具有冒犯性，此处不展示）
英文能力不足：ChatGLM-6B 训练时使用的指示/回答大部分都是中文的，仅有极小一部分英文内容。因此，如果输入英文指示，回复的质量远不如中文，甚至与中文指示下的内容矛盾，并且出现中英夹杂的情况。
易被误导，对话能力较弱：ChatGLM-6B 对话能力还比较弱，而且 “自我认知” 存在问题，并很容易被误导并产生错误的言论。例如当前版本的模型在被误导的情况下，会在自我认知上发生偏差。

不过 GLM 团队也坦言，整体来说 ChatGLM 距离国际顶尖大模型研究和产品（比如 OpenAI 的 ChatGPT 及下一代 GPT 模型）还存在一定的差距。该团队表示，将持续研发并开源更新版本的 ChatGLM 和相关模型。“欢迎大家下载 ChatGLM-6B，基于它进行研究和（非商用）应用开发。GLM 团队希望能和开源社区研究者和开发者一起，推动大模型研究和应用在中国的发展。”

参考

THUDM/ChatGLM-6B
ChatGLM-Tuning
ptuning/README.md
LLMs入门实战篇（二）——清华大学开源中文版ChatGLM-6B模型微调实战
ChatGLM-6B (介绍相关概念、基础环境搭建及部署)
学习实践ChatGLM-6B（部署+运行+微调）
LLMs九层妖塔（第一层 ChatGLM-6B）——ChatGLM-6B模型初体验
LLMs九层妖塔——第一层 ChatGLM学习实战-闯关笔记
torch install
试用宝典-阿里云开发者社区-云计算-阿里云 (aliyun.com)

Pytorch:以CIFAR-10分类为例，给出了神经网络的训练流程 Xiao_Ya__ 深度学习 pytorch pytorch 分类神经网络
下面给出了神经网络的训练流程，包括数据加载与预处理、网络定义、损失函数和优化器定义、网络训练和网络测试。importtorchastimporttorchvisionastvimporttorchvision.transformsastransformsfromtorchvision.transformsimportToPILImageimporttorch.nnasnnimporttorch.n
[C++]使用纯opencv部署yolov12目标检测onnx模型 FL1623863129 深度学习 c++opencv YOLO
yolov12官方框架：sunsmarterjie/yolov12【算法介绍】在C++中使用纯OpenCV部署YOLOv12进行目标检测是一项具有挑战性的任务，因为YOLOv12通常是用PyTorch等深度学习框架实现的，而OpenCV本身并不直接支持加载和运行PyTorch模型。然而，你可以通过一些间接的方法来实现这一目标，比如将PyTorch模型转换为ONNX格式，然后使用OpenCV的DNN
基于Python+OpenCV校园人脸采集和人脸识别系统 2301_79809972 python python plotly
欢迎大家点赞、收藏、关注、评论啦，由于篇幅有限，只展示了部分核心代码。文章目录一项目简介二、功能三、系统四.总结一项目简介一、项目背景与意义随着科技的发展和校园安全管理的需求增加，人脸识别技术逐渐被引入到校园安全管理中。人脸识别技术可以实现对校园内人员的快速、准确识别，提高校园安全管理水平。本项目旨在利用Python和OpenCV库，开发一个校园人脸采集和人脸识别系统，实现对校园内人员的人脸信
Tensorflow2.x框架-神经网络八股扩展-acc曲线与loss曲线诗雨时
loss/loss可视化，可视化出准确率上升、损失函数下降的过程博主微信公众号（左）、Python+智能大数据+AI学习交流群（右）：欢迎关注和加群，大家一起学习交流，共同进步！目录摘要一、acc曲线与loss曲线二、完整代码摘要loss/loss可视化，可视化出准确率上升、损失函数下降的过程一、acc曲线与loss曲线history=model.fit(训练集数据,训练集标签,batch_siz
python安装pyaudio_我不能在我的python上安装pyaudio？怎么做？ weixin_39613385 python安装pyaudio
我有一台windows10pc，我想安装pyaudio，以便与chatterbot一起使用，chatterbot支持，我尝试了两种不同的安装pyaudio的方法。方法是在命令提示符下编写python-mpipinstallPyAudio结果是：C:\Users\Waaberi>python-mpipinstallPyAudioCollectingPyAudioUsingcachedhttps://
在PyAudio模块中安装时出错潮易 python
在PyAudio模块中安装时出错首先，你需要确保你的电脑上已经安装了Python和pip。然后，你可以使用以下命令来安装PyAudio模块：```bashpipinstallPyAudio```如果上述命令无法安装，你可能需要安装一些额外的库。在Ubuntu系统中，你需要先安装一些依赖库，然后再尝试安装PyAudio。你可以使用以下命令来安装这些依赖库：```bashsudoapt-getinst
python-leetcode 43.二叉搜索树中第K小的元素 SylviaW08 leetcode 算法职场和发展
题目：给定一个二叉搜索树的根节点root,和一个整数k,请设计算法，查找其中第K小的元素（从1开始计数）方法一：中序遍历叉搜索树具有如下性质：结点的左子树只包含小于当前结点的数。结点的右子树只包含大于当前结点的数。所有左子树和右子树自身必须也是二叉搜索树二叉树的中序遍历即按照访问左子树——根结点——右子树的方式遍历二叉树；在访问其左子树和右子树时，我们也按照同样的方式遍历；直到遍历完整棵树。因为二
python-leetcode 22.相交链表 SylviaW08 leetcode-python leetcode 算法职场和发展
题目：给两个单链表的头节点heada和headb,请找出并返回两个单链表相交的起始节点。如果两个链表不存在相较节点，返回null。两个链表在C1开始相交。intersectval:相交的起始节点的值，如果不存在相交节点，这一值为0listA:第一个链表listB:第二个链表skipA:在listA从头节点开始，跳到交叉节点的节点数skipB:在listB从头节点开始跳到交叉节点的节点数方法一：哈希
跟着小K开始零基础Python量化分析之旅 1: 初入量化江湖 —— Python与量化的第一次邂逅山海青风 python 量化分析
第一章：初入量化江湖——Python与量化的第一次邂逅故事情境在一个热闹的理财交流群里，小K偶然听到有人提起“量化投资”。那一刻，他心中燃起了一种莫名的好奇与憧憬：“量化投资究竟是什么？我真的能用代码来炒股吗？”然而，面对这一连串新奇的名词，小K感到有些茫然，一头雾水。就在他犹豫不决的时候，一位神秘的前辈私信他：“想要在量化江湖中闯出一片天地，首先得打好基础。先从搞定Python和学习如何读取股票
跟着小K开始零基础Python量化分析之旅 2: 初试身手 —— Python基础与神秘股票清单山海青风 python
第二章：初试身手——Python基础与神秘股票清单在这一章中，我们将跟随小K的脚步，开启Python的初探之旅。小K刚刚踏入量化投资的世界，就收到了前辈神秘发送的一份文件——“神秘股票清单.csv”。前辈告诉他，只有牢牢掌握Python的基础语法，才能游刃有余地处理金融数据，进一步深入量化分析的奥秘。接下来，就让我们一起体验小K如何用Python完成这个第一个小任务，从而收获满满的成就感吧！故事情
跟着小K开始零基础Python量化分析之旅 3: 初探数据世界 —— Pandas与数据清洗的武林秘笈山海青风 python
第三章：初探数据世界——Pandas与数据清洗的武林秘笈在量化江湖中，数据正如武林秘籍中的内功心法，必须先打好基础，才能施展后续高深武技。小K这次获得了一份历史股票交易数据，但初看之下却是一团乱麻：缺失值、重复记录、日期格式不统一……前辈笑着说：“兄弟，若想踏入量化之路，先要学会如何把这‘脏数据’炼成一手干净的‘真气’！”下面，就跟随小K的脚步，逐步揭开数据清洗的秘密，掌握Pandas的基本功法，
无人机实战系列（二）本地摄像头 + Depth-Anything V2 nenchoumi3119 无人机实战无人机
这篇文章介绍了如何在本地运行Depth-AnythingV2，因为我使用的无人机是Tello，其本身仅提供了一个单目视觉相机，在众多单目视觉转Depth的方案中我选择了Depth-AnythingV2，这个库的强大在于其基于深度学习模型将单目视觉以较低的代价转换成RGBD图像，可以用来无人机避障与SLAM。Step1.拉取Depth-AnythingV2源码与模型下载官方仓库提供了两种方式调用De
深度学习笔记——循环神经网络RNN 好评笔记补档深度学习 rnn 人工智能机器学习计算机视觉神经网络 AIGC
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍面试过程中可能遇到的循环神经网络RNN知识点。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集文章目录热门专栏机器学习深度学习文本特征提取的方法1.基础方法1.1词袋模型（BagofWords,BOW）工作原理举例优点缺点1.2TF-IDF（TermFrequency-InverseDocumentFr
Python 学习之旅：高级阶段（十七）Web 开发之模板引擎（如 Jinja2）喜-喜 Python学习 python 学习前端
在Python的Web开发进程中，模板引擎是一个关键的工具，它能帮助我们将动态数据和静态的HTML结构结合起来，生成最终呈现给用户的网页。Jinja2作为Python中广泛使用的模板引擎，以其简洁的语法和强大的功能，在众多Web框架中发挥着重要作用。接下来，让我们以Flask框架为依托，深入了解Jinja2模板引擎。一、模板引擎的作用在Web开发中，我们常常需要根据不同的用户请求，动态生成
Python自动化办公实战：PDF文本提取技巧乔代码嘚 Python python脚本 python 自动化 pdf
哈喽大家好，今天来给大家介绍Python-PDF文本提取技巧PDF文件具有跨平台的特点，可以在不同的操作系统和设备上保持一致的显示效果。但是，PDF文件也有一些缺点，比如不易编辑、复制和搜索。如果我们想要从PDF文件中提取文本内容，该怎么办呢？在本教程中，我们将介绍如何使用Python中的PyPDF2库来提取PDF文件中的内嵌文字内容。PyPDF2是一个纯Python的库，可以读取、分割、合并、裁
终于明白了！人工智能、机器学习、深度学习、集成学习及大模型的定义与联系大模型玩家人工智能机器学习深度学习产品经理算法学习方法集成学习
在当今快速发展的科技领域，人工智能（ArtificialIntelligence,AI）、机器学习（MachineLearning,ML）、深度学习（DeepLearning,DL）、集成学习（EnsembleLearning）以及大模型（LargeModels）等概念频繁出现在人们的视野中。它们不仅推动了科技的进步，也深刻影响了社会生活的方方面面。本文将对这些概念进行全面解析，并探讨它们之间的联
Python酷库之旅-第三方库Pandas(021) 神奇夜光杯 python pandas 开发语言标准库及第三方库基础知识学习与成长
目录一、用法精讲52、pandas.from_dummies函数52-1、语法52-2、参数52-3、功能52-4、返回值52-5、说明52-6、用法52-6-1、数据准备52-6-2、代码示例52-6-3、结果输出53、pandas.factorize函数53-1、语法53-2、参数53-3、功能53-4、返回值53-5、说明53-6、用法53-6-1、数据准备53-6-2、代码示例53-6-3
机器学习笔记——特征工程好评笔记补档机器学习笔记人工智能 AIGC 深度学习计算机视觉面试八股
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本笔记介绍机器学习中常见的特征工程方法、正则化方法和简要介绍强化学习。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集文章目录热门专栏机器学习深度学习特征工程（FzeatureEngineering）1.特征提取（FeatureExtraction）手工特征提取（ManualFeatureExtraction）：自
[python]windows上安装pyaudio最简单方法萌萌哒240 python python windows 开发语言
PyAudio是一个用于处理音频流的Python库，它依赖于PortAudio库。如果直接使用pip命令无法安装PyAudio，可以尝试通过whl文件进行安装。以下是PyAudio通过whl文件安装的详细方法：一、准备阶段下载PyAudio的whl文件访问可靠的Python包分发网站，如镜像站点https://gitee.com/FIRC/pythonlibs_whl_mirror，或者使用其他可
【PyTorch 实战2：UNet 分割模型】10min揭秘 UNet 分割网络如何工作以及pytorch代码实现（详细代码实现） xiaoh_7 pytorch 网络图像处理计算机视觉
UNet网络详解及PyTorch实现一、UNet网络原理 U-Net，自2015年诞生以来，便以其卓越的性能在生物医学图像分割领域崭露头角。作为FCN的一种变体，U-Net凭借其Encoder-Decoder的精巧结构，不仅在医学图像分析中大放异彩，更在卫星图像分割、工业瑕疵检测等多个领域展现出强大的应用能力。UNet是一种常用于图像分割的卷积神经网络架构，其特点在于其U型结构，包括一个收缩路径
【PyTorch项目实战】图像分割 —— U-Net：Semantic segmentation with PyTorch 胖墩会武术深度学习 PyTorch项目实战 python unet pytorch
文章目录一、项目介绍二、项目实战2.1、环境搭建2.1.1、下载源码2.1.2、下载预训练模型2.1.3、下载训练集2.2、环境配置2.3、代码优化+架构优化2.4、模型预测：predict.pyU-Net是一种用于生物医学图像分割的卷积神经网络架构，最初由OlafRonneberger等人于2015年提出。论文：U-Net:ConvolutionalNetworksforBiomedicalIm
【亲测可行】最新ubuntu搭建rknn-toolkit2 computer_vision_chen 带你跑通人工智能项目 YOLO rknn 嵌入式AI
文章目录结构图（ONNX->RKNN）下载rknn-toolkit2搭建环境配置镜像源conda搭建python3.8版本的虚拟环境进入packages目录安装依赖库测试安装是否成功其它rknn-toolkit2rknn_model_zoo关于部署的博客发布本文的时间为2024.10.13rknn-toolkit2版本为2.2.0结构图（ONNX->RKNN）下载rknn-toolkit2gitc
Python微调DeepSeek-R1-Distill-Qwen-1.5B模型：使用Transformers和PyTorch进行训练煤炭里de黑猫 pytorch python 人工智能机器学习
前言近年来，基于Transformer架构的预训练语言模型如GPT、BERT等已经取得了显著的成果，广泛应用于自然语言处理（NLP）的各个领域。为了让这些模型更加适应特定任务，我们通常会进行微调（Fine-tuning）。本博客将详细介绍如何微调一个名为Qwen-1.5B的模型，使用HuggingFace的Transformers库与PyTorch框架来实现。我们将通过一步步的代码解析，帮助你理解
基于UNet对DRIVE视网膜进行图像分割海洋之心深度学习 pytorch 人工智能 python
前言大家好，我是阿光。本专栏整理了《PyTorch深度学习项目实战100例》，内包含了各种不同的深度学习项目，包含项目原理以及源码，每一个项目实例都附带有完整的代码+数据集。正在更新中~✨我的项目环境：平台：Windows10语言环境：python3.7编译器：PyCharmPyTorch版本：1.8.1项目专栏：【PyTorch深度学习项目实战100例】一、基于UNet对DRIVE视网膜进行图像
函数式编程：概念、特性与应用老猿讲编程函数编程 python
1.函数式编程简介函数式编程，从名称上看就与函数紧密相关。它是一种我们常常使用却可能并未意识到的编程范式，关注代码的结构组织，强调一个纯粹但在实际中有些理想化的不可变世界，涉及数学、方程和副作用等概念，甚至还有有趣的“柯里化”。接下来，我们将探讨函数式编程与以往编程方式的不同之处。代码示例以下是一个简单的Python示例，展示了函数式编程中函数作为一等公民的特性：#定义一个简单的函数defadd(
yolov5转onnx模型，onnx转rknn模型部署在rk3588平台上 wtqpshhh YOLO python
安装python等环境，以及相关依赖库，然后克隆YOLOv5仓库的源码。#安装anaconda参考前面环境搭建教程，然后使用conda命令创建环境condacreate-nyolov5python=3.9condaactivateyolov5#拉取最新的yolov5(教程测试时是v7.0)，可以指定下版本分支#gitclonehttps://github.com/ultralytics/yolov
python3.8安装lxml库,Python3爬虫利器之lxml解析库的安装 Intopia
lxml是Python的一个解析库，支持HTML和XML的解析，支持XPath解析方式，而且解析效率非常高。本节中，我们了解一下lxml的安装方式，这主要从Windows、Linux和Mac三大平台来介绍。1.相关链接官方网站：http://lxml.deGitHub：https://github.com/lxml/lxmlPyPI：https://pypi.python.org/pypi/lxm
针对视频内容进行检测开源项目红豆和绿豆开源音视频
以下是10个可以实现视频是否涉及擦边或黄色内容检测的免费开源GitHub项目推荐：1.**OpenNSFW2**OpenNSFW2是一个用于检测图片和视频是否包含成人内容的开源库。它基于深度学习模型，能够实时分析视频帧并给出概率值，判断内容是否涉及黄色。2.**Watsor**Watsor是一个开源项目，支持实时视频流的物体检测。它允许通过配置检测区域和掩码，限制检测范围，并支持多种视频源输入。3
机器学习02 天行者@ 机器学习人工智能深度学习
三、模型选择与调优1交叉验证(1)保留交叉验证HoldOutHoldOutCross-validation（Train-TestSplit）优点1.简单高效操作简便：这种方法的实现非常直接，只需要将原始数据集按照一定比例（常见的如70:30、80:20等）随机划分为训练集和测试集。例如，在Python的scikit-learn库中，使用train_test_split函数可以轻松完成划分，代码简洁
Python从0到100（三十三）：xpath和lxml类库是Dream呀 python 开发语言
1.为什么要学习xpath和lxmllxml是一款高性能的PythonHTML/XML解析器，我们可以利用XPath，来快速的定位特定元素以及获取节点信息2.什么是xpathXPath，全称为XMLPathLanguage，是一种用于在XML文档中进行导航和数据提取的语言，可用来在HTML\XML文档中对元素和属性进行遍历。W3School官方文档：http://www.w3school.com.
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

ChatGLM-6B模型微调实战（以 ADGEN (广告生成) 数据集为例，序列长度达 2048）

1 介绍

2 环境

2.1 python 环境

2.2 下载代码

2.3 安装依赖

2.4（选做）

3 运行

4 微调

4.1 数据集

4.2 模型下载

4.3 微调训练

4.4 模型推理

4.5 生成结果分析

4.6 模型部署

友情链接

5 遇到的问题

报错1

报错 2

报错 3

报错 4

报错 5 （windows 系统）

报错 6 已经下载huggingface文件到本地，并更换目录，但报需下载到本地的错

CPU 占用过高的或者GPU显存不够都可能被killed 掉

局限性

参考

你可能感兴趣的:(LLM,NLP,pytorch,python,深度学习)