wshzd

LLaMA以及其扩展模型总结（一）

自从ChatGPT发布以来，人们看到了AGI时代的曙光，但是由于ChatGPT是闭源的，只能在官网体验和使用API进行访问，据OpenAI CEO说是出于AGI的安全性考虑，这样大大限制了很多研究人员和机构对于AGI的研究进展。Meta公司反其道行之，今年2月24日发布了半开源大语言模型LLaMA(中文意为“羊驼”)，这是一组包含 7 到 650 亿个参数的基础大型语言模型，因其参数量远小于GPT-3，效果却仍能优于后者一度在圈内引起热议。之所以是半开源，是因为LLaMA模型的权重需要申请的。下面对LLaMA以及其扩展的模型进行简单总结：

一、LLaMA

论文地址：https://research.facebook.com/file/1574548786327032/LLaMA--Open-and-Efficient-Foundation-Language-Models.pdf

1.1）介绍

LLaMA，是Meta AI最新发布的一个从7B到65B参数的基础语言模型集合。在数以万亿计的token上训练模型，并表明有可能完全使用公开的数据集来训练最先进的模型，而不需要求助于专有的和不可获取的数据集。LLaMA-13B在大多数bechmark上超过了GPT-3（175B），而LLaMA-65B与最好的模型Chinchilla70B和PaLM-540B相比具有竞争力。

1.2）预训练数据

使用SentencePiece库的BPE算法进行数据切分，并且用bytes对不知道的UTF-8编码进行处理，最终得到的1.4T的token。

1.3）模型的架构与参数

模型架构采纳了其他模型中的一些改进，包括：

Pre-normalization，来自GPT-3，可以稳定训练。
- normalize输入而非输出
- 使用RMSNorm
SwiGLU，来自PaLM，替换了ReLU来获得更好的效果。维度使用的是2/3*4d而不是PaLM中的4d。
Rotary Embedding，来自GPTNeo，替换了绝对位置编码。

其他的模型超参数见下表。

optimizer使用AdamW, beta1=0.9，beta2=0.95。使用cosine learning rate schedule, 最终的learning rate是最高值的十分之一，weight decay 是0.1，2000步warmup。

1.4）模型的性能

1.5）高效实现

使用了xformer中的高效的casual multi-head attention实现来内存占用的运行时间。灵感来自PaperSelf-attention does not need o(n^2) memory，并在Flashattention: Fast and memory-efficient exact attention with io-awareness.中使用。这个高效是由不存储注意力权重和不计算被mask的key/query分数来达到的。
减少了在反向传播阶段需要重新计算的激活值，具体来说，是将计算量比较大的中间结果存储下来，比如线性层的输出。
- 要实现这个，需要手动实现反向传播函数而不是依赖pytorch的autograd。
- 为了更好的达到这一点，还需要我们多使用模型和序列并行来降低内存占用。
- 还需要尽可能的让激活值的计算和GPU间的通信overlap。

在训练65B模型的时候，代码80G内存的2048块A100上每秒每GPU处理380个token。意味着需要21天处理完1.4T token。

1.6）核心结论

LLaMA 是一个开源的基础语言模型集合，参数范围从7B到65B，完全使用公开的数据集在数万亿 Token 上训练；
LLaMA-13B 在大多数基准上都优于 GPT-3(175B)，而模型大小却小了 10 倍以上，LLaMA-65B 与最好的模型 Chinchilla70B 和 PaLM-540B 性能相当；
该研究表明，通过完全在公开可用的数据上进行训练，有可能达到最先进的性能，而不需要求助于专有的数据集，这可能有助于努力提高鲁棒性和减轻已知的问题，如毒性和偏见；
向研究界发布LLaMA模型，可能会加速大型语言模型的开放，并促进对指令微调的进一步研究，未来的工作将包括发布在更大的预训练语料库上训练的更大的模型。

二、Alpaca以及其扩展模型

2.1）Alpaca

2.1.1）Alpaca介绍

官网地址：https://crfm.stanford.edu/2023/03/13/alpaca.html

模型入口：https://crfm.stanford.edu/alpaca

github地址：https://github.com/tatsu-lab/stanford_alpaca

3月15日，斯坦福发布语言大模型Alpaca，它是由Meta的LLaMA 7B微调而来的全新模型，仅用了52k数据，性能约等于GPT-3.5。关键是训练成本奇低，不到600美元。

具体花费如下：

在8个80GB A100上训练了3个小时，不到100美元；
生成数据使用OpenAI的API，500美元。

2.1.2）Alpaca微调

首先使用人工标注的175个「指令-输出」对作为种子，然后，使用这些种子作为上下文示例让text-davinci-003生成更多Prompt。

通过简化生成管道改进了自生成指令的方法，这样大大降低了成本。在数据生成过程中，产生了52K个独特指令和相应的输出，使用OpenAI API的成本不到500美元。

有了这个指令遵循的数据集，研究人员利用Hugging Face的训练框架对LLaMA模型进行微调，利用了完全分片数据并行（FSDP）和混合精度训练等技术。

2.1.3）Alpaca评估

为了评估Alpaca，斯坦福研究人员对自生成指令评价集的输入进行了人工评估（由5位学生作者进行）。

这个评价集是由自生成指令作者收集的，涵盖了多样化的面向用户的指令，包括电子邮件写作、社交媒体和生产力工具等。

他们对GPT-3.5（text-davinci-003）和Alpaca 7B进行了比较，发现这两个模型的性能非常相似。Alpaca在与GPT-3.5的比较中，获胜次数为90对89。

鉴于模型规模较小，且指令数据量不大，取得这个结果已经是相当惊人了。

除了利用这个静态评估集，他们还对Alpaca模型进行了交互式测试，发现Alpaca在各种输入上的表现往往与GPT-3.5相似。

2.2）Alpaca-CoT

是多接口统一的轻量级LLM指令微调平台。

官网地址：https://sota.jiqizhixin.com/project/alpaca-cot

GitHub地址：https://github.com/PhoebusSi/Alpaca-CoT

三、BiLLa[1]

3.1）BiLLa介绍

Github 地址： https://github.com/Neutralzz/BiLLa

HuggingFace 模型：

https://huggingface.co/Neutralzz/BiLLa-7B-LLM（语言模型 BiLLa-7B-LLM）

https://huggingface.co/Neutralzz/BiLLa-7B-SFT（指令微调模型 BiLLa-7B-SFT）

注：因 LLaMa 的使用限制，权重下载后不能直接使用，需通过脚本 [1] 转换

BiLLa 是开源的推理能力增强的中英双语 LLaMA 模型。模型的主要特性有：

较大提升 LLaMA 的中文理解能力，并尽可能减少对原始 LLaMA

英文能力的损伤；
训练过程增加较多的任务型数据，利用 ChatGPT 生成解析，强化

模型理解任务求解逻辑；
全量参数更新，追求更好的生成效果。

以下是经过有限的评测分析得出的结论：

BiLLa-7B-LLM 中英语言建模能力显著优于 Chinese-LLaMA-7B；
BiLLa-7B-SFT中文推理能力显著优于BELLE-LLaMA-Ext-7B等

模型；
由 GPT4 打分，BiLLa-7B-SFT 在英文指令上得分显著高于

ChatGLM-6B，中文得分持平，但解题与代码得分更高。

3.2）BiLLa模型训练

该模型以原始 LLaMa 模型为基础，进行了如下三个阶段的训练。

第一阶段：扩充中文词表，使用中文预训练语料 Wudao [5]、英文预训练语料 PILE [6]、翻译语料 WMT [7] 的中英数据进行二次预训练。
第二阶段：训练数据在第一阶段基础上增加任务型数据，训练过程中两部分数据保持 1:1 的比例混合。任务型数据均为 NLP 各任务的主流开源数据，包含有数学解题、阅读理解、开放域问答、摘要、代码生成等，利用 ChatGPT API 为数据标签生成解析，用于训练提升模型对任务求解逻辑的理解。
第三阶段：保留第二阶段任务型数据，并转化为对话格式，增加其

他指令数据（如 Dolly 2.0、Alpaca GPT4、COIG等），进行对齐阶段的微调。

借鉴 BELLE 之前的工作，三阶段的训练均为全量参数的更新，未使用 LoRA。

目前开源的模型，BiLLa-7B-LLM 是第二阶段训练完成的语言模型，BiLLa-7B-SFT 是第三阶段训练完成的指令微调模型。

四、CaMA[2]

通过全量预训练和指令微调提高了中文理解能力、知识储备和指令理解能力

CaMA: A Chinese-English Bilingual LLaMA Model - CaMA: A Chinese-English Bilingual LLaMA Model.' ZJUNLP

GitHub地址: https://github.com/zjunlp/CaMA

五、ChatLLaMA[3]

5.1）ChatLLaMA模型介绍

3月23日，AI公司Nebuly开源了第一个基于人类反馈强化学习 (RLHF) 的 LLaMA模型：ChatLLama（https://github.com/nebuly-ai/nebullvm/tree/main/apps/accelerate/chatllama），允许用户基于预训练的LLaMA模型构建个性化的ChatGPT服务，且训练速度更快，成本更低。

虽然 LLaMA 发布之初就得到众多研究者的青睐，但是少了 RLHF 的加持，从上述评测结果来看，还是差点意思。在 LLaMA 发布三天后，初创公司 Nebuly AI 开源了 RLHF 版 LLaMA（ChatLLaMA）的训练方法。它的训练过程类似 ChatGPT，该项目允许基于预训练的 LLaMA 模型构建 ChatGPT 形式的服务。项目上线刚刚 2 天，狂揽 5.2K 星。

github地址：https://github.com/nebuly-ai/nebullvm/tree/main/apps/accelerate/chatllama

ChatLLaMA 训练过程算法实现主打比 ChatGPT 训练更快、更便宜，我们可以从以下四点得到验证：

ChatLLaMA 是一个完整的开源实现，允许用户基于预训练的 LLaMA 模型构建 ChatGPT 风格的服务；
与 ChatGPT 相比，LLaMA 架构更小，但训练过程和单 GPU 推理速度更快，成本更低；
ChatLLaMA 内置了对 DeepSpeed ZERO 的支持，以加速微调过程；
该库还支持所有的 LLaMA 模型架构（7B、13B、33B、65B），因此用户可以根据训练时间和推理性能偏好对模型进行微调。

5.2）ChatLLaMA模型使用

ChatLLaMA 允许您使用 RLHF 以类似于 ChatGPT 的方式轻松训练基于 LLaMA 的架构。例如，下面是在 ChatLLaMA 7B 的情况下开始训练的代码。

from chatllama.rlhf.trainer import RLTrainerfrom chatllama.rlhf.config import Config
path = "path_to_config_file.yaml"config = Config(path=path)trainer = RLTrainer(config.trainer)trainer.distillate()trainer.train()trainer.training_stats.plot()

请注意，在开始微调过程之前，您应该提供 Meta 的原始权重和您的自定义数据集。或者，您可以使用 LangChain 的代理生成您自己的数据集。

python generate_dataset.py

六、CAMEL[4]

CAMEL: 从LLaMA衍生并适应临床的模型。CAMEL基于LLaMA进行进一步的微调，使用了MIMIC-III和MIMIC-IV的临床病例，并在临床指导上进行微调。

官网地址：https://starmpcc.github.io/CAMEL/

github地址：https://github.com/starmpcc/CAMEL

七、草本[5]

草本大模型原名是华佗，它提出了一个基于LLaMA模型的中医知识微调模型——华驼，它能够在生物医学领域生成更专业、更可靠、更人性化的回答。

论文地址：https://arxiv.org/pdf/2304.06975v1.pdf

代码开源：https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese

在CMeKG中医知识图谱上，生成了8,000多条指令数据，用于对LLaMA模型进行监督微调。这些指令数据包括问答、填空、排序、分类等类型，涉及中医的各个方面。
在生物医学领域的回答任务上，比较了华驼模型和其他基准模型的表现。这些基准模型包括ChatGLM-6B、Alpaca和原始LLaMA。使用自动评价指标和人工评价来评估模型生成的回答的质量和可靠性。

八、DB-GPT[6]

DB-GPT：基于vicuna-13b和FastChat的开源实验项目，采用了langchain和llama-index技术进行上下文学习和问答。项目完全本地化部署，保证数据的隐私安全，能直接连接到私有数据库处理私有数据。其功能包括SQL生成、SQL诊断、数据库知识问答等。

DB-GPT - A Open Database-GPT Experiment, which based on vicuna-13b and fastchat, meanwhile it use langchain and llama-index for in-context learning and QA' magic.chen

一个数据库相关的GPT实验项目, 模型与数据全部本地化部署, 绝对保障数据的隐私安全。同时此GPT项目可以直接本地部署连接到私有数据库, 进行私有数据处理。

DB-GPT 是一个实验性的开源应用程序，它基于FastChat，并使用vicuna-13b作为基础模型。此外，此程序结合了langchain和llama-index基于现有知识库进行In-Context Learning来对其进行数据库相关知识的增强。它可以进行SQL生成、SQL诊断、数据库知识问答等一系列的工作。

GitHub地址: https://github.com/csunny/DB-GPT

九、ExpertLLaMA

9.1）ExpertLLaMA介绍

ExpertLLaMA:一个使用ExpertPrompting（https://arxiv.org/abs/2305.14688）构建的开源聊天机器人，其能力达到ChatGPT的96%。

ExpertLLaMA通过在普通指令中添加专家身份描述，产生高质量、详细的专家级回答。本项目提供了方法简介、52,000个专家数据集样本、52,000个基线数据集样本、52,000个对应每个具体指令的专家身份描述、基于专家数据集训练的ExpertLLaMA检查点以及与Vicuna、LLaMA-GPT4等现有模型的评估结果

GitHub地址：https://github.com/OFA-Sys/ExpertLLaMA

9.2）ExpertLLaMA微调的大致步骤如下：

a）首先使用gpt-3.5-turbo模型对 52k Alpaca instructions数据使用ExpertPrompting方法进行数据增强，增强后的数据在github地址的data目录下；

b）然后使用这些增强后的指令跟随数据对LLaMA-7B进行微调。

9.3）ExpertLLaMA训练脚本如下：

torchrun --nproc_per_node=4 --master_port= train.py \    --model_name_or_path  \    --data_path ./data/expertllama.json \    --bf16 True \    --output_dir  \    --num_train_epochs 3 \    --per_device_train_batch_size 4 \    --per_device_eval_batch_size 4 \    --gradient_accumulation_steps 8 \    --evaluation_strategy "no" \    --save_strategy "steps" \    --save_steps 2000 \    --save_total_limit 1 \    --learning_rate 2e-5 \    --weight_decay 0. \    --warmup_ratio 0.03 \    --lr_scheduler_type "cosine" \    --logging_steps 1 \    --fsdp "full_shard auto_wrap" \    --fsdp_transformer_layer_cls_to_wrap 'LlamaDecoderLayer' \    --tf32 True

9.4）ExpertLLaMA模型加载：

模型加载可以参考Vicuna，是LLaMA原始模型权重和ExpertLLaMA权重的合并，脚本可以参考：https://github.com/lm-sys/FastChat#vicuna-weights

Step1：下载LLaMA-7B官方模型权重，然后转换成huggingface transformers格式，参考地址：https://huggingface.co/docs/transformers/main/model_doc/llama

Step2：下载ExpertLLaMA权重，参考地址：https://huggingface.co/OFA-Sys/expertllama-7b-delta/tree/main或者设置OFA-Sys/expertllama-7b-delta

Step3：运行./model/apply_delta.py脚本

python3 apply_delta.py --base-model-path {your_base_model_path} --target-model-path {your_target_model_path} --delta-path {downloaded_delta_weights}

本地部署脚本如下：

python3 gen_demo.py --expertllama_path {your_target_model_path}

十、FreedomGPT

FreedomGPT是由AI风险投资公司Age of AI开发，它使用Electron 和 React构建，它是一个桌面应用程序，允许用户在他们的本地机器上运行LLaMA。它与ChatGPT不同，ChatGPT遵循OpenAI的使用政策，限制仇恨、自残、威胁、暴力、性方面的内容。而FreedomGPT是一个号称完全自由的 GPT 聊天模型，不带有任何过滤机制，有 Web 版和桌面端。

官网地址：https://freedomgpt.com/

没有最好的，只有最合适的：重新认识测试工具的价值测试者家园软件测试测试开发和测试质量效能测试工具软件测试人工智能智能化测试自动化测试自主化测试
用ChatGPT做软件测试在软件测试领域，关于“测试工具是否有好坏之分”的问题常常引发热议。一方面，经验丰富的测试专家通常有自己偏爱的工具和方法，另一方面，新手常困惑于琳琅满目的测试工具库，渴望寻找“最好”的工具。然而，测试工具真的有绝对的好坏之分吗？本文将从多维度剖析这个问题，旨在帮助读者开阔视野，重新思考测试工具的选择与价值。一、工具好坏的判断标准：适用性胜于绝对性1.1目标导向性：工具的价值
前端开发中如何使用ChatGPT辅助开发？破碎的天堂鸟学习教程 chatgpt
以下是前端开发中使用ChatGPT辅助开发的完整指南，涵盖核心应用场景、实践方法及注意事项：一、代码生成与优化基础代码生成HTML/CSS/JS框架搭建：通过自然语言描述需求（如"生成带导航栏的响应式页面"），ChatGPT可快速生成结构清晰的代码骨架。例如，输入“用Flexbox实现垂直水平居中布局”，可得到包含justify-content和align-items属性的代码[1][32]。组件
驱动 AI 边缘计算新时代！高性能 i.MX 95 应用平台引领未来 WPG大大通 NXP产线 ATU 伊布小編 (一部)人工智能边缘计算大大通方案 ai 汽车工业
智慧浪潮崛起：AI与边缘计算的时代正悄然深植于我们的日常生活之中，无论是火热的ChatGPT与DeepSeek语言模型，亦或是Meta智能眼镜，AI技术已经无形地影响着我们的生活。这股变革浪潮并未停歇，而是进一步催生了更高效、更贴近现实需求的技术演进。然而，随着AI应用场景的拓展，传统云计算在实时性、隐私保护与带宽等方面逐渐面临瓶颈。特别是在自动驾驶、智慧医疗、工业自动化等高精度应用中，毫秒级的延
svn 通过127.0.01能访问但通过公网IP不能访问，这是什么原因？行思理运维 Linux svn linux 防火墙
连接失败的提示如下1、SVN的启动方法方法一：svnserve-d-r/mnt/svn方法二：svnserve-d--listen-port3690-r/mnt/svn方法三：svnserve-d-r/mnt/svn--listen-host0.0.0.02、首先检查svn服务器是否启动方法一：netstat-tunlp|grepsvn演示如下如上状态，说明已启动方法二：svnserve--ver
基于AI大模型api实现的ChatGPT服务大牛撸码人工智能 chatgpt
项目简介该项目基于AI大模型api实现的自建后端Chat服务，支出同步响应及流式响应，完美呈现打印机效果。支持一键切换ChatGPT(3.5、4.0)模型、文心一言(支持Stable-Diffusion-XL作图)、通义千问、讯飞星火、智谱清言(ChatGLM)等主流模型，后续模型持续对接中。项目包含java服务端、网页端、移动端及管理后台配置。基于AI大模型api实现的ChatGPT服务，支持一
Spring AI简单使用 NaughtyBo 记录 spring
https://github.com/chatanywhere/GPT_API_freeAI框架之SpringAI与SpringCloudAlibabaAI使用讲解超级详细SpringAI+ChatGPT（java接入OpenAI大模型）SpringCloudAlibabaAI速通版！保姆级教程！Java大模型应用开发，微服务整合DeepSeek，LangChain大型语言模型LLM实战-尚硅谷文
llama-factory生成Meta-Llama-3-8B-Instruct模型api服务码不动了鸭 llama 人工智能 transformer
使用llama-factory完成模型的微调训练后，需要开启其api服务进行调用，参考官方https://github.com/hiyouga/LLaMA-Factory/blob/main/examples/inference/llama3_lora_sft.yaml中的内容进行改写API实现的标准是参考了OpenAI的相关接口协议，基于uvicorn服务框架进行开发，使用如下的方式启动：下述为
Llama3-8B+ LLaMA-Factory 中文微调猫猫姐大模型 llama
Llama3-8B+LLaMA-Factory中文微调Llama3是目前开源大模型中最优秀的模型之一，但是原生的Llama3模型训练的中文语料占比非常低，因此在中文的表现方便略微欠佳！本教程就以Llama3-8B-Instruct开源模型为模型基座，通过开源程序LLaMA-Factory来进行中文的微调，提高Llama3的中文能力！LLaMA-Factory是一个开源的模型训练工具Llama3-8
Manus学习手册合集【建议收藏】周师姐学习 pdf 人工智能
这两天，一款通用AI智能体Manus还没发布就火了，因为还在内测中，用户需要邀请码才能够体验，这就导致原本免费的邀请码在二手平台最高被炒到8万8。相比于之前爆火的DeepSeek和ChatGPT这类AI对话工具，Manus是全球首款真正意义上的通用人工智能！没错，就是科幻电影里面能够独立思考，自主运行的人工智能！！manus学习资料：https://pan.xunlei.com/s/VOKk8Cq
Spring AI 实战：手把手教你打造一个智能客服机器人！ Leaton Lee spring 人工智能机器人
前言：为什么要做一个智能客服机器人？在当今数字化时代，智能客服机器人已经成为企业提升用户体验和服务效率的重要工具。无论是解答用户问题、处理订单咨询，还是提供技术支持，智能客服机器人都能够高效地完成任务。SpringAI框架为我们提供了一个强大的工具集，结合自然语言处理（NLP）技术，我们可以轻松地构建一个功能强大的智能客服机器人。本文将从零开始，一步步教你如何利用SpringAI和相关技术打造一个
实用AI工具推荐 DHLSP15 1024程序员节人工智能 ai
在当今数字化时代，AI工具已经成为提升工作效率的重要助手。以下是一些实用AI工具的推荐，它们能在不同领域帮助你提高生产力：ChatGPT：由OpenAI开发，擅长文本生成、撰写文章、回答问题和编程辅助，支持多语言应用。JasperAI：专注于生成高质量的营销文案、社交媒体帖子和博客文章，适合内容创作者和营销人员。DALL·E：由OpenAI推出，能根据文字描述生成图像，适合设计师和内容创作者快速创
Unity AI 技术浅析（二）爱研究的小牛 AIGC—游戏制作 AIGC—虚拟现实 unity 人工智能游戏引擎 AIGC 机器学习深度学习
UnityAI是Unity引擎中集成的智能技术，旨在为游戏开发者、虚拟现实（VR）和增强现实（AR）应用开发者提供强大的AI工具和功能。UnityAI涵盖了从智能代理（Agents）、机器学习（MachineLearning）到自然语言处理（NLP）等多个领域。一、UnityAI的工作原理1.智能代理（Agents）UnityAI的核心之一是智能代理（Agents），这些代理可以模拟游戏中的非玩家
人工智能基础知识 yzx991013 人工智能
首先分为两大类：一：机器视觉cv1.特征比较明显2.经典模型：cnn，resnet，deepface，yolov（1-12），vi-transformer。缺点：不能解决收听问题。3.落地，无人识别，轨道追踪，无人驾驶，（主要解决看的东西）。二：自然语言处理nlp（语音识别）处理（文本）方面解决（说和听的问题），RNN，LSTM，attention，transformer（基于规则的翻译，超越普通
AI时代，数据分析师如何破局？ atbigapp.com 数据分析人工智能数据分析
近年来，AI技术的迅猛发展正在深刻改变各行各业，数据分析领域也不例外。从ChatGPT到DeepSeek，再到最新的Manus，AI工具的能力已经从简单的问答和数据分析，进化到能够独立完成复杂任务并交付完整成果。这种变革不仅提升了效率，也对传统数据分析师的职业前景提出了严峻挑战。如果说以前的AI工具对数据分析的应用只是小打小闹，那DeepSeek和Manus的出现，无疑给数据分析师敲响了警钟。随着
AI 工具层出不穷，Manus 爆火，如何理性看待？ gange574 人工智能 AI写作 ai AI软件 AI平台 AI编程 AI网站
近期AI领域动作不断，吸满了人们的关注，特别是被一些自媒体文章，引起了各种焦虑，让人觉得：是不是马上要被AI取代了？是不是马上就要失业了？我还没跟上AI时代，是不是要被这个时代给抛弃了？内心充满了焦虑与不安！要我说，大可不必，我的答案是：以人为本，AI为辅。首先咱们一起回顾一下，从火爆全球的ChatGPT，到春节期间国产deepseek被大家所熟知，成了手机里的「固定嘉宾」，现在遇事不决：问一下d
基于NLP的客户意见分析：从数据到洞察 Echo_Wish Python 算法 Python 笔记自然语言处理人工智能
友友们好！我的新专栏《Python进阶》正式启动啦！这是一个专为那些渴望提升Python技能的朋友们量身打造的专栏，无论你是已经有一定基础的开发者，还是希望深入挖掘Python潜力的爱好者，这里都将是你不可错过的宝藏。在这个专栏中，你将会找到：●深入解析：每一篇文章都将深入剖析Python的高级概念和应用，包括但不限于数据分析、机器学习、Web开发等。●实战案例：通过丰富的实战案例，带你一步步实现
LLMs之Llama-3：基于Colab平台(免费T4-GPU)利用LLaMA-Factory的GUI界面(底层采用unsloth优化框架【加速训练5~30倍+减少50%的内存占用】)对llama-3 一个处女座的程序猿 NLP/LLMs 成长书屋大语言模型 unsloth LLaMA-3 LoRA
LLMs之Llama-3：基于Colab平台(免费T4-GPU)利用LLaMA-Factory的GUI界面(底层采用unsloth优化框架【加速训练5~30倍+减少50%的内存占用】)对llama-3-8b-Instruct-bnb-4bit模型采用alpaca数据集【instruction-input-output】实现CLI方式/GUI傻瓜可视化方式，进配置微调→参数行LoRA指令微调→模型推
llama_deploy 伊织code #文档翻译 llama llama_deploy llamaindex
本文于240924翻译整理自：https://docs.llamaindex.ai/en/stable/module_guides/workflow/deployment/文章目录一、关于`llama_deploy`为什么使用`llama_deploy`？等等，`llama-agents`在哪里？二、入门1、安装2、高级部署3、部署核心系统4、部署工作流5、与部署交互6、部署嵌套工作流三、一个`l
Windows零门槛部署DeepSeek大模型：Ollama+7B参数模型本地推理全攻略 zxg45 AI大模型 deepseek 硅基流动 AI大模型
一、为什么选择Ollama+DeepSeek组合？1.1DeepSeek模型的三大核心优势中文语境霸主：在C-Eval榜单中，7B参数版本以82.3%准确率超越Llama2-13B6硬件友好：Int4量化后仅需5.2GB存储空间，GTX1060即可运行多模态扩展：支持与StableDiffusion联动生成图文报告1.2Ollama的颠覆性价值相较于传统部署方式，Ollama带来三大突破：开箱即用
llama-factory 记录嘟嘟Listing llama
GitHub-hiyouga/LLaMA-Factory:UnifiedEfficientFine-Tuningof100+LLMs&VLMs(ACL2024)安装gitclonehttps://github.com/hiyouga/LLaMA-Factory.gitcondacreate-nllama_factorypython=3.10condaactivatellama_factorycdL
RAG 检索增强生成：技术详解与应用展望君君学姐 RAG检索增强生成
RAG检索增强生成：技术详解与应用展望一、引言随着人工智能技术的飞速发展，自然语言处理（NLP）领域迎来了前所未有的变革。其中，检索增强生成（Retrieval-AugmentedGeneration，简称RAG）作为一种新兴的技术框架，正逐渐成为大模型应用中的热门选择。RAG通过结合信息检索（IR）和自然语言生成（NLG）的能力，旨在提升模型在回答问题、生成文本等任务中的准确性和可靠性。本文将深
【五.LangChain技术与应用】【31.LangChain ReAct Agent：反应式智能代理的实现】再见孙悟空_ AI 进阶之旅》langchain LangChain技术 LangChain输出解析器人工智能 langchain官方工具 Agent案例2
一、ReActAgent是啥？为什么说它比「普通AI」聪明？想象一下，你让ChatGPT查快递物流，它可能直接编个假单号糊弄你。但换成ReActAgent，它会先推理（Reasoning）需要调用哪个接口，再行动（Action）查询真实数据——这就是ReAct的核心：让AI学会「动脑子」再动手。举个真实案例（参考官方代码改的）：fromlangchain.agentsimportTool,init
人工智能开发趋势光影少年人工智能
人工智能开发趋势：未来技术的演进与创新引言人工智能（AI）正在以惊人的速度发展，并在各行各业中发挥越来越重要的作用。从自然语言处理到计算机视觉，从自动化决策到自主学习，AI的发展方向正变得更加智能化、自动化和人性化。本文将探讨当前AI开发的最新趋势，并展望未来的发展方向。1.生成式AI的崛起近年来，生成式AI（如ChatGPT、StableDiffusion、DALL·E）展现出强大的内容创作能力
使用 Python 快速扫描局域网中活动的 IP 技术探索 python tcp/ip 开发语言
部分数据来源：ChatGPT本文仅用于信息安全的学习，请遵守相关法律法规，严禁用于非法途径。若观众因此作出任何危害网络安全的行为，后果自负，与本人无关。简介如果你需要在局域网中查找活动的IP地址，那么这个Python脚本可以帮助你快速地扫描整个局域网，并输出所有活动的IP地址，最后将它们存储到一个文件中，方便你查看。这个脚本基于Python语言，使用了os和threading模块，它能够快速扫描所
Hugging Face Agents Course （Dummy Agent） ZHOU_CAMP Hugging Face Agents Course 人工智能
参考链接：https://qwen.readthedocs.io/en/latest/getting_started/concepts.htmlhttps://huggingface.co/agents-course/notebooks原notebook中用到的是llama模型，但是需要认证，下面改成了Qwen模型DummyAgentLibrary在这个简单的示例中，我们将从零开始编写一个Agen
只需几步！在本地电脑轻松部署DeepSeek大模型魔法小匠 AI大模型 AI大模型 DeepSeek Ollama 大模型部署大模型API
使用Ollama进行本地部署AI大模型一、Ollama简介Ollama是一个开源的本地大语言模型运行框架，支持在Windows、Linux和macOS上本地运行大语言模型。它提供了丰富的模型库，包括Qwen、Llama等1700+大语言模型，并支持用户上传自己的模型。Ollama还允许用户通过编写Modelfile配置文件来自定义模型的推理参数，支持多GPU并行推理加速。二、安装Ollama（一）
【大模型技术】LlamaFactory 的原理解析与应用大数据追光猿大模型 transformer 人工智能语言模型 python github docker 机器学习
LlamaFactory是一个基于LLaMA系列模型（如LLaMA、LLaMA2、Vicuna等）的开源框架，旨在帮助开发者和研究人员快速实现大语言模型（LLM,LargeLanguageModel）的微调、推理和部署。它提供了一套完整的工具链，支持从数据准备到模型训练、优化和应用的全流程开发。以下是关于LlamaFactory的解析：1.LlamaFactory的核心功能（1）模型微调支持多种微
通过 Groq 后端加载Llama 模型，并调用Function call，也就是通过Groq 后端进行工具的绑定和调用背太阳的牧羊人 agent+langchain llama 语言模型 Function_call
完整代码：importgetpassimportosfromlangchain.chat_modelsimportinit_chat_modelfromlangchain_core.toolsimporttoolfromlangchain_core.messagesimportHumanMessage,ToolMessage,SystemMessage#如果没有设置GROQ_API_KEY，则提示
开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机多卡-RTX 4090双卡（五）开源技术探险家开源模型-实际应用落地 #开源模型-微调实战密码自然语言处理深度学习语言模型
一、前言本篇文章将使用LLaMA-Factory去高效微调QWen2系列模型，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。二、术语介绍2.1.LoRA微调LoRA(Low-RankAdaptation)用于微调大型语言模型(LLM)。是一种有效的自适应策略，它不会引入额外的推理延迟，并在保持模型质量的同时显着减少下游任务的可训练参数数量。2.2.参数
大模型实战—Llama3-8B 中文微调不二人生大模型大模型 llama3
Llama3-8B+LLaMA-Factory中文微调Llama3是目前开源大模型中最优秀的模型之一，但是原生的Llama3模型训练的中文语料占比非常低，因此在中文的表现方便略微欠佳！本教程就以Llama3-8B-Instruct开源模型为模型基座，通过开源程序LLaMA-Factory来进行中文的微调，提高Llama3的中文能力！LLaMA-Factory是一个开源的模型训练工具Llama3-8
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "xxxxx@xxxxx.com"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri

LLaMA以及其扩展模型总结（一）

你可能感兴趣的:(NLP,ChatGPT,llama,chatgpt)