LLaMa 第6页

LLaMA-Factory 基于 LoRA 的 SFT 指令微调及相关功能梳理

1.数据准备微调数据的格式为Alpaca或ShareGPT格式，需进行以下步骤：自定义数据集转换：将原始数据集转换成指定格式（JSON格式）。示例数据：{"instruction":"写一个商品文案","input":"类型#裤*版型#宽松","output":"宽松的阔腿裤吸引了大量明星的喜爱，设计感十足。"}数据注册：修改data/dataset_info.json文件，将数据集注册到系统中。

Ambition_LAO·2025-01-21 07:42

使用 PyTorch 从头开始构建您自己的 Llama 3 架构

https://www.aisolink.com/build-your-own-llama-3-architecture-from-scratch-using-pytorch全文摘要本文提供了一个详细的指南

子然在打码·2025-01-21 00:00

使用MoA(Mixture of Agents)混合智能体技术,结合多个开源大语言模型如Llama3、phi-3和Mistral,实现一个强大的AI智能体

1.简介论文简介:论文提出了一种称为混合智能体(Mixture-of-Agents,MoA)的方法,利用多个大语言模型(LLM)的集体智慧来提高自然语言理解和生成任务的性能。MoA采用了分层结构,每一层包含多个LLM智能体。每个智能体都将前一层所有智能体的输出作为辅助信息来生成自己的回答。通过迭代地综合和优化回答,MoA可以充分利用不同LLM的独特优势。实验发现,即使其他模型提供的辅助回答质量较低

fc&&fl·2025-01-20 14:56

LLama3.2-Vision + Gradio + 流式输出

这里写自定义目录标题LLama-3.2-11B/90B-Vision-Instruct模型下载环境代码效果LLama-3.2-11B/90B-Vision-Instruct使用Gradio+流式输出+LLama3.2

未来之星扣寄艾斯·2025-01-20 12:34

使用Llama 3.2-Vision多模态LLM与您的图像聊天

在此教程中，我们将学习如何使用开源的Llama3.2-Vision模型与图像进行聊天，你会对其OCR、图像理解和推理

AI程序猿人·2025-01-20 12:01

一文看懂llama2（原理&模型&训练）

与此同时，MetaAIMetaAI在2023年推出了LLama（LargeLan

Qpeterqiufengyi·2025-01-20 07:38

C++ macro: Variadic macros (可变参数宏)

C++macro:Variadicmacros{可变参数宏}1.Variadicmacroextensions(可变参数宏扩展)2.Variadicmacros3.llama.cppReferences1

Yongqiang Cheng·2025-01-20 04:11

从零开始的 AI Infra 学习之路

AIInfra学习之路文章目录从零开始的AIInfra学习之路一、概述二、AI算法应用2.1机器学习2.2深度学习2.3LLM三、AI开发体系3.1编程语言四、AI训练框架&推理引擎4.1PyTorch4.2llama.cpp4.3vLLM

SSS不知-道·2025-01-19 15:15

能自行完成整个软件项目的AI工具，以及 Llama 3 在线体验和本地安装部署

能自行完成整个软件项目的AI工具，以及Llama3在线体验和本地安装部署。StreamingT2V（StreamingText-to-Video）模型是一种将文本描述转换为视频内容的人工智能技术。

代码讲故事·2025-01-19 04:35

使用Python访问和操作Llama的方法

使用Python访问和操作Llama的方法Llama是一个流行的Python库，用于处理和操作数据集。它提供了丰富的功能和工具，使我们能够轻松地对数据进行处理、转换和分析。

起风了~~~。·2025-01-18 19:40

BladeDISC++：Dynamic Shape AI 编译器下的显存优化技术

团队近期发布的BladeDISC++项目，探讨在动态场景下如何优化深度学习训练任务的显存峰值，主要内容包括以下三个部分：DynamicShape场景下显存优化的背景与挑战BladeDISC++的创新解决方案Llama2

·2025-01-17 20:51

llama.cpp部署

llama.cpp介绍部署介绍大模型的研究分为训练和推理两个部分：训练的过程，实际上就是在寻找模型参数，使得模型的损失函数最小化；推理结果最优化的过程；训练完成之后，模型的参数就固定了，这时候就可以使用模型进行推理

法号：行颠·2025-01-17 17:12

LLaMA-Factory全面指南：从训练到部署

项目背景与概述LLaMA-Factory项目目标LLaMA-Factory项目是一个专注于大模型训练、微调、推理和部署的开源平台。

我就是全世界·2025-01-17 15:46

安装指南：LLaMA Factory、AutoGPTQ 和 vllm

安装指南：LLaMAFactory、AutoGPTQ和vllm在本文中，我们将详细介绍如何安装LLaMAFactory、AutoGPTQ和vllm，这些工具在大型语言模型（LLMs）和视觉语言模型（VLMs）的微调和量化中非常有用。我们将逐步指导你完成整个安装过程，确保你能够顺利开始使用这些强大的工具。1.安装LLaMAFactoryLLaMAFactory是一个统一高效的微调框架，支持100多种

从零开始学习人工智能·2025-01-17 13:05

设计一个流程来生成测试模型安全性的问题以及验证模型是否安全

要使用Ollama运行llama3.3:70b模型，并设计一个流程来生成测试模型安全性的问题以及验证模型是否安全，可以按照以下步骤进行设计和实现。

MonkeyKing.sun·2025-01-16 18:17

Xinference如何注册自定义模型

Xinference如何注册自定义模型解决方案：1.写个model_config.json，内容如下{"version":1,"context_length":2048,"model_name":"custom-llama

玩人工智能的辣条哥·2024-09-16 08:10

[AI资讯·0605] GLM-4系列开源模型，OpenAI安全疑云，ARM推出终端计算子系统，猿辅导大模型备案……

AI手机PC大爆发，Arm从软硬件到生态发力，打造行业AI百宝箱GLM-4开源版本：超越Llama3，多模态比肩GPT4V，MaaS平台也大升级猿辅导竟然是一家AI公司？

老牛同学·2024-09-14 13:57

新款 GPT-4o mini、Llama 3.1、Mistral NeMo 12B 和其他 GenAI 趋势指南

2024年7月也不例外：仅在本月，我们就看到了MistralCodestralMamba、MistralNeMo12B、GPT-4omini和Llama3.1等的发布。

数云界·2024-09-13 18:53

大模型实战—Ollama 本地部署大模型

AI的应用范围广泛，从自动驾驶汽车到语音助手，再到智能家居系统，都有着AI的身影，而随着Facebook开源LLama2更让越来越多的人接触到了开源大模型。

猫猫姐·2024-09-12 16:34

【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人

打造智能聊天机器人3【Qwen2部署实战】探索Qwen2-7B：通过FastApi框架实现API的部署与调用4【Qwen2部署实战】Ollama上的Qwen2-7B：一键部署大型语言模型指南5【Qwen2部署实战】llama.cpp

寻道AI小兵·2024-09-12 06:09

快速上手指南：在Windows系统中下载Ollama，一键启动大模型体验！

1.下载ollama官网下载安装：ollama.com2.拉取大模型llama3.1终端中输入ollamapullllama3.1，等待安装3.运行llama3.1ollamarunllama3.1接下来就可以和模型对话了退出

再不会AI就不礼貌了·2024-09-11 14:08

反射是一个新的AI模型，可以在一台性能良好的笔记本上运行并在测试中击败GPT-4o

在早期的基准测试中，这个升级版的Meta的Llama3.1-70BInstruct架构已经超越了OpenAI的GPT-4o。

AI甲子光年·2024-09-11 13:34

LLAMA Factory: 简洁高效的大语言模型训练平台

LLAMAFactory:简洁高效的大语言模型训练平台LLaMA-Factory易于使用的LLM微调框架（LLaMA,BLOOM,Mistral,百川，Qwen,ChatGLM）。

俞纬鉴Joshua·2024-09-11 08:57

llama.cpp本地部署大模型

llama.cpp是一个C++库，用于简化LLM推理的设置，它使得在本地机器上运行大模型（GGUF格式）成为可能。

张兆坤的那些事·2024-09-11 00:00

大模型多机多卡脚本实例 - 增量预训练 -accelerate和deepspeed命令多机多卡训练有什么不同

第一步，同步权重ls-l/data/xxx/gpu008/MoeRemake/train/etuning/LLaMA-Factory2/models/xxx-Base-10B-200k-Llama第二步

AI生成曾小健·2024-09-10 16:33

Langchain + Ollama

运行起来后，使用langchain加载fromlangchain.llmsimportOllamaollama=Ollama(base_url='http://localhost:11434',model="llama2

AI工程仔·2024-09-10 15:23

超越传统：Reflection 70B如何革新AI语言处理

Reflection70B：AI语言模型的新里程碑AI领域迎来了革命性的变革，HyperWrite公司推出的开源AI大模型Reflection70B，以其卓越的性能在多个基准测试中超越了GPT-4o和Llama3.1

黑金IT·2024-09-10 06:31

llama_index 官方文档阅读笔记 (持续更新版)

llama0.10.17版本阅读链接:LlamaIndexv0.10.17LlamaIndex是一个基于LLM的应用程序的数据框架，它受益于上下文增强。

皮卡丘ZPC·2024-09-10 02:02

利用 Llama-Index为你的应用程序注入智能搜索

Llama-Index是一个基于大型语言模型的索引和检索工具，它允许用户快速检索和使用大量文本数据。

黑金IT·2024-09-10 01:11

从零搭建一个可离线使用的可实时更新扩展信息的智能问答系统 llamaindex&LLama3大模型&RAG

之前对一件事很好奇，为什么去年训练的大模型可以回答今天的新闻内容。答案是使用了知识扩展系统。基本原理是把参考答案和问题一同提给大模型，给他充分的参考信息做回复编辑。本文教你完成离线版本的智能问答系统搭建。有问题请直接留言最近在疯狂找下家，本人精通图形渲染和ai，求捞啊！基本架构图讲一下基本运行流程：人工准备数据转为嵌入向量存入数据库并生成索引用户提问流程：用户输入问题在索引数据库中查询匹配度较高的

千年奇葩·2024-09-09 20:06

大模型入门（一）

大模型入门（一）一、LLaMa模型介绍1）Pre-normalization2）SwiGLU激活函数3）RoPE旋转位置编码二、Alpaca模型介绍三、Vicuna模型介绍大模型入门（一）——LLaMa

pit_man·2024-09-08 05:40

微软开源 Phi-3.5 视觉模型

下面是关键总结：Phi3.5Mini:3.8B参数，性能超过Llama3.1(8B)和Mistral7B，接近MistralNeMo12B。支持多种语言，使用了包含32,000个词汇的分词器。

三花AI·2024-09-08 02:19

基于Llama 3搭建中文版（Llama3-Chinese-Chat）大模型对话聊天机器人

前面两篇博文，我们分别在个人笔记本电脑部署了Llama38B参数大模型，并使用Ollama搭建了基于Web可视化对话聊天机器人，可以在自己电脑上愉快的与Llama大模型Web机器人对话聊天了。

老牛同学·2024-09-07 22:26

LLM资料大全：文本多模态大模型、垂直领域微调模型、STF数据集、训练微调部署框架、提示词工程等

尤其是以ChatGLM、LLaMA等平民玩家都能跑起来的较小规模的LLM开源之后，业界涌现了非常多基于LLM的二次微调或

汀、人工智能·2024-09-05 22:31

AI多模态实战教程：面壁智能MiniCPM-V多模态大模型问答交互、llama.cpp模型量化和推理

1.1主要模型及特性（1）MiniCPM-Llama3-V2.5：参数规模:8B性能:超越GPT-4V-1106、GeminiPro、Qwen-VL-Max和Claude3，⽀持30+种语⾔，多模态对话

AIGCmagic社区·2024-09-05 21:23

大模型--个人学习心得

架构模型，它通过驯良大量文本数据，学习语言的语法、语义和上下文信息，从而能够对自然语言文本进行建模这种模型在自然语言处理(NLP)领域具有广泛应用常见的13个大模型BERT、GPT系列、T5、Meta的Llama

挚爱清&虚·2024-09-05 12:27

LLM大模型落地-从理论到实践

学习目标熟悉主流LLM（Llama,ChatGLM,Qwen）的技术架构和技术细节；有实际应用RAG、PEFT和SFT的项目经验较强的NLP基础，熟悉BERT、T5、Transformer和GPT的实现和差异

hhaiming_·2024-09-04 01:12

整理了上百个开源中文大语言模型，涵盖模型、应用、数据集、微调、部署、评测_基于大语言模型的网络自动配置平台的设计与开发

尤其是以ChatGLM、LLaMA等平民玩家都能跑起来的较小规模的LLM开源之后，业界涌现了非常多基于LLM的二次微调或应用的案例。

AI大模型-搬运工·2024-09-02 07:20

llama factory微调时出现x86_64-conda-linux-gnu/bin/ld: cannot find -lcurand: No such file or directory解决方案

大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了llamafactory微调时出现x

爱编程的喵喵·2024-09-01 11:18

本地电脑大模型系列之 20 离线 AI：使用 Ollama+llama3+privateGPT+Langchain+GPT4ALL+ChromaDB 与 Pdf、Excel、CSV、PPTX、PPT、

简介Ollama在Mac/Windows/Ubuntu上与llama3一起运行MAC至少需要8GBRAM，Ubuntu和Windows至少需要16GBRAMpython3.10和git系列文章《本地电脑搭建

知识大胖·2024-09-01 10:10

LLM-项目详解（一）：Chinese-LLaMA-Alpaca【transformers/models/llama/modeling_llama.py文件】

u013250861·2024-08-31 22:57

LLM - 从头实现 LLaMA3 网络与推理流程 (RMS | RoPE | GQA | SwiGLU)

CarolineSpike·2024-08-31 22:56

“全面解析！大模型面试宝典（含精选答案与策略）“

大模型（LLMs）进阶面1.llama输入句子长度理论上可以无限长吗？1.什么是LLMs复读机问题？2.为什么会出现LLMs复读机问题？3.如何缓解LLMs复读机问题？

AGI-老冉·2024-08-31 10:07

英伟达如何通过剪枝和蒸馏技术让Llama 3.1模型“瘦身“?

英伟达如何通过剪枝和蒸馏技术让Llama3.1模型"瘦身"?大家好，我是蒜鸭。今天我们来聊聊英伟达最近在大语言模型优化方面的一项有趣研究。

蒜鸭·2024-08-30 19:28

【大模型】大模型 CPU 推理之 llama.cpp

【大模型】大模型CPU推理之llama.cppllama.cpp安装llama.cppMemory/DiskRequirementsQuantization测试推理下载模型测试参考llama.cpp描述

szZack·2024-08-30 02:31

【学习笔记】：Ubuntu 22 使用模型量化工具llama.cpp部署大模型 CPU+GPU

学习笔记：Ubuntu22使用模型量化工具llama.cpp部署大模型CPU+GPU前言1下载并编译llama.cpp1.1git下载llama.cpp仓库源码1.2编译源码（make）1.2.1选择一

淮序_·2024-08-30 02:00

AI-windows下使用llama.cpp部署本地Chinese-LLaMA-Alpaca-2模型

文章目录Llamp.cpp环境配置Chinese-LLaMA-Alpaca-2模型介绍模型下载转换生成量化模型Anaconda环境安装运行Llamp.cpp环境配置gitclonegit@github.com

mrbone11·2024-08-30 01:00

AI视界周刊第 2 期：Llama 3.1 开源、AI 训 AI，越训越傻、AI 搜索重燃战火

✨热点聚焦里程碑——MetaLlama3.1开源：性能媲美闭源模型，支持多语言Meta公司开源Llama3.1系列开源大语言模型，包含8B、

战场小包·2024-08-28 10:03

编译运行 llama.cpp (vulkan, Intel GPU SYCL)

llama.cpp是一个运行AI(神经网络)语言大模型的推理程序,支持多种后端(backend),也就是不同的具体的运行方式,比如CPU运行,GPU运行等.但是编译运行llama.cpp并不是那么容易的

穷人小水滴·2024-08-28 05:27

大模型推理测速 (llama.cpp, Intel GPU A770)

/llama-b3617-bin-ubuntu-x64/build/bin/llama-cli--versionversion:3617(a07c32ea)builtwithcc(Ubuntu11.4.0

穷人小水滴·2024-08-28 05:57

推荐频道

LLaMa