LLaMa

微调大语言模型(生成任务)，怎么评估它到底“变好”了？

随着大语言模型（如GPT、LLaMA）的广泛应用，越来越多团队开始基于它们做微调，定制符合自己业务需求的模型。微调虽能让模型更贴合任务，但评估是否真的“变好”却不是简单的事。

茫茫人海一粒沙·2025-06-29 09:38

LLaMA Factory 微调后，迁移模型

方法1：使用HuggingFaceHub（最推荐）fromtransformersimportAutoModelForCausalLM,AutoTokenizer#在源服务器上保存模型到Hubmodel.push_to_hub("your-username/your-model-name")tokenizer.push_to_hub("your-username/your-model-name")

激进小猪1002·2025-06-28 18:17

开源浪潮之巅：当前最热门的开源项目全景图

万能小贤哥·2025-06-27 08:31

如何使本地大模型拥有联网搜索的能力？

要让本地部署的大模型（如DeepSeek、LLaMA、ChatGLM等）具备联网搜索能力，需要将模型与外部工具结合，通过API调用、插件或代理机制实现实时信息获取。

SugarPPig·2025-06-27 04:28

LLama-Factory 遇到的问题

目录一、LLama-Factory安装二、LLama-Factory遇到的问题（一）包不兼容问题（二）使用文件路径，加载模型一、LLama-Factory安装参考官网介绍：https://github.com

·2025-06-27 02:10

大模型应用10种架构模式全解析：从理论到实战的技术指南

近年来，以GPT-4、LLaMA、PaLM为代表的大模型彻底改变了人工智能的应用范式。然而，如何高效地将这些“庞然大物”落地到实际业务中，仍是开发者面临的核心挑战。

ai大模型雪糕·2025-06-25 20:47

如何在Spring AI中配置多模型切换

在SpringAI中配置多模型切换（例如同时使用OpenAI、Gemini或本地Llama2），可以通过Bean别名或动态运行时选择实现。

友莘居士·2025-06-25 08:50

15.2 LLaMA 3面试模拟神器：动态难度调节+实时反馈，大厂通过率提升90%

LLaMA3面试模拟神器：动态难度调节+实时反馈，大厂通过率提升90%关键词：对话系统设计、场景化提示工程、LLaMA3微调、多轮对话管理、面试模拟Agent技术面试场景Agent设计核心逻辑通过多阶段对话流程控制和动态难度调节实现真实面试模拟

少林码僧·2025-06-25 06:06

灵哥教你玩转Llama3：解决NCCL缺失问题

解决NCCL缺失问题有很多小伙伴私信灵哥:官网的llama3模型用不了,运行会报错灵哥按照官网给的启动命令，确实启动不了torchrun--nproc_per_node1example_chat_completion.py

灵哥讲AI·2025-06-25 06:30

当AI拥有空间直觉：SpatialLM如何让机器“看懂”三维世界？

开源地址：https://huggingface.co/manycore-research/SpatialLM-Llama-1B你是否想象过，只需用手机拍一段视频，AI就能像人类一样理解房间的布局、家具的位置

遇见小码·2025-06-24 15:15

Ollama常用命令

1、下载OllamaLinux系统的安装命令如下：curl-fsSLhttps://ollama.com/install.sh|sh2、进入llama3运行环境：ollamarunllama33、启动服务

大模型老炮·2025-06-24 13:29

15.3 LLaMA 3+LangChain实战：智能点餐Agent多轮对话设计落地，订单准确率提升90%！

LLaMA3+LangChain实战：智能点餐Agent多轮对话设计落地，订单准确率提升90%！

少林码僧·2025-06-23 23:05

二、【LLaMA-Factory实战】数据工程全流程：从格式规范到高质量数据集构建

LLaMA-Factory提供了完整的数据工程工具链，支持从数据格式规范到清洗增强、注册验证的全流程管理。本文结合结构图、实战代码和生产级经验，带您掌握构建高质量数据集的核心技术。

陈奕昆·2025-06-23 11:40

LLaMA-Factory多模态训练：从文本到图像的综合应用

摘要本文深入探讨了LLaMA-Factory框架中的多模态训练技术。从基础的文本-图像对齐到复杂的多模态理解，全面介绍了如何利用LLaMA-Factory进行多模态模型的训练和优化。

CarlowZJ·2025-06-23 11:40

【LLaMA-Factory 实战系列】一、数据准备篇 - 从文本到多模态的完整流程

【LLaMA-Factory实战系列】一、数据准备篇-从文本到多模态的完整流程1.引言2.LLaMA-Factory数据格式概述2.1Alpaca格式2.2ShareGPT格式3.文本数据准备3.1Alpaca

Zhijun.li@Studio·2025-06-23 11:08

输入GSM8K数据集对Llama2-int4模型进行性能评估

思路：逐条输入GSM8K数据集获得模型输出并于数据集中的回答进行比对fromllama_cppimportLlama#从llama_cpp导入Llama类，用于加载并调用Llama模型importtime

Nnbwbyhxy·2025-06-23 03:47

大模型学习路线：这会是你见过最全最新的大模型学习路线【2025最新】

大模型学习路线建议先从主流的Llama开始，然后选用中文的Qwen/Baichuan/ChatGLM，先快速上手体验prompt工程，然后再学习其架构，跑微调脚本如果要深入学习，建议再按以下步骤，从更基础的

大模型入门学习·2025-06-23 00:56

大模型系列——VLLM 部署当前最火大模型llama4

大模型——VLLM部署当前最火大模型llama4最近llama4火车圈了，不愧是大模型界的当红炸子鸡，号称宇宙最强大模型，这里我们快速尝鲜，看看怎么快速部署，首先我们需要知道当前的llama4是没有办法用

猫猫姐·2025-06-22 22:41

ChatMusician：用大模型理解并创造音乐

ChatMusician由SkyworkAIPTE.LTD.和香港科技大学的研究团队共同开发，它基于持续预训练和微调的LLaMA2模型，并通过一种文本兼容的音乐表示法——ABC符号，将音乐作为第二语言来处理

人工智能大模型讲师培训咨询叶梓·2025-06-22 19:19

NF4量化算法的PyTorch实现

为了方便理解NF4算法的实现，这里用PyTorch实现了一版可以和CUDANF4精度对齐的量化和反量化函数，并使用llama-3.1-8b模型进行测试，可以做到和CUDA实现的算子精度基本对齐（仅反量化存在少许误差

风好衣轻·2025-06-22 18:48

Llama 4模型卡片及提示词模板

Llama4模型卡片及提示词模板Llama4模型卡及提示格式介绍Llama4模型概述Llama4是一系列预训练和指令微调的混合专家（Mixture-of-Experts,MoE）大语言模型，包含两种规模

大模型与Agent智能体·2025-06-21 23:44

什么是 QLoRA（Quantized Low-Rank Adaptation，量化低秩适配）

QLoRA结合了4-bit量化（quantization）和LoRA的低秩更新技术，使超大规模模型（如70B参数的LLaMA）能够在单GPU上进行高效微调，同时保持与全参数微调相近的性能。

彬彬侠·2025-06-21 06:23

Streamlit在人工智能中的应用场景

Streamlit在AI大模型（如GPT、LLaMA、Claude等）和RAG（检索增强生成）中的应用非常广泛，它能够快速构建交互式界面，让用户直观体验大模型的能力，并灵活调整参数或输入数据。

不老刘·2025-06-20 18:37

LangChain 本地模型部署指南：Llama3 与 Open-WebUI 的可视化交互开发

技术点目录第一章、智能体(Agent)入门第二章、基于字节Coze构建智能体(Agent)第三章、基于其他平台构建智能体（Agent）第四章、国内外智能体(Agent)经典案例详解第五章、大语言模型应用开发框架LangChain入门第六章、基于LangChain的大模型API接入第七章、基于LangChain的智能体(Agent)开发第八章、开源大语言模型及本地部署第九章、从0到1搭建第一个大语言

zm-v-15930433986·2025-06-20 16:49

别让GPU摸鱼！榨干它！

我们也知道，如今各大优秀模型如DeepSeek、Llama、Gemini厂商除了卷算力，也都开始在工程化、算法等方面进行优化，以便更高效地利用GPU资源，节省成本。

九章云极DataCanvas·2025-06-20 10:13

RAG执行代码报错 “no module named ‘llama_index.vector_stores‘“

RAG执行代码报错“nomodulenamed‘llama_index.vector_stores’”一、问题importchromadbfromllama_index.coreimportVectorStoreIndex

·2025-06-19 22:11

Llama_Index核心组件介绍

文章目录一、什么是LlamaIndex1.简介2.作用二、LlamaIndex核心组件1.数据连接器（DataConnectors）2.数据索引（DataIndexes）3.引擎（Engines）4.数据代理（DataAgents）5.应用集成（ApplicationIntegrations）三、LlamaIndex核心概念1.RAG1，索引2，查询2.索引阶段1，Dataconnectors2，

智模睿脑君·2025-06-19 22:10

llama_index chromadb实现RAG的简单应用

此demo是自己提的一个需求：用modelscope下载的本地大模型实现RAG应用。毕竟大模型本地化有利于微调，RAG使内容更有依据。为什么要用RAG？由于大模型存在一定的局限性：知识时效性不足、专业领域覆盖有限以及生成结果易出现“幻觉”问题，需要通过结合实时数据和专业知识提升生成内容的准确性、时效性和可信度。‌‌检索增强生成（RAG）的核心价值在于弥补大模型固有缺陷一个简单样例加载本地大语言模型

victorwjw·2025-06-19 21:07

端侧可用的 GPT-4V 级单图、多图、视频多模态大模型

端侧可用的GPT-4V级单图、多图、视频多模态大模型中文|EnglishMiniCPM-V2.6|MiniCPM-Llama3-V2.5|MiniCPM-Llama3-V2.5技术报告M

强化学习曾小健·2025-06-17 11:00

（什么是）大模型的“越狱”（Model Jailbreaking）

大模型的“越狱”（ModelJailbreaking）是指通过特定技术手段或策略，绕过大型语言模型（如GPT、Llama、Claude等）内置的安全机制和伦理限制，诱导模型生成原本被禁止的内容（如暴力、

音程·2025-06-17 09:48

大模型微调(Fine-tuning)概览

大模型微调（Fine-Tuning）是将预训练大模型（如GPT、LLaMA）适配到特定任务或领域的核心技术，其效率与效果直接影响大模型的落地价值。

MzKyle·2025-06-17 08:39

llama3源码解读之推理-infer

文章目录前言一、整体源码解读1、完整main源码2、tokenizer加载3、llama3模型加载4、llama3测试数据文本加载5、llama3模型推理模块1、模型推理模块的数据处理2、模型推理模块的

tangjunjun-owen·2025-06-16 05:05

我可以理解llama.cpp是用C++实现了算法，而其他项目一般用python实现？

llama.cpp项目:主要用于推理和部署。下面我们来详细对比一下这两种方式的异同和优劣。范式一：Python+C++/CUDA后端(主流方式)这是绝大多数AI项目（包

欧先生^_^·2025-06-16 05:35

探索未来的对话：llama.cpp 开源项目深度解析

探索未来的对话：llama.cpp开源项目深度解析llama.cppPortofFacebook'sLLaMAmodelinC/C++项目地址:https://gitcode.com/gh_mirrors

幸桔伶·2025-06-16 05:03

深度解析一下 llama.cpp 的源代码

我们来深度解析一下llama.cpp的源代码。llama.cpp是一个非常了不起的项目，它的核心目标是让大型语言模型（LLM）能够在消费级硬件（甚至是手机）上高效运行。

欧先生^_^·2025-06-16 05:03

2025年大模型学习路线图：史上最全、最新的大模型学习指南！非常详细收藏这一篇就够了！

大模型学习路线建议先从主流的Llama开始，然后选用中文的Qwen/Baichuan/ChatGLM，先快速上手体验prompt工程，然后再学习其架构，跑微调脚本前排提示，文末有大模型AGI-CSDN独家资料包哦

大模型教程·2025-06-15 16:42

Llama 4 群：原生多模态 AI 创新新时代的开始

我们正在分享Llama4群中的首批模型，这将使人们能够构建更加个性化的多模式体验。

爱分享的小明·2025-06-15 11:04

在 Windows 和 Linux 系统上安装和部署 Ollama

引言Ollama是一个强大的本地大语言模型（LLM）运行工具，允许用户轻松下载和运行不同的AI模型，如LLaMA、Mistral和Gemma。

萧鼎·2025-06-13 10:34

大模型笔记_模型微调

1.大模型微调的概念大模型微调（Fine-tuning）是指在预训练大语言模型（如GPT、BERT、LLaMA等）的基础上，针对特定任务或领域，使用小量的目标领域数据对模型进行进一步训练，使其更好地适配具体应用场景的过程

饕餮争锋·2025-06-13 02:12

OpenPrompt 是什么？

OpenPrompt是一个基于自然语言处理（NLP）的提示工程（PromptEngineering）工具/框架，主要用于帮助开发者设计、优化和管理自然语言模型（如GPT、LLaMA等）的提示词（Prompt

ZhangJiQun&MXP·2025-06-12 22:37

网络受限情况下，在Ollama中导入从Model Scope下载的safetensors提示错误Error: unsupported architecture “Qwen3ForCausalLM“

Ollamasupportsimportingmodelsforseveraldifferentarchitecturesincluding:Llama(includingLlama2,Llama3,Llama3.1

stupidorclever·2025-06-12 12:30

13.7亿级用户订阅系统架构实战：Stripe支付集成+LLaMA动态权限控制

亿级用户订阅系统架构实战：Stripe支付集成+LLaMA动态权限控制关键词：订阅系统架构设计、支付接口集成、订阅生命周期管理、用户权限控制、SaaS计费模型订阅模式技术实现详解在LanguageMentor

少林码僧·2025-06-11 07:07

Ai自动补全编程工具:llama vscode

CIb0la·2025-06-10 13:22

大语言模型（LLM）中的KV缓存压缩与动态稀疏注意力机制设计

传统注意力机制的计算复杂度随序列长度呈二次方增长，而KV缓存的内存消耗可能高达数十GB（例如Llama2-7B处理100Ktoken时需50GB内存）。

华清远见成都中心·2025-06-10 12:19

【大模型入门】2025年大模型学习路线图：史上最全、最新的学习指南，助你成为AI领域的佼佼者！