llama 第8页

深度学习突破：LLaMA-MoE模型的高效训练策略

为了解决这一问题，Mixture-of-Expert（MoE）模型架构应运而生，而LLaMA-MoE正是这一架构下的重要代表。

人工智能大模型讲师培训咨询叶梓·2025-03-06 01:44

大语言模型技术发展

摘要海外闭源模型领域竞争激烈，OpenAI保持领先地位，而开源模型如Meta的Llama系列也逐渐崛起。

联蔚盘云·2025-03-06 00:43

llama-cpp-python 项目常见问题解决方案

llama-cpp-python项目常见问题解决方案llama-cpp-pythonPythonbindingsforllama.cpp项目地址:https://gitcode.com/gh_mirrors

蔡晶斯·2025-03-05 21:13

【大模型开源实战】10 分钟,教你如何用 LLama-Factory 训练和微调大模型

在这个AI快速发展的时代，我们很高兴为大家带来LlamaFactory-一个为AI开发者和爱好者量身打造的实用工具平台。作为非计算机专业出身的开发者，我们深深受益于计算机世界的开放共享精神。今天，我们希望通过LlamaFactory为这个社区贡献我们的一份力量。LlamaFactory能为您提供什么？英文文档的AI翻译：利用大语言模型将英文文档翻译成中文，助您更便捷地获取最新技术信息。快速获取主流

Langchain·2025-03-05 06:40

大模型本地部署 Llama 3.1：Ollama、OpenWeb UI 和 Spring AI 的综合指南

本文介绍如何使用Ollama在本地部署Llama3.1:8B模型，并通过OpenWebUI和SpringAI来增强模型交互体验和简化API的调用过程。

m0_74822999·2025-03-04 23:43

unsloth+Colab+DeepSeek-R1-Distill-Llama-8B轻松上手

unsloth+Colab+DeepSeek-R1-Distill_哔哩哔哩_bilibili简介：DeepSeek-R1-Distill-Llama-8B是一个基于Llama架构的8B参数语言模型，经过深度蒸馏

AI超元域·2025-03-04 07:08

llama-factory ||启智平台

1.在启智平台上找到没有安装tensorflow的镜像作为基础镜像把llama-factory的github仓库进行下载，得到zip压缩包，上传到启智平台中，如下：2.执行命令如下进入文件夹cdLLaMA-Factory-main

失眠的树亚·2025-03-04 05:27

大模型开发和微调工具Llama-Factory--＞WebUI

WebUILLaMA-Factory支持通过WebUI零代码微调大模型。通过如下指令进入WebUIllamafactory-cliwebui#如果是国内，#USE_MODELSCOPE_HUB设为1，表示模型从ModelScope魔搭社区下载。#避免从HuggingFace下载模型导致网速不畅USE_MODELSCOPE_HUB=1llamafactory-cliwebui1.训练在模型开始训练之

m0_74823705·2025-03-04 05:56

LLaMA（Meta开源的AI模型）与Ollama（本地运行和管理大模型的工具）简介（注意这俩虽然名字相似但没有直接联系）

文章目录LLaMA**Llama系列模型发展**1.**Llama1(2023年2月)**2.**Llama2(2023年7月)**3.

Dontla·2025-03-04 04:54

DeepSeek 1.5B 蒸馏模型的征程 6 部署（Llama 方式）

前言DeepSeek是一款基于人工智能的搜索引擎，旨在提升用户的搜索体验。它利用先进的自然语言处理技术，通过理解查询的上下文和意图，为用户提供更精确、相关的搜索结果。与传统的搜索引擎不同，DeepSeek不仅仅依赖于关键词匹配，还能通过深度学习分析用户的需求，呈现更加智能化的搜索结果。此外，DeepSeek还具备语义理解能力，能够处理复杂的查询，并在短时间内给出最符合用户需求的答案。DeepSee

·2025-03-03 17:17

Llama 3.2入门基础教程（非常详细），Llama 3.2微调、部署以及多模态训练入门到精通，收藏这一篇就够了！

9月25日Meta发布了Llama3.2，包括11B和90B的视觉语言模型。前排提示，文末有大模型AGI-CSDN独家资料包哦！

中年猿人·2025-03-03 17:49

python测试ollama的API接口是否可用

python测试ollama的API接口是否可用测试代码ollama_API_test.pyimportollamamodele_name="llama3"message="""Whyistheskyblue

王铁柱子哟-·2025-03-03 06:26

《AI大模型开发笔记》DeepSeek技术创新点

对比同级别Llama3-40

Richard Chijq·2025-03-03 03:57

llama_factory微调QWen1.5

GitHub-hiyouga/LLaMA-Factory:UnifyEfficientFine-Tuningof100+LLMsUnifyEfficientFine-Tuningof100+LLMs.Contributetohiyouga

Kun Li·2025-03-03 02:50

LLaMA Factory添加新模型template的实战解析

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委，编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。

herosunly·2025-03-03 01:19

微调DeepSeek-R1-Distill-Llama-8B打造sql2text大模型！小白也能十分钟打造自己的推理大模型！unsloth+Colab轻松上手

简介：DeepSeek-R1-Distill-Llama-8B是一个基于Llama架构的8B参数语言模型，经过深度蒸馏（distillation）处理，旨在提高推理效率和精度。

X.Cristiano·2025-03-02 23:28

通过 PromptTemplate 生成干净的 SQL 查询语句并执行SQL查询语句

问题描述在使用LangChain和Llama模型生成SQL查询时，遇到了sqlite3.OperationalError错误。

背太阳的牧羊人·2025-03-02 22:22

构造一个工具（TravelSQLAgentTool），利用大语言模型（例如 Llama 模型）来完成 SQL 查询代理工具

完整代码：fromlangchain_core.toolsimporttoolfromlangchain_community.utilitiesimportSQLDatabasefromlangchain_core.promptsimportPromptTemplatefromlangchain_core.output_parsersimportStrOutputParserfromlangcha

背太阳的牧羊人·2025-03-02 22:22

Llama 2架构深度解析：Meta开源的70B参数大模型设计哲学

一、架构设计理念Llama2作为Meta开源的商用级大语言模型，其架构设计体现了三大核心原则：效率优先：在7B/13B/70B参数规模下保持线性计算复杂度扩展性强化：通过改进注意力机制支持4k上下文长度安全性内嵌

AI时代已来！·2025-03-02 14:46

【模型部署】大模型部署工具对比：SGLang, Ollama, VLLM, LLaMA.cpp如何选择？

LLaMA.cpp:这是一个针对C++优化的LLaMA模型实现，特别适合在资源受限的环境中

深度求索者·2025-03-02 08:19

本地大模型编程实战(09)自制聊天机器人(3)

包括：使用LangGraph构建聊天机器人自动裁剪聊天历史管理聊天会话的方法以流的方式输出回复我们将同时使用llama3.1和deepseek做演示。

火云牌神·2025-03-01 15:52

借助知识图谱和Llama-Index实现基于大模型的RAG

幻觉是在处理大型语言模型（LLMs）时常见的问题。LLMs生成流畅连贯的文本，但经常产生不准确或不一致的信息。防止LLMs中出现幻觉的一种方法是使用外部知识源，如提供事实信息的数据库或知识图谱。矢量数据库和知识图谱使用不同的方法来存储和表示数据。矢量数据库适合基于相似性的操作，知识图谱旨在捕捉和分析复杂的关系和依赖关系。对于LLM中的幻觉问题，知识图谱是一个比向量数据库更好的解决方案。知识图谱为L

爱吃牛油果的璐璐·2025-03-01 08:32

[论文笔记] LLM大模型剪枝篇——2、剪枝总体方案

N=20（N：剪枝崩溃临界点，LLaMA2在45%，Mistral-7B在35%，Qwen在20%，Phi-2在25%）对后(P

心心喵·2025-03-01 04:25

【deepseek】deepseek-r1本地部署-第三步：下载模型

二、操作1、LMStudio开发模式切换模式名字PowerUser2、下载模型模型名字DeepSeek-R1-Distill-Llama-8B-GGUF3、下载完成三、总结按需选择合适的bit的模型，否则会跑不动

Evenurs·2025-03-01 02:45

谈谈DeepSeek-v3在算力约束下的出色工作

DeepSeek-v3在算力约束下的出色工作原创渣Bzartbot2024年12月28日22:52上海寒冷的周末,加完班挤点时间读个论文吧.Deepseek-v3仅用了2048块H800GPU就超越了Llama3405B

强化学习曾小健·2025-02-28 22:19

【llm对话系统】大模型源码分析之 LLaMA 模型的 Masked Attention

然而，在自回归（autoregressive）模型中，例如LLaMA，我们需要对注意力进行屏蔽（Masking），以防止模型“偷看”未来的信息。

kakaZhui·2025-02-28 20:03

Llama.cpp 服务器安装指南（使用 Docker，GPU 专用）

前置条件在开始之前，请确保你的系统满足以下要求：操作系统：Ubuntu20.04/22.04（或支持Docker的Linux系统）。硬件：NVIDIAGPU（例如RTX4090）。内存：16GB+系统内存，GPU需12GB+显存（RTX4090有24GB）。存储：15GB+可用空间（用于源码、镜像和模型文件）。网络：需要互联网连接以下载源码和依赖。软件：已安装并运行Docker。已安装NVIDIA

田猿笔记·2025-02-28 09:37

自编大模型系列之 01 使用 Python 从头构建 LLaMA 3 编写您自己的十亿参数LLM（教程含源码）

LLaMA3是继Mistral之后最有前途的开源模型之一，可以解决各种任务。我之前在Medium上写过一篇博客，介绍如何使用LLaMA架构从头开始创建一个具有超过230万个参数的LLM。

知识大胖·2025-02-27 10:33

Ollama微调

它支持多种流行的开源大语言模型，如Llama2、Qwen2.5等。在上一篇文章中我们部署Ollama，并使用简单命令管理Ollama。接下来我们学习Ollama的高级应用。

软件不硬·2025-02-26 19:08

大模型是如何蒸馏像Qwen-7B，Llama-3 这种小模型的？

1.Qwen-7B和Llama-3的所属公司Qwen-7B：属于阿里巴巴，是“通义千问”系列的开源模型，由阿里云团队研发。

闫哥大数据·2025-02-26 03:12

深入探索 llama-cpp-python：在 LangChain 中启用本地 LLM 推理

Llama.cpp是一个用于推理许多LLM模型的开源库，它的Python绑定——llama-cpp-python提供了在Python中更加便捷的接口。

aehrutktrjk·2025-02-26 02:06

llama-cpp-python本地部署并使用gpu版本

使用带编译的命令安装llama库#首选GGML_CUDA后续LLAMA_CUBLAS将删除CMAKE_ARGS="-DGGML_CUDA=on"FORCE_CMAKE=1pipinstallllama-cpp-python

i__chen·2025-02-26 02:03

部署 Llama 3.1 405B：分步指南,深入研究 Llama 最新模型 Llama 3.1 4050 亿参数模型的部署。这个强大的模型需要大量的 VRAM，特别是 4 位量化版本需要 231 G

简介今天，我们将深入研究Llama最新模型Llama3.14050亿参数模型的部署。这个强大的模型需要大量的VRAM，特别是4位量化版本需要231GB。

知识大胖·2025-02-25 02:47

DeepSeek-R1秘籍轻松迁移，只需原始数据0.3% | 邱锡鹏团队联合出品

以Llama2-7B为例

·2025-02-24 19:13

Meta官宣Llama3：迄今为止最强大的开源大模型

4月18日，Meta在官方博客官宣了Llama3，标志着人工智能领域迈向了一个重要的飞跃。此版本具有经过预训练和指令微调的语言模型，具有8B(80亿)和70B(700亿)参数，可以支持广泛的用例。

·2025-02-24 19:09

垂类大模型微调（二）：使用LLaMA-Factory

上一篇博文和大家一起安装了LLaMA-Factory工具，并下载了大模型在上面进行了简单的加载和推理，今天尝试通过LoRa技术对大模型进行微调；一、训练集准备1.1介绍训练集结构这里演示对Qwen2.5

CITY_OF_MO_GY·2025-02-24 07:00

LLaMA-Factory|微调大语言模型初探索(3)，qlora微调deepseek记录

前言上篇文章记录了使用lora微调llama-1b，微调成功，但是微调llama-8b显存爆炸，这次尝试使用qlora来尝试微调参数体量更大的大语言模型，看看64G显存的极限在哪里。

闻道且行之·2025-02-24 01:49

将 Llama 3 与 Ollama 和 Python 结合使用使用 Ollama API 访问这一领先模型

Meta最近发布的新法学硕士Llama3在人工智能领域引起了轰动。例如，请查看我对下面型号的70B版本的评论和测试。在我的测试中，Llama3令人印象深刻，但它们是使用聊天界面进行的。

知识大胖·2025-02-23 09:28

科普：大模型使用中的temperature 与 top-k及其它

在大语言模型（如通过Ollama运行的llama2模型）中，temperature和top-k是两个用于控制文本生成过程的重要参数，它们在功能上相互独立，但又共同影响着模型生成文本的随机性和多样性。

人工干智能·2025-02-22 23:35

【2024 Dec 超实时】编辑安装llama.cpp并运行llama

首先讲一下环境这是2024年12月，llama.cpp的编译需要cmake呜呜呜网上教程都是make跑的。反正我现在装的时候make已经不再适用了，因为工具的版本，捣鼓了很久。

AI．愚人自愈·2025-02-22 13:45

大模型微调

以下是在本地部署使用LLaMA-Factory导出的LoRA模型，并通过Ollama运行的步骤指南：1.准备工作已训练好的LoRA模型:确保通过LLaMA-Factory导出了LoRA适配器文件（通常是

猴的哥儿·2025-02-22 12:42

【Llama3:8b】手把手教你如何在本地部署自己的 LLM大模型

一、为什么需要本地部署属于自己的大模型？趋势：我们正处于AI人工智能时代，各行各业的公司和产品都在向AI靠拢。打造垂直领域的AI模型将成为每个公司未来的发展趋势。数据安全：在无法掌握核心算法的情况下，许多公司选择使用大公司的成熟方案。然而，这涉及到数据安全的问题。训练垂直定制化的大模型需要大量数据，而数据是公司的核心资产和基石。没有公司愿意将这些关键数据上传到外部服务器，这是公司的命脉所在。本地部

AI大模型..·2025-02-22 12:40

基于ChatGPT-4o信息检索、总结分析、论文写作与投稿、专利idea构思与交底书的撰写

AAIshangyanxiu·2025-02-22 10:26

哪种LLM量化方法最适合您？：GGUF、GPTQ 还是 AWQ

：GGUF、GPTQ还是AWQ1.GGUF：(GPT-GeneratedUnifiedFormat,GPT生成的统一格式)GGUF是GGML的后继者，由llama.cpp团队推出。

GordonJK·2025-02-22 05:38

LLM Course系列：使用 Unsloth 高效地微调 Llama 3.1

最近发布的Llama3.1为模型提供了令人难以置信的性能水平，缩小了闭源模型和开放权重模型之间的差距。

橙狮科技·2025-02-22 04:36

尝试在exo集群下使用deepseek模型：第一步，调通llama

exo是一个多机协同AI大模型集群软件，它可以将多种设备统一成一个强大的GPU，支持多种模型，并具有动态模型分区、自动设备发现等功能‌。问题实践：多机协同AI大模型集群软件exo：体验github日榜第一名的魅力！-CSDN博客在安装了exo后，一直运行没有成功，在网页运行的时候，报错让使用debug>2去调试原来可以命令行调试运行：DEBUG=9exorunllama-3.2-1b--disab

skywalk8163·2025-02-21 22:33

NVIDIA B200：高性能 AI 计算的未来

在Llama270B型号上运行推理时，B200每秒可处理11,26

知识大胖·2025-02-21 15:01

Llama都在用的RoPE有了视频版，长视频理解/检索绝佳拍档

VideoRoPE团队投稿量子位|公众号QbitAILlama都在用的RoPE（旋转位置嵌入）被扩展到视频领域，长视频理解和检索更强了。复旦大学、上海AI实验室等提出VideoRoPE，并确定了将RoPE有效应用于视频所需的四个关键特性。在长视频检索、视频理解和视频幻觉等各种下游任务中，VideoRoPE始终优于先前的RoPE变体。用三维结构保留时空关系RoPE是一种能够将相对位置信息依赖集成到s

·2025-02-21 06:19

Swift：KeyPath

官方给出的示例：classAnimal:NSObject{@objcvarname:Stringinit(name:String){self.name=name}}letllama=Animal(name:"Llama

陌上心·2025-02-21 01:52

如何将模型长度扩展到100万：Llama 3的NTK-aware插值技术解析小学生都懂的

好的，以下是对Llama3如何通过NTK-aware插值调整位置编码以扩展上下文长度到100万的详细原理解释：1.RoPE（旋转位置编码）的原理RoPE是一种用于Transformer模型的位置编码方法

从零开始学习人工智能·2025-02-21 00:41

推荐频道

llama