llama 第10页

使用 Llama.cpp 和 llama-cpp-python 快速部署本地 LLM 模型

在这篇技术文章中，我们将探讨如何使用llama-cpp-python（llama.cpp的Python绑定）在本地运行大语言模型（LLMs）。

hgSdaegva·2025-02-12 20:16

DeepSeek模型架构及优化内容

DeepSeekv1版本模型结构DeepSeekLLM基本上遵循LLaMA的设计：采⽤Pre-Norm结构，并使⽤RMSNorm函数.利⽤SwiGLU作为Feed-ForwardNetwork（FFN）

开出南方的花·2025-02-12 19:39

llama3简介与国内最快体验方式

Llama3的指令调优模型专为对话场景优化设计，在行业通用基准测试中表现优于众多开源聊天模型，并且我们在开发过程中特别注重提高其有用性和安全性。

weixin_40941102·2025-02-12 15:08

DeepSeek V3 两周使用总结

官方宣称：（1）基于自研的MoE模型和671B参数，在14.8Ttoken上进行了预训练；（2）多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405

AI生成曾小健·2025-02-12 11:12

关于安装llama-cpp-python报错问题解决方法

ubuntu系统下安装llama-cpp-python报错在ubuntu操作系统通过pipinstallllama-cpp-python指令安装llama-cpp-python会发生如下的报错：note

路过蜻蜓523·2025-02-12 09:33

llama-cpp-python CUDA error问题

安装完cuBLAS(CUDA)版本的llama-cpp-pythonCMAKE_ARGS="-DLLAMA_CUBLAS=on"pipinstallllama-cpp-python跑模型，指定n_gpu_layers

0语1言·2025-02-12 09:31

DeepSeek-MoE-16b：高效稀疏架构引领大模型降本增效革命

模型定位与技术背景DeepSeek-MoE-16b是深度求索（DeepSeek）研发的混合专家模型（MixtureofExperts,MoE），参数规模160亿，旨在通过稀疏化计算架构解决传统稠密模型（如Llama2

热爱分享的博士僧·2025-02-11 18:36

【大模型部署及其应用】Ollama搭建运行中文大语音模型Llama3-8B-Chinese-Chat

Ollama是一种用于运行大语言模型（如LLaMA）的平台，适合本地化部署和运行。

源代码杀手·2025-02-11 18:34

5分钟在本地PC上使用VLLM快速启动Valdemardi/DeepSeek-R1-Distill-Llama-70B-AWQ

5分钟在本地PC上使用VLLM快速启动Valdemardi/DeepSeek-R1-Distill-Llama-70B-AWQ前言环境准备所需工具创建虚拟环境安装VLLM及依赖库模型下载安装HuggingFaceCLI

engchina·2025-02-11 14:41

【llama3.1】Ollama 下载安装指南

Ollama是一款强大的跨平台工具，它可以在macOS、Linux和Windows系统上运行。在这篇博文中，我们将详细介绍如何在Windows系统上下载和安装Ollama。下载Ollama首先，访问Ollama的官方网站并导航到下载页面。你会看到如下图所示的界面：步骤1：选择操作系统在下载页面，你可以看到三个操作系统选项：macOS、Linux和Windows。点击Windows选项卡。步骤2：下

大表哥汽车人·2025-02-11 01:02

[论文笔记] llama3.2 蒸馏

参考链接：LLaMA3.2技术报告：GitHub-meta-llama/llama-stack:ModelcomponentsoftheLlamaStackAPIs[2407.21783]TheLlama3HerdofModelshttps

心心喵·2025-02-10 03:24

使用 llama-cpp-python 在 LangChain 中运行 LLM 模型

使用llama-cpp-python在LangChain中运行LLM模型引言在人工智能和自然语言处理领域，大型语言模型（LLMs）的应用越来越广泛。

qq_37836323·2025-02-10 01:37

DeepSeek创始人专访：中国的AI不可能永远跟随，需要有人站到技术的前沿

训练成本估计只有Llama3.1405B模型的11分之一，后者的效果还不如它。

人工智能学家·2025-02-09 20:34

llama.cpp的C语言API使用

我们知道，一般运行大语言模型都是在Python上运行的，可是Python的性能太差了，不适合用于生产环境，因此可以采用llama.cpp提供的API在C语言上运行大模型。

怎么这么多名字都被占了·2025-02-09 13:43

基于 llama-Factory 动手实践 Llama 全参数 SFT 和 LoRA SFT

一、llama-Factory：你的Llama模型SFT工厂llama-Factory是一个开源的、用户友好的工具，专门用于对Llama系列模型进行微调。

kakaZhui·2025-02-09 12:36

DeepSeek为什么采用与主流大模型不一样的MoE架构？一文搞懂什么是MoE模型

但像Qwen、LLama模型，用的却是Dense架构，也就是传统的Transformer架构。这两种架构有个很明显的区别。

大模型_学习路线·2025-02-08 04:39

LLAMA-Factory安装教程（解决报错cannot allocate memory in static TLS block的问题）

步骤一：下载基础镜像#配置dockerDNSvi/etc/docker/daemon.json#daemon.json文件中{"insecure-registries":["https://swr.cn-east-317.qdrgznjszx.com"],"registry-mirrors":["https://docker.mirrors.ustc.edu.cn"]}systemctlresta

拾回程序猿的圈圈∞·2025-02-07 18:41

大模型生态开源工具整理

最近一直在做大模型应用开发工作,总结下用到的一些开源工具1-模型训练LLaMA-Factory整体介绍LLaMA-Factory是一个开源的微调框架，为开发者提供简便高效的工具，以便在预训练模型基础上快速适应特定任务需求

miracletiger·2025-02-07 08:35

Ollama安装部署deepseek

目录Ollama安装软件(Windows)安装软件(Linux)安装软件(Docker)最简单下载模型下载Ollama内置的模型下载llama3模型(亲测垃圾机房都可以跑起来)下载DeepSeek-V3

angel725·2025-02-07 02:53

大模型面试必看！超详细面经指南+答案，轻松拿Offer！2025大模型上岸就靠它了！

[x]大模型（LLMs）进阶面[x]1.llama输入句子长度理论上可以无限长吗？[x]1.什么是LLMs复读机问题？[x]2.为什么会出现LLMs复读机问题？[x]3.如何缓解LLMs复读机问题？

AI大模型-大飞·2025-02-06 16:47

llama.cpp LLM_ARCH_DEEPSEEK and LLM_ARCH_DEEPSEEK2

llama.cppLLM_ARCH_DEEPSEEKandLLM_ARCH_DEEPSEEK21.`LLM_ARCH_DEEPSEEK`and`LLM_ARCH_DEEPSEEK2`2.

Yongqiang Cheng·2025-02-06 06:42

DataWhale wow-agent task 2: llama-index搭建电商数据库查询&课本问答agent

llama-index库之于openai库的优势方便连接外部数据SQL数据库操作配置对话模型创建数据库对话引擎llama中的NLSQLTableQueryEng

Meteora1024875·2025-02-05 18:07

llama.cpp GGML Quantization Type

llama.cppGGMLQuantizationType1.GGMLQuantizationType2.

Yongqiang Cheng·2025-02-05 18:06

在Ubuntu 22.04 LTS下编译llama.cpp（基于OpenBLAS）

步骤如下：a.安装make、C++、pkg-config：sudoaptinstallmakeg++pkg-configb.安装openblas-lapack：wgethttps://github.com/xianyi/OpenBLAS/releases/download/v0.3.27/OpenBLAS-0.3.27.tar.gztarzxvfOpenBLAS-0.3.27.tar.gzsudo

m0_70960708·2025-02-05 18:35

运行 Deepseek 视觉模型的方法

知识大胖·2025-02-05 13:30

如何利用DeepSeek打造医疗领域专属AI助手？从微调到部署全流程解析

一、基座模型选型：医疗推理的黄金搭档1.1为什么选择DeepSeek-R1-Distill-Llama-8

明哲AI·2025-02-05 10:05

Ollama能本地部署Llama 3等大模型的原因解析（ollama核心架构、技术特性、实际应用）

、Llama3模型的技术特性2.1、模型架构2.2、模型性能3.

周杰伦_Jay·2025-02-05 03:19

使用Ollama本地化部署DeepSeek

多模型支持：兼容多种开源模型，如LLaMA、DeepSeek等。高效管理：提供命令行工具，方便用户下载

·2025-02-05 02:15

Llama最新开源大模型Llama3.1

Meta公司于2024年7月23日发布了最新的开源大模型Llama3.1，这是其在大语言模型领域的重要进展。

kcarly·2025-02-04 21:32

Yuan 2.0-M32 是一个基于 Yuan 2.0 架构的双语混合专家 (MoE) 语言模型，旨在以更少的参数和计算量实现更高的准确率

性能优异：在代码生成、数学解题、科学知识和推理等多个领域展现出与Llama3-70B等大型模型相当甚至更优的性能。模型结构

东方佑·2025-02-04 06:01

Mixture of Experts（MoE）学习笔记

不过在这之后开源社区并没有对MoE架构进行很多的探索，更多的工作还是聚焦在预训练新的大模型，在Llama2或其他模型上做Fine-tune，以及扩展大模型的ContextLength。12月8号

南七小僧·2025-02-03 12:44

最强开源大模型炸场！全网独一份AI大模型学习实践资源...（待会删）

Meta发布Llama3系列模型，号称「最强大的开源大模型」，震撼科技圈！毫不夸张地说，AI大模型正在颠覆程序员的价值！

大模型应用·2025-02-02 21:11

本地部署LLM工具大比拼：谁才是你的智能之选？

Python_金钱豹·2025-02-02 21:10

国产大模型 DeepSeek，能跟 ChatGPT 一战，还不用梯子，确定不试试？

集成显卡·2025-02-02 21:38

什么是LLM？看这一篇就够了！

GPT、LLaMA、M

Python程序员罗宾·2025-02-02 14:50

在Windows上用Llama Factory微调Llama 3的基本操作

这篇博客参考了一些文章，例如：教程：利用LLaMA_Factory微调llama3:8b大模型_llama3模型微调保存-CSDN博客也可以参考LlamaFactory的Readme：GitHub-hiyouga

蛐蛐蛐·2025-02-02 13:16

【llm对话系统】大模型 Llama 源码分析之并行训练方案

Llama作为当前最流行的开源大模型之一，其训练代码中采用了多种并行技术。本文将深入Llama的训练代码，分析其并行训练方案，主要关注参数并行和部分结构参数共享。

kakaZhui·2025-02-02 13:14

【llm对话系统】大模型 Llama 源码分析之 LoRA 微调

本文将深入分析LoRA的原理，并结合Llama源码解读其实现逻辑，最后探讨LoRA的优势。2

kakaZhui·2025-02-02 13:14

【llm对话系统】大模型 Llama 源码分析之 Flash Attention

1.写在前面近年来，基于Transformer架构的大型语言模型(LLM)在自然语言处理(NLP)领域取得了巨大的成功。Transformer的核心组件是自注意力(Self-Attention)机制，它允许模型捕捉输入序列中不同位置之间的关系。然而，标准的自注意力机制的计算复杂度与序列长度的平方成正比，这使得它在处理长序列时效率低下。为了解决这个问题，FlashAttention被提出，它是一种高

kakaZhui·2025-02-02 13:43

llama.cpp LLM_CHAT_TEMPLATE_DEEPSEEK_3

llama.cppLLM_CHAT_TEMPLATE_DEEPSEEK_31.`LLAMA_VOCAB_PRE_TYPE_DEEPSEEK3_LLM`2.

Yongqiang Cheng·2025-02-02 12:10

【明明安装flash-attn成功，但是import的时候报错】

Thismodelingfilerequiresthefollowingpackagesthatwerenotfoundinyourenvironment:flash_attn.明明安装flash-attn成功，但是import的时候报错问题描述：运行Llama2

厂泉心·2025-02-02 12:07

【llm对话系统】大模型 Llama、Qwen 和 ChatGLM 的网络结构和训练方法对比

1.引言近年来，大型语言模型(LLM)取得了令人瞩目的进展，其中Llama、Qwen和ChatGLM是三个备受关注的开源模型。

kakaZhui·2025-02-02 07:54

开源LLMs导览：工作原理、顶级LLM列表对比

4.1BERT4.2LLaMA(LargeLanguageModelM

万俟淋曦·2025-02-01 23:11

深入探索Llama.cpp：在LangChain中使用llama-cpp-python

深入探索Llama.cpp：在LangChain中使用llama-cpp-python随着大语言模型（LLMs）的普及，开发者需要更有效的方法来部署和使用这些模型。

dfvcbipanjr·2025-02-01 16:10

使用Ollama本地化部署DeepSeek

多模型支持：兼容多种开源模型，如LLaMA、DeepSeek等。高效管理：提供命令行工具，方便用户下载

·2025-02-01 16:48

Llama大型语言模型原理详解

Llama大型语言模型是一种基于深度学习的自然语言处理模型，它在文本生成、问答、摘要等多种NLP任务中展现出强大的性能。

摆烂大大王·2025-01-31 11:40

中国Deepseek超Llama 4触发Meta

恐慌模式始于DeepseekV3，它在性能测试中已经超过了Llama4。更让人尴尬的是

极道Jdon·2025-01-31 08:13

开源大模型（LLM）下载

1、找到对应的模型文件，比如Meta-Llama-3-8B，然后找到下载入口2、点击模型下载，有2种下载方式，这里我们通过git下载（注意由于模型文件一般都比较大，直接使用gitclone下载时会有问题

baidu_20834545·2025-01-31 06:25

【llm对话系统】大模型源码分析之llama模型的long context更长上下文支持

1.引言Llama模型的一个重要特性是支持长上下文处理。本文将深入分析Llama源码中实现长上下文的关键技术点，包括位置编码(positionembedding)的外推方法、注意力机制的优化等。

kakaZhui·2025-01-30 12:57

推荐频道

llama

使用 Llama.cpp 和 llama-cpp-python 快速部署本地 LLM 模型

DeepSeek模型架构及优化内容

llama3简介与国内最快体验方式

DeepSeek V3 两周使用总结

关于安装llama-cpp-python报错问题解决方法

llama-cpp-python CUDA error问题

DeepSeek-MoE-16b：高效稀疏架构引领大模型降本增效革命

【大模型部署及其应用 】Ollama搭建运行中文大语音模型Llama3-8B-Chinese-Chat

5分钟在本地PC上使用VLLM快速启动Valdemardi/DeepSeek-R1-Distill-Llama-70B-AWQ

【llama3.1】Ollama 下载安装指南

[论文笔记] llama3.2 蒸馏

使用 llama-cpp-python 在 LangChain 中运行 LLM 模型

DeepSeek创始人专访：中国的AI不可能永远跟随，需要有人站到技术的前沿

llama.cpp的C语言API使用

基于 llama-Factory 动手实践 Llama 全参数 SFT 和 LoRA SFT

推荐一款企业级的Agentic RAG应用框架——RAGapp

DeepSeek为什么采用与主流大模型不一样的MoE架构？一文搞懂什么是MoE模型

LLAMA-Factory安装教程（解决报错cannot allocate memory in static TLS block的问题）

大模型生态开源工具整理

Ollama安装部署deepseek

大模型面试必看！超详细面经指南+答案，轻松拿Offer！2025大模型上岸就靠它了！

llama.cpp LLM_ARCH_DEEPSEEK and LLM_ARCH_DEEPSEEK2

DataWhale wow-agent task 2: llama-index搭建电商数据库查询&课本问答agent

llama.cpp GGML Quantization Type

在Ubuntu 22.04 LTS下编译llama.cpp（基于OpenBLAS）

运行 Deepseek 视觉模型的方法

如何利用DeepSeek打造医疗领域专属AI助手？从微调到部署全流程解析

Ollama能本地部署Llama 3等大模型的原因解析（ollama核心架构、技术特性、实际应用）

使用Ollama本地化部署DeepSeek

Llama最新开源大模型Llama3.1

Yuan 2.0-M32 是一个基于 Yuan 2.0 架构的双语混合专家 (MoE) 语言模型，旨在以更少的参数和计算量实现更高的准确率

Mixture of Experts（MoE）学习笔记

最强开源大模型炸场！全网独一份AI大模型学习实践资源...（待会删）

本地部署LLM工具大比拼：谁才是你的智能之选？

国产大模型 DeepSeek，能跟 ChatGPT 一战，还不用梯子，确定不试试？

什么是LLM？看这一篇就够了！

在Windows上用Llama Factory微调Llama 3的基本操作

【llm对话系统】大模型 Llama 源码分析之并行训练方案

【llm对话系统】大模型 Llama 源码分析之 LoRA 微调

【llm对话系统】大模型 Llama 源码分析之 Flash Attention

llama.cpp LLM_CHAT_TEMPLATE_DEEPSEEK_3

【明明安装flash-attn成功，但是import的时候报错】

【llm对话系统】大模型 Llama、Qwen 和 ChatGLM 的网络结构和训练方法对比

开源LLMs导览：工作原理、顶级LLM列表对比

深入探索Llama.cpp：在LangChain中使用llama-cpp-python

使用Ollama本地化部署DeepSeek

Llama大型语言模型原理详解

中国Deepseek超Llama 4触发Meta

开源大模型（LLM）下载

【llm对话系统】大模型源码分析之llama模型的long context更长上下文支持

【大模型部署及其应用】Ollama搭建运行中文大语音模型Llama3-8B-Chinese-Chat