llama 第4页

基于ChatGPT-4o信息检索、总结分析、论文写作与投稿、专利idea构思与交底书的撰写

AAIshangyanxiu·2025-02-22 10:26

哪种LLM量化方法最适合您？：GGUF、GPTQ 还是 AWQ

：GGUF、GPTQ还是AWQ1.GGUF：(GPT-GeneratedUnifiedFormat,GPT生成的统一格式)GGUF是GGML的后继者，由llama.cpp团队推出。

GordonJK·2025-02-22 05:38

LLM Course系列：使用 Unsloth 高效地微调 Llama 3.1

最近发布的Llama3.1为模型提供了令人难以置信的性能水平，缩小了闭源模型和开放权重模型之间的差距。

橙狮科技·2025-02-22 04:36

尝试在exo集群下使用deepseek模型：第一步，调通llama

exo是一个多机协同AI大模型集群软件，它可以将多种设备统一成一个强大的GPU，支持多种模型，并具有动态模型分区、自动设备发现等功能‌。问题实践：多机协同AI大模型集群软件exo：体验github日榜第一名的魅力！-CSDN博客在安装了exo后，一直运行没有成功，在网页运行的时候，报错让使用debug>2去调试原来可以命令行调试运行：DEBUG=9exorunllama-3.2-1b--disab

skywalk8163·2025-02-21 22:33

NVIDIA B200：高性能 AI 计算的未来

在Llama270B型号上运行推理时，B200每秒可处理11,26

知识大胖·2025-02-21 15:01

Llama都在用的RoPE有了视频版，长视频理解/检索绝佳拍档

VideoRoPE团队投稿量子位|公众号QbitAILlama都在用的RoPE（旋转位置嵌入）被扩展到视频领域，长视频理解和检索更强了。复旦大学、上海AI实验室等提出VideoRoPE，并确定了将RoPE有效应用于视频所需的四个关键特性。在长视频检索、视频理解和视频幻觉等各种下游任务中，VideoRoPE始终优于先前的RoPE变体。用三维结构保留时空关系RoPE是一种能够将相对位置信息依赖集成到s

·2025-02-21 06:19

Swift：KeyPath

官方给出的示例：classAnimal:NSObject{@objcvarname:Stringinit(name:String){self.name=name}}letllama=Animal(name:"Llama

陌上心·2025-02-21 01:52

如何将模型长度扩展到100万：Llama 3的NTK-aware插值技术解析小学生都懂的

好的，以下是对Llama3如何通过NTK-aware插值调整位置编码以扩展上下文长度到100万的详细原理解释：1.RoPE（旋转位置编码）的原理RoPE是一种用于Transformer模型的位置编码方法

从零开始学习人工智能·2025-02-21 00:41

ChatGPT和DeepSeek打造科研与办公的高效引擎

AAIshangyanxiu·2025-02-20 23:05

零基础学会asp.net做AI大模型网站/小程序十六：专栏总结

---------------------------正文----------------------------------------目录本专栏总结后续方向项目简介项目结构使用方法项目地址关键特点LLaMA

借雨醉东风·2025-02-20 20:10

华为昇腾服务器部署DeepSeek模型实战

服务器是配置了8块910B3的显卡，每块显卡有64GB显存，根据DeepSeekR1各个模型的参数计算，如果部署R1的Qwen14B版本，需要1张显卡，如果是32B版本，需要2张，Llama70B的模型需要

gzroy·2025-02-20 18:22

Docker Compose部署大语言模型LLaMa3+可视化UI界面Open WebUI

一、介绍Ollama：部署+运行大语言模型的软件LLaMa3：史上最强开源AI大模型—Meta公司新发布的大语言模型OpenWebUI：AI用户界面，可通过浏览器访问二、Docker部署docker-compose.yml

m0_74824877·2025-02-20 14:44

大模型（含deepseek r1）本地部署利器ollama的API操作指南

它支持多种预训练的大型语言模型（如LLaMA2、Mistral、Gemma、DeepSeek等），并提供了一个简单高效的方式来加载和使用这些模型。

·2025-02-20 13:41

DeepSeek和ChatGPT的全面对比

一、模型基础架构对比（2023技术版本）维度DeepSeekChatGPT模型家族LLAMA架构改进GPT-4优化版本参数量级开放7B/35B/120B闭源175B+位置编码RoPE+NTK扩展ALiBiAttention

陈皮话梅糖@·2025-02-20 12:00

KTransformers如何通过内核级优化、多GPU并行策略和稀疏注意力等技术显著加速大语言模型的推理速度？

例如，通过使用Llama和Marlin等高效内核，显著提升了计算效率。通过IntelAMX指令集优化，KTransformers在CPU端实现了更高的

魔王阿卡纳兹·2025-02-20 04:53

Meta放大招！首届生成式AI大会LlamaCon即将来袭

这一大会以Meta的生成式AI模型家族Llama命名，旨在分享Meta在开源AI领域的最新进展，帮助开发者构建出色的应用和产品。Meta表示，更多细节将在不久后公布。

·2025-02-19 15:29

LLaMA系列大模型调研与整理-llama-alpaca-lora

文章目录LLaMA大模型及其衍生模型1.LLaMA2.stanford_alpaca3.ChatDoctor4.alpaca-lora5.Chinese-LLaMA-Alpaca6.BELLE大模型综述

AI大模型-大飞·2025-02-19 02:17

大模型工具大比拼：SGLang、Ollama、VLLM、LLaMA.cpp 如何选择？

本文将深入对比SGLang、Ollama、VLLM和LLaMA.cpp四款热门大模型工具，帮助您找到最契合需求的解决方案！工具概览在开始之前，先简单了解一下这四款工具的特点：SGLang：性能卓越的

X_taiyang18·2025-02-18 23:42

Docker下使用llama.cpp部署带Function calling和Json Mode功能的Mistral 7B模型

Docker下使用llama.cpp部署带Functioncalling和JsonMode功能的Mistral7B模型说明：首次发表日期：2024-08-27参考：https://www.markhneedham.com

shizidushu·2025-02-18 13:59

大语言模型（LLM）如何实现上下文的长期记忆？

引言大语言模型（LargeLanguageModels,LLMs），如GPT-4、Claude和LLaMA等，已经在自然语言处理领域展现出卓越的能力。

·2025-02-18 00:06

LLaMA3大模型技术全网最全解析——模型架构与训练方法（收录于GPT-4/ChatGPT技术与产业分析）

chenweiPhD·2025-02-16 21:15

AWS上基于Llama 3模型检测Amazon Redshift里文本数据的语法和语义错误的设计方案

一、技术栈选型核心服务：AmazonRedshift：存储原始文本和检测结果AmazonBedrock：托管Llama370B模型AWSLambda：无服务计算（Python运行时）AmazonS3：中间数据存储

weixin_30777913·2025-02-16 15:30

AIGC 实战：如何使用 Docker 在 Ollama 上离线运行大模型（LLM）

Ollama简介Ollama是一个开源平台，用于管理和运行各种大型语言模型(LLM)，例如Llama2、Mistral和Tinyllama。它提供命令行界面(CLI)用于安装、模型管理和交互。

surfirst·2025-02-16 04:04

DataWhale 组队学习 wow-agent task2 体验总结归纳

一、Llama-index知识体验1.ReActAgent与业务自动化ReActAgent：通过ReActAgent，业务逻辑可以自动转换为代码，只要有相应的API，模型就可以调用。

菜鸟码农01·2025-02-16 02:46

大模型prompt实例：知识库信息质量校验模块

大模型应用向开发路径：AI代理工作流大模型应用开发实用开源项目汇总大模型问答项目问答性能评估方法大模型数据侧总结大模型token等基本概念及参数和内存的关系大模型应用开发-华为大模型生态规划从零开始的LLaMA-Factory

写代码的中青年·2025-02-15 22:45

Windows10/11部署llama及webUi使用

前言整体是希望在windows下安装llama3:8b以及gemma:7b两个大模型，并使用open/ollama-webui来访问从目标出发，llama3和gemma都属于开源大模型，可以自行编译，但是那个步骤对于初步探索的人来说要求太高了

闲杂人等12138·2025-02-15 21:44

LLaMA-Factory 安装linux部署&conda笔记

第一行代码是我导入https://github.com/hiyouga/LLaMA-Factory.git到我的项目那里的，试过网上随便搜索过相同，估计没更新，安装了几次都运行失败，克隆了最新的就安装成功了

jayxlb2·2025-02-15 20:07

DeepSeek-R1 蒸馏 Qwen 和 Llama 架构企业级RAG知识库

以Qwen或Llama架构为

qq_25467441·2025-02-15 20:00

【开发日志】数字人+LLM：从概念到实现的全程记录！

系统环境：CPU:i91490016GBGPU:GTX40608GBSYS:Windows11WSL:Ubuntu22.04本文章使用到的技术内容:数字人框架:LiveTalking大模型:Llama3.1TTS

AI大模型-王哥·2025-02-15 13:11

基于 llama-index与Qwen大模型实现RAG

文章目录llama-index核心功能工作流程Qwen技术特点核心能力RAG核心原理关键优势工作流程知识准备阶段查询处理阶段检索与重排阶段语言模型调用阶段实现环境准备代码实现参考LlamaIndex和Langchain

uncle_ll·2025-02-15 09:35

LLM大模型中文开源数据集集锦（三）

文章目录1ChatGLM-Med:基于中文医学知识的ChatGLM模型微调1.1数据集1.2ChatGLM+P-tuningV2微调1.3Llama+Alpaca的Lora微调版本2LawGPT_zh：

悟乙己·2025-02-14 13:01

大模型参数规模解析：32B中的“B“代表什么？如何影响AI性能？

Billion（十亿）：在AI模型领域，"B"特指模型参数量的十亿级单位参数定义：神经网络中可调节的权重数值，决定模型的信息处理能力计算示例：32B=32×10⁹=320亿参数GPT-3175B=1750亿参数LLaMA

燃灯工作室·2025-02-14 10:35

Win7本地化部署deepseek-r1等大模型详解

参考链接在Windows7操作系统，基于llama.cpp本地化部署deepseek-r1模型的方法2025-02-082G内存Windows7运行deepseek-r1:1.5b这两个链接写的可能不够详细

mygodalien·2025-02-14 04:20

一杯咖啡的时间学习大模型（LLM）：LLaMA解读之旋转编码RoPE（含代码实现）

文章目录一、LLaMA的核心改进全景二、旋转位置编码（RoPE）2.1改进动机2.2数学原理2.3源码实现一、LLaMA的核心改进全景Meta开源的LLaMA模型凭借其卓越的性能表现成为大模型发展的重要里程碑

Bug_makerACE·2025-02-14 02:52

自学人工智能大模型，满足7B模型的训练和微调以及推理，预算3万，如何选购电脑

如果你的预算是3万元人民币，希望训练和微调7B参数规模的人工智能大模型（如LLaMA、Mistral等），你需要一台高性能的深度学习工作站。

岁月的眸·2025-02-13 23:03

***LLAMA*-CPP-PYTHON 安装与配置完全指南**

LLAMA-CPP-PYTHON安装与配置完全指南llama-cpp-pythonPythonbindingsforllama.cpp项目地址:https://gitcode.com/gh_mirrors

童瑶知Valda·2025-02-13 02:58

win10 llamafactory模型微调相关① || Ollama运行微调模型

2.Ollama加载GGUF模型文件微调相关1.微调结果评估【06】LLaMA-Factory微调大模型——微调模型评估_llamafactory评估-CSDN博客2.模型下载到本地通义千问2.5-3B-Instruct

我的巨剑能轻松搅动潮汐·2025-02-12 22:31

用Llama Factory单机多卡微调Qwen2.5时报torch.OutOfMemoryError: CUDA out of memory的解决办法

接着上一篇博客：在Ubuntu上用LlamaFactory命令行微调Qwen2.5的简单过程_llamafactory微调qwen2.5-CSDN博客如果需要微调比较大的模型，例如Qwen2.5-32B，那么在两个3090上可能不够用，这里我用A6000×4的服务器。但如果仿照上篇博客，直接运行：llamafactory-clitrainexamples/train_qlora/qwen_lora

蛐蛐蛐·2025-02-12 22:27

使用 Llama.cpp 和 llama-cpp-python 快速部署本地 LLM 模型

在这篇技术文章中，我们将探讨如何使用llama-cpp-python（llama.cpp的Python绑定）在本地运行大语言模型（LLMs）。

hgSdaegva·2025-02-12 20:16

DeepSeek模型架构及优化内容

DeepSeekv1版本模型结构DeepSeekLLM基本上遵循LLaMA的设计：采⽤Pre-Norm结构，并使⽤RMSNorm函数.利⽤SwiGLU作为Feed-ForwardNetwork（FFN）

开出南方的花·2025-02-12 19:39

llama3简介与国内最快体验方式

Llama3的指令调优模型专为对话场景优化设计，在行业通用基准测试中表现优于众多开源聊天模型，并且我们在开发过程中特别注重提高其有用性和安全性。

weixin_40941102·2025-02-12 15:08

DeepSeek V3 两周使用总结

官方宣称：（1）基于自研的MoE模型和671B参数，在14.8Ttoken上进行了预训练；（2）多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405

AI生成曾小健·2025-02-12 11:12

关于安装llama-cpp-python报错问题解决方法

ubuntu系统下安装llama-cpp-python报错在ubuntu操作系统通过pipinstallllama-cpp-python指令安装llama-cpp-python会发生如下的报错：note

路过蜻蜓523·2025-02-12 09:33

llama-cpp-python CUDA error问题

安装完cuBLAS(CUDA)版本的llama-cpp-pythonCMAKE_ARGS="-DLLAMA_CUBLAS=on"pipinstallllama-cpp-python跑模型，指定n_gpu_layers

0语1言·2025-02-12 09:31

DeepSeek-MoE-16b：高效稀疏架构引领大模型降本增效革命

模型定位与技术背景DeepSeek-MoE-16b是深度求索（DeepSeek）研发的混合专家模型（MixtureofExperts,MoE），参数规模160亿，旨在通过稀疏化计算架构解决传统稠密模型（如Llama2

热爱分享的博士僧·2025-02-11 18:36

【大模型部署及其应用】Ollama搭建运行中文大语音模型Llama3-8B-Chinese-Chat

Ollama是一种用于运行大语言模型（如LLaMA）的平台，适合本地化部署和运行。

源代码杀手·2025-02-11 18:34

5分钟在本地PC上使用VLLM快速启动Valdemardi/DeepSeek-R1-Distill-Llama-70B-AWQ

5分钟在本地PC上使用VLLM快速启动Valdemardi/DeepSeek-R1-Distill-Llama-70B-AWQ前言环境准备所需工具创建虚拟环境安装VLLM及依赖库模型下载安装HuggingFaceCLI

engchina·2025-02-11 14:41

【llama3.1】Ollama 下载安装指南

Ollama是一款强大的跨平台工具，它可以在macOS、Linux和Windows系统上运行。在这篇博文中，我们将详细介绍如何在Windows系统上下载和安装Ollama。下载Ollama首先，访问Ollama的官方网站并导航到下载页面。你会看到如下图所示的界面：步骤1：选择操作系统在下载页面，你可以看到三个操作系统选项：macOS、Linux和Windows。点击Windows选项卡。步骤2：下

大表哥汽车人·2025-02-11 01:02

[论文笔记] llama3.2 蒸馏

参考链接：LLaMA3.2技术报告：GitHub-meta-llama/llama-stack:ModelcomponentsoftheLlamaStackAPIs[2407.21783]TheLlama3HerdofModelshttps

心心喵·2025-02-10 03:24

使用 llama-cpp-python 在 LangChain 中运行 LLM 模型

使用llama-cpp-python在LangChain中运行LLM模型引言在人工智能和自然语言处理领域，大型语言模型（LLMs）的应用越来越广泛。

qq_37836323·2025-02-10 01:37

推荐频道

llama