LLaMa 第7页

探索GGUF：利用llama.cpp高效运行大型语言模型

探索GGUF：利用llama.cpp高效运行大型语言模型在人工智能领域，大型语言模型（LLM）的应用越来越广泛，但运行这些模型常常需要大量计算资源和复杂的配置。

Chen_Chance·2024-08-28 05:27

Code Llama: Open Foundation Models for Code论文阅读

yang_daxia·2024-08-27 18:46

基于华为昇腾910B和LLaMA Factory多卡微调的实战教程

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委，编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。

herosunly·2024-08-27 10:57

Cerebras DocChat发布：基于Llama 3构建，DocChat在几小时内完成GPT-4级别的对话问答训练

Cerebras发布的DocChat标志着基于文档的对话式问答系统的一个重大里程碑。Cerebras以其在机器学习（ML）和大型语言模型（LLMs）方面的深厚专业知识而闻名，推出了DocChat系列的两个新模型：CerebrasLlama3-DocChat和CerebrasDragon-DocChat。这些模型旨在提供高性能的对话式人工智能，特别是针对基于文档的问答任务，并利用Cerebras的尖

科技大本营·2024-08-27 00:00

大模型微调技术（Adapter-Tuning、Prefix-Tuning、Prompt-Tuning(P-Tuning)、P-Tuning v2、LoRA）_adapter微调 p tuning

2022年11月30日，ChatGPT发布至今，国内外不断涌现出了不少大模型，呈现“百模大战”的景象，比如ChatGLM-6B、LLAMA、Alpaca等模型及在此模型基础上进一步开发的特定领域的大模型

Cc不爱吃洋葱·2024-08-26 19:12

什么是LLM？看这一篇就够了！

GPT、LLaMA、M

AI程序猿人·2024-08-26 17:03

AI初识--LLM、ollama、llama都是些个啥？

LLM全称（largelanguagemodel）也就是大语言模型什么是Ollama，它与Llama是什么关系？

才艺のblog·2024-08-25 20:51

用 Unsloth 微调 LLaMA 3 8B

用Unsloth微调LLaMA38B今年4月份，Meta公司发布了功能强大的大型语言模型（LLM）Llama-3，为从事各种NLP任务的开发人员提供了功能强大可以在普通机器上运行的开源LLM。

liugddx·2024-08-25 08:05

使用LangChain和LLaMA2构建自然语言SQL查询助手

使用LangChain和LLaMA2构建自然语言SQL查询助手引言在当今数据驱动的世界中，能够轻松查询和分析数据库中的信息变得越来越重要。然而，并非所有人都精通SQL语言。

qq_37836323·2024-08-24 08:14

离线 AI：使用 Termux 从源代码在 Android 手机/Waydroid 上构建 Ollama

Android手机/WaydroidTermux的终端命令相同推荐文章《在自己笔记本上使用Llama-3生成PowerPoint—幻灯片自动化的第一步》权重1，本地类、ppt类《如何微调NLLB-200

知识大胖·2024-08-23 17:32

小琳AI课堂：Llama——NLP界的多面手

Llama:NLP界的多面手引言：大家好，这里是小琳AI课堂。今天，我们要探索的是自然语言处理（NLP）领域的一位明星——Llama。

小琳ai·2024-08-23 14:43

FastAPI部署大模型Llama 3.1

项目地址：self-llm/models/Llama3_1/01-Llama3_1-8B-InstructFastApi部署调用.mdatmaster·datawhalechina/self-llm(github.com

记得叫Mark周更·2024-08-23 14:12

transformers调用llama的方式

transformers调用llama的使用方式不同版本llama对应的transformers库版本llama2llama3Meta-Llama-3-8B-InstructMeta-Llama-3-8Bllama3.1Meta-Llama

myccver·2024-08-23 13:11

Llama开源代码详细解读（2）

FlashAttentionifis_flash_attn_available():#检查flashattention的可用性fromflash_attnimportflash_attn_func,flash_attn_varlen_funcfromflash_attn.bert_paddingimportindex_first_axis,pad_input,unpad_input#noqaFla

江安的猪猪·2024-08-23 04:45

LLM基础｜模型后量化原理、量化类型及方式、量化实现效果

xdm在尝试运行Llama-Chat-7B推理时的时候，是不是也容易遇到OOM的问题？

Sunny_AI_addict·2024-08-22 16:04

开源免费大语言模型（LLMs）排行榜

目录一、模型介绍1.1LLaMA(LargeLanguageModelMetaAI)1.2Falcon1.3Mistral1.4GPT-NeoX1.5Bloom1.6OPT(OpenPre-trainedTransformer

张3蜂·2024-08-21 22:37

llama.cpp 编译安装@Ubuntu

在Kylin和Ubuntu编译llama.cpp，具体参考：llama模型c语言推理@FreeBSD-CSDN博客现在代码并编译：gitclonehttps://github.com/ggerganov

skywalk8163·2024-03-29 12:47

大模型的学习 LLaMa和ChatGLM，minichatgpt4

LLaMa和ChatGLM，minichatgpt4什么情况用Bert模型，什么情况用LLaMA、ChatGLM类大模型，咋选？

贝猫说python·2024-03-27 07:55

3月18日，每日信息差

据介绍，该平台支持广泛的AI模型，包括目前主流的Baichuan-7B、GeminiNano、Llama2和智谱

信息差Pro·2024-03-25 09:26

VisionLLaMA: A Unified LLaMA Interface for Vision Tasks

VisionLLaMA:AUnifiedLLaMAInterfaceforVisionTasks相关链接：arxivgithub关键字：VisionLLaMA、visiontransformers、imagegeneration、imageclassification、semanticsegmentation摘要大型语言模型(LLMs)通常基于Transformer架构来处理文本输入。例如，LLa

liferecords·2024-03-06 21:47

千卡利用率超98%，详解JuiceFS在权威AI测试中的实现策略

虽然目前不支持大语言模型如GPT、LLaMA，但BERT与大语言模型同为多层transform

·2024-02-28 15:34

大模型量化技术原理-LLM.int8()、GPTQ

基于LLaMA-7B/Bloomz-7B1-mt复现开

吃果冻不吐果冻皮·2024-02-20 21:39

【眼科大模型】Ophtha-LLaMA2：视觉模型提取图像特征 + LLM基于特征生成眼底病变的诊断报告

Ophtha-LLaMA2：视觉模型提取图像特征+LLM基于特征生成眼底病变的诊断报告提出背景设计思路选择大模型基座生成诊断报告论文：https://arxiv.org/pdf/2312.04906.pdf

Debroon·2024-02-20 16:34

GPT在地学、GIS、气象、农业、生态、环境等领域中应用

GPT在地学、GIS、气象、农业、生态、环境等领域中应用一开启大模型1开启大模型1)大模型的发展历程与最新功能2)大模型的强大功能与应用场景3)国内外经典大模型（ChatGPT、LLaMA、Gemini

夏日恋雨·2024-02-20 14:37

如何用GPT进行数据处理？

夏日恋雨·2024-02-20 14:06

GPT在机器学习，深度学习等领域应用

详情点击公众号：技术科研吧链接：GPT在机器学习，深度学习等领域应用第一：2024年AI领域最新技术1.OpenAI新模型-GPT-52.谷歌新模型-GeminiUltra3.Meta新模型-LLama34

夏日恋雨·2024-02-20 14:02

使用go-llama.cpp 运行 yi-01-6b大模型，使用本地CPU运行，速度挺快的

1，视频地址2，关于llama.cpp项目https://github.com/ggerganov/llama.cppLaMA.cpp项目是开发者GeorgiGerganov基于Meta释出的LLaMA

fly-iot·2024-02-20 10:23

【论文笔记 · PFM】Lag-Llama: Towards Foundation Models for Time Series Forecasting

Lag-Llama:TowardsFoundationModelsforTimeSeriesForecasting摘要本文提出Lag-Llama，在大量时间序列数据上训练的通用单变量概率时间序列预测模型

lokol.·2024-02-20 08:49

Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试

在原论文《Lag-Llama:TowardsFoundationMo

deephub·2024-02-20 08:16

LLaMA 2 - 你所需要的一切资源

摘录关于LLaMA2的全部资源，如何去测试、训练并部署它。LLaMA2是一个由Meta开发的大型语言模型，是LLaMA1的继任者。

·2024-02-19 21:59

peft库编写逻辑分析

Peft库编写逻辑分析（以LLaMa+prefix为例）Peft库加载finetune模型分析Peft生成代码importtorchfrompeftimportPeftModelfromtransformersimport

瓶子好亮·2024-02-19 15:17

NotImplementedError: Cannot copy out of meta tensor； no data!

这个问题出现在我对llama-2-70b进行量化后，重新加载模型时出现的问题#错误信息new_value=value.to(device)NotImplementedError:Cannotcopyoutofmetatensor

瓶子好亮·2024-02-19 15:16

OpenAI ChatGPT-4开发笔记2024-08：windows本地环境下载Llama 2

Step1:AskforpermissiononMeta’swebsiteTobeabletodownloadthemodel,youfirstneedtoagreetosometermsandconditionsfromMeta.Youcangotothislink,thenpressDownloadthemodel,thenyouwillbetakentoaformwhereyouhaveto

aiXpert·2024-02-19 14:30

Windows11(非WSL)安装Installing llama-cpp-python with GPU Support

直接安装，只支持CPU。想支持GPU，麻烦一些。1.安装CUDAToolkit(NVIDIACUDAToolkit(availableathttps://developer.nvidia.com/cuda-downloads)2.安装如下物件：gitpythoncmakeVisualStudioCommunity(makesureyouinstallthiswiththefollowingsett

aiXpert·2024-02-19 14:30

Quantitative Analysis: PIM Chip Demands for LLAMA-7B inference

1Architecture如果将LLAMA-7B模型参数量化为4bit，则存储模型参数需要3.3GB。那么，至少PIMchip的存储至少要4GB。

简vae·2024-02-19 14:53

Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试

在原论文《Lag-Llama:TowardsFoundationMo

·2024-02-15 10:32

如何使用Hugging Face：对Transformer和pipelines的介绍

一、transformer介绍众所周知，transformer模型（如GPT-3、LLaMa和ChatGPT）已经彻底改变了人工智能领域。

第欧根尼的酒桶·2024-02-15 08:10

GPT用来润色论文\生成完整长篇论文\进行AI绘图，真的太香了！

慢腾腾的小蜗牛·2024-02-15 03:49

GPT/GPT4科研实践应用与AI绘图技术及论文高效写作

详情点击公众号：技术科研吧链接：GPT/GPT4科研实践应用与AI绘图技术及论文高效写作一：AI领域最新技术1.OpenAI新模型-GPT-52.谷歌新模型-GeminiUltra3.Meta新模型-LLama34

慢腾腾的小蜗牛·2024-02-15 03:48

扩展说明: 指令微调 Llama 2

这篇博客是一篇来自MetaAI，关于指令微调Llama2的扩展说明。旨在聚焦构建指令数据集，有了它，我们则可以使用自己的指令来微调Llama2基础模型。目标是构建一个能够基于输入内容来生成指令的模型。

·2024-02-13 21:53

超好用的AI提示词工具，再也不用烦恼怎样写好提示词了

同样，我在使用ChatGPT、Llama等大型语言模型的时候，为了获得更好的结果，prompt也需要按照一定的格式、给足背景和需求。

程序员_阿轩·2024-02-13 01:19

这次理解透彻了！用代码从零实现大模型的自注意力、多头注意力。。。

这篇文章将介绍Transformer架构以及GPT-4和Llama等大型语言模型（LLM）中使用的自注意力机制。自注意力等相关机

Python算法实战·2024-02-12 23:47

用code去探索理解Llama架构的简单又实用的方法

除了白月光我们也需要朱砂痣我最近也在反思，可能有时候算法和论文也不是每个读者都爱看，我也会在今后的文章中加点code或者debug模型的内容，也许还有一些好玩的应用demo，会提升这部分在文章类型中的比例今天带着大家通过代码角度看一下Llama

周博洋K·2024-02-12 13:54

揭秘 LLM 推理：全面解析 LLM 推理性能的关键因素

在短短一年时间内，涌现出了数以百计的LLM模型，包括开源模型如LLaMA、Mistral、Yi、Baichuan、Qwen，以及闭源模型如Claude、Gemini等。

lichunericli·2024-02-12 08:53

部署llama-2-chat-7B

部署llama-2-chat-7B模型时，遇到以下问题输入以下命令python3convert.py--outfile./models/llama-2-7b-chat..

qq_45719856·2024-02-12 03:22

Could not build wheels for llama-cpp-python, which is required to install pyproject.toml-based proj

安装llama-cpp-python包时，出现下述问题：Collectingllama-cpp-pythonUsingcachedllama_cpp_python-0.2.28.tar.gz(9.4MB

qq_45719856·2024-02-12 03:51

LLM之RAG实战（二十六）| 使用llamaindex-cli无需一行代码即可实现RAG

本文将介绍一个无需一行代码即可实现RAG的开源工具：llamaindex-cli，该工具是基于llama-index实现的，并采用默认向量数据库Chroma，因此首先需要进行如下安装：pipinstallllama-indexpipinstallchromadbStep1

wshzd·2024-02-11 06:32

正常网络可用，网页版+APP——科大讯飞星火认知大模型使用指南

近一年的大模型发生了巨大的发展，随着LLaMA开源，大模型的进展有了很大的飞跃。虽然国内大模型和GPT4之间还有一定差距，但是使用性方面还是方便很多。本文介绍的是科大讯飞星火认知大模型的使用。

大数据流动·2024-02-10 00:11

llama原始模型如何tokenize中文

加载分词器：tokenizer=AutoTokenizer.from_pretrained(model_name_or_path)model=LlamaForCausalLM.from_pretrained(model_name_or_path)如图所示：原理：print('强'.encode('utf-8'))print('终'.encode('utf-8'))输出：b'\xe5\xbc\xba

Takoony·2024-02-09 19:21

推荐频道

LLaMa

探索GGUF：利用llama.cpp高效运行大型语言模型

Code Llama: Open Foundation Models for Code论文阅读

基于华为昇腾910B和LLaMA Factory多卡微调的实战教程

Cerebras DocChat发布：基于Llama 3构建，DocChat在几小时内完成GPT-4级别的对话问答训练

大模型微调技术（Adapter-Tuning、Prefix-Tuning、Prompt-Tuning(P-Tuning)、P-Tuning v2、LoRA）_adapter微调 p tuning

什么是LLM？看这一篇就够了！

AI初识--LLM、ollama、llama都是些个啥？

用 Unsloth 微调 LLaMA 3 8B

使用LangChain和LLaMA2构建自然语言SQL查询助手

离线 AI：使用 Termux 从源代码在 Android 手机/Waydroid 上构建 Ollama

小琳AI课堂：Llama——NLP界的多面手

FastAPI部署大模型Llama 3.1

transformers调用llama的方式

Llama开源代码详细解读（2）

LLM基础｜模型后量化原理、量化类型及方式、量化实现效果

开源免费大语言模型（LLMs）排行榜

llama.cpp 编译安装@Ubuntu

大模型的学习 LLaMa和ChatGLM，minichatgpt4

3月18日，每日信息差

VisionLLaMA: A Unified LLaMA Interface for Vision Tasks

千卡利用率超98%，详解JuiceFS在权威AI测试中的实现策略

大模型量化技术原理-LLM.int8()、GPTQ

【眼科大模型】Ophtha-LLaMA2：视觉模型提取图像特征 + LLM基于特征生成眼底病变的诊断报告

GPT在地学、GIS、气象、农业、生态、环境等领域中应用

如何用GPT进行数据处理？

GPT在机器学习，深度学习等领域应用

使用go-llama.cpp 运行 yi-01-6b大模型，使用本地CPU运行，速度挺快的

【论文笔记 · PFM】Lag-Llama: Towards Foundation Models for Time Series Forecasting

Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试

LLaMA 2 - 你所需要的一切资源

peft库编写逻辑分析

NotImplementedError: Cannot copy out of meta tensor； no data!

OpenAI ChatGPT-4开发笔记2024-08：windows本地环境下载Llama 2

Windows11(非WSL)安装Installing llama-cpp-python with GPU Support

Quantitative Analysis: PIM Chip Demands for LLAMA-7B inference

Lag-Llama:第一个时间序列预测的开源基础模型介绍和性能测试

如何使用Hugging Face：对Transformer和pipelines的介绍

GPT用来润色论文\生成完整长篇论文\进行AI绘图，真的太香了！

GPT/GPT4科研实践应用与AI绘图技术及论文高效写作

最新ChatGPT/GPT4科研应用与AI绘图及论文高效写作

扩展说明: 指令微调 Llama 2

超好用的AI提示词工具，再也不用烦恼怎样写好提示词了

这次理解透彻了！用代码从零实现大模型的自注意力、多头注意力。。。

用code去探索理解Llama架构的简单又实用的方法

揭秘 LLM 推理：全面解析 LLM 推理性能的关键因素

部署llama-2-chat-7B

Could not build wheels for llama-cpp-python, which is required to install pyproject.toml-based proj

LLM之RAG实战（二十六）| 使用llamaindex-cli无需一行代码即可实现RAG

正常网络可用，网页版+APP——科大讯飞星火认知大模型使用指南

llama原始模型如何tokenize中文