llama2 第4页

大语言模型之十二 SentencePiece扩充LLama2中文词汇

大语言模型的发展潜力已经毋庸置疑了，如何让中文大语言模型更适合中小公司使用这是一道难题。在模型的选择上我们倾向于选择国外的LLama或者BLoom之类的，而不是百川之类的中文大模型，原因在于从基建到框架到数据国外的开源资料非常多，比如HuggingfaceTransformer、微软的DeepSpeed、meta的LLama、Pytorch，Google的colab、TensorFlow、BERT

shichaog·2023-09-28 07:50

一文读懂Llama 2（从原理到实战）

简介Llama2，是MetaAI正式发布的最新一代开源大模型。Llama2训练所用的token翻了一倍至2万亿，同时对于使用大模型最重要的上下文长度限制，Llama2也翻了一倍。

music score·2023-09-28 06:54

LLaMA Efficient Tuning 主流大模型的高效工具【预训练+指令监督微调】

LLaMAEfficientTuning的简介2023年6月发布的LLaMAEfficientTuning，它是一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM2/LLaMA2/

张志翔的博客·2023-09-26 19:59

性能超越Llama2等同等尺寸模型

9月25日，阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用。Qwen-14B在多个权威评测中超越同等规模模型，部分指标甚至接近Llama2-70B。阿里云此前开源了70亿参数模型Qwen-7B等，一个多月下载量破100万，成为开源社区的口碑之作。Qwen-14B是一款支持多种语言的高性能开源模型，相比同类模型使用了更多的高质量数据，整体训练数据

CSDN云计算·2023-09-26 05:38

700亿参数Llama 2训练加速195%！数据成为其提升效果的关键要素

Llama2是MetaAI正式发布的最新一代开源大模型，达到了2万亿的token。精调Chat模型是在100万人类标注数据上训练。

景联文科技·2023-09-24 02:55

英伟达 nvidia 官方code llama在线使用

该模型是基于Llama2研发的，为开放模型中的佼佼者，其性能达到了行业领先水平。模型特点与亮点CodeLlama系列提供多种型号，以满足不同应用的需求。

三块钱0794·2023-09-23 11:47

LLM系列 | 19 : Llama 2实战(上篇)-本地部署(附代码)

今天这篇关于Llama2的小作文其实比较长，所以分为上下两篇，上篇主要介绍Llama2的基本情况和基于官方模型实测Llama2在中英上的效果，包括单轮和多轮对话。

JasonLiu1919·2023-09-23 00:53

LLM系列 | 20 : Llama2 实战(下篇)-中文语料微调(附完整代码)

简介紧接前文：万字长文细说ChatGPT的前世今生Llama2实战(上篇):本地部署(附代码)上篇主要介绍Llama2的基本情况和基于官方模型实测Llama2在中英上的效果，包括单轮和多轮对话。

JasonLiu1919·2023-09-23 00:49

碾压Llama2！微软13亿参数phi-1.5，单个A100训练，刷新SOTA

微软推出了一个全新预训练模型phi-1.5，共有13亿参数，能做QA问答、聊天和写代码等等。模型越大，能力越强吗？然而，事实并非如此。近日，微软研究人员推出了一个模型phi-1.5，仅有13亿参数。论文地址：https://arxiv.org/pdf/2309.05463.pdf具体来说，在常识推理、语言技能，phi-1.5表现与其他模型相当。同时在多步推理上，远远超过其他大模型。phi-1.5展

语音之家·2023-09-22 00:54

ChatGLM 实践指南

如今ChatGLM2-6b、LLama2等越来越多强大的开源模型的出现，成本和安全性越来越可控，私有知识库也就逐渐变得可落地。再加上看到阿里云

张志翔的博客·2023-09-21 13:48

使用QLoRA对Llama 2进行微调的详细笔记

使用QLoRA对Llama2进行微调是我们常用的一个方法，但是在微调时会遇到各种各样的问题，所以在本文中，将尝试以详细注释的方式给出一些常见问题的答案。

·2023-09-21 12:44

太强了开源的AI工具APP，AIdea -支持 AI聊天、协作、图片生成

一款集成了主流大语言模型以及绘图模型的APP，采用Flutter开发，代码完全开源，支持以下功能：支持GPT-3.5/4问答聊天支持国产模型：通义千问，文心一言、讯飞星火、商汤日日新支持开源模型：Llama2

AI 研习所·2023-09-21 12:33

论文阅读_大语言模型_Llama2

英文名称:Llama2:OpenFoundationandFine-TunedChatModels中文名称:Llama2：开源的基础模型和微调的聊天模型文章:http://arxiv.org/abs/2307.09288

xieyan0811·2023-09-21 10:57

MHA、MQA、GQA区别和联系

TFATS·2023-09-21 00:53

LLM微调（一）| 单GPU使用QLoRA微调Llama 2.0实战

最近LLaMA2在LLaMA1的基础上做了很多优化，比如上下文从2048扩展到4096，使用了Grouped-QueryAttention（GQA）共享多头注意力的key和value矩阵，具体可以参考：

wshzd·2023-09-20 20:30

[NLP] LLM---＜训练中文LLama2(三)＞对LLama2进行中文预料预训练

预训练预训练部分可以为两个阶段：第一阶段：冻结transformer参数，仅训练embedding，在尽量不干扰原模型的情况下适配新增的中文词向量。第二阶段：使用LoRA技术，为模型添加LoRA权重（adapter），训练embedding的同时也更新LoRA参数。第一阶段预训练由于第一阶段预训练会冻结transformer参数，仅训练embedding模型，因此，收敛速度较慢，如果不是有特别充裕

舒克与贝克·2023-09-19 14:55

大语言模型之十-Byte Pair Encoding

Tokenizer诸如GPT-3/4以及LlaMA/LlaMA2大语言模型都采用了token的作为模型的输入输出，其输入是文本，然后将文本转为token（正整数），然后从一串token（对应于文本）预测下一个

shichaog·2023-09-18 04:57

[NLP] LLM---＜训练中文LLama2(五)＞对SFT后的LLama2进行DPO训练

当前关于LLM的共识大型语言模型（LLM）使NLP中微调模型的过程变得更加复杂。最初，当ChatGPT等模型首次出现时，最主要的方法是先训练奖励模型，然后优化LLM策略。从人类反馈中强化学习（RLHF）极大地推动了NLP的发展，并将NLP中许多长期面临的挑战抛在了一边。基于人类反馈的强化学习(ReinforcementLearningfromHumanFeedback，RLHF)事实上已成为GPT

舒克与贝克·2023-09-17 15:37

[NLP] LLM---＜训练中文LLama2(四)方式一＞对LLama2进行SFT微调

指令精调指令精调阶段的任务形式基本与StanfordAlpaca相同。训练方案也采用了LoRA进行高效精调，并进一步增加了可训练参数数量。在prompt设计上，精调以及预测时采用的都是原版StanfordAlpaca不带input的模版。对于包含input字段的数据，采用f"{instruction}+\n+{input}"的形式进行拼接。其中，StanfordAlpaca格式如下所示：[{"in

舒克与贝克·2023-09-17 10:34

[NLP] LLM---＜训练中文LLama2(一)＞训练一个中文LLama2的步骤

一数据集【Awesome-Chinese-LLM中文数据集】【awesome-instruction-dataset】【awesome-instruction-datasets】【LLaMA-Efficient-Tuning-数据集】Wiki中文百科（25w词条）wikipedia-cn-20230720-filteredBaiduBaiKe（563w词条）百度网盘提取码:bwvbMedicalD

舒克与贝克·2023-09-17 10:09

打造生产级Llama大模型服务

对于任何想要尝试人工智能或本地LLM，又不想因为意外的云账单或API费用而感到震惊的人，我可以告诉你我自己的旅程是如何的，以及如何开始使用廉价的消费级硬件执行Llama2推理。

新缸中之脑·2023-09-16 11:30

本地部署CodeLlama +GTX1080显卡对接open-interpreter对接wxbot（一）

CodeLlama"是一个大型代码语言模型的系列，基于"Llama2"构建，为编程任务提供了无监督指导能力，并在开放模型中

三块钱0794·2023-09-15 13:24

常用与业务密切相关的prompt

可以在Bard、Bing、Claude2、ChatGPT和Llama2上使用定义您的业务目的和愿景。提示：“我正在[插入行业]创业。我的重点是定义与我的受众产生共鸣的明确目标和愿景。

赵孝正·2023-09-15 08:57

常用与业务密切相关的prompt

可以在Bard、Bing、Claude2、ChatGPT和Llama2上使用定义您的业务目的和愿景。提示：“我正在[插入行业]创业。我的重点是定义与我的受众产生共鸣的明确目标和愿景。

赵孝正·2023-09-15 08:22

巴比特 | 元宇宙每日必读：Meta 正开发全新大模型，比肩GPT-4；天猫申请大模型商标...

Meta的目标是，其新的人工智能模型将比两个月前发布的名为Llama2的模型强大数倍。计划中的系统将帮助其他公司构建能够生成复杂文本、分析和其他输出结果的服务。

巴比特资讯·2023-09-12 18:23

Code Llama: Open Foundation Models for Code

CodeLlama：代码的开放基础模型摘要1引言2CodeLlama：专业化Llama2用于代码3结果4负责任的人工智能与安全5相关工作6讨论摘要我们发布了CodeLlama，这是一个基于Llama2的大型代码语言模型系列

UnknownBody·2023-09-11 20:13

Try llama2 in NUC (by quqi99)

quqi99·2023-09-11 01:12

Baichuan2开源大模型正式发布，王小川：性能超过LLaMA2

大数据产业创新服务媒体——聚焦数据·改变商业ChatGPT火爆出圈之后，社交巨头Meta奋力追赶，分别在3月、7月发布开源的LLaMA、LLaMA2大模型，引领一场大模型开源运动。

数据猿·2023-09-10 05:26

【精华】AIGC专栏-Text/Img/Video/audio

LeeZhao@·2023-09-09 22:27

Llama 2 论文《Llama 2: Open Foundation and Fine-Tuned Chat Models》阅读笔记

文章目录Llama2:OpenFoundationandFine-TunedChatModels1.简介2.预训练2.1预训练数据2.2训练详情2.3LLAMA2预训练模型评估3.微调3.1supervisedFine-Tuning

chencjiajy·2023-09-09 19:50

[NLP]LLM--使用LLama2进行离线推理

一模型下载二模型推理本文基于Chinese-LLaMA-Alpaca-2项目代码介绍，使用原生的llama2-hf克隆好了Chinese-LLaMA-Alpaca-2项目之后，基于GPU的部署非常简单。下载完成以后的模型参数(HuggingFace格式)如下：简单说明一下各个文件的作用文件名称示例说明config.json{"architectures":["LlamaForCausalLM"],

舒克与贝克·2023-09-09 07:55

[NLP]LLM---FineTune自己的Llama2模型

一数据集准备Let’stalkabitabouttheparameterswecantunehere.First,wewanttoloadallama-2-7b-hfmodelandtrainitonthemlabonne/guanaco-llama2-1k(1,000samples),whichwillproduceourfine-tunedmodelllama-2-7b-miniguanaco

舒克与贝克·2023-09-09 06:38

IDEFICS 简介: 最先进视觉语言模型的开源复现

引言CodeLlama是为代码类任务而生的一组最先进的、开放的Llama2模型，我们很高兴能将其集成入HuggingFace生态系统！CodeLlama使用与Llama2相同的社区许可证，且可商用。

·2023-09-09 00:31

基于llama2 微调的python 代码解释器

https://github.com/SeungyounShin/Llama2-Code-Interpreter

君臣Andy·2023-09-08 09:59

Code Llama：Llama 2 学会写代码了！

引言CodeLlama是为代码类任务而生的一组最先进的、开放的Llama2模型，我们很高兴能将其集成入HuggingFace生态系统！CodeLlama使用与Llama2相同的社区许可证，且可商用。

·2023-09-07 21:07

Meta推出Code Llama：编程的未来已来

今天，Meta推出了一项前沿技术——CodeLlama，这是一款基于Llama2构建的大型语言模型（LLM），专门用于生成和讨论代码。这一创新技术的发布标志着编程领域的新时代。

dotNET跨平台·2023-09-07 20:20

官方的Code Llama开源：免费商用，神秘版本接近GPT-4

作为Llama2的代码专用版本，CodeLlama基于特定的代码数据集在其上进一步微调

数据派THU·2023-09-07 20:20

如何让 Llama2、通义千问开源大语言模型快速跑在函数计算上？

:::info本文是“在Serverless平台上构建AIGC应用”系列文章的第一篇文章。:::前言随着ChatGPT以及StableDiffusion,Midjourney这些新生代AIGC应用的兴起，围绕AIGC应用的相关开发变得越来越广泛，有呈井喷之势，从长远看这波应用的爆发不仅仅是停留在形式之上，更是在各个领域产生实际的生产力价值，比如办公领域有copilotsystem365,钉钉智能；

Serverless 社区·2023-09-07 06:12

如何让 Llama2、通义千问开源大语言模型快速跑在函数计算上？

本文是“在Serverless平台上构建AIGC应用”系列文章的第一篇文章。前言随着ChatGPT以及StableDiffusion,Midjourney这些新生代AIGC应用的兴起，围绕AIGC应用的相关开发变得越来越广泛，有呈井喷之势，从长远看这波应用的爆发不仅仅是停留在形式之上，更是在各个领域产生实际的生产力价值，比如办公领域有copilotsystem365,钉钉智能；代码编程领域有git

·2023-09-06 18:33

Notebook 一站式打包“Llama-2-7B chatbot”与“Llama-2-7B-with agent”

Llama-2模型7月18日，Meta与微软联手发布了免费、可直接商用的LLM模型——Llama2。Facebook人工智能研究院首席

·2023-09-05 16:59

微调llama2模型教程：创建自己的Python代码生成器

所以本文将重点展示如何定制自己的llama2，进行快速训练，以完成特定任务。

·2023-09-04 23:09

揭秘最领先的Llama2中文大模型！

导语国内最大的开源社区：Llama中文社区率先完成了国内首个真正意义上的中文版Llama2-13B大模型，从模型底层实现了Llama2中文能力的大幅优化和提升。

PaperWeekly·2023-09-04 23:14

当大模型不是问题时，如何应对 LLM 的工程化落地挑战？

现今，我们可以看到LLaMA2、CodeLLaMA2等模型在不断刷新这种可能性。而在模型不是问题之后，作为架构师、开发人员，我们应该致力于：将LLM以工程化的方式落地。于

Phodal·2023-09-04 10:43

【LLM模型篇】LLaMA2 | Vicuna | EcomGPT等（更新中）

文章目录一、Basemodelchatglm2模型Vicuna模型LLaMA2模型1.训练细节2.EvaluationResults3.更多参考alpaca模型其他大模型和peft高效参数微调二、垂直领域大模型

山顶夕景·2023-09-03 18:27

Windows10上使用llama-recipes(LoRA)来对llama-2-7b做fine-tune

刚刚在Windows10上搭建环境来对llama2做finetune，里面坑还是挺多的，这里把印象中的坑整理了一下以作备忘。

lhf2112·2023-09-03 04:24

将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！

Llama2是Facebook母公司Meta发布的开源可商用大模型，国内的开源社区以及个人和机构也纷纷着手基于Llama2构建了中文版，并且还利用GGML机器学习张量库构建了可以在CPU上运行的Llama2

米开朗基杨·2023-08-31 11:32

AI聊天机器人平台Poe发布更新；自然语言理解课程概要

AI新闻AI聊天机器人平台Poe发布更新突破功能限制增加企业级服务摘要：知名问答网站Quora旗下的AI聊天机器人平台Poe发布了一系列更新，包括推出Mac应用、支持同时进行多个对话、接入Meta的Llama2

go2coding·2023-08-31 07:26

CCF CED 2023——1024中国工程师文化日启动！

今年7月，Meta发布了免费可商用的Llama2大语言模型，更是给这个领域注入了

QbitAl·2023-08-30 14:11

波士顿大学「鸭嘴兽-70B」登顶Hugging Face大模型排行榜！高效数据集+独特LoRA微调是关键

和现在抱脸开源榜单上大部分的模型一样，鸭嘴兽是来自波士顿大学的研究人员基于Llama2微调而来。同时，鸭嘴兽的进步就像之前所有的开

夕小瑶·2023-08-30 01:43

机器学习算法示例的收集；MetaAI编码工具Code Llama；“天工AI搜索”首发实测

AI新闻Meta推出新一代AI编码工具CodeLlama，助力程序员提高开发效率摘要：Meta推出CodeLlama，这是一个基于Llama2语言模型打造的AI编码工具，能够生成新的代码并调试人类编写的工作

go2coding·2023-08-28 17:09

推荐频道

llama2

大语言模型之十二 SentencePiece扩充LLama2中文词汇

一文读懂Llama 2（从原理到实战）

LLaMA Efficient Tuning 主流大模型的高效工具【预训练+指令监督微调】

性能超越Llama2等同等尺寸模型

700亿参数Llama 2训练加速195%！数据成为其提升效果的关键要素

英伟达 nvidia 官方code llama在线使用

LLM系列 | 19 : Llama 2实战(上篇)-本地部署(附代码)

LLM系列 | 20 : Llama2 实战(下篇)-中文语料微调(附完整代码)

碾压Llama2！微软13亿参数phi-1.5，单个A100训练，刷新SOTA

ChatGLM 实践指南

使用QLoRA对Llama 2进行微调的详细笔记

太强了开源的AI工具APP，AIdea -支持 AI聊天、协作、图片生成

论文阅读_大语言模型_Llama2

MHA、MQA、GQA区别和联系

LLM微调（一）| 单GPU使用QLoRA微调Llama 2.0实战

[NLP] LLM---＜训练中文LLama2(三)＞对LLama2进行中文预料预训练

大语言模型之十-Byte Pair Encoding

[NLP] LLM---＜训练中文LLama2(五)＞对SFT后的LLama2进行DPO训练

[NLP] LLM---＜训练中文LLama2(四)方式一＞对LLama2进行SFT微调

[NLP] LLM---＜训练中文LLama2(一)＞训练一个中文LLama2的步骤

打造生产级Llama大模型服务

本地部署CodeLlama +GTX1080显卡 对接open-interpreter对接wxbot（一）

常用与业务密切相关的prompt

常用与业务密切相关的prompt

巴比特 | 元宇宙每日必读：Meta 正开发全新大模型，比肩GPT-4；天猫申请大模型商标...

Code Llama: Open Foundation Models for Code

Try llama2 in NUC (by quqi99)

Baichuan2开源大模型正式发布，王小川：性能超过LLaMA2

【精华】AIGC专栏-Text/Img/Video/audio

Llama 2 论文《Llama 2: Open Foundation and Fine-Tuned Chat Models》阅读笔记

[NLP]LLM--使用LLama2进行离线推理

[NLP]LLM---FineTune自己的Llama2模型

IDEFICS 简介: 最先进视觉语言模型的开源复现

基于llama2 微调 的python 代码解释器

Code Llama：Llama 2 学会写代码了！

Meta推出Code Llama：编程的未来已来

官方的Code Llama开源：免费商用，神秘版本接近GPT-4

如何让 Llama2、通义千问开源大语言模型快速跑在函数计算上？

如何让 Llama2、通义千问开源大语言模型快速跑在函数计算上？

Notebook 一站式打包“Llama-2-7B chatbot”与“Llama-2-7B-with agent”

微调llama2模型教程：创建自己的Python代码生成器

揭秘最领先的Llama2中文大模型！

当大模型不是问题时，如何应对 LLM 的工程化落地挑战？

【LLM模型篇】LLaMA2 | Vicuna | EcomGPT等（更新中）

Windows10上使用llama-recipes(LoRA)来对llama-2-7b做fine-tune

将 Llama2 中文模型接入 FastGPT，再将 FastGPT 接入任意 GPT 套壳应用，真刺激！

AI聊天机器人平台Poe发布更新；自然语言理解课程概要

CCF CED 2023——1024中国工程师文化日启动！

波士顿大学「鸭嘴兽-70B」登顶Hugging Face大模型排行榜！高效数据集+独特LoRA微调是关键

机器学习算法示例的收集；MetaAI编码工具Code Llama；“天工AI搜索”首发实测

本地部署CodeLlama +GTX1080显卡对接open-interpreter对接wxbot（一）

基于llama2 微调的python 代码解释器