llama 第21页

使用KNN及tensorflow进行中文pdf关键词搜索，类似AutoGPT或ChatPDF实现原理

接上回，如何使用AI模型（如GPT、LLaMA），训练某一考试的教材、历年试题？

civilpy·2023-08-19 07:35

中文医学知识语言模型：BenTsao

介绍BenTsao：[原名：华驼(HuaTuo)]:基于中文医学知识的大语言模型指令微调本项目开源了经过中文医学指令精调/指令微调(Instruction-tuning)的大语言模型集，包括LLaMA、

A雄·2023-08-18 15:16

Sealos 国内集群正式上线，可一键运行 LLama2 中文版大模型！

2023年7月19日，MetaAI宣布开源旗下的LLama2大模型，Meta首席科学家、图灵奖得主YannLeCun在推特上表示Meta此举可能将改变大模型行业的竞争格局。

·2023-08-17 16:12

关于 Llama 2 的一切资源，我们都帮你整理好了

Llama2是一个由Meta开发的大型语言模型，是LLaMA1的继任者。Llama2可通过AWS、HuggingFace获取，并可以自由用于研究和商业用途。

·2023-08-17 14:05

LLaMA 2 - 最全资源汇总，你想要的都有

LLaMA2是Meta开发的大型语言模型，是LLaMA1的后继者。LLaMA2可通过AWS、HuggingFace等提供商免费用于研究和商业用途。

技术狂潮AI·2023-08-17 05:05

【AI实战】从零开始搭建中文 LLaMA-33B 语言模型 Chinese-LLaMA-Alpaca-33B

【AI实战】从零开始搭建中文LLaMA-33B语言模型Chinese-LLaMA-Alpaca-33B简介环境配置环境搭建依赖安装代码及模型权重拉取拉取Chinese-LLaMA-Alpaca拉取llama

szZack·2023-08-17 00:08

[论文] LIMA: Less Is More for Alignment

文章目录概要内容关键方法高质量样本获取模型评估方法结论思考Meta新模型LIMA，基于LLaMa-65B，精选1000个微调样本进行训练，对比GPT-4/Bard/DaVinci003，表现出强大的性能

晨阳2023·2023-08-17 00:08

[大模型] 搭建llama主流大模型训练环境

关键词：大模型，LLAMA，CUDA，模型训练1.基础环境OS：Ubuntu18.04GPU：4*A100(40G)(单机4卡A10040G)CUDA：11.7cuDNN：8.4.1(需要登录官网后下载

晨阳2023·2023-08-17 00:36

大语言模型之三 InstructGPT训练过程

2020年后全球互联网大厂、AI创业公司研发了不少AI超大模型（百亿甚至千亿参数），典型代表是NLP领域的GPT-3，LlaMA，视觉领域的DALL*E2，StableDiffusion以及V-MoE。

shichaog·2023-08-16 21:26

Dify 新增多模型支持，探索不同模型的无限可能

本次更新，让大家可以轻易使用上国内外知名的开源模型如：Llama2、ChatGLM、百川Baichua

·2023-08-16 19:44

Llama 2免费托管及API提供

Llama2是Meta最新的文本生成模型，目前其性能优于所有开源替代方案。

新缸中之脑·2023-08-16 18:59

摆脱 OpenAI 依赖，8 分钟教你用开源生态构建全栈 AI 应用

本文将应用理论于实践，给大家演示如何利用Milvus、Xinference、Llama2-70B开源模型和LangChain，构筑出一个全功能的问答系统。

·2023-08-16 18:57

Hugging News #0814: Llama 2 学习资源大汇总

重磅更新Llama2学习资源大汇总！Llama2是由Meta推出的新型开放式大型语言模型。我们很高兴能够将其全面集成入HuggingFace，并

Hugging Face·2023-08-16 08:15

开启想象翅膀：轻松实现文本生成模型的创作应用，支持LLaMA、ChatGLM、UDA、GPT2等模型，开箱即用

开启想象翅膀：轻松实现文本生成模型的创作应用，支持LLaMA、ChatGLM、UDA、GPT2等模型，开箱即用1.介绍TextGen实现了多种文本生成模型，包括：LLaMA、ChatGLM、UDA、GPT2

·2023-08-15 18:03

Hugging News #0724: Llama 2 登陆 Hugging Face、AI 开源游戏竞赛获奖选手公布！

每一周，我们的同事都会向社区的成员们发布一些关于HuggingFace相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「HuggingNews」。本期HuggingNews有哪些有趣的消息，快来看看吧！重点内容️道德与社会问题简报:文生图模型中的偏见最新一期的HuggingFace道德与社会“夏至”简报已经发布！这一简报对于道德与社会议题的关注

·2023-08-15 16:57

2023年的深度学习入门指南(18) - 将LLaMA2跑起来

2023年的深度学习入门指南(18)-将LLaMA2跑起来之前我们说到过，在GPT3之后，大模型就很少有开源的了。其中，最为典型的开源支持者就是Meta公司的研究团队。

Jtag特工·2023-08-15 11:26

部署lawyer-llama

Git-DownloadingPackageGit-DownloadingPackageGit-DownloadingPackage下载git，wget需要下载一下（GNUWget1.21.4forWindows），Windows中gitbash完全可以替代原生的cmd，但是对于gitbash会有一些Linux下广泛使用的命令的缺失，比如wget命令。在此，以安装wget命令为例，其他命令可以采用

小草cys·2023-08-15 11:55

通过 Amazon SageMaker JumpStart 部署 Llama 2 快速构建专属 LLM 应用

来自Meta的Llama2基础模型现已在AmazonSageMakerJumpStart中提供。

亚马逊云开发者·2023-08-15 03:58

LLM - Transformer && LLaMA2 结构分析与 LoRA 详解

Multi-Head-Attention◆ADD&Norm◆FeedForward◆Linear&Softmax2.不同LLM结构◆Encoder-Only◆Encoder-Decoder◆Decoder-Only3.LLaMA

BIT_666·2023-08-14 20:38

oobabooga-text-generation-webui可能是最好的语言模型启动器（包含手把手安装教程）

oobabooga-text-generation-webui是一个用于运行类似Chatglm、RWKV-Raven、Vicuna、MOSS、LLaMA、llama.cpp、GPT-J、Pythia、OPT

javastart·2023-08-14 12:03

NLP预训练汇总

NLP预训练汇总transformerElmoBertLlama2023-arxiv-LLaMA:OpenandEfficientFoundationLanguageModelsLLaMA源码解析

发呆的比目鱼·2023-08-14 11:13

使用代码下载开源的大模型文件示例以及中文微调llama资源汇总：

一、下载示例fromhuggingface_hubimportsnapshot_downloadrepo_id="THUDM/chatglm2-6b"local_dir='./chatglm2-6b/'cache_dir=local_dir+"/cache"whileTrue:try:snapshot_download(cache_dir=cache_dir,local_dir=local_dir

samoyan·2023-08-14 11:12

2023-arxiv-LLaMA: Open and Efficient Foundation Language Models

开放和高效的基础语言模型Paper：https://arxiv.org/abs/2302.13971Code:https://github.com/facebookresearch/llama摘要本文介绍了

发呆的比目鱼·2023-08-14 11:42

浅谈LLAMA2核心函数generate源码

在学习LLAMA2的generate源码之前，先介绍Temperature超参数及sample_top_p的原理。

余俊晖·2023-08-14 05:58

学术论文GPT源码解读：从chatpaper、chatwithpaper到gpt_academic

前言之前7月中旬，我曾在微博上说准备做“20个LLM大型项目的源码解读”针对这个事，目前的最新情况是已经做了的：LLaMA、Alpaca、ChatGLM-6B、deepspeedchat、transformer

v_JULY_v·2023-08-13 14:36

论文笔记--Llama 2: Open Foundation and Fine-Tuned Chat Models

论文笔记--Llama2:OpenFoundationandFine-TunedChatModels1.文章简介2.文章概括3文章重点技术3.1预训练Pretraining3.1.1预训练细节3.1.2Llama2

Isawany·2023-08-13 02:49

百度智能云：千帆大模型平台接入Llama 2等33个大模型，上线103个Prompt模板

今天给大家带来的是百度智能云：千帆大模型平台接入Llama2等33个大模型，上线103

herosunly·2023-08-12 15:08

开启想象翅膀：轻松实现文本生成模型的创作应用，支持LLaMA、ChatGLM、UDA、GPT2、Seq2Seq、BART、T5、SongNet等模型，开箱即用

开启想象翅膀：轻松实现文本生成模型的创作应用，支持LLaMA、ChatGLM、UDA、GPT2、Seq2Seq、BART、T5、SongNet等模型，开箱即用TextGen:ImplementationofTextGenerationmodels1

汀、人工智能·2023-08-12 14:00

LLaMA长度外推高性价比trick：线性插值法及相关改进源码阅读及相关记录

前言最近，开源了可商用的llama2，支持长度相比llama1的1024，拓展到了4096长度，然而，相比GPT-4、Claude-2等支持的长度，llama的长度外推显得尤为重要，本文记录了三种网络开源的

余俊晖·2023-08-11 06:12

Hugging Face 的文本生成和大语言模型的开源生态

[更新于2023年7月23日:添加Llama2。]文本生成和对话技术已经出现多年了。早期的挑战在于通过设置参数和分辨偏差，同时控制好文本忠实性和多样性。

Hugging Face·2023-08-11 06:34

GPT-4，Llama2，ChatGLM2，PaLM2共聚一堂 | LLM Day @KDD 2023

点击蓝字关注我们AITIME欢迎每一位AI爱好者的加入！以下内容来源于GLM大模型在过去半年中，以ChatGPT为代表的大规模语言模型（LLMs）彻底改变世界，人类与世界的交互逐渐进入到了一个新的阶段。然而，伴随着资本狂热之后的冷静，LLMs当前进展到了哪一步，以及接下来急迫需要解决哪些问题，这亟需学术界人士去细致分析。为此，在即将召开的ACMKDD2023会议上，由清华大学唐杰教授、东昱晓助理教

AITIME论道·2023-08-10 08:21

win10,win11 下部署Vicuna-7B，Vicuna-13B模型，gpu cpu运行

60GB或者28GB的显存如果没有上面的硬件配置请绕行了，我笔记本有64G内存，两个都跑跑看，使用python3.9，当时转换13b时一直崩溃后来发现是没有设定虚拟内存，后来加上了9个G，才可以跑起来下载llama

babytiger·2023-08-09 21:11

大模型训练的一些坑点和判断

在每一个独立环节里，冷启动的也是需要的，比如LLama2里面提到了一个SFT的bootstra

语音之家·2023-08-09 18:24

NLP（六十四）使用FastChat计算LLaMA-2模型的token长度

LLaMA-2模型部署在文章NLP（五十九）使用FastChat部署百川大模型中，笔者介绍了FastChat框架，以及如何使用FastChat来部署百川模型。

山阴少年·2023-08-09 10:37

一周 AIGC 丨苹果下架多款 AIGC 应用，阿里云开源通义千问 70 亿参数模型

百度智能云“千帆大模型平台”升级，接入LLaMA2等33个模型，成为国内拥有大模型最多的平台。图片来源：由无界AI生成01融资AI+网络安全公司“众智维科技”完成近亿元A轮融资据36

巴比特资讯·2023-08-09 07:23

CMU神秘token贡献ChatGPT安全措施|【2023-0802】【第八期】

一、大咖观点：本科毕业加入谷歌，还写了「思维链」开山之作，这位OpenAI新秀正为本科生答疑解惑开源的Llama2背后，有这些年轻华人的力量二、大模型评测：ChatGPT羊驼家族全沦陷！

linxid【智子纪元】·2023-08-08 16:07

大模型汇总（持续更新）

序号模型参数量发布机构模态是否开源1chatgpt1750亿OpenAI自然语言部分开源2GPT-4OpenAI自然语言，图像未开源3Bardgoogle自然语言未开源4LLaMA270/130/700

leo0308·2023-08-08 12:29

RLHF不是万金油！MIT哈佛等32人研究天团揭露最大弱点，囊括250+论文成果，挑战大模型机制

来源|新智元当前，不论是GPT-4，还是Llama2等大语言模型，背后的机制都是人类反馈强化学习（RLHF）。RLHF就像是大模型的「万金油」，能够指导智能体学习并提升性能。

夕小瑶·2023-08-08 11:15

Llama 2：开放基础和微调聊天模型

介绍大型语言模型(llm)作为高能力的人工智能助手，在复杂的推理任务中表现出色，这些任务需要广泛领域的专家知识，包括编程和创意写作等专业领域。它们可以通过直观的聊天界面与人类进行交互，这在公众中得到了迅速而广泛的采用。法学硕士的能力是显著的考虑到训练的表面上简单的性质方法。自回归变压器在广泛的自监督数据语料库上进行预训练，然后通过强化学习(ReinforcementLearningwithhuma

TD程序员·2023-08-08 10:02

Meta开源Llama 2免费大语言模型，媲美ChatGPT，可在线试玩

Llama2是Llama1模型的升级版本，引入了一系列预训练和微调LLM，参数量范围从7B到70B(7B、13B、70B)。

人工智能研究所·2023-08-08 03:41

GPT-4里套娃LLaMA 2！OpenAI创始成员周末爆改「羊驼宝宝」，GitHub一日千星

梦晨发自凹非寺量子位|公众号QbitAI大神仅花一个周末训练微型LLaMA2，并移植到C语言。推理代码只有500行，在苹果M1笔记本上做到每秒输出98个token。

QbitAl·2023-08-08 00:26

Llama 2 云端部署与API调用【AWS SageMaker】

Meta刚刚发布了Llama2大模型。如果你和我们一样，你一定会迫不及待地想要亲自动手并用它来构建。推荐：用NSDT设计器快速搭建可编程3D场景。

新缸中之脑·2023-08-07 19:22

AI一键生成短视频

stablediffution使用过成果展示技术要点环境要求：python:3.10.6GPU:显存最低8G文本处理文本语义分析采用清华大学开源的chatGLM2-6B,当然本地部署也可以使用Meta开源的Llama

MagicTangc·2023-08-07 19:46

中文版开源Llama 2同时有了语言、多模态大模型，完全可商用

7月19日，Meta终于发布了免费可商用版本Llama2，让开源大模型领域的格局发生了巨大变化。

语音之家·2023-08-07 19:45

大模型微调技术（Adapter-Tuning、Prefix-Tuning、Prompt-Tuning(P-Tuning)、P-Tuning v2、LoRA）

2022年11月30日，ChatGPT发布至今，国内外不断涌现出了不少大模型，呈现“百模大战”的景象，比如ChatGLM-6B、LLAMA、Alpaca等模型及在此模型基础上进一步开发的特定领域的大模型

渣渣崔·2023-08-07 14:27

Llama 2 with langchain项目详解（一）

Llama2withlangchain项目详解（一）2023年2月25日，美国Meta公司发布了Llama1开源大模型。

段智华·2023-08-07 09:56

Llama 2 with langchain项目详解（三）

Llama2withlangchain项目详解（三）17.3Llama2withlangchain基础本节讲解在LangChain中使用Llama2模型的基础知识，展示如何运行LangChain的代码，

段智华·2023-08-07 07:54

开源大模型详解

二、LLaMa2LLaMa2是Meta发布的开源大模型，是开源可商用的版本，有

Linux猿·2023-08-07 06:57

【AI实战】开源中文 llama2 来了，30 分钟搭建 130 亿参数大模型 Llama2-Chinese-13b-Chat

【AI实战】开源中文llama2来了，30分钟搭建130亿参数大模型Llama2-Chinese-13b-Chat简介环境配置环境搭建依赖安装代码及模型权重拉取拉取Llama2-Chinese拉取Llama2

szZack·2023-08-06 22:15

[踩坑记] CUDA环境下bitsandbytes安装报错/异常解决

关键词：模型量化，bitsandbytes，bitsandbytes报错，大模型环境，CUDA环境1.问题描述在部署大模型LLaMA的过程中，需要安装量化工具包bitsandbytes，环境如下：操作系统

晨阳2023·2023-08-06 11:19

推荐频道

llama