LLaMa 第17页

Hugging Face 的文本生成和大语言模型的开源生态

[更新于2023年7月23日:添加Llama2。]文本生成和对话技术已经出现多年了。早期的挑战在于通过设置参数和分辨偏差，同时控制好文本忠实性和多样性。

Hugging Face·2023-08-11 06:34

GPT-4，Llama2，ChatGLM2，PaLM2共聚一堂 | LLM Day @KDD 2023

点击蓝字关注我们AITIME欢迎每一位AI爱好者的加入！以下内容来源于GLM大模型在过去半年中，以ChatGPT为代表的大规模语言模型（LLMs）彻底改变世界，人类与世界的交互逐渐进入到了一个新的阶段。然而，伴随着资本狂热之后的冷静，LLMs当前进展到了哪一步，以及接下来急迫需要解决哪些问题，这亟需学术界人士去细致分析。为此，在即将召开的ACMKDD2023会议上，由清华大学唐杰教授、东昱晓助理教

AITIME论道·2023-08-10 08:21

win10,win11 下部署Vicuna-7B，Vicuna-13B模型，gpu cpu运行

60GB或者28GB的显存如果没有上面的硬件配置请绕行了，我笔记本有64G内存，两个都跑跑看，使用python3.9，当时转换13b时一直崩溃后来发现是没有设定虚拟内存，后来加上了9个G，才可以跑起来下载llama

babytiger·2023-08-09 21:11

大模型训练的一些坑点和判断

在每一个独立环节里，冷启动的也是需要的，比如LLama2里面提到了一个SFT的bootstra

语音之家·2023-08-09 18:24

NLP（六十四）使用FastChat计算LLaMA-2模型的token长度

LLaMA-2模型部署在文章NLP（五十九）使用FastChat部署百川大模型中，笔者介绍了FastChat框架，以及如何使用FastChat来部署百川模型。

山阴少年·2023-08-09 10:37

一周 AIGC 丨苹果下架多款 AIGC 应用，阿里云开源通义千问 70 亿参数模型

百度智能云“千帆大模型平台”升级，接入LLaMA2等33个模型，成为国内拥有大模型最多的平台。图片来源：由无界AI生成01融资AI+网络安全公司“众智维科技”完成近亿元A轮融资据36

巴比特资讯·2023-08-09 07:23

CMU神秘token贡献ChatGPT安全措施|【2023-0802】【第八期】

一、大咖观点：本科毕业加入谷歌，还写了「思维链」开山之作，这位OpenAI新秀正为本科生答疑解惑开源的Llama2背后，有这些年轻华人的力量二、大模型评测：ChatGPT羊驼家族全沦陷！

linxid【智子纪元】·2023-08-08 16:07

大模型汇总（持续更新）

序号模型参数量发布机构模态是否开源1chatgpt1750亿OpenAI自然语言部分开源2GPT-4OpenAI自然语言，图像未开源3Bardgoogle自然语言未开源4LLaMA270/130/700

leo0308·2023-08-08 12:29

RLHF不是万金油！MIT哈佛等32人研究天团揭露最大弱点，囊括250+论文成果，挑战大模型机制

来源|新智元当前，不论是GPT-4，还是Llama2等大语言模型，背后的机制都是人类反馈强化学习（RLHF）。RLHF就像是大模型的「万金油」，能够指导智能体学习并提升性能。

夕小瑶·2023-08-08 11:15

Llama 2：开放基础和微调聊天模型

介绍大型语言模型(llm)作为高能力的人工智能助手，在复杂的推理任务中表现出色，这些任务需要广泛领域的专家知识，包括编程和创意写作等专业领域。它们可以通过直观的聊天界面与人类进行交互，这在公众中得到了迅速而广泛的采用。法学硕士的能力是显著的考虑到训练的表面上简单的性质方法。自回归变压器在广泛的自监督数据语料库上进行预训练，然后通过强化学习(ReinforcementLearningwithhuma

TD程序员·2023-08-08 10:02

Meta开源Llama 2免费大语言模型，媲美ChatGPT，可在线试玩

Llama2是Llama1模型的升级版本，引入了一系列预训练和微调LLM，参数量范围从7B到70B(7B、13B、70B)。

人工智能研究所·2023-08-08 03:41

GPT-4里套娃LLaMA 2！OpenAI创始成员周末爆改「羊驼宝宝」，GitHub一日千星

梦晨发自凹非寺量子位|公众号QbitAI大神仅花一个周末训练微型LLaMA2，并移植到C语言。推理代码只有500行，在苹果M1笔记本上做到每秒输出98个token。

QbitAl·2023-08-08 00:26

Llama 2 云端部署与API调用【AWS SageMaker】

Meta刚刚发布了Llama2大模型。如果你和我们一样，你一定会迫不及待地想要亲自动手并用它来构建。推荐：用NSDT设计器快速搭建可编程3D场景。

新缸中之脑·2023-08-07 19:22

AI一键生成短视频

stablediffution使用过成果展示技术要点环境要求：python:3.10.6GPU:显存最低8G文本处理文本语义分析采用清华大学开源的chatGLM2-6B,当然本地部署也可以使用Meta开源的Llama

MagicTangc·2023-08-07 19:46

中文版开源Llama 2同时有了语言、多模态大模型，完全可商用

7月19日，Meta终于发布了免费可商用版本Llama2，让开源大模型领域的格局发生了巨大变化。

语音之家·2023-08-07 19:45

大模型微调技术（Adapter-Tuning、Prefix-Tuning、Prompt-Tuning(P-Tuning)、P-Tuning v2、LoRA）

2022年11月30日，ChatGPT发布至今，国内外不断涌现出了不少大模型，呈现“百模大战”的景象，比如ChatGLM-6B、LLAMA、Alpaca等模型及在此模型基础上进一步开发的特定领域的大模型

渣渣崔·2023-08-07 14:27

Llama 2 with langchain项目详解（一）

Llama2withlangchain项目详解（一）2023年2月25日，美国Meta公司发布了Llama1开源大模型。

段智华·2023-08-07 09:56

Llama 2 with langchain项目详解（三）

Llama2withlangchain项目详解（三）17.3Llama2withlangchain基础本节讲解在LangChain中使用Llama2模型的基础知识，展示如何运行LangChain的代码，

段智华·2023-08-07 07:54

开源大模型详解

二、LLaMa2LLaMa2是Meta发布的开源大模型，是开源可商用的版本，有

Linux猿·2023-08-07 06:57

【AI实战】开源中文 llama2 来了，30 分钟搭建 130 亿参数大模型 Llama2-Chinese-13b-Chat

【AI实战】开源中文llama2来了，30分钟搭建130亿参数大模型Llama2-Chinese-13b-Chat简介环境配置环境搭建依赖安装代码及模型权重拉取拉取Llama2-Chinese拉取Llama2

szZack·2023-08-06 22:15

[踩坑记] CUDA环境下bitsandbytes安装报错/异常解决

关键词：模型量化，bitsandbytes，bitsandbytes报错，大模型环境，CUDA环境1.问题描述在部署大模型LLaMA的过程中，需要安装量化工具包bitsandbytes，环境如下：操作系统

晨阳2023·2023-08-06 11:19

大模型训练时，使用bitsandbytes报错的解决方法

前言在对大语言模型(LLaMa、Chat-GLM等)进行微调时，考虑到减少显存占用，会使用如下方式加载模型。

Anycall201·2023-08-06 11:49

大模型使用——超算上部署LLAMA-2-70B-Chat

大模型使用——超算上部署LLAMA-2-70B-Chat前言1、本机为Inspiron5005，为64位，所用操作系统为Windos10。

Phunsukh_Wangdu·2023-08-06 09:36

导出LLaMA等LLM模型为onnx

这篇博客（大模型LLaMa及周边项目（二）-知乎）进行了llama导出onnx的开创性的工作，但是依赖于侵入式修改transformers库，比较不方便。

Luchang-Li·2023-08-06 09:06

NLP实践——使用Llama-2进行中文对话

NLP实践——使用Llama-2进行中文对话1.前言2.利用prompt3.利用LogitProcessor3.1修改13.2修改23.3修改33.4修改41.前言在之前的博客NLP实践——Llama-

常鸿宇·2023-08-06 08:53

ChatGenTitle：使用百万arXiv论文信息在LLaMA模型上进行微调的论文题目生成模型

项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）：汇总有意义的项目设计集合，助力新人快速实战掌握技能，助力用户更好利用CSDN平台，自主完成项目设计升级，提升自身的硬实力。专栏订阅：项目大全提升自身的硬实力[专栏详细介绍：项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的

汀、人工智能·2023-08-05 22:32

以Llama-2为例，在生成模型中使用自定义LogitsProcessor

以Llama-2为例，在生成模型中使用自定义LogitsProcessor1.前言2.场景介绍3.解决方法4.结语1.前言在上一篇文章以Llama-2为例，在生成模型中使用自定义StoppingCriteria

常鸿宇·2023-08-05 12:12

以Llama-2为例，在生成模型中使用自定义StoppingCriteria

以Llama-2为例，在生成模型中使用自定义StoppingCriteria1.前言2.场景介绍3.解决方法4.结语1.前言在之前的文章中，介绍了使用transformers模块创建的模型，其generate

常鸿宇·2023-08-05 12:11

百度智能云“千帆大模型平台”最新升级：接入Llama 2等33个模型！

今年3月，百度智能云推出“千帆大模型平台”。作为全球首个一站式的企业级大模型平台，千帆不但提供包括文心一言在内的大模型服务及第三方大模型服务，还提供大模型开发和应用的整套工具链，能够帮助企业解决大模型开发和应用过程中的所有问题。本次千帆大模型平台升级的目的是给企业、开发者提供更加灵活、多样化、高效的大模型服务，客户可选择最适合自身业务的大模型，再利用千帆大模型平台全套工具链进行模型再训练、指令微调

百度智能云·2023-08-05 12:04

Together AI发布了LLaMA-2-7B-32K模型；全球客服中心加速拥抱对话式AI和虚拟助手

AI新闻OpenAI宣布安卓版ChatGPT在全球范围上线摘要：OpenAI宣布其安卓版ChatGPT已在所有支持的国家和地区上线，用户可通过该人工智能工具获取问题的答案、指导或建议，并完成各种任务。该版本从原来的四个国家扩展到16个国家和地区。ChatGPT的上线覆盖广泛，具有重要影响力和广泛公众兴趣，对话模型的创新性和应用价值催生了这一重要举措。它将极大地改变人们使用智能语言模型的方式。该新闻

go2coding·2023-08-05 11:31

如何微调医疗大模型llm：llama2学习笔记

三个微调方向：简单医疗问答临床问答影像学一般流程：1数据集准备2模型基座选择3微调4案例拆解1数据集准备：两种类型，一种文本一种影像扩展，多模态2模型基座选择多模态处理所有视频，文本，数字人将会受到威胁，数字人赛道多模态处理将会对医疗领域有很大的促进多模态的架构整个影像大模型现阶段不太成熟，医疗领域的方案，各个医生的方案没有标准的方案，没有办法通用，不会被通用的大模型被替代掉。诊断虽然可能一样，但

stay_foolish12·2023-08-05 03:15

基于 Llama2 和 OpenVINO™ 打造聊天机器人

点击蓝字关注我们,让开发变得更有趣作者|英特尔AI软件工程师杨亦诚指导|英特尔OpenVINO布道师武卓博士排版|李擎基于Llama2和OpenVINO™打造聊天机器人Llama2是Meta发布了其最新的大型语言模型

OpenVINO 中文社区·2023-08-04 23:43

LangChain+ChatGLM整合LLaMa模型（二）

开源大模型语言LLaMaLLaMa模型GitHub地址添加LLaMa模型配置启用LLaMa模型LangChain+ChatGLM大模型应用落地实践（一）LLaMa模型GitHub地址gitlfsclonehttps

爱机车的程序猿·2023-08-04 08:29

ChatGPT安全限制的新方案

更令人担忧的是，相同的提示也适用于ChatGPT、Claude、Bard和LLaMA-2这种闭源的优秀LLM。测试Claude2Claude2具有额外的安全过滤层。

heikeb·2023-08-04 06:23

基于 Docker 的深度学习环境：Windows 篇

soulteary·2023-08-03 14:28

LLM - LLama 模型读取报错 TypeError: not a string

一.引言读取LLama2模型时报错TypeError:notastring看异常栈是AutoTokenizer.from_pretrained时候的异常。

BIT_666·2023-08-03 12:24

《探索文心千帆大模型平台：代码编写从此变得轻松》

文章目录前言一、初识文心千帆1.1功能丰富1.2注册登录二、内置第三方大模型2.1ERNIE-Bot模型2.2ERNIE-Bot-turbo模型2.3BLOOMZ-7B模型2.4Llama模型全家桶2.5

袁袁袁袁满·2023-08-03 10:29

[玩转AIGC]如何训练LLaMA2（模型训练、推理、代码讲解，并附可直接运行的kaggle连接）

目录一、clone仓库二、数据集下载与处理1、数据集下载2、数据集标记化（耗时较长）三、修改配置四、开始训练五、模型推理六、train.py训练代码讲解1、导包2、定义模型训练参数与相关设置3、加载模型配置4、迭代生成数据5、模型初始化6、设置自动混合精度与优化函数7、损失评估与学习率获取8、日志保存初始化9、循环训练七、run.c推理代码讲解1、结构及内存管理2、模型初始化：读取checkpoi

六五酥·2023-08-02 17:34

LLaMA系列 | LLaMA和LLaMA-2精简总结

文章目录1、LLaMA1.1、模型结构1.2、训练方式1.3、结论2、LLaMA-22.1、相比LLaMA1的升级2.3、模型结构2.3.1、MHA,MQA,GQA区别与联系2.4、训练方式1、LLaMA

#苦行僧·2023-08-02 12:01

SentencePiece android ndk编译

LLaMa等LLM语言模型一般使用SentencePiecetokenizer，在端侧部署需要编译和使用其c++版本。

Luchang-Li·2023-08-02 03:59

使用LLM插件从命令行访问Llama 2

大家好，最近的一个大新闻是MetaAI推出了新的开源授权的大型语言模型Llama2，这是一项非常重要的进展。

python156·2023-08-02 03:33

音视频技术开发周刊 | 304

更强的Llama2开源，可直接商用：一夜之间，大模型格局变了Meta终于发布了大家期待已久的免费可商用版本Llama2。

LiveVideoStack_·2023-08-02 01:43

聊聊拉长LLaMA的一些经验

比如文档问答、小说续写等当今开源LLM中的当红炸子鸡——LLaMA，第一版上下文长度是2048，第二版长度是4096。

CompHub·2023-08-01 13:49

Meta AI研究团队新AI模型： Llama 2 大语言模型

Llama是FacebookResearch团队开发的基础语言模型集，旨在提供广泛的语言理解能力。它基于转换器架构，参数范围从7B到65B。

源代码杀手·2023-08-01 08:31

九、开源小语言模型之chatLLaMA

1、源起3月初，随着Meta的LLaMA模型被泄露，开源社区获得了首个真正具备

vandh·2023-08-01 08:22

灵雀云Alauda MLOps 现已支持 Meta LLaMA 2 全系列模型

为了帮助企业更好地应对上述挑战，灵雀云于近日宣布，企业可通过AlaudaMLOps（以下简称AML）使用由Meta开发的LLaMA2全系列模型。

灵雀云·2023-08-01 04:35

【LLM系列之踩坑记】你训练的大模型生成长度真的变短了吗

最近在忙着对LLama做中文增强训练，结果中文词表扩充继续预训练以及指令数据有监督微调之后，与知识库、检索内容结合的时候发现了一些有意思的现象，也在群里大家简单交流过，那么接下来笔者结合一些训练经历分享一些经验之谈

致Great·2023-08-01 01:04

LLaMA：开放和高效的基础语言模型

Part1前言我们介绍了LLaMA，这是一个参数范围从7B到65B的基础语言模型集合。

系统免驱动·2023-07-31 15:38

免费商用 Meta 发布开源大语言模型 Llama 2

Meta和微软深度合作，正式推出下一代开源大语言模型Llama2，并宣布免费提供给研究和商业使用。

ejinxian·2023-07-31 13:41

中文LLaMA模型和指令精调的Alpaca大模型：中文数据进行二次预训练，进一步提升了中文基础语义理解能力