E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLaMa
Hugging Face 的文本生成和大语言模型的开源生态
[更新于2023年7月23日:添加
Llama
2。]文本生成和对话技术已经出现多年了。早期的挑战在于通过设置参数和分辨偏差,同时控制好文本忠实性和多样性。
Hugging Face
·
2023-08-11 06:34
语言模型
开源
人工智能
自然语言处理
GPT-4,
Llama
2,ChatGLM2,PaLM2共聚一堂 | LLM Day @KDD 2023
点击蓝字关注我们AITIME欢迎每一位AI爱好者的加入!以下内容来源于GLM大模型在过去半年中,以ChatGPT为代表的大规模语言模型(LLMs)彻底改变世界,人类与世界的交互逐渐进入到了一个新的阶段。然而,伴随着资本狂热之后的冷静,LLMs当前进展到了哪一步,以及接下来急迫需要解决哪些问题,这亟需学术界人士去细致分析。为此,在即将召开的ACMKDD2023会议上,由清华大学唐杰教授、东昱晓助理教
AITIME论道
·
2023-08-10 08:21
win10,win11 下部署Vicuna-7B,Vicuna-13B模型,gpu cpu运行
60GB或者28GB的显存如果没有上面的硬件配置请绕行了,我笔记本有64G内存,两个都跑跑看,使用python3.9,当时转换13b时一直崩溃后来发现是没有设定虚拟内存,后来加上了9个G,才可以跑起来下载
llama
babytiger
·
2023-08-09 21:11
git
大模型训练的一些坑点和判断
在每一个独立环节里,冷启动的也是需要的,比如
LLama
2里面提到了一个SFT的bootstra
语音之家
·
2023-08-09 18:24
智能语音
人工智能
NLP(六十四)使用FastChat计算
LLaMA
-2模型的token长度
LLaMA
-2模型部署 在文章NLP(五十九)使用FastChat部署百川大模型中,笔者介绍了FastChat框架,以及如何使用FastChat来部署百川模型。
山阴少年
·
2023-08-09 10:37
NLP
自然语言处理
人工智能
LLaMA-2
一周 AIGC 丨苹果下架多款 AIGC 应用,阿里云开源通义千问 70 亿参数模型
百度智能云“千帆大模型平台”升级,接入
LLaMA
2等33个模型,成为国内拥有大模型最多的平台。图片来源:由无界AI生成01融资AI+网络安全公司“众智维科技”完成近亿元A轮融资据36
巴比特资讯
·
2023-08-09 07:23
AIGC
阿里云
开源
云计算
CMU神秘token贡献ChatGPT安全措施|【2023-0802】【第八期】
一、大咖观点:本科毕业加入谷歌,还写了「思维链」开山之作,这位OpenAI新秀正为本科生答疑解惑开源的
Llama
2背后,有这些年轻华人的力量二、大模型评测:ChatGPT羊驼家族全沦陷!
linxid【智子纪元】
·
2023-08-08 16:07
chatgpt
大模型汇总(持续更新)
序号模型参数量发布机构模态是否开源1chatgpt1750亿OpenAI自然语言部分开源2GPT-4OpenAI自然语言,图像未开源3Bardgoogle自然语言未开源4
LLaMA
270/130/700
leo0308
·
2023-08-08 12:29
人工智能
语言模型
RLHF不是万金油!MIT哈佛等32人研究天团揭露最大弱点,囊括250+论文成果,挑战大模型机制
来源|新智元当前,不论是GPT-4,还是
Llama
2等大语言模型,背后的机制都是人类反馈强化学习(RLHF)。RLHF就像是大模型的「万金油」,能够指导智能体学习并提升性能。
夕小瑶
·
2023-08-08 11:15
人工智能
大模型
Llama
2:开放基础和微调聊天模型
介绍大型语言模型(llm)作为高能力的人工智能助手,在复杂的推理任务中表现出色,这些任务需要广泛领域的专家知识,包括编程和创意写作等专业领域。它们可以通过直观的聊天界面与人类进行交互,这在公众中得到了迅速而广泛的采用。法学硕士的能力是显著的考虑到训练的表面上简单的性质方法。自回归变压器在广泛的自监督数据语料库上进行预训练,然后通过强化学习(ReinforcementLearningwithhuma
TD程序员
·
2023-08-08 10:02
自然语言处理实战篇
llama
Meta开源
Llama
2免费大语言模型,媲美ChatGPT,可在线试玩
Llama
2是
Llama
1模型的升级版本,引入了一系列预训练和微调LLM,参数量范围从7B到70B(7B、13B、70B)。
人工智能研究所
·
2023-08-08 03:41
人工智能之NLP自然语言处理
llama
语言模型
chatgpt
transformer
GPT-4里套娃
LLaMA
2!OpenAI创始成员周末爆改「羊驼宝宝」,GitHub一日千星
梦晨发自凹非寺量子位|公众号QbitAI大神仅花一个周末训练微型
LLaMA
2,并移植到C语言。推理代码只有500行,在苹果M1笔记本上做到每秒输出98个token。
QbitAl
·
2023-08-08 00:26
llama
github
Llama
2 云端部署与API调用【AWS SageMaker】
Meta刚刚发布了
Llama
2大模型。如果你和我们一样,你一定会迫不及待地想要亲自动手并用它来构建。推荐:用NSDT设计器快速搭建可编程3D场景。
新缸中之脑
·
2023-08-07 19:22
llama
aws
云计算
AI一键生成短视频
stablediffution使用过成果展示技术要点环境要求:python:3.10.6GPU:显存最低8G文本处理文本语义分析采用清华大学开源的chatGLM2-6B,当然本地部署也可以使用Meta开源的
Llama
MagicTangc
·
2023-08-07 19:46
AI
人工智能
音视频
短视频
一键生成
中文版开源
Llama
2同时有了语言、多模态大模型,完全可商用
7月19日,Meta终于发布了免费可商用版本
Llama
2,让开源大模型领域的格局发生了巨大变化。
语音之家
·
2023-08-07 19:45
智能语音
人工智能
科技
语音识别
深度学习
AIGC
大模型微调技术(Adapter-Tuning、Prefix-Tuning、Prompt-Tuning(P-Tuning)、P-Tuning v2、LoRA)
2022年11月30日,ChatGPT发布至今,国内外不断涌现出了不少大模型,呈现“百模大战”的景象,比如ChatGLM-6B、
LLAMA
、Alpaca等模型及在此模型基础上进一步开发的特定领域的大模型
渣渣崔
·
2023-08-07 14:27
nlp
Llama
2 with langchain项目详解(一)
Llama
2withlangchain项目详解(一)2023年2月25日,美国Meta公司发布了
Llama
1开源大模型。
段智华
·
2023-08-07 09:56
ChatGPT学习
ChatGPT国内
LangChain
GPT-3
GPT-4
OpenAI
Llama
2 with langchain项目详解(三)
Llama
2withlangchain项目详解(三)17.3
Llama
2withlangchain基础本节讲解在LangChain中使用
Llama
2模型的基础知识,展示如何运行LangChain的代码,
段智华
·
2023-08-07 07:54
ChatGPT学习
ChatGPT国内
LangChain
OpenAI
GPT-3
GPT-4
开源大模型详解
二、
LLaMa
2
LLaMa
2是Meta发布的开源大模型,是开源可商用的版本,有
Linux猿
·
2023-08-07 06:57
大模型
-
AIGC
大模型
机器学习
AIGC
开源
OpenAI
【AI实战】开源中文
llama
2 来了,30 分钟搭建 130 亿参数大模型
Llama
2-Chinese-13b-Chat
【AI实战】开源中文
llama
2来了,30分钟搭建130亿参数大模型
Llama
2-Chinese-13b-Chat简介环境配置环境搭建依赖安装代码及模型权重拉取拉取
Llama
2-Chinese拉取
Llama
2
szZack
·
2023-08-06 22:15
大语言模型
开源中文
llama2
llama2
llama2-chinese
[踩坑记] CUDA环境下bitsandbytes安装报错/异常解决
关键词:模型量化,bitsandbytes,bitsandbytes报错,大模型环境,CUDA环境1.问题描述在部署大模型
LLaMA
的过程中,需要安装量化工具包bitsandbytes,环境如下:操作系统
晨阳2023
·
2023-08-06 11:19
人工智能
语言模型
深度学习
大模型训练时,使用bitsandbytes报错的解决方法
前言在对大语言模型(
LLaMa
、Chat-GLM等)进行微调时,考虑到减少显存占用,会使用如下方式加载模型。
Anycall201
·
2023-08-06 11:49
问题记录
Linux运维
语言模型
pytorch
深度学习
大模型使用——超算上部署
LLAMA
-2-70B-Chat
大模型使用——超算上部署
LLAMA
-2-70B-Chat前言1、本机为Inspiron5005,为64位,所用操作系统为Windos10。
Phunsukh_Wangdu
·
2023-08-06 09:36
语言模型
导出
LLaMA
等LLM模型为onnx
这篇博客(大模型
LLaMa
及周边项目(二)-知乎)进行了
llama
导出onnx的开创性的工作,但是依赖于侵入式修改transformers库,比较不方便。
Luchang-Li
·
2023-08-06 09:06
推理引擎
大模型
llama
人工智能
onnx
NLP实践——使用
Llama
-2进行中文对话
NLP实践——使用
Llama
-2进行中文对话1.前言2.利用prompt3.利用LogitProcessor3.1修改13.2修改23.3修改33.4修改41.前言在之前的博客NLP实践——
Llama
-
常鸿宇
·
2023-08-06 08:53
生成模型
实验记录
自然语言处理
自然语言处理
llama
人工智能
ChatGenTitle:使用百万arXiv论文信息在
LLaMA
模型上进行微调的论文题目生成模型
项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域):汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户更好利用CSDN平台,自主完成项目设计升级,提升自身的硬实力。专栏订阅:项目大全提升自身的硬实力[专栏详细介绍:项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的
汀、人工智能
·
2023-08-05 22:32
项目大全:提升自身的硬实力
llama
人工智能
自然语言处理
nlp
LLama
大语言模型
以
Llama
-2为例,在生成模型中使用自定义LogitsProcessor
以
Llama
-2为例,在生成模型中使用自定义LogitsProcessor1.前言2.场景介绍3.解决方法4.结语1.前言在上一篇文章以
Llama
-2为例,在生成模型中使用自定义StoppingCriteria
常鸿宇
·
2023-08-05 12:12
生成模型
自然语言处理
实验记录
llama
生成模型
NLP
以
Llama
-2为例,在生成模型中使用自定义StoppingCriteria
以
Llama
-2为例,在生成模型中使用自定义StoppingCriteria1.前言2.场景介绍3.解决方法4.结语1.前言在之前的文章中,介绍了使用transformers模块创建的模型,其generate
常鸿宇
·
2023-08-05 12:11
生成模型
自然语言处理
llama
生成模型
NLP
transformers
百度智能云“千帆大模型平台”最新升级:接入
Llama
2等33个模型!
今年3月,百度智能云推出“千帆大模型平台”。作为全球首个一站式的企业级大模型平台,千帆不但提供包括文心一言在内的大模型服务及第三方大模型服务,还提供大模型开发和应用的整套工具链,能够帮助企业解决大模型开发和应用过程中的所有问题。本次千帆大模型平台升级的目的是给企业、开发者提供更加灵活、多样化、高效的大模型服务,客户可选择最适合自身业务的大模型,再利用千帆大模型平台全套工具链进行模型再训练、指令微调
百度智能云
·
2023-08-05 12:04
百度
llama
人工智能
Together AI发布了
LLaMA
-2-7B-32K模型;全球客服中心加速拥抱对话式AI和虚拟助手
AI新闻OpenAI宣布安卓版ChatGPT在全球范围上线摘要:OpenAI宣布其安卓版ChatGPT已在所有支持的国家和地区上线,用户可通过该人工智能工具获取问题的答案、指导或建议,并完成各种任务。该版本从原来的四个国家扩展到16个国家和地区。ChatGPT的上线覆盖广泛,具有重要影响力和广泛公众兴趣,对话模型的创新性和应用价值催生了这一重要举措。它将极大地改变人们使用智能语言模型的方式。该新闻
go2coding
·
2023-08-05 11:31
AI日报
人工智能
llama
如何微调医疗大模型llm:
llama
2学习笔记
三个微调方向:简单医疗问答临床问答影像学一般流程:1数据集准备2模型基座选择3微调4案例拆解1数据集准备:两种类型,一种文本一种影像扩展,多模态2模型基座选择多模态处理所有视频,文本,数字人将会受到威胁,数字人赛道多模态处理将会对医疗领域有很大的促进多模态的架构整个影像大模型现阶段不太成熟,医疗领域的方案,各个医生的方案没有标准的方案,没有办法通用,不会被通用的大模型被替代掉。诊断虽然可能一样,但
stay_foolish12
·
2023-08-05 03:15
大模型
医疗
基于
Llama
2 和 OpenVINO™ 打造聊天机器人
点击蓝字关注我们,让开发变得更有趣作者|英特尔AI软件工程师杨亦诚指导|英特尔OpenVINO布道师武卓博士排版|李擎基于
Llama
2和OpenVINO™打造聊天机器人
Llama
2是Meta发布了其最新的大型语言模型
OpenVINO 中文社区
·
2023-08-04 23:43
openvino
机器人
人工智能
LangChain+ChatGLM整合
LLaMa
模型(二)
开源大模型语言LLaMaLLaMa模型GitHub地址添加
LLaMa
模型配置启用
LLaMa
模型LangChain+ChatGLM大模型应用落地实践(一)
LLaMa
模型GitHub地址gitlfsclonehttps
爱机车的程序猿
·
2023-08-04 08:29
AI
langchain
llama
ChatGLM
大模型
python
ChatGPT安全限制的新方案
更令人担忧的是,相同的提示也适用于ChatGPT、Claude、Bard和
LLaMA
-2这种闭源的优秀LLM。测试Claude2Claude2具有额外的安全过滤层。
heikeb
·
2023-08-04 06:23
chatgpt
安全
基于 Docker 的深度学习环境:Windows 篇
这几周总有不少好玩的开源模型和相关的应用组团出现,最近几篇文章发布后(尤其是
LLaMA
2)
soulteary
·
2023-08-03 14:28
为了不折腾而去折腾的那些事
docker
深度学习
windows
人工智能
SDXL
stable
diffusion
LLM -
LLama
模型读取报错 TypeError: not a string
一.引言读取
LLama
2模型时报错TypeError:notastring看异常栈是AutoTokenizer.from_pretrained时候的异常。
BIT_666
·
2023-08-03 12:24
LLM
llama
《探索文心千帆大模型平台: 代码编写从此变得轻松》
文章目录前言一、初识文心千帆1.1功能丰富1.2注册登录二、内置第三方大模型2.1ERNIE-Bot模型2.2ERNIE-Bot-turbo模型2.3BLOOMZ-7B模型2.4
Llama
模型全家桶2.5
袁袁袁袁满
·
2023-08-03 10:29
《极客日报》
人工智能
AIGC
chatgpt
大模型
深度学习
机器学习
数据挖掘
[玩转AIGC]如何训练
LLaMA
2(模型训练、推理、代码讲解,并附可直接运行的kaggle连接)
目录一、clone仓库二、数据集下载与处理1、数据集下载2、数据集标记化(耗时较长)三、修改配置四、开始训练五、模型推理六、train.py训练代码讲解1、导包2、定义模型训练参数与相关设置3、加载模型配置4、迭代生成数据5、模型初始化6、设置自动混合精度与优化函数7、损失评估与学习率获取8、日志保存初始化9、循环训练七、run.c推理代码讲解1、结构及内存管理2、模型初始化:读取checkpoi
六五酥
·
2023-08-02 17:34
玩转AIGC
AIGC
python
机器学习
人工智能
LLaMA
系列 |
LLaMA
和
LLaMA
-2精简总结
文章目录1、
LLaMA
1.1、模型结构1.2、训练方式1.3、结论2、
LLaMA
-22.1、相比
LLaMA
1的升级2.3、模型结构2.3.1、MHA,MQA,GQA区别与联系2.4、训练方式1、
LLaMA
#苦行僧
·
2023-08-02 12:01
#
LLaMA系列
llama
大模型
llm
自然语言处理
人工智能
深度学习
SentencePiece android ndk编译
LLaMa
等LLM语言模型一般使用SentencePiecetokenizer,在端侧部署需要编译和使用其c++版本。
Luchang-Li
·
2023-08-02 03:59
推理引擎
android
sentencepiece
llama
安卓
NDK
使用LLM插件从命令行访问
Llama
2
大家好,最近的一个大新闻是MetaAI推出了新的开源授权的大型语言模型
Llama
2,这是一项非常重要的进展。
python156
·
2023-08-02 03:33
llama
音视频技术开发周刊 | 304
更强的
Llama
2开源,可直接商用:一夜之间,大模型格局变了Meta终于发布了大家期待已久的免费可商用版本
Llama
2。
LiveVideoStack_
·
2023-08-02 01:43
聊聊拉长
LLaMA
的一些经验
比如文档问答、小说续写等当今开源LLM中的当红炸子鸡——
LLaMA
,第一版上下文长度是2048,第二版长度是4096。
CompHub
·
2023-08-01 13:49
llama
人工智能
chatgpt
算法
数据挖掘
Meta AI研究团队新AI模型:
Llama
2 大语言模型
Llama
是FacebookResearch团队开发的基础语言模型集,旨在提供广泛的语言理解能力。它基于转换器架构,参数范围从7B到65B。
源代码杀手
·
2023-08-01 08:31
AI技术快讯
人工智能
llama
语言模型
九、开源小语言模型之chatLLaMA
1、源起3月初,随着Meta的
LLaMA
模型被泄露,开源社区获得了首个真正具备
vandh
·
2023-08-01 08:22
AIGC与游戏引擎实战
语言模型
人工智能
自然语言处理
chatgpt
灵雀云Alauda MLOps 现已支持 Meta
LLaMA
2 全系列模型
为了帮助企业更好地应对上述挑战,灵雀云于近日宣布,企业可通过AlaudaMLOps(以下简称AML)使用由Meta开发的
LLaMA
2全系列模型。
灵雀云
·
2023-08-01 04:35
llama
【LLM系列之踩坑记】你训练的大模型生成长度真的变短了吗
最近在忙着对
LLama
做中文增强训练,结果中文词表扩充继续预训练以及指令数据有监督微调之后,与知识库、检索内容结合的时候发现了一些有意思的现象,也在群里大家简单交流过,那么接下来笔者结合一些训练经历分享一些经验之谈
致Great
·
2023-08-01 01:04
人工智能
LLaMA
:开放和高效的基础语言模型
Part1前言我们介绍了
LLaMA
,这是一个参数范围从7B到65B的基础语言模型集合。
系统免驱动
·
2023-07-31 15:38
llama
语言模型
人工智能
免费商用 Meta 发布开源大语言模型
Llama
2
Meta和微软深度合作,正式推出下一代开源大语言模型
Llama
2,并宣布免费提供给研究和商业使用。
ejinxian
·
2023-07-31 13:41
语言模型
llama
人工智能
中文
LLaMA
模型和指令精调的Alpaca大模型:中文数据进行二次预训练,进一步提升了中文基础语义理解能力
项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域):汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户更好利用CSDN平台,自主完成项目设计升级,提升自身的硬实力。专栏订阅:项目大全提升自身的硬实力[专栏详细介绍:项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的
汀、人工智能
·
2023-07-30 15:28
项目大全:提升自身的硬实力
llama
人工智能
自然语言处理
智能问答
LLM
Alpaca
大语言模型
上一页
13
14
15
16
17
18
19
20
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他