E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
闻达LLM
详解各种
LLM
系列|(1)LLaMA 1 模型架构、预训练、部署优化特点总结
一、引言LLaMA是Meta在2023年2月发布的一系列从7B到65B参数的基础语言模型。LLaMA作为第一个向学术界开源的模型,在大模型爆发的时代具有标志性的意义。为了更深入地理解LLaMA的技术特点,特地在此整理了LLaMA1模型架构、预训练、部署优化特点。话不多说,我们仔细看看吧二、LLaMA简介论文:https://arxiv.org/abs/2302.13971Github:GitHub
Sunny_AI_addict
·
2023-12-24 01:31
各种LLM
llama
深度学习
人工智能
自然语言处理
nlp
transformer
【腾讯云HAI域探秘】10分钟速通腾讯HAI-高性能计算服务
在HA]中,根据应用智能匹配并推选出最适合的GPU算力资源,以确保您在数据科学、
LLM
、AI作画等高性能应用中获得最佳性价比此外,HAI的一键部署特性让您可以在短短几分钟内构
Niunainai023
·
2023-12-24 01:55
腾讯云
云计算
认识“DRESS”:通过自然语言反馈与人类协调和互动的大视觉语言模型 (LVLM)
这是通过巧妙地将大型语言模型(
LLM
)与大规模视觉指令微调融合来实现的。然而,LVLM只需要手工制作或
LLM
生成的数据集即可通过监督微调(SFT)进行对齐。
Mars_prime
·
2023-12-23 18:03
LVLM
语言模型
人工智能
自然语言处理
吴恩达RLHF课程笔记
1.创建偏好数据集一个prompt输入到
LLM
后可以有多个回答,对每个回答选择偏好比如{prompt,answer1,answer2,prefer1}2.根据这个数据集(偏好数据集),创建rewardmodel
鱼鱼9901
·
2023-12-23 14:56
nlp
笔记
python
自然语言处理
【无标题】
引言随着大型语言模型(
LLM
)在自然语言处理领域的日益重要,新型多语言多任务模型——TigerBot-70B的问世,标志着全球范围内一个新的技术里程碑的达成。
努力犯错
·
2023-12-23 12:47
人工智能
语言模型
自然语言处理
stable
diffusion
chatgpt
自然语言处理阅读第三弹
LLM
微调三种方法Prefix-Tuning/Prompt-Tuning:在模型的输入或隐层添加k个额外可训练的前缀tokens(这些前缀是连续的伪tokens,不对应真实的tokens),只训练这些前缀参数
u013308709
·
2023-12-23 10:17
自然语言处理
自然语言处理
人工智能
LLM
微调(四)| 微调Llama 2实现Text-to-SQL,并使用LlamaIndex在数据库上进行推理
Llama2是开源
LLM
发展的一个巨大里程碑。
wshzd
·
2023-12-23 09:57
ChatGPT
笔记
NLP
数据库
llama
sql
LLM
之RAG实战(六)| 高级RAG 02:选择最佳embedding和重排序模型
在构建检索增强生成(RAG)Pipeline时,一个关键组件是Retriever。我们有多种embedding模型可供选择,包括OpenAI、CohereAI和开源sentencetransformers。此外,CohereAI和sentencetransformers还提供了几个重排序器。但是,有了所有这些选项,我们如何确定最佳组合以获得一流的检索性能?我们如何知道哪种embedding模型最适
wshzd
·
2023-12-23 09:27
ChatGPT
笔记
embedding
LLM
之RAG实战(七)| 使用llama_index实现多模态RAG
一、多模态RAGOpenAI开发日上最令人兴奋的发布之一是GPT-4VAPI(https://platform.openai.com/docs/guides/vision)的发布。GPT-4V是一个多模态模型,可以接收文本/图像,并可以输出文本响应。最近还有一些其他的多模态模型:LLaVa和Fuyu-8B。在过去的一年里,大部分应用程序开发都是围绕文本输入/文本输出范式。最典型的例子之一是检索增强
wshzd
·
2023-12-23 09:27
ChatGPT
笔记
RAG
llama
AIGC
chatgpt
LLM
之RAG实战(八)| 使用Neo4j和LlamaIndex实现多模态RAG
一年前,没有人使用
LLM
来提高生产力。时至今日,很难想象我们大多数人或多或少都在使用
LLM
提供服务,从个人助手到文生图场景。由于大量的研究和兴趣,
LLM
每天都在变得越来越好、越来越聪明。
wshzd
·
2023-12-23 09:55
ChatGPT
笔记
neo4j
chatgpt
Q-star计划的更多细节
继续探讨点Q*相关的话题,这个应该是目前X和Reddit上比较火的话题了,其实就是关于Q*的方法是不是让
LLM
变得会产生意识,会产生自己的好恶和对人类的偏见,关于Q-star的一些介绍可以看我上一篇的扫盲帖
周博洋K
·
2023-12-23 09:31
深度学习
人工智能
AIGC
agi
JetBrains AI Assistant 最佳平替方案来了
JetBrainsAI服务采用不同的大型语言模型(
LLM
),并透明地使它们为您作为产品用户工作。它由OpenAI作为第一个第三方提供商和许多JetBrains的专有模型提供支持。
码农小旋风
·
2023-12-23 08:03
后端
利用ChatGPT分析数据的六种方法
ChatGPT是一款功能强大的工具,它是一种高级大语言模型(
LLM
),能够理解并进行类似人类的文本对话。虽然ChatGPT已被证明可以生成会话文本,但它对各行各业的人都大有助益。
c++服务器开发
·
2023-12-23 08:55
chatgpt
python
人工智能
论文阅读——llava
VisualInstructionTuningLLaVA指令智能体分为两类:端到端的,通过LangChain[1]/
LLM
[35]协调各种模型的系统。数据集生成用GPT辅助生成的,具体不写了。
じんじん
·
2023-12-23 06:39
论文
人工智能
大语言模型的三种主要架构 Decoder-Only、Encoder-Only、Encoder-Decoder
现代大型语言模型(
LLM
)的演变进化树,如下图:https://arxiv.org/pdf/2304.13712.pdf基于Transformer模型以非灰色显示:decoder-only模型在蓝色分支
Charles_yy
·
2023-12-23 06:35
LLM
大语言模型
LangChain 28 BabyAGI编写旧金山的天气预报
系列文章LangChain实现给动物取名字,LangChain2模块化prompttemplate并用streamlit生成网站实现给动物取名字LangChain3使用Agent访问Wikipedia和
llm
-math
AI架构师易筋
·
2023-12-23 04:08
LLM-Large
Language
Models
langchain
LLM
prompt
chatgpt
人工智能
LangChain 27 AI Agents角色扮演多轮对话解决问题CAMEL
系列文章LangChain实现给动物取名字,LangChain2模块化prompttemplate并用streamlit生成网站实现给动物取名字LangChain3使用Agent访问Wikipedia和
llm
-math
AI架构师易筋
·
2023-12-23 04:38
LLM-Large
Language
Models
人工智能
langchain
LLM
prompt
chatgpt
LangChain 29 调试Debugging 详细信息verbose
系列文章LangChain实现给动物取名字,LangChain2模块化prompttemplate并用streamlit生成网站实现给动物取名字LangChain3使用Agent访问Wikipedia和
llm
-math
AI架构师易筋
·
2023-12-23 04:36
LLM-Large
Language
Models
langchain
LLM
prompt
chatgpt
人工智能
Ubuntu 22.04 配置
LLM
大语言模型环境
本文介绍了清洁安装的UbuntuServer22.04LTS安装NVIDIA显卡驱动、CUDA12.1、cuDNN的方法及ChatGLM3、百川2、FastChat等大语言模型的部署使用方法。安装NVIDIA驱动禁用nouveausudovi/etc/modprobe.d/blacklist.conf尾部追加一行blacklistnouveau执行并重启系统sudoupdate-initramfs
flymyd
·
2023-12-23 01:24
ubuntu
linux
LLM
大语言模型
gpt
chatgpt
ChatGPT开源系列
目录进化树从GPT-4可以看出未来
LLM
的哪些趋势?未来的研发方向和优化策略是什么?
MIngo的成长
·
2023-12-23 01:16
chatgpt
深度学习
自然语言处理
LoRA模型原理
一、前言大语言模型(LargeLanguageModel,
LLM
)的出现,训练参数的级别直接跃迁到数十亿甚至数千亿,在模型微调、迁移学习小样本数据时,使用全量训练的成本是极大的。
zzZ_CMing
·
2023-12-22 16:35
AIGC
AIGC
2023年度AI盘点 AIGC|AGI|ChatGPT|人工智能大模型
文章目录前言01《ChatGPT驱动软件开发》02《ChatGPT原理与实战》03《神经网络与深度学习》《AIGC重塑教育》05《通用人工智能》
LLM
:LargeLanguageModel,即大语言模型
雪碧有白泡泡
·
2023-12-22 16:14
粉丝福利活动
人工智能
AIGC
agi
我用Streamlit+
LLM
(大型语言模型)轻松实现Web聊天
Streamlit是时下比较热门的一个基于Python的Web应用程序框架,它可以在几分钟内将数据转化为可共享的Web应用程序,无需前端开发经验,使用纯Python代码实现,简单且高效。ChatGPT是目前非常火的OpenAI公司开发的聊天机器人模型,它无所不知就像一本大百科全书,它可以帮你做很多繁杂的日常工作,比如可以代你写文章,代你做excel表格,甚至代你写代码。今天我们要将两者结合起来开发
-派神-
·
2023-12-22 14:22
chatgpt
streamlit
MoDS: Model-oriented Data Selection for Instruction Tuning
摘要:一些论文证明Instructiontuning证明只需要很少的数据集就可以实现与人类意图对齐,并且大模型
LLM
并不能从Instructiontuning中学到东西,仅仅是生成一些可靠的格式。
Re:fused
·
2023-12-22 14:51
人工智能
机器学习
[
LLM
]Streamlit+
LLM
(大型语言模型)创建实用且强大的Web聊天机器人
Streamlit和Streamlit_chatStreamlit是一个开源框架,使开发人员能够快速构建和共享用于机器学习和数据科学项目的交互式Web应用程序。它还提供了一系列小部件,只需要一行Python代码即可创建,例如st.table(…)。对于我们创建一个简单的用于私人使用的聊天机器人网站来说,Streamlit是一个非常合适的库,它还提供了第三方Streamlit_chat库,进一步方便
舒克与贝克
·
2023-12-22 14:19
语言模型
机器人
人工智能
基于亚马逊云科技Amazon SageMaker的多模态模型训练、推理及批量表征提取
背景随着大语言模型(
LLM
)的发展,视觉语言模型(VLM)的应用及落地也在越来越多的场景中被关注及提出。
ZAKER科技动态
·
2023-12-22 13:45
科技
人工智能
ChatGPT一周年:开源语言大模型的冲击
在获得这一成功之后,人们对
LLM
的兴趣不断增加,新的
LLM
在学术界和工业界不断涌现,其中包括许多专注于
LLM
的初创公司。
OneFlow深度学习框架
·
2023-12-22 13:46
前沿技术
chatgpt
LLM
语言模型
llama
开源
LLM
推理优化综述
1摘要自OpenAI发布ChatGPT以来,基于Transformer架构的大语言模型(
LLM
)在全球范围内引发了深度的技术关注,并取得了令人瞩目的成就。
Linux基金会AI&Data基金会
·
2023-12-22 10:08
vLLM 实战
引言随着人工智能技术的飞速发展,以及今年以来ChatGPT的爆火,大语言模型(LargeLanguageModel,
LLM
)受到越来越多的关注。
Linux基金会AI&Data基金会
·
2023-12-22 10:38
浅谈大模型生成测试用例
引言大语言模型(
LLM
)在自然语言处理中表现出了卓越的性能,包括问答、翻译、文本生成并且能够处理大规模数据集,并为通用人工智能开辟了新的可能性。
Linux基金会AI&Data基金会
·
2023-12-22 10:37
测试用例
10分钟创建AIGC应用,腾讯云推出高性能应用服务HAI
HAI能够提供即插即用的算力与常见环境,可帮助中小企业、开发者及个人用户快速部署语言模型(
LLM
)、AI作画、数据科学等高性能应用,原生集成配套的开发工具与组件,从而大幅提高应用
天府云创
·
2023-12-22 09:10
人工智能与AIGC
AIGC
腾讯云
云计算
应用服务HAI
深入探讨开源对话系统:IntelliQ的世界
这个项目旨在利用大型语言模型(
LLM
)构建一个多轮问答系统,不仅具备强大的意图识别和词槽填充(SlotFilling)技术,还在对话系统的理解深度和响应精确度上做出了显著提升。
gallonyin
·
2023-12-22 09:38
产品调研
开源项目
AI
语言模型
开源软件
谷歌推大语言模型VideoPoet:文本图片皆可生成视频和音频
GoogleResearch最近发布了一款名为VideoPoet的大型语言模型(
LLM
),旨在解决当前视频生成领域的挑战。该领域近年来涌现出许多视频生成模型,但在生成连贯的大运动时仍存在瓶颈。
智云研
·
2023-12-22 08:11
计算机视觉
人工智能
深度学习
2024 年 8 个顶级开源
LLM
(大语言模型)
如果没有所谓的大型语言模型(
LLM
),当前的生成式人工智能革命就不可能实现。
LLM
基于transformers(一种强大的神经架构)是用于建模和处理人类语言的AI系统。
yule.yang
·
2023-12-22 07:28
AI
开源
语言模型
人工智能
每个开发人员都应该知道的六个生成式 AI 框架和工具
1.LangChainLangChain由HarrisonChase开发并于2022年10月首次亮相,是一个开源平台,旨在构建由
LLM
驱动的强大应用程序,例如ChatGPT等聊天机器人和各种量身定制的应用程序
yule.yang
·
2023-12-22 07:28
AI
人工智能
LangChain,构建带有Milvus存储的问题分析任务
LangChain简述LangChain就是一个
LLM
编程框架,你想开发一个基于
LLM
应用,需要什么组件它都有,直接使用就行;甚至针对常规的应用流程,它利用链(LangChain中Chain的由来)这个概念已经内置标准化方案了
Dreammmming Time
·
2023-12-22 04:00
大语言模型
langchain
milvus
python
EmotionPrompt:对大语言模型 “动感情” 就能够提升表现
LLM
能否理解这种类型的智慧,并像我们一样加以利用呢?中科院软件所&微软&北师大的研究人员就是要发掘这一点。在他
叶庭云
·
2023-12-21 21:11
人工智能学习之路
人工智能
大语言模型
ChatGPT
EmotionPrompt
情感激励
突破边界:高性能计算引领
LLM
驶向通用人工智能AGI的创新纪元
AGI|AIGC|大模型训练|GH200
LLM
|LLMs|大语言模型|MI300ChatGPT的成功带动整个AIGC产业的发展,尤其是
LLM
(大型语言模型,大语言模型)、NLP、高性能计算和深度学习等领域
高性能服务器
·
2023-12-21 20:23
人工智能
agi
AIGC
什么是深度学习,多模态学习,迁移学习,
LLM
深度学习、多模态学习、迁移学习和大型语言模型(
LLM
)是人工智能和机器学习领域的重要概念,它们各自有着独特的定义和应用。
稻壳特筑
·
2023-12-21 17:38
深度学习
深度学习
学习
迁移学习
LLM
和搜索引擎是一样的吗?
像ChatGPT这样的AI大型语言模型(
LLM
)已经风靡全球,并被集成到工作流程、平台和软件中,以提高我们的效率和生产力。ChatGPT就像新弗兰克的红辣酱;人们用它来做任何事情。
网站优化知识宝典
·
2023-12-21 08:07
SEO
搜索引擎
人工智能
SEO
seo
Google
VIGC: Visual Instruction Generation and Correction---------VIGC:视觉指令生成和纠正
上海人工智能实验室Abstract视觉编码器和大语言模型(
LLM
)的集成推动了多模态大语言模型(MLLM)的最新进展。然而,视觉语言任务的高质量指令调整数据的稀缺仍然是一个挑战。
Mars_prime
·
2023-12-21 08:35
人工智能
LVLM幻觉
算法
深度学习
7.7亿参数,超越5400亿PaLM!UW谷歌提出「分步蒸馏」,只需80%训练数据|ACL 2023
LLM
不实用,小模型蒸馏才是「现实」的大模型应用路线,全面领先微调技术!土豪请无视。。。
语音之家
·
2023-12-21 07:03
palm
人工智能
深度学习
如何入门 GPT 并快速跟上当前的大语言模型
LLM
进展?
入门GPT首先说第一个问题:如何入门GPT模型?最直接的方式当然是去阅读官方的论文。GPT模型从2018年的GPT-1到现在的GPT-4已经迭代了好几个版本,通过官方团队发表的论文是最能准确理清其发展脉络的途径,其中包括GPT模型本身和一些介绍关键技术的文章,比如训练方法RLHF这些。下面列出一些主要的文章。第一手资料:论文GPT-1:language_understanding_paper.pd
xiaoduan2016
·
2023-12-21 05:18
ChatGPT
chatgpt
gpt
gpt-3
大模型
LLM
深入浅出、主打通俗易懂
AI(人工智能)是通过机器来模拟人类认识能力的一种科技能力。AI最核心的能力就是根据给定的输入做出判断或预测。对数据进行分析,从而总结得到研究对象的内在规律。一般通过使用适当的统计、机器学习、深度学习等方法,对收集的大量数据进行计算、分析、汇总和整理,以求最大化地开发数据价值,发挥数据作用。目前AI分两大模块,计算机视觉和自然语言处理1.计算机视觉应用场景:人脸识别、自动驾驶、车辆识别、医学影像、
SmallTenMr
·
2023-12-21 01:00
AI
人工智能
自然语言处理
【人工智能】
LLM
大模型的本质:一个超高阶函数(函数式编程思想,高阶函数),大模型的本质是有巨大数量的函数复合组成的超高阶函数
LLM
大模型的本质:一个超高阶函数(函数式编程思想,高阶函数),大模型的本质是有巨大数量的函数复合组成的超高阶函数。
禅与计算机程序设计艺术
·
2023-12-21 01:59
ChatGPT
大数据AI人工智能
LLM大模型落地实战指南
人工智能
机器学习
算法
大模型
函数
2023年度佳作:AIGC、AGI、GhatGPT、人工智能大语言模型的崛起与挑战
LLM
:LargeLanguageModel,即大语言模型,旨在理解和生成人类语言。
LLM
的特点是规模庞大,包含成
库库的里昂
·
2023-12-20 22:06
杂谈
人工智能
AIGC
agi
语言模型
自然语言处理
OpenAI官方的Prompt工程指南:你可以这么玩ChatGPT
随着ChatGPT、GPT-4等大型语言模型(
LLM
)的出现,提示工程(PromptEngineering)变得越来越重要。很多人将prompt视为
LLM
的咒语,其好坏直接影响模型输出的结果。
智云研
·
2023-12-20 18:49
prompt
chatgpt
人工智能
如何通过MT-Bench评估大模型
如何评估
LLM
在开放性问题的回答能力前面三篇博客中介绍了如何评估大模型,内容包括评估大模型时常用的指标,每个指标背后的含义,如何通过编写代码实现指标的收集。对于pass@k指标,还进行了专门的说明。
taoli-qiao
·
2023-12-20 18:43
LLM
人工智能
整理了上百个开源中文大语言模型,涵盖模型、应用、数据集、微调、部署、评测
自ChatGPT为代表的大语言模型(LargeLanguageModel,
LLM
)出现以后,由于其惊人的类通用人工智能(AGI)的能力,掀起了新一轮自然语言处理领域的研究和应用的浪潮。
Python算法实战
·
2023-12-20 17:53
大模型理论与实战
大模型
语言模型
人工智能
自然语言处理
大模型
算法
微调
langchain
PP-OCR与文心一言强强结合,无须训练,信息抽取精度超80%!
在大模型时代,
LLM
会带来怎样的帮助呢?近期,我们发布了一个融合了文心一言和PP-OCRv4的文档图像信息抽取神器——PP-ChatO
飞桨PaddlePaddle
·
2023-12-20 14:02
技术干货
ocr
文心一言
人工智能
上一页
20
21
22
23
24
25
26
27
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他