E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
闻达LLM
VIGC: Visual Instruction Generation and Correction---------VIGC:视觉指令生成和纠正
上海人工智能实验室Abstract视觉编码器和大语言模型(
LLM
)的集成推动了多模态大语言模型(MLLM)的最新进展。然而,视觉语言任务的高质量指令调整数据的稀缺仍然是一个挑战。
Mars_prime
·
2023-12-21 08:35
人工智能
LVLM幻觉
算法
深度学习
7.7亿参数,超越5400亿PaLM!UW谷歌提出「分步蒸馏」,只需80%训练数据|ACL 2023
LLM
不实用,小模型蒸馏才是「现实」的大模型应用路线,全面领先微调技术!土豪请无视。。。
语音之家
·
2023-12-21 07:03
palm
人工智能
深度学习
如何入门 GPT 并快速跟上当前的大语言模型
LLM
进展?
入门GPT首先说第一个问题:如何入门GPT模型?最直接的方式当然是去阅读官方的论文。GPT模型从2018年的GPT-1到现在的GPT-4已经迭代了好几个版本,通过官方团队发表的论文是最能准确理清其发展脉络的途径,其中包括GPT模型本身和一些介绍关键技术的文章,比如训练方法RLHF这些。下面列出一些主要的文章。第一手资料:论文GPT-1:language_understanding_paper.pd
xiaoduan2016
·
2023-12-21 05:18
ChatGPT
chatgpt
gpt
gpt-3
大模型
LLM
深入浅出、主打通俗易懂
AI(人工智能)是通过机器来模拟人类认识能力的一种科技能力。AI最核心的能力就是根据给定的输入做出判断或预测。对数据进行分析,从而总结得到研究对象的内在规律。一般通过使用适当的统计、机器学习、深度学习等方法,对收集的大量数据进行计算、分析、汇总和整理,以求最大化地开发数据价值,发挥数据作用。目前AI分两大模块,计算机视觉和自然语言处理1.计算机视觉应用场景:人脸识别、自动驾驶、车辆识别、医学影像、
SmallTenMr
·
2023-12-21 01:00
AI
人工智能
自然语言处理
【人工智能】
LLM
大模型的本质:一个超高阶函数(函数式编程思想,高阶函数),大模型的本质是有巨大数量的函数复合组成的超高阶函数
LLM
大模型的本质:一个超高阶函数(函数式编程思想,高阶函数),大模型的本质是有巨大数量的函数复合组成的超高阶函数。
禅与计算机程序设计艺术
·
2023-12-21 01:59
ChatGPT
大数据AI人工智能
LLM大模型落地实战指南
人工智能
机器学习
算法
大模型
函数
2023年度佳作:AIGC、AGI、GhatGPT、人工智能大语言模型的崛起与挑战
LLM
:LargeLanguageModel,即大语言模型,旨在理解和生成人类语言。
LLM
的特点是规模庞大,包含成
库库的里昂
·
2023-12-20 22:06
杂谈
人工智能
AIGC
agi
语言模型
自然语言处理
OpenAI官方的Prompt工程指南:你可以这么玩ChatGPT
随着ChatGPT、GPT-4等大型语言模型(
LLM
)的出现,提示工程(PromptEngineering)变得越来越重要。很多人将prompt视为
LLM
的咒语,其好坏直接影响模型输出的结果。
智云研
·
2023-12-20 18:49
prompt
chatgpt
人工智能
如何通过MT-Bench评估大模型
如何评估
LLM
在开放性问题的回答能力前面三篇博客中介绍了如何评估大模型,内容包括评估大模型时常用的指标,每个指标背后的含义,如何通过编写代码实现指标的收集。对于pass@k指标,还进行了专门的说明。
taoli-qiao
·
2023-12-20 18:43
LLM
人工智能
整理了上百个开源中文大语言模型,涵盖模型、应用、数据集、微调、部署、评测
自ChatGPT为代表的大语言模型(LargeLanguageModel,
LLM
)出现以后,由于其惊人的类通用人工智能(AGI)的能力,掀起了新一轮自然语言处理领域的研究和应用的浪潮。
Python算法实战
·
2023-12-20 17:53
大模型理论与实战
大模型
语言模型
人工智能
自然语言处理
大模型
算法
微调
langchain
PP-OCR与文心一言强强结合,无须训练,信息抽取精度超80%!
在大模型时代,
LLM
会带来怎样的帮助呢?近期,我们发布了一个融合了文心一言和PP-OCRv4的文档图像信息抽取神器——PP-ChatO
飞桨PaddlePaddle
·
2023-12-20 14:02
技术干货
ocr
文心一言
人工智能
20倍压缩比!微软提出大模型提示压缩框架LLMLingua
近期,越来越多研究在探索大型语言模型(
LLM
)在实际应用中的推理和生成能力。随着ChatGPT等模型的广泛研究与应用,如何在保留关键信息的同时,压缩较长的提示成为当前大模型研究的问题之一。
夕小瑶
·
2023-12-20 13:45
人工智能
OpenAI发布AGI安全风险框架!董事会可随时叫停GPT-5等模型发布,奥特曼也得乖乖听话
前有OpenAI安全系统(SafetySystems)负责人长文梳理针对
LLM
的对抗攻击类型与防御方法,后有IlyaSutskever领衔的“超级对齐”团队(Superalignment)发布论
夕小瑶
·
2023-12-20 13:45
agi
安全
gpt
国货之光,复旦发布大模型训练效率工具 CoLLiE,效率显著提升
在这个信息爆炸的时代,大型语言模型(
LLM
)成为理解和挖掘文本信息的重要工具。为了更好地适应各种应用场景,对
LLM
进行定制化训练变得至关重要。
夕小瑶
·
2023-12-20 13:14
人工智能
复旦团队提出思维交流框架EoT,由CoT到EoT,可跨模型通信,表现更出色
大型语言模型(
LLM
)通过利用庞大的训练语料和强大的计算资源,在众多NLP任务中表现卓越。然而,在理解和进行推理方面,这些模型仍显得相对薄弱,仅依靠增加模型的大小无法解决这一问题。
夕小瑶
·
2023-12-20 13:44
人工智能
【机器阅读理解】System Report for CCL23-Eval Task 9: HUST1037 Explore Proper Prompt Strategy for
LLM
in MRC
通过使用ChatGLM、GPT3.5和GPT4进行实验,我们发现提示语和
LLM
阅读理解能力之间存在相关性,提示语工程提高了每种模型的阅读理解能力。我们团队提交了系统评估结果,在三项指标和总分中均
辰阳星宇
·
2023-12-20 07:54
科研论文
prompt
策略模式
HuatuoGPT模型介绍
文章目录HuatuoGPT模型介绍
LLM
4Med(医疗大模型)的作用ChatGPT存在的问题HuatuoGPT的特点ChatGPT与真实医生的区别解决方案用于SFT阶段的混合数据基于AI反馈的RL评估单轮问答多轮问答人工评估
dzysunshine
·
2023-12-20 07:25
ChatGPT
chatgpt
基于
LLM
+场景识别+词槽实体抽取实现多轮问答
前言随着人工智能技术的不断进步,大语言模型(
LLM
)已成为技术前沿的热点。它们不仅能够理解和生成文本,还能在多种应用场景中实现复杂的交互。
gallonyin
·
2023-12-19 21:30
开源项目
AI
产品笔记
语言模型
智能问答
大模型(
LLM
)+词槽(slot)构建动态场景多轮对话系统
近年来,随着大型语言模型(
LLM
)的进步,构建能够理解和响应各种用户需求的聊天机器人变得更加可行和强大。本文将介绍我们最新的开源项目——一个基于
LLM
和词槽(slot)方法的动态场景多轮对话系统。
gallonyin
·
2023-12-19 21:28
产品笔记
AI
开源项目
人工智能
ai
OpenAI 官方的 Prompt 工程指南:你可以这么玩ChatGPT
写好prompt已经成为
LLM
的一项必修课。随着ChatGPT、GPT-4等大型语言模型(
LLM
)的出现,提示工程(PromptEngineering)变得越来越重要。
Python算法实战
·
2023-12-19 17:03
大模型理论与实战
大模型
prompt
chatgpt
大模型
知识库
人工智能
语言模型
pytorch
大语言模型(
LLM
)与 Jupyter 连接起来了!
现在,大语言模型(
LLM
)与Jupyter连接起来了!这主要归功于一个名叫JupyterAI的项目,它是官方支持的ProjectJupyter子项目。
Python算法实战
·
2023-12-19 17:03
大模型理论与实战
大模型
语言模型
jupyter
人工智能
chatgpt
大模型
TimeGPT:时序预测领域终于迎来了第一个大模型
大型语言模型(
llm
)最近在ChatGPT等应用程序中变得非常流行,因为它们可以适应各种各样的任务,而无需进一步的训练。这就引出了一个问题:时间序列的基础模型能像自然语言处理那样存在吗?
Python算法实战
·
2023-12-19 17:02
大模型
大模型理论与实战
时间序列
大模型
算法
自然语言处理
人工智能
RAG(检索增强生成)技术
1.基本概念检索增强
LLM
(RetrievalAugmentedLLM),简单来说,就是给
LLM
提供外部数据库,对于用户问题(Query),通过一些信息检索(InformationRetrieval,IR
IT斜杆青年
·
2023-12-19 15:18
LLMs
llama
chatgpt
MetaGPT使用总结
前言MetaGPT是基于ChatGPT的一个AIAgent应用,这个应用将
LLM
组成一个软件开发公司,并在公司中设置了老板、产品经理、架构师、项目经理、研发工程师、测试工程师等角色。
金闪闪_Li
·
2023-12-19 10:48
AI
Agent
agi
LLM
Agent发展演进历史(观看metagpt视频笔记)
LLM
相关的6篇重要的论文,其中4篇来自谷歌,2篇来自openai。
峰峰jack
·
2023-12-19 10:46
AIGC
Metagpt
笔记
MetaGPT-Agent相关代码分析
Agent参考资料:智能体入门|MetaGPT组成Agent=
LLM
+Observation+Thought+Action+Memory-大语言模型(
LLM
):
LLM
作为智能体的“大脑”部分,使其能够处理信息
6000lt
·
2023-12-19 10:15
6000的机器学习笔记
AIGC
人工智能
语言模型
情感香槟——御姐 MetaGPT版本项目代码分析
meta给我的感觉很像langchain对
llm
的感觉,开发友好工具丰富!也请大家多多体验!(源百度项目:https://aistudio.baidu.com/projectdetail/720310
王多头发
·
2023-12-19 10:15
python
agent
llm
gpt
metaGPT
MetaGPT实现多智能体通信,智能体也能轻松狼人杀
ExploringLargeLanguageModelsforCommunicationGames:AnEmpiricalStudyonWerewolf》(以下简称“论文”)为题的论文中,展示了大型语言模型(
LLM
DeepWisdom
·
2023-12-19 10:44
MetaGPT
GPT
GitHub
人工智能
游戏程序
机器学习
github
深度学习
Compositional Chain-of-Thought Prompting for Large Multimodal Models大型多模态模型的组合思想链提示
Abstract强大的视觉主干和大型语言模型(
LLM
)推理的结合使大型多模态模型(LMM)成为各种视觉和语言(VL)任务的当前标准。
Mars_prime
·
2023-12-19 08:04
大模型幻觉
人工智能
算法
机器学习
LVLM幻觉
Multimodal Chain-of-Thought Reasoning in Language Models语言模型中的多模态思维链推理
Abstract大型语言模型(
LLM
)通过利用思维链(CoT)提示生成中间推理链作为推断答案的基本原理,在复杂推理方面表现出了令人印象深刻的性能。然而,现有的CoT研究主要集中在语言情态上。
Mars_prime
·
2023-12-19 08:31
大模型幻觉
语言模型
人工智能
机器学习
Can
LLM
-Generated Misinformation Be Detected?
CanLLM-GeneratedMisinformationBeDetected?Tags:Hallucination,LLMAuthors:CanyuChen,KaiShuCreatedDate:December8,202310:12AMFinishedDate:2023/12/11Status:Finishedorganization:IllinoisInstituteofTechnology
HMTT
·
2023-12-19 06:01
论文随笔
chatgpt
LongLoRA 介绍
本文将介绍一篇关于使用局部注意力来微调长上下文
LLM
的文章。文章的要点如下:提出了一种新的局部注意力机制,称为ShiftShortAttention,它可以有效地减少
LLM
处理长上下文所需的计算量。
步子哥
·
2023-12-19 02:27
人工智能
神经网络
深度学习
【
LLM
】Prompt Engineering
PromptEngineeringCoTCoT-SCToTGoTCoT:Chain-of-Thought通过这样链式的思考,Model输出的结果会更准确CoT-SC:Self-ConsistencyImprovesChainofThoughtReasoninginLanguageModels往往,我们会使用Greedydecode这样的策略,每次在概率最大的几个token中选择一个token,进行
Hellespontus
·
2023-12-18 19:03
AIGC
prompt
人工智能
AIGC
gpt
自然语言处理
transformer
语言模型
Python - FastAPI 实现 get、post 请求
Postman请求1.post-create_item2.get-read_items四.Requests请求1.post-create_item2.get-read_items五.总结一.引言前面介绍了
LLM
BIT_666
·
2023-12-18 19:49
Python
常用语法
post
get
FastAPI
GPT实战系列-大话
LLM
大模型训练
GPT实战系列-大话
LLM
大模型训练GPT实战系列-探究GPT等大模型的文本生成GPT实战系列-Baichuan2等大模型的计算精度与量化GPT实战系列-GPT训练的Pretraining,SFT,RewardModeling
Alex_StarSky
·
2023-12-18 18:11
GPT实战系列
GPT训练
LLM
预训练
PEFT
ChatGLM
Baichuan
Qianwen
GPT实战系列-探究GPT等大模型的文本生成
GPT实战系列-探究GPT等
LLM
文本生成GPT专栏文章:GPT实战系列-Baichuan2等大模型的计算精度与量化-CSDN博客GPT实战系列-GPT训练的Pretraining,SFT,RewardModeling
Alex_StarSky
·
2023-12-18 18:09
GPT实战系列
GPT
CoT
Baichuan
ChatGLM
LLM
文本生成
写好ChatGPT提示词原则之:清晰且具体(clear & specific)
为了最大化这些大型语言模型(
LLM
)的潜力,关键在于编写有效的提示词。适当的提示不仅引导模型正确理解需求,还能防止模型产生误导性或无关的输出。
(_Marvin_)
·
2023-12-18 17:54
ChatGPT
chatgpt
人工智能
prompt
gpt
AI编程
中文开源
LLM
评测
中文开源
LLM
汇总评测模型推理建议使用通用的模型推理工具包运行推理,一般都提供较好的UI以及兼容OpenAI的API。
.MING_X
·
2023-12-18 13:41
人工智能
人工智能
深度学习
langchain
copilot
gpt
prompt
embedding
[
LLM
]nanoGPT---训练一个写唐诗的GPT
karpathy/nanoGPT:Thesimplest,fastestrepositoryfortraining/finetuningmedium-sizedGPTs.(github.com)原有模型使用的莎士比亚的戏剧数据集,如果需要一个写唐诗机器人,需要使用唐诗的文本数据,一个不错的唐诗,宋词数据的下载资源地址:https://github.com/chinese-poet这个数据集里面包含
舒克与贝克
·
2023-12-18 12:13
LLM
gpt
开源
LLM
微调训练指南:如何打造属于自己的
LLM
模型
一、介绍今天我们来聊一聊关于
LLM
的微调训练,
LLM
应该算是目前当之无愧的最有影响力的AI技术。尽管它只是一个语言模型,但它具备理解和生成人类语言的能力,非常厉害!
机器学习社区
·
2023-12-18 10:25
大模型
自然语言
语言模型
人工智能
自然语言处理
AIGC
多模态大模型
llm
with vector db
KITLM:Domain-SpecificKnowledgeInTegrationintoLanguageModelsforQuestionAnswering大型语言模型(
LLM
)在广泛的自然语言任务中表现出了非凡的性能
summermoonlight
·
2023-12-18 07:02
人工智能
LLM
tip
参考链接作用依次递减B站链接langchain+文档+openaiembedding+openai3.5turbo快速搭建一个本地知识问答系统,视频也尝试了本地模型进行embedding,效果比较差视频附上相关的ipynb的代码代码链接微软AutoGen链接吴恩达prompt课程
summermoonlight
·
2023-12-18 07:28
自然语言处理
python
人工智能
算法
【
LLM
】“幻觉”的缓解方法
HallucinationWhat’sHallucination什么是幻觉在大型语言模型(
LLM
)中生成与现实或已知事实不符的信息。
Hellespontus
·
2023-12-18 07:30
AIGC
人工智能
AIGC
chatgpt
embedding
gpt
prompt
gpt-3
【
LLM
】大语言模型的前世今生
AnOverviewofLLMsLLMs’statusquoNLPFourParadigmAtimelineofexistinglargelanguagemodels看好OpenAI、Meta和LLaMA。TypicalArchitecturesCasualDecodereg.GPT3、LLaMA…在前两篇文章大家也了解到GPT的结构了,在训练模型去预测下一个token的时候,是以一个无监督的形式
Hellespontus
·
2023-12-18 07:55
AIGC
人工智能
AIGC
chatgpt
embedding
gpt
gpt-3
transformer
LLM
大语言模型(二):Streamlit 无需前端经验也能画web页面
怎样用Streamlit画一个
LLM
的web页面呢?文本输出页面布局滑动条按钮对话框输入框总结问题假如你是一位后端开发,没有任何的web开发经验,那如何去实现一个
LLM
的对话交互页面呢?
Hugo Lei
·
2023-12-18 05:15
LLM工程
语言模型
人工智能
自然语言处理
python
streamlit
LLM
详解各种
LLM
系列|(2)LLaMA 2模型架构、 预训练、SFT内容详解 (PART-1)
一、引言Llama2是Meta在LLaMA基础上升级的一系列从7B到70B参数的大语言模型。Llama2在各个榜单上精度全面超过LLaMA1,Llama2作为开源界表现最好的模型之一,目前被广泛使用。为了更深入地理解Llama2的技术特点,特地在此整理了Llama2模型架构、预训练、SFT的内容详解,对于后续的RLHF和安全性分析,由于篇幅原因,笔者将写另一篇来介绍。话不多说,直接上干货啦一、LL
Sunny_AI_addict
·
2023-12-18 03:36
各种LLM
llama
深度学习
nlp
自然语言处理
人工智能
Mistral MOE架构全面解析
架构全面解析前言Mistral架构分析分词网络主干MixtralDecoderLayerAttentionMOEMLP下游任务因果推理文本分类Mistral架构全面解析前言Mixtral-8x7B大型语言模型(
LLM
江小皮不皮
·
2023-12-18 03:06
人工智能
MOE
mixtral
llama
大模型
mlp
python
Llama 架构分析
架构分析Llama架构分析前言Llama架构分析分词网络主干DecoderLayerAttentionMLP下游任务因果推理文本分类Llama架构分析前言Meta开发并公开发布了Llama系列大型语言模型(
LLM
江小皮不皮
·
2023-12-18 03:35
llama
人工智能
大模型
mlp
attention
分词器
NExT-GPT: Any-to-Any Multimodal
LLM
阅读学习
提出两种轻量的对齐技术——编码端的语言模型中心对齐和解码端的指令遵循对齐,实现了高效的语义对齐与最小的计算开销。提出新的模态切换指令微调(MosIT)方法与高质量数据集,赋予NExT-GPT复杂的跨模态理解与生成能力。方法:通过将语言模型与多模态适配器和不同的解码器相连接,构建了一个端到端的通用任意多模态语言模型系统NExT-GPT。优势:利用现有的高性能编码器和解码器进行微调,既避免了从头开始训
south020
·
2023-12-18 03:36
gpt
学习
百度
OpenAI炸裂新作:GPT-4破解GPT-2大脑!30万神经元全被看透
LLM
的哪些部分,究竟负责哪些行为?这些都让他们百思不得其解。万万没想到,AI的「可
乐享技术
·
2023-12-18 02:05
gpt
人工智能
机器学习
文本处理工具doctran(集成
LLM
和NLP库)
(本质上是对
LLM
和NLP库的封装)G
hj_caas
·
2023-12-17 23:04
LLM
自然语言处理
人工智能
上一页
19
20
21
22
23
24
25
26
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他