E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
N-gram语言模型
ChatGLM2发布,位居C-Eval榜首!
文章目录中文大
语言模型
评估基准:C-EVALChatGLM2-6B部署推理环境配置模型下载git-lfs安装代码调用基于gradio的网页版Demo显存占用情况数理逻辑推理性能显存占用的减少量化对模型性能的影响基于
dzysunshine
·
2023-10-07 03:34
ChatGPT
chatgpt
chatglm
主流的图像—文本的多模态技术实现方法有哪些?
大体上可划分为3类:1)训练中间层以对齐视觉模块和
语言模型
。该类方法首先预训练视觉模块,将这些视觉模块与LLM冻结,然后在视觉模块与LLM之间插入可训练的中间层,构建多模态模型。
哥廷根数学学派
·
2023-10-07 00:27
深度学习
人工智能
数据挖掘
机器学习
DLRover 在 K8s 上千卡级大模型训练稳定性保障的技术实践
AI系统工程师文|张吉(花名:理之)蚂蚁集团AI系统工程师文|兰霆峰四川大学20级计算机系专注分布式深度学习领域,主要参与蚂蚁大规模分布式训练引擎的设计和开发本文5104字阅读13分钟01背景.如今大
语言模型
SOFAStack
·
2023-10-06 17:00
kubernetes
容器
云原生
使用4090显卡部署 Qwen-14B-Chat-Int4
Qwen-14B是基于Transformer的大
语言模型
,在超大规模的预训练数据上进行训练得到。预
engchina
·
2023-10-06 13:20
LINUX
Qwen-14B
Qwen
ModelScope
【NLP】400万token,大模型推理飙升22倍!清华校友爆火一作,GitHub狂揽1.8k星
大
语言模型
的上下文长度限制从此不存在了?!
风度78
·
2023-10-06 10:00
自然语言处理
人工智能
StreamingLLM - 处理无限长度的输入
:https://github.com/mit-han-lab/streaming-llm论文:https://arxiv.org/abs/2309.17453在流媒体应用程序(如多轮对话)中部署大型
语言模型
伊织code
·
2023-10-06 10:29
StreamingLLM
LLM
大模型
长度
ChatGPT基础使用总结
文章目录一、ChatGPT基础概念大型
语言模型
LLMs---一种能够以类似人类语言的方式“说话”的软件ChatGPT定义---OpenAI研发的一款聊天机器人程序(2022年GPT-3.5,属于大型
语言模型
runafterhit
·
2023-10-06 07:28
软件工程类
chatgpt
人工智能
AI创作工具的使用体验报告
在使用过程中,我发现它的
语言模型
很智能,能够根据我的需求自动生成符合要求的内容,不需要我手动输入太多的文字和语句。另外,这个工具的界面设计也比较简洁,能够快速帮助我生成想要的内容。
Leon_George
·
2023-10-06 02:33
人工智能
【计算机组成原理】考研真题攻克与重点知识点剖析 - 第 2 篇:数据的表示和运算
此前我尝试了完全使用Python或是结合大
语言模型
对考研真题进行数据清洗与可视化分析,本人技术有限,最终数据清洗结果不够理想,相关CSDN文章便没有发出。
friklogff
·
2023-10-05 23:07
计算机组成原理
考研
如何使用大
语言模型
来绘制图画
请创作一张科技感十足的图片,包含siri和iphone两个元素,请帮我挑选合适的style和background好的,我会为你创作一张科技感十足的图片,包含siri和iphone两个元素。我会根据你的要求,选择一种适合的风格和背景。请稍等一下,我马上回来。
winfredzhang
·
2023-10-05 19:00
语言模型
人工智能
自然语言处理
XLNet:运行机制及和Bert的异同比较 - 知乎
目录1XLNet引入了自回归
语言模型
及自编码
语言模型
1.1自回归
语言模型
(AutoregressiveLM)概念:优点:缺点:1.2自编码
语言模型
(AutoencoderLM)概念:优点:缺点:1.3XLNet
云淡风轻__
·
2023-10-05 18:22
NLP
bert
xlnet
自然语言处理
大
语言模型
(LLMs)综述调研
大
语言模型
why?
nanobobo
·
2023-10-05 12:29
nlp
语言模型
人工智能
自然语言处理
LLMs 奖励模型 RLHF: Reward model
这个奖励模型通常也是一个
语言模型
。例如,一个通过在来自人类标记者对提示的评估中准备的成对比较数据上使用监督学习方法进行训练的模型。对于给定的提示X,奖励模型学习偏好人类首选的完成y_j,同
AI架构师易筋
·
2023-10-05 12:55
LLM-Large
Language
Models
深度学习
人工智能
机器学习
LLMs 从人类获得反馈RLHF: Obtaining feedback from humans
然后,您将使用这个LLM(大型
语言模型
),以及一个提示数据集,为每个提示生成多个不同的响应。提示数据集由多个提示组成,每个提示都会
AI架构师易筋
·
2023-10-05 11:04
LLM-Large
Language
Models
chatgpt
深度学习
人工智能
用向量数据库Milvus Cloud 搭建AI聊天机器人
加入大
语言模型
(LLM)接着,需要在聊天机器人中加入LLM。这样,用户就可以和聊天机器人开展对话了。本示例中,我们将使用OpenAIChatGPT背后的模型服务:GPT-3.5。
LCHub低代码社区
·
2023-10-05 08:22
《向量数据库指南》
数据库
AI-native
人工智能
向量数据库
MIlvus
Cloud
GPT
第一阶段在未标记数据集上训练
语言模型
来学习神经网络的初始参数;第二阶段使用响应任务中的标记数据将参数微调以适应当前任务。下面我
jerrychenly
·
2023-10-05 04:34
GPT系列论文解读:GPT-2
GPT系列GPT(GenerativePre-trainedTransformer)是一系列基于Transformer架构的预训练
语言模型
,由OpenAI开发。
青云遮夜雨
·
2023-10-05 00:43
NLP
gpt
自然语言处理
人工智能
【论文笔记】Task and Motion Planning with Large Language Models for Object Rearrangement
大型
语言模型
(LLMs)是获取这种知识的一种潜在来源。用LLMs实现机器人多目标重排。关键问题:它们并不能天
Ctrl+Alt+L
·
2023-10-04 22:26
序列决策
论文笔记
论文阅读
语言模型
人工智能
AIGC生成式代码——Code Llama 简介、部署、测试、应用、本地化
导读:本文介绍了CodeLlama的简介、本地化部署、测试和应用实战方案,帮助学习大
语言模型
的同学们更好地应用CodeLlama。
清风等待KT
·
2023-10-04 21:10
探索AIGC部署应用常见大模型
AIGC
人工智能
python
llama
gpt
【Java-LangChain:使用 ChatGPT API 搭建系统-1】简介
本课程以构建客服助手为例,使用不同的Prompt链式调用
语言模型
,具体的Prompt选择将取决于上一次调用的输出结果,有时还需要从外部来源查找信息。本课程将围绕该主题,逐步了
df007df
·
2023-10-04 19:29
Java-LangChain
chatgpt
langchain
人工智能
google 知识库_Googles领域的知识库增强
语言模型
google知识库Googlehaspublishedanewwayofpre-trainingalanguagemodelwhichisaugmentedusingaknowledgeretrievalmechanism,thatlooksupexistingknowledgefromanexternalWikipediacorpus.Thismakestheoutputsthetrainedl
weixin_26704853
·
2023-10-04 14:07
python
java
人工智能
机器学习
大数据
行业首创 !Graph RAG:基于知识图谱的检索增强技术与优势对比(附 Demo)
传统的搜索增强技术受限于训练文本数量、质量等问题,对于复杂或多义词查询效果不佳,更无法满足ChatGPT等大
语言模型
应用带来的大规模、高并发的复杂关联查询需求。
悦数图数据库
·
2023-10-04 13:21
新闻动态
知识图谱
人工智能
数据库
【论文笔记】检索还是生成回复?RAG:我都要
检索式回复是在外部知识库中检索出满意的回复,较为可靠和可控,但回复缺乏多样性;而生成式回复则依赖于强大的
语言模型
中储存的内部知识,不可控,解释性差,但能生成更丰富的回复。
iLuz
·
2023-10-04 13:50
自然语言处理
深度学习
机器学习
ICCV 2023 | CAPEAM:基于上下文感知规划和环境感知记忆机制构建具身智能体
文章链接:https://arxiv.org/abs/2308.072412023年,大型
语言模型
(LLMs)以及AIAgents的蓬勃发展为整个机器智能领域带来了全新的发展机遇。
TechBeat人工智能社区
·
2023-10-04 13:19
技术文章
机器人
计算机视觉
AI数据技术02:RAG数据检索
RAG使用大型
语言模型
(LLM)等工具将信息检索的强大功能与自然语言生成无缝结合,为内容创建提供了一种变革性的方法。
无水先生
·
2023-10-04 13:17
LLM和ChatGPT
人工智能
人工智能
自然语言处理
为什么现在的LLM都是Decoder only的架构?
LLM是“LargeLanguageModel”的简写,目前一般指百亿参数以上的
语言模型
,主要面向文本生成任务。
TFATS
·
2023-10-04 12:38
GPT大模型
nlp
算法
AIGC
自然语言处理
深度学习
大模型 Decoder 的生成策略
IntroductionGreedySearchbeamsearchSamplingTop-KSamplingTop-p(nucleus)sampling总结一、Introduction1、简介近年来,由于在数百万个网页数据上训练的大型基于Transformer的
语言模型
的兴起
TFATS
·
2023-10-04 12:37
GPT大模型
nlp
算法
AIGC
自然语言处理
大模型
深度学习
人工智能
【Java-LangChain:使用 ChatGPT API 搭建系统-2】
语言模型
,提问范式与 Token
第二章
语言模型
,提问范式与Token在本章中,我们将和您分享大型
语言模型
(LLM)的工作原理、训练方式以及分词器(tokenizer)等细节对LLM输出的影响。
df007df
·
2023-10-04 10:32
Java-LangChain
chatgpt
java
langchain
ChatGPT的底层架构简介
ChatGPT是一种新型自然语言处理模型,它是由OpenAI开发的一种基于Transformer结构的预训练
语言模型
。ChatGPT主要用于对话生成任务,例如聊天机器人、客户服务等应用场景。
鹤鹤的森林
·
2023-10-04 06:41
学习
chatgpt
神经网络
cnn
rnn
人工智能
机器学习
深度学习
【Java-LangChain:使用 ChatGPT API 搭建系统-6】处理输入-链式 Prompt Chaining Prompts
我们已经证明了
语言模型
非常擅长遵循复杂的指令,特别是像GPT-4这样的高级模型。那么让我们用两个比喻来解释为什么我们要这样做,来比较思
df007df
·
2023-10-04 06:24
Java-LangChain
java
langchain
chatgpt
[论文笔记]BitFit
引言今天带来一篇参数高效微调的论文笔记,论文题目为基于Transformer掩码
语言模型
简单高效的参数微调。BitFit,一种稀疏的微调方法,仅修改模型的偏置项(或它们的子集)。
愤怒的可乐
·
2023-10-04 05:17
论文翻译/笔记
#
大模型[论文]
论文阅读
BitFit
大
语言模型
之十五-预训练和监督微调中文LLama-2
这篇博客是继《大
语言模型
之十二SentencePiece扩充LLama2中文词汇》、《大
语言模型
之十三LLama2中文推理》和《大
语言模型
之十四-PEFT的LoRA》前面博客演示了中文词汇的扩充以及给予
shichaog
·
2023-10-04 01:07
神经网络&人工智能
语言模型
llama
人工智能
论文笔记|Unified Language Model Pre-training for Natural Language Understanding and Generation
任@燕山大学论文来源代码地址前言预训练
语言模型
提高了NLP任务的技术水平。对不同类型的
语言模型
进行预训练时,使用了不同的预测任务和训练目标,如下表所示。
期待成功
·
2023-10-04 01:56
自然语言处理
笔记
论文笔记 Unified Language Model Pre-training for Natural Language Understanding and Generation
一个新的预训练
语言模型
(UNILM),它可以用于自然语言理解NLU和生成任务NLG。UNILM由多个语言建模目标共同预训练,共享相同的参数。二、和别的pre-train模型有啥区别?
RunningQzh
·
2023-10-04 01:56
语言模型
r语言
深度学习
论文笔记 -《All NLP Tasks Are Generation Tasks: A General Pre-training Framework》
而在本文中,提出了一种通用
语言模型
(GeneralLanguageModel,GLM)来解决这个问题。GLM模型结构有三个主要优点
*Lisen
·
2023-10-04 01:56
论文
NLP
人工智能
预训练语言模型
NLP
[论文笔记]UNILM
引言今天带来论文UnifiedLanguageModelPre-trainingforNaturalLanguageUnderstandingandGeneration的笔记,论文标题是统一预训练
语言模型
用于自然语言理解和生成
愤怒的可乐
·
2023-10-04 01:25
论文翻译/笔记
UniLM
CTF 解码器思路
这个时候大
语言模型
ChatGPT就能够很快的分析编码。解码器:下面是一个base64编码flag交给ChatGPT处理的例子:总结但如果编码格式不是很常见,可能需要给chatGPT提供编码方式。
学习溢出
·
2023-10-04 00:09
CTF
人工智能
chatgpt
【计算机组成原理】考研真题攻克与重点知识点剖析 - 第 1 篇:计算机系统概述
此前我尝试了完全使用Python或是结合大
语言模型
对考研真题进行数据清洗与可视化分析,本人技术有限,最终数据清洗结果不够理想,相关CSDN文章便没有发出。
friklogff
·
2023-10-04 00:08
计算机组成原理
考研
2022-07-11
NatMacInt|基于
语言模型
的蛋白质设计原创mumu图灵基因2022-07-1108:32发表于江苏收录于合集#前沿生物大数据分析撰文:mumuIF=15.508推荐度:⭐⭐⭐⭐⭐亮点:作者认为基于
图灵基因
·
2023-10-04 00:35
大规模
语言模型
--训练成本
目前,基于Transformers架构的大型
语言模型
(LLM),如GPT、T5和BERT,已经在各种自然语言处理(NLP)任务中取得了SOTA结果。
hanscalZheng
·
2023-10-03 23:20
大语言模型
语言模型
人工智能
自然语言处理
大
语言模型
之十四-PEFT的LoRA
在《大
语言模型
之七-Llama-2单GPU微调SFT》和《大
语言模型
之十三LLama2中文推理》中我们都提到了LoRA(低秩分解)方法,之所以用低秩分解进行参数的优化的原因是为了减少计算资源。
shichaog
·
2023-10-03 20:52
神经网络&人工智能
语言模型
人工智能
自然语言处理
ChatGPT 对学生和教师产生哪些影响 ?
ChatGPT是OpenAI开发的一种可以理解人类语言并进行交流的
语言模型
。它已经过大量文本数据的训练,可以生成不同
云炬网络平台
·
2023-10-03 15:09
考研
大数据
学习
科技
chatgpt
一款简化Python自然语言处理的开源库
它使用了机器学习算法和
语言模型
来执行各种文本处理任务。2安装使用之前,需要安装,打开
迷途小书童的Note
·
2023-10-03 15:09
python
自然语言处理
开发语言
人工智能
Mind Map:大
语言模型
中的知识图谱提示激发思维图10.1+10.2
知识图谱提示激发思维图摘要介绍相关工作方法第一步:证据图挖掘第二步:证据图聚合第三步:LLMMindMap推理实验实验设置医学问答长对话问题使用KG的部分知识生成深入分析总结摘要LLM通常在吸收新知识的能力、generationofhallucination以及决策过程的透明度方面有局限性。“generationofhallucination”(幻觉生成)可以指代使用计算机模型或算法生成虚假的感知
露葵025
·
2023-10-03 13:56
语言模型
知识图谱
人工智能
人工智能(AI)在产生新创意方面有多出色?
然而,人工智能的最新进展——特别是像ChatGPT这样的大
语言模型
的出现——正在挑战这种假定。我们教授创新、创业和产品设计方面的课程已有多年时间。
Do1twell
·
2023-10-03 13:20
人工智能
chatgpt
经典循环神经网络(一)RNN及其在歌词数据集上的应用
在
语言模型
方向,
n-gram
是当时最为流行的
语言模型
方法。
n-gram
的问题是其捕捉句子中长期依赖的能力非常有限。另外
n-gram
算法过于简单,其是否有能力取得令人信服的效果的确要打一个大的问号。
undo_try
·
2023-10-03 13:36
#
深度学习
rnn
人工智能
深度学习
GPT系列模型解读:GPT-1
GPT系列GPT(GenerativePre-trainedTransformer)是一系列基于Transformer架构的预训练
语言模型
,由OpenAI开发。
青云遮夜雨
·
2023-10-03 08:07
NLP
gpt
人工智能助手,你我皆可拥有
ChatGPT是一种基于Transformer的
语言模型
,由OpenAI提出。它在自然语言处理领域取得了很大的成功,被广泛应用于对话系统、文本生成、文本分类、问答系统等多个领域。
开源服务指南
·
2023-10-03 04:46
开源专题
人工智能
开源
ChatGPT简单科普
它还不能够产生意识,只是一个LLM(大
语言模型
),它还缺少一些灵魂和意识构成的本质要素,比如它对生存延续没有具体的概念和实现途径,对死亡也没有恐惧和敬畏。
大囚长
·
2023-10-03 01:06
chatgpt
人工智能
机器学习
课代表:ChatGPT及大模型专题研讨会
既然做都做了,还是有些结果比较好,简单分享一下我的笔记和一些思考以ChatGPT为代表的对话式大型
语言模型
模型角度:具备涌现能力的模型(目前看来为自回归的、参数规模在百亿以上的,就是10+B)涌现能力:
MetLightt
·
2023-10-03 01:06
chatgpt
机器学习
人工智能
上一页
60
61
62
63
64
65
66
67
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他