E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
N-gram语言模型
LLM 03-大模型的有害性
LLM03-大模型的有害性3.1引言1在这次内容中,我们将开始探讨大型
语言模型
的有害性(危害)。
Gocara
·
2023-09-15 23:50
LLM
人工智能
python
语言模型
nlp
LLM 05-大模型法律
LLM05-大模型法律5.1简介在这个教程中,我们将探讨法律对大型
语言模型
的开发和部署有何规定。
Gocara
·
2023-09-15 23:44
LLM
nlp
人工智能
语言模型
万字长文总结检索增强 LLM
连接:https://zhuanlan.zhihu.com/p/655272123ChatGPT的出现,让我们看到了大
语言模型
(LargeLanguageModel,LLM)在语言和代码理解、人类指令遵循
WitsMakeMen
·
2023-09-15 21:37
LLM
Why Can GPT Learn In-Context? Language Models Implicitly Perform Gradient Descent as Meta-Optimizers
将LLM
语言模型
当做了元优化器,将ICL当做了隐式的fine-tuning,并且通过实验来验证了ICL和显示的fine-tuning是有类似效果的。
WitsMakeMen
·
2023-09-15 21:07
gpt
语言模型
人工智能
分享 8 篇NLP论文,有研究惊奇发现:大
语言模型
除了学习语言还学到了... ...
来源:AINLPer公众号(每日干货分享!!)编辑:ShuYini校稿:ShuYini时间:2023-4-07引言今天继续给大家分享8篇关于自然语言处理(NLP)的论文,其中主要包括:大预言模型的研究、动态环境下的语言回应、数据增强(使用10%的真实数据训练结果胜过100%的数据)、幽默话术的识别(幽默往往和缺陷相关)、模型幻觉抑制、自动化文章评分、稀疏奖励下的强化学习等。论文获取方法:1、直接获
AINLPer
·
2023-09-15 21:47
自然语言处理
语言模型
学习
谁说 AI 编程工具缺乏记忆和联想能力?简单琐碎的需求完全可以交给它
无数的工具、产品横空出世,包括面向企业的大
语言模型
,以及帮助个人的AI工具。其中,在
亚马逊云开发者
·
2023-09-15 18:23
人工智能
PoeAI:免费使用GPT-4的AI聊天机器人平台
Poe.com的AI聊天机器人基于ChatGPT以及Claude等大
语言模型
,有多种语言和风格,可以根据用
Mr.长安
·
2023-09-15 18:16
AIGC产品合集
人工智能
机器人
chatgpt
本地部署CodeLlama +GTX1080显卡 对接open-interpreter对接wxbot(一)
CodeLlama"是一个大型代码
语言模型
的系列,基于"Llama2"构建,为编程任务提供了无监督指导能力,并在开放模型中
三块钱0794
·
2023-09-15 13:24
llama
codellame
wxbot
interpreter
淘天集团联合爱橙科技开源大模型训练框架Megatron-LLaMA
9月12日,淘天集团联合爱橙科技正式对外开源大模型训练框架——Megatron-LLaMA,旨在让技术开发者们能够更方便地提升大
语言模型
训练性能,降低训练成本,并保持和LLaMA社区的兼容性。
阿里技术
·
2023-09-15 11:28
科技
开源
llama
[NLP]TRL 正式推出,来训练你的首个 RLHF 模型
这是一个超全面的全栈库,包含了一整套工具用于使用强化学习(ReinforcementLearning)训练transformer
语言模型
。
舒克与贝克
·
2023-09-15 09:38
人工智能
使用 LoRA 和 QLoRA 对大型
语言模型
进行参数高效的微调
在本文中,我们将探讨PEFT方法如何优化大型
语言模型
(LLM)对特定任务的适应。
TD程序员
·
2023-09-15 09:37
自然语言处理实战篇
语言模型
人工智能
自然语言处理
【AIGC】提示词 Prompt 分享
Promptengineering(提示词工程)是指在使用
语言模型
进行生成性任务时,设计和调整输入提示(prompts)以改善模型生成结果的过程。
Booomcat
·
2023-09-15 08:52
AIGC
AIGC
prompt
链式法则:概率论描述
语言模型
目录1.事件相互独立2.链式法则3.示例4.
语言模型
中的链式法则1.事件相互独立事件相互独立就是:一个事件的发生与否,不会影响另外一个事件的发生。
阿波拉
·
2023-09-15 06:46
数学基础
概率论
语言模型
人工智能
自然语言处理
OpenAI开发系列(二):大
语言模型
发展史及Transformer架构详解
这款拥有超过1.75亿参数和每秒运行成本达到100万美元的大型
语言模型
(LargeLanguageModels,LLMs)开启了自然语言处理(NLP)领域的新纪元。
算法小陈
·
2023-09-15 06:45
transformer
Attention注意力机制
Self-Attention
ChatGPT训练过程
GPT系列模型详解
大语言模型发展史
语言模型
构建图像分割任务的统一架构——从 MaskFormer 到 Mask2Former 再到 MP-Former
受到大
语言模型
的启发,视觉领域也掀起构建“大一统”框架的热潮。
datamore
·
2023-09-15 04:43
计算机视觉
深度学习
人工智能
图像处理
分类
LLM本地知识库问答系统(二):如何正确使用LlamaIndex索引
LlamaIndex简介LlamaIndex(也称为GPTIndex)是一个用户友好的界面,可将外部数据连接到大型
语言模型
(LLM)。它提供了一系列工具来简化流程,
wshzd
·
2023-09-15 02:37
ChatGPT
人工智能
MindMap: Knowledge Graph Prompting Sparks Graph of Thoughts in Large Language Models
思维导图:大型
语言模型
中的知识图谱提示火花思维图摘要1引言2相关工作3方法4实验5结论摘要LLM通常在吸收新知识的能力、幻觉的产生以及决策过程的透明度方面表现出局限性。
UnknownBody
·
2023-09-15 00:59
LLM
知识图谱
知识图谱
语言模型
人工智能
KNOWLEDGE SOLVER: TEACHING LLMS TO SEARCH FOR DOMAIN KNOWLEDGE FROM KNOWLEDGE GRAPHS
知识求解器:教LLMS从知识图谱中搜索领域知识摘要1引言2相关工作3问题定义4方法5实验6结论摘要大型
语言模型
(LLM),如ChatGPT和GPT-4,由于其涌现能力和可推广性,是通用的,可以解决不同的任务
UnknownBody
·
2023-09-15 00:29
知识图谱
LLM
知识图谱
人工智能
Continual Pre-Training of Large Language Models: How to (re)warm your model?
大型
语言模型
的持续预训练:如何(重新)预热你的模型摘要1引言2设置3相关工作4持续加热5讨论/局限性6结论摘要大型
语言模型
(LLM)通常在数十亿个token上进行预训练,但一旦新数据可用,就会重新启动过程
UnknownBody
·
2023-09-15 00:57
LLM
语言模型
人工智能
PSP - 蛋白质序列提取 Transformer 蛋白质
语言模型
ESM2 特征
欢迎关注我的CSDN:https://spike.blog.csdn.net/本文地址:https://spike.blog.csdn.net/article/details/132888139蛋白质
语言模型
SpikeKing
·
2023-09-14 20:02
AI
for
Biotech
蛋白质语言模型
ESM2
使用大型
语言模型
的指南: 提高效率及安全性的技巧和策略 | 开源日报 0913
brexhq/prompt-engineeringStars:5.8kLicense:MITPromptEngineeringGuide,提供了与大型
语言模型
(LLM)相关的技巧和窍门。
开源服务指南
·
2023-09-14 20:21
开源日报
语言模型
人工智能
自然语言处理
华策影视AIGC工程师招聘; 百度大模型创业松;主流大
语言模型
的技术原理细节;AIGC Prompt的七个缺陷 | ShowMeAI日报
日报&周刊合集|生产力工具与行业应用大全|点赞关注评论拜托啦!华策影视AIGC工程师招聘,AIGC在「文娱领域」的真正落地逛即刻时发现关注的AI博主@杨昌发布了自己公司的招聘信息,而且附上了团队氛围和工作感受等分享。华策影视是影视行业龙头企业,成立了AIGC应用研究院,重视AI且不算卷。岗位base上海,感兴趣可以前往社交媒体主页查看详情~⋙即刻@杨昌|了解更多百度AGIFoundathon大模型
ShowMeAI
·
2023-09-14 19:32
ShowMeAI资讯日报
⛽
首席AI资讯收纳官
AIGC
语言模型
paddlepaddle
LLM
langchain
prompt
chatgpt
7分钟了解ChatGPT是如何运作的
ChatGPT是现在最为热门的聊天助手应用,它使用了一个大型
语言模型
(LLM),即GPT-3.5。它通过大量的文本数据进行训练,以理解和生成人类语言。但是,你是否有了解过ChatGPT是如何运作的吗?
程序猿DD_
·
2023-09-14 16:49
chatgpt
2023百度十大科技前沿发明发布,超70%为大模型重构与创新
百度首席技术官王海峰表示,大
语言模型
具备了理解、生成、逻辑、记忆等人工智能的核心基础能力,为通用人工智能带来曙光。文心一言大
语言模型
是百度多年技术积累和产业实践的水到渠成,飞桨深度学
光锥智能
·
2023-09-14 15:31
百度
transformer大
语言模型
(LLM)部署方案整理
说明大模型的基本特征就是大,单机单卡部署会很慢,甚至显存不够用。毕竟不是谁都有H100/A100,能有个3090就不错了。目前已经有不少框架支持了大模型的分布式部署,可以并行的提高推理速度。不光可以单机多卡,还可以多机多卡。我自己没啥使用经验,简单罗列下给自己备查。不足之处,欢迎在评论区指出。框架名称出品方开源地址FasterTranaformer英伟达FasterTransformergithu
yuanlulu
·
2023-09-14 10:52
深度学习论文笔记和实践
transformer
语言模型
深度学习
人工智能
自然语言处理
部署
大模型升级与设计之道:ChatGLM、LLAMA、Baichuan及LLM结构解析
本文通过深入剖析ChatGLM、LLAMA和Baichuan模型的升级路径,以及探讨大型
语言模型
结构选型,为大家提供了一个系统性的视角,梳理了大型预训练模型的关键要素。
阿里巴巴淘系技术团队官网博客
·
2023-09-14 10:26
llama
Claude: ChatGPT替代大
语言模型
【产品介绍】Claude是Anthropic推出的类ChatGPT大
语言模型
,也是一个AI人工智能助理,可以帮助各种行业的用户处理工作,如客户服务、法律、教练、搜索和销售。
Mr.长安
·
2023-09-14 09:49
AIGC产品合集
人工智能
Textbooks Are All You Need II: phi-1.5 technical report
教科书是你所需要的一切:phi-1.5技术报告摘要1引言2技术规范3基准结果4解决毒性和偏见5我们的模型的使用6讨论摘要我们继续调查TinyStories发起的基于Transformer的较小
语言模型
的威力
UnknownBody
·
2023-09-14 07:19
LLM
语言模型
人工智能
Baichuan 2: Open Large-scale Language Models
Baichuan2:开放的大规模
语言模型
摘要1引言2预训练3对齐4安全性5评估6相关工作7限制和道德考虑摘要大型
语言模型
(LLM)在基于自然语言指令的几个例子的各种自然语言任务中表现出了显著的性能,从而减少了对广泛功能工程的需求
UnknownBody
·
2023-09-14 07:19
LLM
语言模型
人工智能
自然语言处理
Causal Reasoning and Large Language Models: Opening a New Frontier for Causality
@TOC摘要大型
语言模型
(LLM)的因果能力是一个有重大争议的问题,对LLM在医学、科学、法律和政策等具有社会影响力的领域的使用具有重要意义。
UnknownBody
·
2023-09-14 07:19
LLM
语言模型
人工智能
自然语言处理
When Less is More: Investigating Data Pruning for Pretraining LLMs at Scale
当少即是多:研究大规模预训练LLM的数据修剪摘要1引言2方法3实验4结果和讨论5相关工作6结论摘要近年来,大量的文本数据对大型
语言模型
(LLM)的发展做出了重大贡献。
UnknownBody
·
2023-09-14 07:45
LLM
剪枝
算法
机器学习
语言模型
阿里云PAI-灵骏大模型训练工具Pai-Megatron-Patch正式开源!
作者:李鹏,王明,施晨,黄俊导读随着深度学习大
语言模型
的不断发展,其模型结构和量级在快速演化,依托大模型技术的应用更是层出不穷。
阿里云大数据AI技术
·
2023-09-14 07:53
阿里云
开源
云计算
【深度学习】大模型卷到机器人上了
就像Transformer出现后,以此为基础的大
语言模型
ChatGPT,视觉基础模型SegmentAnything相继横空出世,并展现出强大的涌现能力。生成式AI可谓百花齐鸣,争相绽放。
人工智能大讲堂
·
2023-09-14 06:03
深度学习
深度学习
机器人
人工智能
Vision-CAIR/MiniGPT-4:使用先进的大型
语言模型
增强视觉-语言理解
Vision-CAIR/MiniGPT-4:使用先进的大型
语言模型
增强视觉-语言理解摘要视觉-语言理解是人工智能领域的一个重要方向,它涉及到图像和文本之间的复杂交互。
senda66
·
2023-09-14 02:18
AI
语言模型
人工智能
深度学习
ChatGPT追祖寻宗:GPT-2论文要点解读
论文要点解读中我们介绍了GPT1论文中的相关要点内容,其实自GPT模型诞生以来,其核心模型架构基本没有太大的改变,都是一路坚持奉行着基于Transformer的单解码器结构,通过无监督预训练方式来拟合条件概率下的
语言模型
计算公式
五点钟科技
·
2023-09-14 01:37
论文解读系列
gpt
chatgpt
文本生成
NLP
人工智能
深度学习
论文
Talk | ICCV‘23清华大学博士生诸子钰:3D-VisTA通用统一的3D视觉语言预训练模型
他与大家分享的主题是:“3D-VisTA通用统一的3D视觉语言预训练模型”,他聚焦于3D视觉语言领域,介绍了3D视觉语言的相关任务,以及他们团队的最新工作3D-VisTA是如何设计通用统一的视觉
语言模型
的
TechBeat人工智能社区
·
2023-09-14 01:27
每周Talk上架
计算机视觉
语言模型
NeurIPS-2021-multimodal-few-shot-learning-with-frozen-language-models-Paper
NeurIPS(人工智能A会)2021年入选实现了将图像映射到
语言模型
可以使用的输入Frozen[49]achievesthisbyjointlytraininganNF-ResNet-50[3]andfrozenGPT
菜菜小堡
·
2023-09-13 22:28
人工智能
深度学习
自然语言处理应用(三):微调BERT
BERT(BidirectionalEncoderRepresentationsfromTransformers)是一种基于Transformer架构的深度双向预训练
语言模型
,通过在大规模无监督数据上进行预训练
青云遮夜雨
·
2023-09-13 21:07
深度学习
自然语言处理
bert
easyui
腾讯混元大模型—携千亿参数勇闯“百模大战”孰胜孰败,实力说话
腾讯混元大模型是由腾讯全链路自研的通用大
语言模型
,拥有超千亿参数规模,预训练语料超2万亿tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。
BFT白芙堂
·
2023-09-13 19:28
人工智能
推荐10个AI人工智能技术网站(一键收藏,应有尽有)
1、MentalAIMentalAI(https://ai.ciyundata.com/)是一种基于文心大模型的知识增强大
语言模型
,专注于自然语言处理(NLP)领域的技术研发。
偷拨网线的william
·
2023-09-13 16:14
人工智能
Orca LLM:模拟 ChatGPT 的推理过程
推荐:使用NSDT场景编辑器快速搭建3D应用场景介绍在大型
语言模型
(LLM)领域,人们一直在追求在不影响其效率的情况下增强小型模型的功能。
ygtu2018
·
2023-09-13 13:40
chatgpt
人工智能
深度学习
《向量数据库指南》——向量数据库内核面临的技术挑战及应对措施
最近一年,以ChatGPT、LLaMA为代表的大
语言模型
的兴起,将向量数据库的发展推向了新的高度。
LCHub低代码社区
·
2023-09-13 13:14
《向量数据库指南》
数据库
人工智能
MIlvus
MIlvusCloud
ModaHub
向量数据库
维格云
【精华】AI Agent:大模型改变世界的“钥匙”
文章目录1.Auto-GPT2.BabyAGI3.AgentGPT4.GodMode5.AITown6.ChatDev当前大模型的本质是大
语言模型
(LargeLanguageModel,LLM)。
LeeZhao@
·
2023-09-13 12:22
人工智能
AIGC
AI
Agent
chatGPT笔记
文章目录一、GPT之技术演进时间线二、chatGPT中的
语言模型
instructGPT跟传统语言LM模型最大不同点是什么?
hit56实验室
·
2023-09-13 12:53
机器学习
人工智能
深度学习
如何评估大型
语言模型
01对大型
语言模型
(LLM)的主客观评估在评估大型
语言模型
时,我们可以进行客观评估和主观评估。主观评估的方法是用户亲自尝试不同的模型,提出一些问题,然后根据自己的感受来判断哪个模型好,哪个模型不好。
叶锦鲤
·
2023-09-13 12:14
语言模型
人工智能
自然语言处理
16. 线性代数 - 矩阵的性质
它与大
语言模型
(L
茶桁
·
2023-09-13 11:30
茶桁的AI秘籍
-
数学篇
线性代数
矩阵
【CS324】Large Language Models(持续更新)
note文章目录note一、引言二、大模型的能力1.从
语言模型
到任务模型2.任务评估三、大模型的有害性(上)四、大模型的有害性(下)五、大模型的数据Reference一、引言
语言模型
最初是在信息理论的背景下研究的
山顶夕景
·
2023-09-13 11:05
LLM大模型
#
自然语言处理
深度学习
自然语言处理
大模型
深度学习
AI文本创作在百度App发文的实践
作者|内容生态端团队导读大
语言模型
(LLM)指包含数百亿(或更多)参数的
语言模型
,这些模型通常在大规模数据集上进行训练,以提高其性能和泛化能力。
百度Geek说
·
2023-09-13 09:56
人工智能
百度
AI辅助创作
文心一言
智能生成文案
文本直接生成3D游戏场景、功能,用ChatGPT方式开发游戏!
3D游戏开发平台Hiber3D通过谷歌的PaLM大
语言模型
,结合自身500多个模板库,以及数百万个成品3D场景进行微调,推出了一个全新游戏开发平台。
RPA中国
·
2023-09-13 09:01
游戏
chatgpt
以太坊实现、
语言模型
应用与实用工具 | 开源日报 0817
GoEthereum是以太坊协议的官方Golang执行层实现,可运行各种节点并提供网关访问以太坊网络;LangChain-Chatchat是基于大
语言模型
的本地知识库问答应用实现,支持离线运行和多种模型接入
开源服务指南
·
2023-09-13 09:30
开源日报
语言模型
开源
人工智能
上一页
67
68
69
70
71
72
73
74
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他