E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
N-gram语言模型
自然语言处理---Transformer机制详解之GPT2模型介绍
1GPT2的架构从模型架构上看,GPT2并没有特别新颖的架构,它和只带有解码器模块的Transformer很像.所谓
语言模型
,作用就是根据已有句子的一部分,来预测下一个单词会是什么.现实应用中大家最熟悉的一个
语言模型
应用
lichunericli
·
2023-10-22 05:19
自然语言处理
自然语言处理
transformer
人工智能
What Makes Pre-trained Language Models Better Zero-shot Learners?
是什么让经过预训练的
语言模型
更好地成为零样本学习者?
UnknownBody
·
2023-10-22 04:59
LLM
语言模型
人工智能
深度学习
AIO开放接口平台免费畅享ChatGPT聊天、联网互动、学术等服务!更有DALL·E 3最强AI绘图功能!
AIO开放接口平台|服务介绍ALLINONE(AIO)API服务是LLM(大
语言模型
)开放接口平台:持续接入各种主流的大模型接口,并提供简单、易用、统一的API交互!
智慧地球(AI·Earth)
·
2023-10-22 02:07
chatgpt
人工智能
36种场景分析ChatGPT Vision能力,LMM将全面替代大
语言模型
? | 京东云技术团队
LMM将会全面替代大
语言模型
?
京东云技术团队
·
2023-10-22 02:24
人工智能
chatgpt
gpt
语言模型
[人工智能-综述-14]:第九届全球软件大会(南京)有感 -3-大
语言模型
模型是什么?它改变了什么?世界上只需要一台超级电脑,大
语言模型
让这句话不再是一个笑话。
四、大
语言模型
是程序员的搭档五、大
语言模型
是普通人的好帮手六、大
语言模型
是决策者的军师七、大
语言模型
是云平台服务八、大
语言模型
是智脑九、大
语言模型
是蜂后,人类是蜜蜂十、人类在训练大
语言模型
,大
语言模型
也在训练人类十一
文火冰糖的硅基工坊
·
2023-10-22 01:42
人工智能-综述
人工智能
语言模型
自然语言处理
[人工智能-综述-15]:第九届全球软件大会(南京)有感 -4-大
语言模型
全流程、全方面提升软件生产效能
软件项目管理VS软件工程1.3企业管理与部门管理二、第一步:企业数字化:企业信息系统三、第二步:软件生产自动化:DevOps四、第四步:软件生产智能化:人工智能4.1机器学习与深度学习助力DevOps4.2大
语言模型
全方面提升软件生产效能一
文火冰糖的硅基工坊
·
2023-10-22 01:42
人工智能
语言模型
自然语言处理
IT
管理
架构
[人工智能-综述-13]:第九届全球软件大会(南京)有感 -2-新型的云服务:AI即服务,传统的云服务:IaaS,PaaS,SaaS, DaaS
目录一、传统的云服务1.1概述1.2从大数据云服务走向AI云服务二、AI即服务:新型的云服务1.1概述1.2基于AI服务的应用程序1.3基于大
语言模型
的AI应用程序1.4AI编程云服务平台1.5大模型在
文火冰糖的硅基工坊
·
2023-10-22 01:12
人工智能-综述
人工智能
云原生
paas
管理
数据挖掘
云计算
IT
李彦宏:不逊色于GPT4!文心一言4.0重磅发布,AI下半场开始加速
他表示百度将以"重构所有应用"为目标,并基于最新的大
语言模型
文心一言4.0对百度搜索、百度文库和百度网盘进行了革命性的升级。
程序员字典
·
2023-10-22 00:21
后端
飞桨大模型套件:一站式体验,性能极致,生态兼容
大
语言模型
套件PaddleNLP众所周知PaddleNLP并不是一个全新的模型库,自2021年以来PaddleNLP一直是国内头部的开源NLP库,在GitHub上拥有超过一万的Star。
飞桨PaddlePaddle
·
2023-10-22 00:14
AI开发者说
paddlepaddle
nlp
AI 和大
语言模型
给云计算和 DevOps 带来了哪些影响?
AI和大
语言模型
给云计算和DevOps带来了哪些影响?云计算创新已经从革命性阶段过渡到了进化性阶段,重点在于迁移和重构工作负载。
虹科电子科技
·
2023-10-21 23:14
云科技
人工智能
devops
语言模型
NeurIPS 23 Spotlight丨3D-LLM:将3D世界注入大
语言模型
来源:投稿作者:橡皮编辑:学姐论文链接:https://arxiv.org/pdf/2307.12981.pdf开源代码:https://vis-www.cs.umass.edu/3dllm/摘要:大型
语言模型
深度之眼
·
2023-10-21 23:33
粉丝的投稿
人工智能干货
深度学习干货
NeurIPS
大模型
ChatGPT编程能力实证研究
编程能力实证研究刘子夕冯洋1陈碧欢2娄一翎彭鑫陈振宇
[email protected]
;
[email protected]
南京大学计算机软件新技术国家重点实验室复旦大学计算机科学技术学院摘要近年来,大型
语言模型
pengxin_ce
·
2023-10-21 22:32
chatgpt
人工智能
Parameter-efficient transfer learning系列之Adapter
2Adapter3Adapterfusion4总结参考文献1简介目前在大规模预训练模型上进行finetune是NLP中一种高效的迁移方法,但是对于众多的下游任务而言,finetune是一种低效的参数更新方式,对于每一个下游任务,都需要去更新
语言模型
的全部参数
zenRRan
·
2023-10-21 18:46
算法
python
机器学习
人工智能
深度学习
Parameter-efficient transfer learning系列之LoRA与BitFit
目前大规模
语言模型
在诸多任务上取得sota效果,Finetune全模型参数以适配下游任务虽然能取得不错的效果,但是却是一种低效的参数更新方式,归因于模型的庞大模型参数量带来的训练成本,从而限制了在诸多下游任务的应用
zenRRan
·
2023-10-21 18:46
阿里妈妈Union Lab全量公测,你会用吗?
UnionLab是一种智能化的选品推荐、推广内容创作工具,它内置了大
语言模型
(LLMs),使得选品、推广更加智能和简单。
doudouduo6
·
2023-10-21 18:11
Union
Lab
【ChatGLM2-6B】在只有CPU的Linux服务器上进行部署
简介ChatGLM2-6B是清华大学开源的一款支持中英双语的对话
语言模型
。经过了1.4T中英标识符的预训练与人类偏好对齐训练,具有62亿参数的ChatGLM2-6B已经能生成相当符合人类偏好的回答。
太空眼睛
·
2023-10-21 18:09
人工智能
linux
ChatGLM2
chatglm2-6b
大语言模型
CPU
清华大学
【ChatGLM2-6B】nginx转发配置
背景好不容易把ChatGLM2-6B大
语言模型
部署好了,使用streamlit方式启动起来了,终于可以愉快的玩耍了,然后想着申请一个域名,使用HTTPS协议访问,但实践过程中,发现这个大
语言模型
的nginx
太空眼睛
·
2023-10-21 18:05
人工智能
nginx
运维
chatglm2
websocket
CHUNKED
403
转发
PRCV 2023:
语言模型
与视觉生态如何协同?合合信息瞄准“多模态”技术
近期,2023年中国模式识别与计算机视觉大会(PRCV)在厦门成功举行。大会由中国计算机学会(CCF)、中国自动化学会(CAA)、中国图象图形学学会(CSIG)和中国人工智能学会(CAAI)联合主办,多媒体可信感知与高效计算教育部重点实验室、厦门大学人工智能研究院、厦门大学信息学院承办,是国内模式识别和计算机视觉领域的学术盛会。本次大会通过聚焦中国模式识别与计算机视觉领域的最新理论和技术成果解读、
合合技术团队
·
2023-10-21 17:41
语言模型
人工智能
多模态大模型
合合信息
【前端】使用tesseract插件识别提取图片中的文字
使用tesseracttesseract更多的
语言模型
:language配置安装Tesseract.js可通过本地拷贝或CDN使用CDN引用后,使用全局对象Tesseract即可。
ZSK6
·
2023-10-21 17:29
前端
工具集
前端
是否在业务中使用大
语言模型
?
是否在业务中使用大
语言模型
?
学习3人组
·
2023-10-21 16:14
人工智能
Pre-trained Language Models Can be Fully Zero-Shot Learners
预训练
语言模型
可以是完全零样本的学习者摘要1引言2相关工作3背景:PLMs基于提示的调整4提出的方法:NPPrompt5实验6讨论7结论局限性摘要在没有标记或额外的未标记数据的情况下,我们如何将预先训练的模型扩展到许多语言理解任务
UnknownBody
·
2023-10-21 16:08
LLM
语言模型
深度学习
人工智能
面向大模型微调的instruction指令自动化生成技术:SELF-INSTRUCT指令自动化生成框架工作介绍...
来自:老刘说NLP进NLP群—>加入NLP交流群大型的"指令微调"
语言模型
(对指令的回复进行微调)已经显示其出对新任务进行zero-shot生成的卓越能力。
zenRRan
·
2023-10-21 15:11
自动化
人工智能
机器学习
深度学习
python
SELF-INSTRUCT: Aligning Language Models with Self-Generated Instructions
自我指导:将
语言模型
与自生成的指令相结合摘要1引言2方法3来自GPT3的自学数据4实验结果5相关工作6结论摘要大型“指令调整”
语言模型
(即,微调以响应指令)已经证明了将零样本推广到新任务的显著能力。
UnknownBody
·
2023-10-21 15:36
LLM
语言模型
人工智能
深度学习
[python-大
语言模型
]从浅到深一系列学习笔记记录
整体学习路径参照:点这里python-机器学习-深度学习-大
语言模型
-数据开发面向开发者的LLM入门提示原则面向开发者的LLM入门学习链接:github地址:https://github.com/datawhalechina
_Amber
·
2023-10-21 14:19
人工智能学习
python
自然语言处理
大模型基础——大模型范式
大模型背后的范式整个预训练
语言模型
的使用范式:对于预训练模型,最核心的要素是从无标注的数据中去学习,通过自监督的一些任务去做预训练,得到丰富的知识。
一碗水不行吗
·
2023-10-21 13:30
人工智能
人工智能
Adobe 推出 Photoshop Elements 2024 新版
ChatGPT测试版上线DALL・E3摘要:OpenAI旗下
语言模型
ChatGPT测试版已
go2coding
·
2023-10-21 11:15
AI日报
adobe
photoshop
chatgpt
柴洪峰院士:大模型赋能金融科技思考与展望
本文整理自7月7日世界人工智能大会“AI生成与垂直大
语言模型
的无限魅力”论坛上中国工程院院士、复旦大学金融科技研究院院长柴洪峰《大模型赋能金融科技思考与展望》的主题分享,从金融垂直模型构建、金融知识图谱与大模型融合以及金融大模型的监管三个方面进行介绍
AI界小学生
·
2023-10-21 10:47
金融
科技
达观曹植大模型正式对外公测!专注于长文本、多语言、垂直化发展
达观数据自23年3月宣布研发大
语言模型
以来,一直积极探索大
语言模型
的专业化、特长化和产品化。
AI界小学生
·
2023-10-21 10:17
曹植大语言模型
达观数据
大模型与数据库:AI 时代的双向助推力
随着AIGC的时代到来,以GPT为首的大型
语言模型
(LargeLanguageModel,LLM)已经成为当今人工智能领域最热门的话题之一。
OpenPie|拓数派
·
2023-10-21 08:28
PieCloudDB
Database
拓数派
数据库
人工智能
AI-新人类电商人的AI课,用世界先进的AI帮助电商降本增效
课程下载:https://download.csdn.net/download/m0_66047725/88448518比如用
语言模型
写短视频文案、脚本,用生图模型做场景、拍摄、换装,用数字人做直播短视频
软希源码
·
2023-10-21 05:22
软希网资源下载
人工智能
AI-新人类电商人的AI课
深度学习模型部署与优化:策略与实践;L40S与A100、H100的对比分析
★深度学习、机器学习、生成式AI、深度神经网络、抽象学习、Seq2Seq、VAE、GAN、GPT、BERT、预训练
语言模型
、Transformer、ChatGPT、GenAI、多模态大模型、视觉大模型、
高性能服务器
·
2023-10-21 04:05
深度学习
人工智能
高性能计算与多模态处理的探索之旅:英伟达GH200性能优化与GPT-4V的算力加速未来
多模态大模型通过融合视觉等多种感知能力来扩展
语言模型
,实现更强大的通用人工智能。GPT-4V(GPT-4
高性能服务器
·
2023-10-21 04:35
多模态大模型
multimodal prompting
PromptingforMultimodalHatefulMemeClassification这篇文献探讨了针对hatefulmemes的分类问题,提出了一种基于提示的方法(PromptHate),该方法利用预训练的
语言模型
来实现分类
zclfe
·
2023-10-21 04:29
人工智能
机器学习
深度学习
LLM ReAct: 将推理和行为相结合的通用范式 学习记录
LLMReAct是一种将推理和行为相结合的通用范式,可以让大型
语言模型
(LLM)根据逻辑推理(Reason),构建完整系列行动(Act),从而达成期望目标。
enjoy编程
·
2023-10-21 04:51
AI
程序员实用工具集合
LLM
ReAct
Prompt
提示工程
大模型
谷歌与OpenAI合作,用Google Search为大模型刷新!
夕小瑶科技说原创编译|奶茶子最近一项由Google、UniversityofMassachusettsAmherst、OpenAI联合发布的研究探讨了大型
语言模型
(LLMS)面临的一个重要挑战,即它们在适应不断变化的世界时的困难
夕小瑶
·
2023-10-21 00:46
人工智能
Semantic Kernel: 大
语言模型
和代码之间的桥梁
乍一看,在代码中调用像GPT-4这样的大型
语言模型
(LLM)似乎很简单。API是单个REST调用,接收文本并根据输入返回响应。但在实践中,事情变得比这复杂得多。
dotNET跨平台
·
2023-10-21 00:37
语言模型
人工智能
自然语言处理
大
语言模型
综述
大
语言模型
综述文章自20世纪50年代图灵测试被提出以来,研究人员一直在探索和开发能够理解并掌握语言的人工智能技术。
zenRRan
·
2023-10-21 00:06
语言模型
人工智能
深度学习
机器学习
自然语言处理
腾讯AILab等《大型
语言模型
中的幻觉》,全面阐述检测、解释和减轻幻觉...
虽然大型
语言模型
(LLMs)在各种下游任务中展示出了卓越的能力,但一个重要的关注点是它们表现出幻觉的倾向:LLMs偶尔会生成与用户输入不符、与先前生成的上下文相矛盾或与已建立的世界知识不一致的内容。
人工智能学家
·
2023-10-21 00:34
语言模型
人工智能
自然语言处理
OpenAI放大招“对打”谷歌Gemini:全力筹备多模态大模型,并发布新指令
语言模型
...
谷歌已经公布大
语言模型
Gemini,计划于今年秋季首次与广大用户见面,且有报道称该模型已经在接受指定企业客户的测试。从目前的情
人工智能学家
·
2023-10-21 00:34
语言模型
人工智能
自然语言处理
你知道什么是大
语言模型
吗
在自然语言处理领域,大
语言模型
是一类十分重要的技术。顾名思义,大
语言模型
指的是比较“大”的(神经网络)
语言模型
,它们以自上文推理词语概率为核心任务。
Fsafn
·
2023-10-21 00:03
经验分享
【人工智能】突破界限:LLM 大
语言模型
在推动基于AI的语言处理方面的极限,大模型发展历史,对AI带来的变革,对各行各业的影响,未来的发展趋势,大模型的能力极限在哪里?
突破界限:大型
语言模型
推动基于AI的语言处理发展文章目录突破界限:大型
语言模型
推动基于AI的语言处理发展1.引言2.大型
语言模型
的发展史时间线关键阶段3.基于大型
语言模型
的AI变革4.对各行各业的影响各行各业影响
禅与计算机程序设计艺术
·
2023-10-21 00:32
ChatGPT
人工智能
语言模型
深度学习
ChatGPT
一文读懂“大
语言模型
”
1、背景本文基于谷歌云的官方视频:《IntroductiontoLargeLanguageModels》,使用ChatGPT4整理而成,希望对大家入门大
语言模型
有帮助。
明明如月学长
·
2023-10-21 00:32
机器学习
语言模型
人工智能
自然语言处理
大
语言模型
面试心路历程【0 offer版】
记录自己大
语言模型
面试的经历,旨在可以帮助更多想要从事此方面的小伙伴。
抓个马尾女孩
·
2023-10-20 23:40
其他
语言模型
chatgpt
面试
MemGPT: Towards LLMs as Operating Systems
MemGPT:将LLM作为操作系统摘要1引言2MEMORY-GPT(MEMGPT)3实验4相关工作5结论要点和未来方向5.1局限性摘要大型
语言模型
(LLM)已经彻底改变了人工智能,但受到有限上下文窗口的限制
UnknownBody
·
2023-10-20 22:39
LLM
人工智能
深度学习
语言模型
RECOMP: Improving Retrieval-Augmented LMs with Compression and Selective Augmentation
RECOMP:利用压缩和选择性增强改进检索增强LMs摘要1引言2问题公式化:RECOMP3学习压缩器4实验设置5结果6分析与讨论7相关工作8结论摘要在推理时检索文档并在上下文中为其做准备可以提高
语言模型
在各种
UnknownBody
·
2023-10-20 22:38
LLM
人工智能
深度学习
VeRA: Vector-based Random Matrix Adaptation
VeRA:基于向量的随机矩阵自适应摘要1引言2相关工作3方法4实验5结论摘要低秩(LoRA)是一种流行的方法,它可以在微调大规模
语言模型
时减少线性参数的数量,但在扩展更大的模型时仍然面临着巨大的存储挑战
UnknownBody
·
2023-10-20 22:08
LLM
语言模型
SELF-RAG: LEARNING TO RETRIEVE, GENERATE, AND CRITIQUE THROUGH SELF-REFLECTION
SELF-RAG:通过自我反思学习检索、生成和批判摘要1引言2相关工作3SELF-RAG:学习检索、生成和批判4实验5结果与分析6结论摘要尽管大型
语言模型
(LLM)具有非凡的能力,但由于它们仅依赖于所封装的参数知识
UnknownBody
·
2023-10-20 22:34
LLM
人工智能
语言模型
BLIP2模型加载在不同设备上
背景现在大
语言模型
越来越大,占用的内存越来越多,这导致内存较小的设备无法体验大模型的效果。transformer提供了将一个大模型分别加载在gpu和cpu上的方法。
huahuahuahhhh
·
2023-10-20 19:08
多模态
恒生电子联合恒生聚源发布数智金融新品,聚焦大模型技术金融业务应用
6月28日,恒生电子和旗下子公司恒生聚源正式发布基于大
语言模型
技术打造的数智金融新品,金融智能助手光子和全新升级的智能投研平台WarrenQ。
CSDN云计算
·
2023-10-20 16:56
人工智能
大数据
PERSONALIZED SOUPS: PERSONALIZED LARGE LANGUAGE MODEL ALIGNMENT VIA POST-HOC PARAMETER MERGING
个性化汤:基于POST-HOC参数合并的个性化大
语言模型
对齐摘要1引言2相关工作3从个性化的人类反馈中强化学习4实验5结论摘要虽然从人类反馈中强化学习(RLHF)将大型
语言模型
(LLM)与一般的
UnknownBody
·
2023-10-20 15:41
LLM
语言模型
人工智能
自然语言处理
上一页
54
55
56
57
58
59
60
61
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他