N-gram语言模型第58页

自然语言处理---Transformer机制详解之GPT2模型介绍

1GPT2的架构从模型架构上看,GPT2并没有特别新颖的架构,它和只带有解码器模块的Transformer很像.所谓语言模型,作用就是根据已有句子的一部分,来预测下一个单词会是什么.现实应用中大家最熟悉的一个语言模型应用

lichunericli·2023-10-22 05:19

What Makes Pre-trained Language Models Better Zero-shot Learners？

是什么让经过预训练的语言模型更好地成为零样本学习者？

UnknownBody·2023-10-22 04:59

AIO开放接口平台免费畅享ChatGPT聊天、联网互动、学术等服务！更有DALL·E 3最强AI绘图功能！

AIO开放接口平台|服务介绍ALLINONE（AIO）API服务是LLM(大语言模型)开放接口平台：持续接入各种主流的大模型接口，并提供简单、易用、统一的API交互!

智慧地球（AI·Earth）·2023-10-22 02:07

36种场景分析ChatGPT Vision能力，LMM将全面替代大语言模型？ | 京东云技术团队

LMM将会全面替代大语言模型？

京东云技术团队·2023-10-22 02:24

[人工智能-综述-14]：第九届全球软件大会（南京）有感 -3-大语言模型模型是什么？它改变了什么？世界上只需要一台超级电脑，大语言模型让这句话不再是一个笑话。

四、大语言模型是程序员的搭档五、大语言模型是普通人的好帮手六、大语言模型是决策者的军师七、大语言模型是云平台服务八、大语言模型是智脑九、大语言模型是蜂后，人类是蜜蜂十、人类在训练大语言模型，大语言模型也在训练人类十一

文火冰糖的硅基工坊·2023-10-22 01:42

[人工智能-综述-15]：第九届全球软件大会（南京）有感 -4-大语言模型全流程、全方面提升软件生产效能

软件项目管理VS软件工程1.3企业管理与部门管理二、第一步：企业数字化：企业信息系统三、第二步：软件生产自动化：DevOps四、第四步：软件生产智能化：人工智能4.1机器学习与深度学习助力DevOps4.2大语言模型全方面提升软件生产效能一

文火冰糖的硅基工坊·2023-10-22 01:42

[人工智能-综述-13]：第九届全球软件大会（南京）有感 -2-新型的云服务：AI即服务，传统的云服务：IaaS，PaaS，SaaS, DaaS

目录一、传统的云服务1.1概述1.2从大数据云服务走向AI云服务二、AI即服务：新型的云服务1.1概述1.2基于AI服务的应用程序1.3基于大语言模型的AI应用程序1.4AI编程云服务平台1.5大模型在

文火冰糖的硅基工坊·2023-10-22 01:12

李彦宏：不逊色于GPT4！文心一言4.0重磅发布，AI下半场开始加速

他表示百度将以"重构所有应用"为目标，并基于最新的大语言模型文心一言4.0对百度搜索、百度文库和百度网盘进行了革命性的升级。

程序员字典·2023-10-22 00:21

飞桨大模型套件：一站式体验，性能极致，生态兼容

大语言模型套件PaddleNLP众所周知PaddleNLP并不是一个全新的模型库，自2021年以来PaddleNLP一直是国内头部的开源NLP库，在GitHub上拥有超过一万的Star。

飞桨PaddlePaddle·2023-10-22 00:14

AI 和大语言模型给云计算和 DevOps 带来了哪些影响？

AI和大语言模型给云计算和DevOps带来了哪些影响？云计算创新已经从革命性阶段过渡到了进化性阶段，重点在于迁移和重构工作负载。

虹科电子科技·2023-10-21 23:14

NeurIPS 23 Spotlight丨3D-LLM：将3D世界注入大语言模型

来源：投稿作者：橡皮编辑：学姐论文链接：https://arxiv.org/pdf/2307.12981.pdf开源代码：https://vis-www.cs.umass.edu/3dllm/摘要：大型语言模型

深度之眼·2023-10-21 23:33

ChatGPT编程能力实证研究

编程能力实证研究刘子夕冯洋1陈碧欢2娄一翎彭鑫陈振宇[email protected];[email protected]南京大学计算机软件新技术国家重点实验室复旦大学计算机科学技术学院摘要近年来，大型语言模型

pengxin_ce·2023-10-21 22:32

Parameter-efficient transfer learning系列之Adapter

2Adapter3Adapterfusion4总结参考文献1简介目前在大规模预训练模型上进行finetune是NLP中一种高效的迁移方法，但是对于众多的下游任务而言，finetune是一种低效的参数更新方式，对于每一个下游任务，都需要去更新语言模型的全部参数

zenRRan·2023-10-21 18:46

Parameter-efficient transfer learning系列之LoRA与BitFit

目前大规模语言模型在诸多任务上取得sota效果，Finetune全模型参数以适配下游任务虽然能取得不错的效果，但是却是一种低效的参数更新方式，归因于模型的庞大模型参数量带来的训练成本，从而限制了在诸多下游任务的应用

zenRRan·2023-10-21 18:46

阿里妈妈Union Lab全量公测，你会用吗？

doudouduo6·2023-10-21 18:11

【ChatGLM2-6B】在只有CPU的Linux服务器上进行部署

简介ChatGLM2-6B是清华大学开源的一款支持中英双语的对话语言模型。经过了1.4T中英标识符的预训练与人类偏好对齐训练，具有62亿参数的ChatGLM2-6B已经能生成相当符合人类偏好的回答。

太空眼睛·2023-10-21 18:09

【ChatGLM2-6B】nginx转发配置

背景好不容易把ChatGLM2-6B大语言模型部署好了，使用streamlit方式启动起来了，终于可以愉快的玩耍了，然后想着申请一个域名，使用HTTPS协议访问，但实践过程中，发现这个大语言模型的nginx

太空眼睛·2023-10-21 18:05

PRCV 2023：语言模型与视觉生态如何协同？合合信息瞄准“多模态”技术

近期，2023年中国模式识别与计算机视觉大会（PRCV）在厦门成功举行。大会由中国计算机学会（CCF）、中国自动化学会（CAA）、中国图象图形学学会（CSIG）和中国人工智能学会（CAAI）联合主办，多媒体可信感知与高效计算教育部重点实验室、厦门大学人工智能研究院、厦门大学信息学院承办，是国内模式识别和计算机视觉领域的学术盛会。本次大会通过聚焦中国模式识别与计算机视觉领域的最新理论和技术成果解读、

合合技术团队·2023-10-21 17:41

【前端】使用tesseract插件识别提取图片中的文字

使用tesseracttesseract更多的语言模型：language配置安装Tesseract.js可通过本地拷贝或CDN使用CDN引用后，使用全局对象Tesseract即可。

ZSK6·2023-10-21 17:29

是否在业务中使用大语言模型？

是否在业务中使用大语言模型？

学习3人组·2023-10-21 16:14

Pre-trained Language Models Can be Fully Zero-Shot Learners

预训练语言模型可以是完全零样本的学习者摘要1引言2相关工作3背景：PLMs基于提示的调整4提出的方法：NPPrompt5实验6讨论7结论局限性摘要在没有标记或额外的未标记数据的情况下，我们如何将预先训练的模型扩展到许多语言理解任务

UnknownBody·2023-10-21 16:08

面向大模型微调的instruction指令自动化生成技术：SELF-INSTRUCT指令自动化生成框架工作介绍...

来自：老刘说NLP进NLP群—>加入NLP交流群大型的"指令微调"语言模型（对指令的回复进行微调）已经显示其出对新任务进行zero-shot生成的卓越能力。

zenRRan·2023-10-21 15:11

SELF-INSTRUCT: Aligning Language Models with Self-Generated Instructions

自我指导：将语言模型与自生成的指令相结合摘要1引言2方法3来自GPT3的自学数据4实验结果5相关工作6结论摘要大型“指令调整”语言模型（即，微调以响应指令）已经证明了将零样本推广到新任务的显著能力。

UnknownBody·2023-10-21 15:36

[python-大语言模型]从浅到深一系列学习笔记记录

整体学习路径参照：点这里python-机器学习-深度学习-大语言模型-数据开发面向开发者的LLM入门提示原则面向开发者的LLM入门学习链接：github地址：https://github.com/datawhalechina

_Amber·2023-10-21 14:19

大模型基础——大模型范式

大模型背后的范式整个预训练语言模型的使用范式：对于预训练模型，最核心的要素是从无标注的数据中去学习，通过自监督的一些任务去做预训练，得到丰富的知识。

一碗水不行吗·2023-10-21 13:30

Adobe 推出 Photoshop Elements 2024 新版

ChatGPT测试版上线DALL・E3摘要:OpenAI旗下语言模型ChatGPT测试版已

go2coding·2023-10-21 11:15

柴洪峰院士：大模型赋能金融科技思考与展望

本文整理自7月7日世界人工智能大会“AI生成与垂直大语言模型的无限魅力”论坛上中国工程院院士、复旦大学金融科技研究院院长柴洪峰《大模型赋能金融科技思考与展望》的主题分享，从金融垂直模型构建、金融知识图谱与大模型融合以及金融大模型的监管三个方面进行介绍

AI界小学生·2023-10-21 10:47

达观曹植大模型正式对外公测！专注于长文本、多语言、垂直化发展

达观数据自23年3月宣布研发大语言模型以来，一直积极探索大语言模型的专业化、特长化和产品化。

AI界小学生·2023-10-21 10:17

大模型与数据库：AI 时代的双向助推力

随着AIGC的时代到来，以GPT为首的大型语言模型（LargeLanguageModel，LLM）已经成为当今人工智能领域最热门的话题之一。

OpenPie｜拓数派·2023-10-21 08:28

AI-新人类电商人的AI课，用世界先进的AI帮助电商降本增效

课程下载：https://download.csdn.net/download/m0_66047725/88448518比如用语言模型写短视频文案、脚本，用生图模型做场景、拍摄、换装，用数字人做直播短视频

软希源码·2023-10-21 05:22

深度学习模型部署与优化：策略与实践；L40S与A100、H100的对比分析

★深度学习、机器学习、生成式AI、深度神经网络、抽象学习、Seq2Seq、VAE、GAN、GPT、BERT、预训练语言模型、Transformer、ChatGPT、GenAI、多模态大模型、视觉大模型、

高性能服务器·2023-10-21 04:05

高性能计算与多模态处理的探索之旅：英伟达GH200性能优化与GPT-4V的算力加速未来

多模态大模型通过融合视觉等多种感知能力来扩展语言模型，实现更强大的通用人工智能。GPT-4V（GPT-4

高性能服务器·2023-10-21 04:35

multimodal prompting

PromptingforMultimodalHatefulMemeClassification这篇文献探讨了针对hatefulmemes的分类问题，提出了一种基于提示的方法（PromptHate），该方法利用预训练的语言模型来实现分类

zclfe·2023-10-21 04:29

LLM ReAct: 将推理和行为相结合的通用范式学习记录

LLMReAct是一种将推理和行为相结合的通用范式，可以让大型语言模型（LLM）根据逻辑推理（Reason），构建完整系列行动（Act），从而达成期望目标。

enjoy编程·2023-10-21 04:51

谷歌与OpenAI合作，用Google Search为大模型刷新！

夕小瑶科技说原创编译|奶茶子最近一项由Google、UniversityofMassachusettsAmherst、OpenAI联合发布的研究探讨了大型语言模型（LLMS）面临的一个重要挑战，即它们在适应不断变化的世界时的困难

夕小瑶·2023-10-21 00:46

Semantic Kernel: 大语言模型和代码之间的桥梁

乍一看，在代码中调用像GPT-4这样的大型语言模型（LLM）似乎很简单。API是单个REST调用，接收文本并根据输入返回响应。但在实践中，事情变得比这复杂得多。

dotNET跨平台·2023-10-21 00:37

大语言模型综述

大语言模型综述文章自20世纪50年代图灵测试被提出以来，研究人员一直在探索和开发能够理解并掌握语言的人工智能技术。

zenRRan·2023-10-21 00:06

腾讯AILab等《大型语言模型中的幻觉》，全面阐述检测、解释和减轻幻觉...

虽然大型语言模型（LLMs）在各种下游任务中展示出了卓越的能力，但一个重要的关注点是它们表现出幻觉的倾向：LLMs偶尔会生成与用户输入不符、与先前生成的上下文相矛盾或与已建立的世界知识不一致的内容。

人工智能学家·2023-10-21 00:34

OpenAI放大招“对打”谷歌Gemini：全力筹备多模态大模型，并发布新指令语言模型...

谷歌已经公布大语言模型Gemini，计划于今年秋季首次与广大用户见面，且有报道称该模型已经在接受指定企业客户的测试。从目前的情

人工智能学家·2023-10-21 00:34

你知道什么是大语言模型吗

在自然语言处理领域，大语言模型是一类十分重要的技术。顾名思义，大语言模型指的是比较“大”的（神经网络）语言模型，它们以自上文推理词语概率为核心任务。

Fsafn·2023-10-21 00:03

【人工智能】突破界限：LLM 大语言模型在推动基于AI的语言处理方面的极限，大模型发展历史，对AI带来的变革，对各行各业的影响，未来的发展趋势，大模型的能力极限在哪里？

突破界限：大型语言模型推动基于AI的语言处理发展文章目录突破界限：大型语言模型推动基于AI的语言处理发展1.引言2.大型语言模型的发展史时间线关键阶段3.基于大型语言模型的AI变革4.对各行各业的影响各行各业影响

禅与计算机程序设计艺术·2023-10-21 00:32

一文读懂“大语言模型”

1、背景本文基于谷歌云的官方视频：《IntroductiontoLargeLanguageModels》，使用ChatGPT4整理而成，希望对大家入门大语言模型有帮助。

明明如月学长·2023-10-21 00:32

大语言模型面试心路历程【0 offer版】

记录自己大语言模型面试的经历，旨在可以帮助更多想要从事此方面的小伙伴。

抓个马尾女孩·2023-10-20 23:40

MemGPT: Towards LLMs as Operating Systems

MemGPT：将LLM作为操作系统摘要1引言2MEMORY-GPT(MEMGPT)3实验4相关工作5结论要点和未来方向5.1局限性摘要大型语言模型（LLM）已经彻底改变了人工智能，但受到有限上下文窗口的限制

UnknownBody·2023-10-20 22:39

RECOMP: Improving Retrieval-Augmented LMs with Compression and Selective Augmentation

RECOMP：利用压缩和选择性增强改进检索增强LMs摘要1引言2问题公式化：RECOMP3学习压缩器4实验设置5结果6分析与讨论7相关工作8结论摘要在推理时检索文档并在上下文中为其做准备可以提高语言模型在各种

UnknownBody·2023-10-20 22:38

VeRA: Vector-based Random Matrix Adaptation

VeRA：基于向量的随机矩阵自适应摘要1引言2相关工作3方法4实验5结论摘要低秩（LoRA）是一种流行的方法，它可以在微调大规模语言模型时减少线性参数的数量，但在扩展更大的模型时仍然面临着巨大的存储挑战

UnknownBody·2023-10-20 22:08

SELF-RAG: LEARNING TO RETRIEVE, GENERATE, AND CRITIQUE THROUGH SELF-REFLECTION

SELF-RAG：通过自我反思学习检索、生成和批判摘要1引言2相关工作3SELF-RAG：学习检索、生成和批判4实验5结果与分析6结论摘要尽管大型语言模型（LLM）具有非凡的能力，但由于它们仅依赖于所封装的参数知识

UnknownBody·2023-10-20 22:34

BLIP2模型加载在不同设备上

背景现在大语言模型越来越大，占用的内存越来越多，这导致内存较小的设备无法体验大模型的效果。transformer提供了将一个大模型分别加载在gpu和cpu上的方法。

huahuahuahhhh·2023-10-20 19:08

恒生电子联合恒生聚源发布数智金融新品，聚焦大模型技术金融业务应用

6月28日，恒生电子和旗下子公司恒生聚源正式发布基于大语言模型技术打造的数智金融新品，金融智能助手光子和全新升级的智能投研平台WarrenQ。

CSDN云计算·2023-10-20 16:56

PERSONALIZED SOUPS: PERSONALIZED LARGE LANGUAGE MODEL ALIGNMENT VIA POST-HOC PARAMETER MERGING

个性化汤：基于POST-HOC参数合并的个性化大语言模型对齐摘要1引言2相关工作3从个性化的人类反馈中强化学习4实验5结论摘要虽然从人类反馈中强化学习（RLHF）将大型语言模型（LLM）与一般的

UnknownBody·2023-10-20 15:41

推荐频道

N-gram语言模型