N-gram语言模型第72页

LLM 01-引言

LLM01-引言1.1什么是语言模型语言模型（LM）的经典定义是一种对令牌序列(token)的概率分布。假设我们有一个令牌集的词汇表VVV。

Gocara·2023-09-13 05:17

LLM 02-大模型的能力

LLM02-大模型的能力我们将深入探讨GPT-3——这个具有代表性的大型语言模型的能力。

Gocara·2023-09-13 05:42

玩转大语言模型：文本生成和模型控制的革新之道 | 开源日报 0901

laravel/frameworkStars:30.1kLicense:MITLaravel是一个具有表达力和优雅语法的Web应用框架，旨在简化常见的Web项目开发任务，提供了丰富的学习资源。特色亮点：Laravel框架注重可读性和优雅的语法，使开发成为一种愉快和创造性的体验。旨在简化常见的Web项目开发任务，提供了丰富的工具。拥有全面的文档和视频教程库，是现代Web应用开发框架中最丰富和全面的。

开源服务指南·2023-09-13 04:57

FastChat工作原理解析

Hugggingface提供的Transformer库HuggingFace的Transformers库是一个用于自然语言处理（NLP）任务的Python库，旨在简化和加速使用预训练语言模型（如BERT

taoli-qiao·2023-09-13 04:09

使用Fastchat部署vicuna大模型

FastChat是一个用于训练、提供服务和评估基于大型语言模型的聊天机器人的开放平台。其核心特点包括：最先进模型（例如Vicuna）的权重、训练代码和评估代码。

taoli-qiao·2023-09-13 04:08

Generative AI 新世界 | 大模型参数高效微调和量化原理概述

本期文章，我们将探讨两个目前大语言模型（LLM）领域的开发者们都关注的热门话题：大型语言模型的高效微调和量化。微调大型语言模型允许开发者调整开源基础模型，从而提高特定领域任务的性能。

亚马逊云开发者·2023-09-13 01:58

FastChat

FastChat是一个用于训练/部署和评估基于大型语言模型的聊天机器人的开发平台。

studyeboy·2023-09-13 00:42

【具身智能】RT-2：视觉-语言-动作模型（VLA）

文章目录前言一、视觉-语言-动作（VLA）模型二、利用VLM控制机器人三、实验四、Demo五、总结前言RoboticTransformer2（RT-2）是由谷歌DeepMind新推出的大语言模型，它为人类提供了通过纯语言命令来优化机器人控制的能力

Travis.X·2023-09-12 23:32

国内外大语言模型调研（更新到2023.09.12）

目录国外OpenAI-ChatGPTAnthropic-ClaudeGoogle-Bard国内百度-文心一言清华大学&智谱AI-ChatGLM百川智能-百川大模型科大讯飞-星火阿里-通义千问360-360智脑腾讯-混元大模型华为-盘古大模型字节跳动-云雀大模型好未来-MathGPT商汤科技-商量京东-言犀面向B端复旦大学-MOSSMiniMax-MiniMax上海AI实验室-书生浦语中科院自动化所

热爱旅行的小李同学·2023-09-12 23:41

多元共进｜创新技术提供助力，共创增长机遇

借助新推出的面向开发者的大语言模型PaLMAPI，合作伙伴可以进一步创新应用，打造良好的用户体验，实现业务增长。在大会上，谷歌合作创新团队

高校俱乐部·2023-09-12 21:21

FlashAttention：Fast and Memory-Efficient Exact Attention with IO-Awareness

FlashAttention让语言模型拥有更长的上下文FlashAttention序：概述：简介：FlashAttention块稀疏FlashAttention优点：标准注意力算法实现流程：FlashAttentionBlock-SparseFlashAttention

江小皮不皮·2023-09-12 18:04

论文浅尝 | 思维树：使用大语言模型反复思考解决问题

笔记整理：许泽众，浙江大学博士，研究方向为知识图谱上的神经符号推理链接：https://arxiv.org/abs/2305.106011.动机语言模型是一种强大的工具，可以用于各种需要数学、符号、常识或知识推理的任务

开放知识图谱·2023-09-12 17:39

论文分享丨西工大音频语音与语言处理研究组四篇论文被IEEE Trans. ASLP和SPL录用

一篇论文被重要期刊IEEESignalProcessingLetters(IEEESPL)录用，论文方向涉及说话人识别中的对抗攻击、基于扩散模型的跨语种情感迁移语音合成、语音转换中基于多层级韵律建模的风格迁移、基于语言模型的语音转换

语音之家·2023-09-12 16:00

ChatGPT诞生的新岗位：提示工程师（Prompt Engineer）

Prompt工程师擅长对运行在大型语言模型上的AI聊天机器人提问，来获得所需的回答。与编写代码的传统计

程序员白城·2023-09-12 16:11

大语言模型之八-提示工程（Prompt engineer）

大语言模型的效果好，很大程度上归功于算力和数据集，算力使得模型可以足够大，大到模型的理解、记忆、推理和生成以及泛化能力可以同时兼备，而数据集则是模型学习的来源。

shichaog·2023-09-12 16:10

LARGE LANGUAGE MODELS AS OPTIMIZERS

作为优化器的大型语言模型摘要1引言2OPRO：LLM作为优化器3激励性例子：数学优化4应用：提示优化5提示优化实验6相关工作7结论摘要优化无处不在。

UnknownBody·2023-09-12 13:39

请体验一下falcon 180b 大语言模型的感觉

引言由TechnologyInnovationInstitute(T四训练的开源大模型Falcon180B登陆HuggingFace!Falcon180B为开源大模型树立了全新的标杆。作为当前最大的开源大模型，有l80B参数并且是在在3.5万亿token的TIIRefinedWeb数据集上进行训练，这也是目前开源模型里最长的单波段预训练。你可以在HuggingFaceHub中查阅其基础模型、聊天模

winfredzhang·2023-09-12 13:52

GPT引领前沿与应用突破之GPT-4科研实践技术与AI绘图

查看原文>>>GPT引领前沿与应用突破之GPT4科研实践技术与AI绘图目录专题一、AIGC概述专题二、人工智能算法介绍专题三、大语言模型Prompt提示词使用技巧专题四、让GPT成为你的生活助理（动手练习

吹翻书页的风·2023-09-12 12:40

pytorch代码实现注意力机制之MHSA

MHSA注意力机制MHSA是多头自注意力机制(Multi-HeadSelf-Altention)，是自然语言处理领域中用于语言模型中的一种特殊机制。

我悟了-·2023-09-12 11:52

AI文本创作在百度App发文的实践

作者|内容生态端团队导读大语言模型（LLM）指包含数百亿（或更多）参数的语言模型，这些模型通常在大规模数据集上进行训练，以提高其性能和泛化能力。

·2023-09-12 10:56

Falcon 180B 目前最强大的开源模型

TechnologyInnovationInstitute最近发布了Falcon180B大型语言模型(LLM)，它击败了Llama-270b，与谷歌Bard的基础模型PaLM-2Large不相上下。

·2023-09-12 10:25

【AI理论学习】语言模型Performer：一种基于Transformer架构的通用注意力框架

语言模型Performer：一种基于Transformer架构的通用注意力框架Performer论文解读RegularAttentionMechanismFAVOR+：通过矩阵相关性实现快速注意力Attention

镰刀韭菜·2023-09-12 10:26

Lost in the Middle: How Language Models Use Long Contexts

迷失在中间：语言模型如何使用长上下文摘要1引言2语言模型3多文档问答4语言模型如何从输入上下文中检索？5为什么语言模型很难使用它们的整个输入上下文？6更多的背景总是更好吗？

UnknownBody·2023-09-12 08:36

ChatGPT在工业领域的研究与应用探索-数据与工况认知

ChatGPT发展现状...22.ChatGPT如何与工业相结合...23.ChatGPT在工业领域的研究与应用...31.ChatGPT发展现状ChatGPT是基于OpenAI的GPT-4架构的一种大型语言模型

iNeuOS工业互联网·2023-09-12 07:09

Pytorch intermediate(四) Language Model (RNN-LM)

这里将会介绍语言模型，这个模型中我们需要重点关注的是每个时序输入过程中产生的输出。可以理解为，我输入a，那么我需要

青山渺渺·2023-09-12 07:59

开放域问答论文阅读-Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval Augme

最近，大型语言模型（LLM）（例如ChatGPT）在利用世界知识解决各种任务（包括知识密集型任务）方面表现出了令人印象深刻的能力。

无脑敲代码，bug漫天飞·2023-09-12 07:24

GPT4RoI: Instruction Tuning Large Language Model on Region-of-Interest

在图像-文本对上调整大语言模型（LLM）的指令已经实现了前所未有的视觉-语言多模态能力。然而，他们的视觉语言对齐仅建立在图像级别上，缺乏区域级别对齐限制了他们在细粒度多模态理解方面的进步。

Spielberg_1·2023-09-12 06:23

AIGC：【LLM（七）】——Baichuan2：真开源可商用的中文大模型

模型推理四.模型量化4.1量化方法4.2在线量化4.3离线量化4.4量化效果五.模型微调5.1依赖安装5.2单机训练5.3多机训练5.4轻量化微调一.模型介绍Baichuan2是百川智能推出的新一代开源大语言模型

J_Xiong0117·2023-09-12 06:46

1800亿参数，支持中文，3.5万亿训练数据！开源类ChatGPT模型

阿联酋阿布扎比技术创新研究所（TechnologyInnovationInstitute，简称TII）在官网发布了，目前性能最强的开源大语言模型之一Falcon180B。

RPA中国·2023-09-12 03:44

ELMo 原理解析

SuiXin'sBlog原文：https://suixinblog.cn/2019/09/elmo.html作者：SuiXinELMo(EmbeddingsfromLanguageModels)是一个深度上下文相关的词嵌入语言模型

Sui_Xin·2023-09-12 00:39

客户好评“收割机”，NPS高达0.7, 实在RPA6.8.0重磅升级解析

近期，实在智能大模型新品（TARS-RPA-Agent）发布会召开，通过底层软件架构的全新优化和全面结合大语言模型实现“超进化”，持续以AI技术为RPA行业提供领先的超自动化解决方案。

实在智能RPA·2023-09-11 21:08

你说，PC做！实在智能推出行业首个基于大模型的TARS-RPA-Agent产品

6月下旬，AI行业准独角兽实在智能（IntelligenceIndeed）开启自研垂直大语言模型“塔斯（TARS）”内测。

实在智能RPA·2023-09-11 21:38

在“听得懂”之后“看得见、动起来”，实在智能首发“你说PC做”的大模型Agent

大洋彼岸种下了一颗AI的种子，拥有“算力魔法”的ChatGPT在海内外掀起一场“大”爆发——大型语言模型爆发，带动了AI大模型技术的新热潮。

实在智能RPA·2023-09-11 21:38

[学习笔记]词向量模型-Word2vec

论文储备知识-pre-knowledge语言模型的概念语言模型是计算一个句子是句子的概率的模型。(语法和语义上)语言模型的发展基于专家语法规则的语言模型语言学家企图总结

N刻后告诉你·2023-09-11 21:01

万字长文: 检索增强 LLM

来自：AI思维单车ChatGPT的出现，让我们看到了大语言模型(LargeLanguageModel,LLM)在语言和代码理解、人类指令遵循、基本推理等多方面的能力，但幻觉问题Hallucinations

zenRRan·2023-09-11 20:47

Code Llama: Open Foundation Models for Code

CodeLlama：代码的开放基础模型摘要1引言2CodeLlama：专业化Llama2用于代码3结果4负责任的人工智能与安全5相关工作6讨论摘要我们发布了CodeLlama，这是一个基于Llama2的大型代码语言模型系列

UnknownBody·2023-09-11 20:13

Augmented Large Language Models with Parametric Knowledge Guiding

参数知识引导下的增强大型语言模型摘要1引言2相关工作3LLM的参数化知识引导4实验5结论摘要大型语言模型（LLM）凭借其令人印象深刻的语言理解和生成能力，显著提高了自然语言处理（NLP）。

UnknownBody·2023-09-11 20:13

ACL 2023 | 自查纠错：给大模型的“思考过程”注入知识以提高事实正确度

大型语言模型（LLMs）逐渐成为自然语言处理（NLP）中的常态，并在生成和推理任务中展现出良好的性能。然而其最致命的缺点之一是生成的内容缺乏事实正确性。

PaperWeekly·2023-09-11 20:12

直播预告 | ACL 2023原作解读：自查纠错—知识增强的思维链框架

ACL2023:自查纠错——知识增强的思维链框架直播嘉宾李星漩新加坡南洋理工大学和达摩院联培博士生直播时间2023年8月29日（周二）19:00-19:30观看方式扫码下方二维码进入直播间观看▼报告介绍大型语言模型

PaperWeekly·2023-09-11 20:12

How Language Model Hallucinations Can Snowball

语言模型幻觉是如何产生雪球的摘要1引言2为什么我们期待幻觉像滚雪球一样越滚越大？3实验4我们能防止雪球幻觉吗？

UnknownBody·2023-09-11 19:42

Verify-and-Edit: A Knowledge-Enhanced Chain-of-Thought Framework

验证与编辑：一个知识增强的思想链框架摘要1引言2相关工作3验证和编辑框架4实验设置5结果与分析6结论局限性摘要由于大型语言模型（LLM）已成为NLP中的规范，在生成和推理任务中表现出良好的性能，其最致命的缺点之一是缺乏事实的正确性

UnknownBody·2023-09-11 19:11

在家构建您的迷你聊天Chat gpt

在这篇文章中，您将了解什么是可以像ChatGPT一样运行的语言模型如何使用高级语言模型构建聊天机器人推荐：使用NSDT场景编辑器助你快速搭建可编辑的3D应用场景什么是指令遵循模型？语言模型是机器学习模

·2023-09-11 18:56

在家构建您的迷你聊天Chat gpt

在这篇文章中，您将了解什么是可以像ChatGPT一样运行的语言模型如何使用高级语言模型构建聊天机器人推荐：使用NSDT场景编辑器助你快速搭建可编辑的3D应用场景什么是指令遵循模型？语言模型是机器学习模

·2023-09-11 18:55

从 GPT4All 体验 LLM

大型语言模型最近变得流行起来。ChatGPT很时髦。尝试ChatGPT以了解LLM的内容很容易，但有时，您可能需要一个可以在您的计算机上运行的离线替代方案。

·2023-09-11 18:24

【专题】2023年大语言模型综合评测报告PDF合集分享（附原数据表）

2023年，国内主要厂商也相继推出自研的大语言模型产品，同时，国内也推出了大量的大语言模型应用，逐步构建了基于中文语言特色的

·2023-09-11 17:50

【专题】2023年大语言模型综合评测报告PDF合集分享（附原数据表）

2023年，国内主要厂商也相继推出自研的大语言模型产品，同时，国内也推出了大量的大语言模型应用，逐步构建了基于中文语言特色的

·2023-09-11 16:47

DevChat 上线 VSCode 插件！国内开源的 AI 编程，做不被 AI 取代的新程序员！

（要用AI来辅助写代码，国际主流的几个大语言模型的表现都不尽如人意，谁用谁知道……除了Claude我们还在测试中。于是，我们基于大语言模型，做了个辅助编程的开源的VSCode插件——DevChat。）

思码逸研发效能·2023-09-11 12:12

大模型心高气傲，没有AI Agents生死难料

AIAgent，正在接棒大语言模型LLM，成为AI圈最火的话题。

脑极体·2023-09-11 10:39

当红语言模型利器：深度解析向量数据库技术及其应用

编者按：随着大语言模型的广泛应用，如何存储和高效检索这些模型产生的大量向量表示成为一个较为关键的问题。本文深入探讨了向量数据库在提升语言模型应用性能方面的作用，并介绍了不同类型向量数据库的特点。

·2023-09-11 10:11

【大模型】更强的开源可商用的中英文大语言模型baichuan2来了，从零开始搭建

【大模型】更强的开源可商用的中英文大语言模型baichuan2来了，从零开始搭建Baichuan2介绍技术报告github地址模型下载开放协议协议测试评估通用领域测试7B模型结果13B模型结果法律、医疗

szZack·2023-09-11 09:57

推荐频道

N-gram语言模型

LLM 01-引言

LLM 02-大模型的能力

玩转大语言模型：文本生成和模型控制的革新之道 | 开源日报 0901

FastChat工作原理解析

使用Fastchat部署vicuna大模型

Generative AI 新世界 | 大模型参数高效微调和量化原理概述

FastChat

【具身智能】RT-2：视觉-语言-动作模型（VLA）

国内外大语言模型调研（更新到2023.09.12）

多元共进｜创新技术提供助力，共创增长机遇

FlashAttention：Fast and Memory-Efficient Exact Attention with IO-Awareness

论文浅尝 | 思维树：使用大语言模型反复思考解决问题

论文分享丨西工大音频语音与语言处理研究组四篇论文被IEEE Trans. ASLP和SPL录用

ChatGPT诞生的新岗位：提示工程师（Prompt Engineer）

大语言模型之八-提示工程（Prompt engineer）

LARGE LANGUAGE MODELS AS OPTIMIZERS

请体验一下falcon 180b 大语言模型的感觉

GPT引领前沿与应用突破之GPT-4科研实践技术与AI绘图

pytorch代码实现注意力机制之MHSA

AI文本创作在百度App发文的实践

Falcon 180B 目前最强大的开源模型

【AI理论学习】语言模型Performer：一种基于Transformer架构的通用注意力框架

Lost in the Middle: How Language Models Use Long Contexts

ChatGPT在工业领域的研究与应用探索-数据与工况认知

Pytorch intermediate(四) Language Model (RNN-LM)

开放域问答论文阅读-Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval Augme

GPT4RoI: Instruction Tuning Large Language Model on Region-of-Interest

AIGC：【LLM（七）】——Baichuan2：真开源可商用的中文大模型

1800亿参数，支持中文，3.5万亿训练数据！开源类ChatGPT模型

ELMo 原理解析

客户好评“收割机”，NPS高达0.7, 实在RPA6.8.0重磅升级解析

你说，PC做！实在智能推出行业首个基于大模型的TARS-RPA-Agent产品

在“听得懂”之后“看得见、动起来”，实在智能首发“你说PC做”的大模型Agent

[学习笔记]词向量模型-Word2vec

万字长文: 检索增强 LLM

Code Llama: Open Foundation Models for Code

Augmented Large Language Models with Parametric Knowledge Guiding

ACL 2023 | 自查纠错：给大模型的“思考过程”注入知识以提高事实正确度

直播预告 | ACL 2023原作解读：自查纠错—知识增强的思维链框架

How Language Model Hallucinations Can Snowball

Verify-and-Edit: A Knowledge-Enhanced Chain-of-Thought Framework

在家构建您的迷你聊天Chat gpt

在家构建您的迷你聊天Chat gpt

从 GPT4All 体验 LLM

【专题】2023年大语言模型综合评测报告PDF合集分享（附原数据表）

【专题】2023年大语言模型综合评测报告PDF合集分享（附原数据表）

DevChat 上线 VSCode 插件！国内开源的 AI 编程，做不被 AI 取代的新程序员！

大模型心高气傲，没有AI Agents生死难料

当红语言模型利器：深度解析向量数据库技术及其应用

【大模型】更强的开源可商用的中英文大语言模型baichuan2来了，从零开始搭建