N-gram语言模型第8页

有道CEO周枫：当我们谈论大模型时，应该关注哪些新能力？

作者：周枫基于大语言模型技术的ChatGPT推出已经有4个月了，更多同类产品还在快速出现。比如，前天谷歌更新了Bard，将辅助编程能力支持的语言数量扩展到20种。

有道AI情报局·2024-02-13 05:47

超好用的AI提示词工具，再也不用烦恼怎样写好提示词了

同样，我在使用ChatGPT、Llama等大型语言模型的时候，为了获得更好的结果，prompt也需要按照一定的格式、给足背景和需求。

程序员_阿轩·2024-02-13 01:19

GPT3是否是强人工智能？

今天和大家分享一下AI方向自然语言处理（NLP）领域内一个新的语言模型：GPT-3。

枯木嫩芽·2024-02-13 00:28

写的太通透了！大模型自省式 RAG 与 LangGraph 的实践！

本文讲解了自省式RAG的基础原理以及基于LangGraph的实践演示自省式RAG与LangGraph重要链接关于Self-RAG和CRAG的教程手册演示视频研究背景由于大多数大型语言模型（LLMs）通常只针对大量公共数据进行周期性训练

Python算法实战·2024-02-12 23:17

ChatGPT的背后原理：大模型、注意力机制、强化学习

微信搜索关注《Python学研大本营》，加入读者群，分享更多精彩本文主要介绍为ChatGPT提供动力的机器学习模型，将从大型语言模型的介绍开始，深入探讨使GPT-3得到训练的革命性的自注意机制，然后深入到从人类反馈强化学习

Python学研大本营·2024-02-12 23:17

这次理解透彻了！用代码从零实现大模型的自注意力、多头注意力。。。

这篇文章将介绍Transformer架构以及GPT-4和Llama等大型语言模型（LLM）中使用的自注意力机制。自注意力等相关机

Python算法实战·2024-02-12 23:47

Cross-lingual Transfer of Monolingual Representations

clipboard.png假设有两种语言L1和L2，L1既有大量无标签数据又有下游任务的监督数据，L2只有大量无标签数据，整个流程可分为一下四步：在L1无标签的数据集上，训练一个单语的bert，任务为masked语言模型

ltochange·2024-02-12 20:03

大模型题库

你能解释一下Transformer架构及其在大型语言模型中的作用吗？

lichunericli·2024-02-12 19:28

基于大语言模型的AI Agents

基于大语言模型（LLM）的AIAgent利用LLM进行记忆检索、决策推理和行动顺序选择等，把Agent的智能程度提升到了新的高度。LLM驱动的Agent具体是怎么做的呢？什么是AIAgent？

lichunericli·2024-02-12 19:27

LLM的参数微调、训练、推理；LLM应用框架；LLM分布式训练

GPT-3：由OpenAI开发，GPT-3是一个巨大的自回归语言模型，拥有1750亿个参数。它可以生成文本、回答问题、翻译文本等。

lichunericli·2024-02-12 19:27

LLMs模型选择，LLMs复读机问题，LLMs长文本处理方案

LLMs复读机问题（LLMsParrotingProblem）是指大型语言模型（LLMs）在生成文本时可能出现的重复或重复先前输入内容的现象。

lichunericli·2024-02-12 19:26

2024 通义语音 AI 技术图景，大模型引领 AI 再进化

在此技术背景下，OpenAI携应用级界面产品ChatGPT横空出世，使得人们对大语言模型的通用能力有了全新的认识，引燃了语义大语言模型的研究热潮。与此同时，要模拟

阿里技术·2024-02-12 15:01

大语言模型ChatGLM + P-Tuning微调实践

大语言模型ChatGLM+P-Tuning微调实践文章目录大语言模型ChatGLM+P-Tuning微调实践LLM微调基础本次实践环境说明ChatGLM部署以及激活conda环境安装依赖禁用W&B训练数据集

North_D·2024-02-12 13:59

大语言模型langchain+ChatGLM3-6B+本地知识库实战

大语言模型langchain+ChatGLM3-6B+本地知识库实战文章目录大语言模型langchain+ChatGLM3-6B+本地知识库实战目标微调、本地知识库和Prompt基本概念1、环境准备2、

North_D·2024-02-12 13:29

书生谱语-全链条开发工具

书生·谱语全链条开发体系包含：数据、模型预训练、模型微调、模型量化部署、模型测评、模型场景应用全链路开发体系github链接通用大模型国内外大语言模型快速发展，涌现了大量的大语言模型以及一批创业公司深度学习模型的发展大模型利用多模态优势

SatVision炼金士·2024-02-12 11:21

大语言模型不适合的范围

大语言模型在某些情况下可能不适用，主要体现在以下几个方面：1、特定领域知识不足大语言模型可能缺乏某些特定领域的专业知识，导致在特定行业或领域的问题上表现不佳。

人机与认知实验室·2024-02-12 09:24

（CTC解码）Modeified prefix-search decoding algorithm

Algorithm.png下面的代码基本上就是上面算法的复现，代码中增加了逐行的解释，代码中实际上没有语言模型部分。如果需要，可以比着葫芦画瓢，自己增加上。"""

ZhengkunTian·2024-02-12 08:06

Nature Machine Intelligence 法国国家科学研究中心评论“使用大语言模型进行研究的危机”

ChatGPT于2022年底发布，将大型语言模型（LLM）推到了聚光灯下。通过使用户能够直接用自然语言查询模型，ChatGPT实现了对这些模型的访问——这是一个受欢迎的发展。

xwz小王子·2024-02-12 08:35

揭秘 LLM 推理：全面解析 LLM 推理性能的关键因素

一、背景介绍自OpenAI一年前发布ChatGPT以来，大型语言模型（LLM）领域经历了前所未有的快速发展。

lichunericli·2024-02-12 08:53

VLM 系列——Llava1.6——论文解读

一、概述1、是什么Llava1.6是llava1.5的升级暂时还没有论文等，是一个多模态视觉-文本大语言模型，可以完成：图像描述、视觉问答、根据图片写代码（HTML、JS、CSS），潜在可以完成单个目标的视觉定位

TigerZ*·2024-02-12 06:10

VLM 系列——MoE-LLaVa——论文解读

概述1、是什么moe-Llava是Llava1.5的改进全称《MoE-LLaVA:MixtureofExpertsforLargeVision-LanguageModels》，是一个多模态视觉-文本大语言模型

TigerZ*·2024-02-12 06:40

VLM 系列——LLaVA-MoLE——论文解读

LLaVA-MoLE:SparseMixtureofLoRAExpertsforMitigatingDataConflictsinInstructionFinetuningMLLMs》，是一个多模态视觉-文本大语言模型

TigerZ*·2024-02-12 06:37

探索ChatGPT4：新一代人工智能语言模型的突破

Draven21·2024-02-12 03:41

文献阅读：Mamba: Linear-Time Sequence Modeling with Selective State Spaces

Linear-TimeSequenceModelingwithSelectiveStateSpaces1.文章简介2.方法介绍1.StateSpaceModels2.SelectiveStateSpaceModels3.实验考察&结论1.简单问题上的验证2.实际场景效果1.语言模型

Espresso Macchiato·2024-02-11 21:54

LoRA：语言模型微调的计算资源优化策略

编者按：随着数据量和计算能力的增加，大模型的参数量也在不断增加，同时进行大模型微调的成本也变得越来越高。全参数微调需要大量的计算资源和时间，且在进行切换下游任务时代价高昂。本文作者介绍了一种新方法LoRA，可以在保持模型性能的同时大幅减少微调的参数量和所需资源。LoRA通过引入两个低秩适配矩阵，用矩阵乘法的方法替换大部分参数。实验证明，LoRA在多项NLP任务上的表现与许多微调方法（如Adapte

·2024-02-11 20:51

RAG 新路径！提升开发效率、用户体验拉满

随着大语言模型和智能问答技术的崛起，RAG凭借其独特的结合检索和生成能力，在提供丰富对话式体验和高效文档管理方面成为了行业的热点。

·2024-02-11 18:21

使用UMAP降维可视化RAG嵌入

大型语言模型（LLMs）如GPT-4已经展示了出色的文本理解和生成能力。但它们在处理领域特定信息方面面临挑战，比如当查询超出训练数据范围时，它们会产生错误的答案。

·2024-02-11 17:42

GPT-4：比ChatGPT3.5好得多，但它有多好你知道么？

GPT-4简介GPT-4是一款由OpenAI开发的人工智能语言模型，它是ChatGPT3.5的升级版。

·2024-02-11 17:36

【论文精读】RetNet

摘要Transformer是大型语言模型的主流架构。然而，transformer的训练并行性是以低效的推理为代价，这使得transformer对部署不友好。

None-D·2024-02-11 15:11

这款对标ChatGPT的国产MoE大模型重磅更新！集AI对话、AI绘画、AI阅读、AI写作于一体！

木易AI信息差·2024-02-11 13:49

ChatGPT高效提问—prompt常见用法（续篇八）

ChatGPT高效提问—prompt常见用法（续篇八）1.1对抗对抗是一个重要主题，深入探讨了大型语言模型（LLM）的安全风险。

Bruce_Liuxiaowei·2024-02-11 12:34

ChatGPT高效提问—prompt常见用法（续篇九）

ChatGPT高效提问—prompt常见用法（续篇九）如何准确地向大型语言模型提出问题，使其更好地理解我们的意图，从而得到期望的答案呢？

Bruce_Liuxiaowei·2024-02-11 11:28

GPT-4模型的创造力

超级的创造力是GPT-4等高级语言模型的重要特征之一。

科学禅道·2024-02-11 07:23

LLM之RAG实战（二十五）| 使用LlamaIndex和BM25重排序实践

这种方法旨在为语言模型提供访问外部数据源，来提高其在生成响应时的准确性和相关性，从而增强语言模型的能力。1.1检索组件：目的：检索组件的主要功能是响应查询或提示，从大型数据库或语料库中提取相关文档或信

wshzd·2024-02-11 06:03

微软 & CMU - Tag-LLM：将通用大语言模型改用于专业领域

yetingyun.blog.csdn.net/一、前言论文地址：https://arxiv.org/abs/2402.05140Github地址：https://github.com/sjunhongshen/Tag-LLM大语言模型

叶庭云·2024-02-11 05:33

知识增强的预训练模型简介

NLP论文解读·2024-02-10 20:48

[算法前沿]--061-生成式 AI 的发展方向，是 Chat 还是 Agent？

它使用大型语言模型（LLM）作为其核心计算引擎，使其能够进行对话、执行任务、推理并展现一定程度的自主性。简而言之，Agent是一个具有复杂推理能力、记忆和执行任务手段的系统。

三更科技公社·2024-02-10 17:38

谷歌发布“史上最强”大模型，全面对标GPT-4，又遭质疑

前言23年12月6日，谷歌突然宣布推出大语言模型Gemini。

近咫／＼ぃ天涯·2024-02-10 12:53

NLP之transformer -Task01

常见的NLP任务本教程将NLP任务划分为4个大类：1、文本分类，2、序列标注，3、问答任务——抽取式问答和多选问答，4、生成任务——语言模型、机器翻译和摘要生成。

曼曼668·2024-02-10 11:55

【大模型】大语言模型前沿技术系列讲座-学习笔记1：人工智能发展史

最近参加了深蓝学院举办的《大型语言模型前沿技术系列分享》，该系列分享以大模型(LLM)为背景，以科普、启发为目的，从最基本的Transformer开始讲起，逐步涉及一些更高阶更深入的课题，涵盖大模型基础

不雨_亦潇潇·2024-02-10 09:22

知识图谱与大模型双向驱动的关键问题和应用探索

导读知识图谱和大型语言模型都是用来表示和处理知识的手段。大模型补足了理解语言的能力，知识图谱则丰富了表示知识的方式，两者的深度结合必将为人工智能提供更为全面、可靠、可控的知识处理方法。

金融机器智能官方·2024-02-10 08:35

小巨人大爆发：紧凑型大型语言模型效率之谜揭晓！

订阅：https://rengongzhineng.io/在自然语言处理（NLP）这个飞速发展的领域里，大型语言模型（LLM）的出现无疑是一场革命

新加坡内哥谈技术·2024-02-10 07:41

ChatGPT高效提问—prompt常见用法（续篇四）

在知识生成过程中，模型接收prompt输入的问题、指令或上下文信息，并利用其内部的知识库、语言模型和推理能力，生成相应的回答或文本。生成的知识可以包括对事实的描述、解释、推断、观点或建议等。

Bruce_Liuxiaowei·2024-02-10 01:21

利用大型语言模型打造微信、企业微信、钉钉和飞书平台的智能助理：免费接入与详细设置指南

项目介绍Tips：我们使用这个开源项目chatgpt-on-wechat项目主页：GitHub-zhayujie/chatgpt-on-wechat:基于大模型搭建的微信聊天机器人，同时支持微信、企业微信、公众号、飞书、钉钉接入，可选择GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/LinkAI，能处理文本、语音和图片，访问操作系统和互联网，支持基于自有知识库

SqaiLai·2024-02-10 00:40

每日一看大模型新闻（2023.12.20下）大模型+搜索构建完整技术栈，百川智能搜索增强给企业定制化下了一剂「猛药」；谷歌发布最重要23个产品时刻，其中15个有关AI；微软Azure发布GPT-RAG

1.产品发布1.1谷歌发布新大语言模型：零样本生成10秒视频达SOTA！发布日期：2023.12.20谷歌发布新大语言模型：零样本生成10秒视频达SOTA！

超爱玩大模型·2024-02-09 22:19

每日一看大模型新闻（2023.12.22）Privado推出开源LLM聊天应用MuroChat；百度：推出文字解谜AI游戏“模问题”；一文说尽「大模型推理」！12家高校机构联合发布150页报告

MuroChat通过集成大型语言模型，自动检测和删除敏感数据，满足企业组织的数据保护需求。特性包括数据防火墙、单一登录支