N-gram语言模型。第35页

LLMs：《A Survey on Evaluation of Large Language Models大型语言模型评估综述》理解智能本质(具备推理能力)、AI评估的重要性(识别当前算法的局限性

LLMs：《ASurveyonEvaluationofLargeLanguageModels大型语言模型评估综述》翻译与解读导读：该文章首先介绍了人工智能（AI）对机器智能的专注，并探讨了评估AI模型的方法

GitHub质检员·2023-12-21 20:55

突破边界：高性能计算引领LLM驶向通用人工智能AGI的创新纪元

高性能服务器·2023-12-21 20:23

翻译: LLMs离通用人工智能AGI有多远 20个小时学会开车 Artificial General Intelligence

大型语言模型的崛起导致了像ChatGPT这样的单一模型可以用于许多事情，并且感觉它们可能是通用的。但通用技术与人工通用智能并不是同一回事。让我们看看AGI的真正技术定义是什么。

AI架构师易筋·2023-12-21 20:53

大模型结合推荐系统，发论文创新点怎么找？附14篇会议论文＆代码

深度之眼·2023-12-21 19:11

ChatGPT4与ArcGIS Pro3助力AI 地理空间分析和可视化及助力科研论文写作

随着chatGPT/GPT4等大语言模型的出现，AI思维也已经成为一种必备的能力，ArcGISPro3的卓越性能与ChatGPT

科研online·2023-12-21 18:04

【深度学习】语言模型与注意力机制以及Bert实战指引之一

文章目录统计语言模型和神经网络语言模型注意力机制和Bert实战Bert配置环境和模型转换格式准备模型构建网络设计模型配置代码实战统计语言模型和神经网络语言模型区别：统计语言模型的本质是基于词与词共现频次的统计

weixin_40293999·2023-12-21 17:52

什么是深度学习，多模态学习，迁移学习，LLM

深度学习、多模态学习、迁移学习和大型语言模型（LLM）是人工智能和机器学习领域的重要概念，它们各自有着独特的定义和应用。

稻壳特筑·2023-12-21 17:38

从头开始实现LoRA以及一些实用技巧

LoRA是Low-RankAdaptation或Low-RankAdaptors的缩写，它提供了一种用于对预先存在的语言模型进行微调的高效且轻量级的方法。LoRA的主要优点之一是它的效率。

机器学习社区·2023-12-21 14:26

ChatGPT：你真的了解网络安全吗？浅谈攻击防御进行时之传统的网络安全

基于其语言模型庞大、可控制、具有高度扩展性的特点，本文通过对话ChatGPT，浅谈网络安全攻击防御进行时。传统的网络安全提问ChatGPT：什么是传统的网络安全，主要包括哪些方面？

会python的小孩·2023-12-21 13:45

论文笔记 | Nature 2023 FunSearch：利用大语言模型在数学科学领域探索新的发现

文章目录一、前言二、主要内容三、总结CSDN叶庭云：https://yetingyun.blog.csdn.net/一、前言科学中有许多难以解决的问题，这些问题难以获得确切解答，但却相对容易进行验证。在数学和计算机科学领域，这类问题被称为NP完全优化问题（NP-completeoptimizationproblems）。人们普遍认为不存在能够在“可接受时间”内（即多项式时间内）解决此类问题的算法，

叶庭云·2023-12-21 12:22

年末再抛大模型深水炸弹！WAVE SUMMIT+2023大会如约而至

大模型技术生态发展正当时前言回望2023年，大语言模型或许将是科技史上最浓墨重彩的一笔。从技术、产业到生态，大语言模型在突飞猛进中加速重构万物。

洁洁！·2023-12-21 12:23

年度大盘点：AIGC、AGI、GhatGPT震撼登场！揭秘人工智能大模型的奥秘与必读书单

01《ChatGPT驱动软件开发》02《ChatGPT原理与实战》03《神经网络与深度学习》04《AIGC重塑教育》05《通用人工智能》前言在2023年，人工智能领域经历了一场前所未有的大爆发，特别是在语言模型领域

洁洁！·2023-12-21 12:23

同济&复旦团队的最新综述：大语言模型的检索增强生成

文章目录一、前言二、主要内容三、总结CSDN叶庭云：https://yetingyun.blog.csdn.net/一、前言论文题目：《Retrieval-AugmentedGenerationforLargeLanguageModels:ASurvey》论文地址：https://arxiv.org/abs/2312.10997Github项目地址：https://github.com/Tongj

叶庭云·2023-12-21 11:28

HALLUSIONBENCH: An Advanced Diagnostic Suite for Entangled Language Hallucination & Visual Illusion

AnAdvancedDiagnosticSuiteforEntangledLanguageHallucination&VisualIllusioninLargeVision-LanguageModels----HALLUSIONBENCH：大型视觉语言模型中纠缠语言幻觉和视觉错觉的高级诊断套件马里兰大学学院公园分校

Mars_prime·2023-12-21 08:07

Beyond Hallucinations: Enhancing LVLMs through Hallucination-Aware Direct Preference Optimization

超越幻觉：通过幻觉感知直接偏好优化增强LVLM上海人工智能实验室Abstract近年来，多模态大语言模型取得了显着的进步，但它们仍然面临着一个被称为“幻觉问题”的常见问题，即模型生成的文本描述包含图像中不准确或不存在的内容

Mars_prime·2023-12-21 08:07

LLM 和搜索引擎是一样的吗？

网站优化知识宝典·2023-12-21 08:07

Learn to Explain: Multimodal Reasoning viaThought Chains for Science Question Answering科学问答的思维链

ScienceQA展示了以下功能的实用性语言模型中的CoT，因为CoT在少样本GPT-3中将问答性能提高了1.20%微调的UnifiedQA中为3.99%。思想链(CoT)。

Mars_prime·2023-12-21 08:37

VIGC: Visual Instruction Generation and Correction---------VIGC：视觉指令生成和纠正

上海人工智能实验室Abstract视觉编码器和大语言模型（LLM）的集成推动了多模态大语言模型（MLLM）的最新进展。然而，视觉语言任务的高质量指令调整数据的稀缺仍然是一个挑战。

Mars_prime·2023-12-21 08:35

7.7亿参数，超越5400亿PaLM！UW谷歌提出「分步蒸馏」，只需80%训练数据｜ACL 2023

大型语言模型虽然性能优异，可以用零样本或少样本提示解决新任务，但LLM在实际应用部署时却很不实用，内存利用效率低，并且需要大量计算资源。

语音之家·2023-12-21 07:03

AIGC：阿里开源大模型通义千问部署与实战

Qwen-7B是基于Transformer的大语言模型,在超大规模的预训练数据上进行训练得到。预训练数据类型多样，覆盖广泛，包括大量网络文本、专业书籍、代码等。

智慧医疗探索者·2023-12-21 06:54

ChatGPT | 02-如何利用ChatGPT学习英语？

简介ChatGPT是OpenAI训练的大型语言模型，可以帮助获取信息，回答问题，生成文本，提供建议，解决问题等。

SpringBear_KISS·2023-12-21 06:29

如何入门 GPT 并快速跟上当前的大语言模型 LLM 进展？

入门GPT首先说第一个问题：如何入门GPT模型？最直接的方式当然是去阅读官方的论文。GPT模型从2018年的GPT-1到现在的GPT-4已经迭代了好几个版本，通过官方团队发表的论文是最能准确理清其发展脉络的途径，其中包括GPT模型本身和一些介绍关键技术的文章，比如训练方法RLHF这些。下面列出一些主要的文章。第一手资料：论文GPT-1：language_understanding_paper.pd

xiaoduan2016·2023-12-21 05:18

技术分析测试

整体架构流程提示：这里可以添加技术整体架构例如：在语言模型中，编码器和解码器都是由一个个的Transformer组件拼接在一起形成的。

青山渺渺·2023-12-21 04:11

【无标题】

整体架构流程提示：这里可以添加技术整体架构例如：在语言模型中，编码器和解码器都是由一个个的Transformer组件拼接在一起形成的。

青山渺渺·2023-12-21 04:11

智能部署之巅：Amazon SageMaker引领机器学习革新

（全球TMT2023年12月6日讯）亚马逊云科技在2023re:Invent全球大会上，宣布推出五项AmazonSageMaker新功能，帮助客户加速构建、训练和部署大语言模型和其他基础模型。

小威要向诸佬学习呀·2023-12-21 01:45

Text2SQL学习整理（四）将预训练语言模型引入WikiSQL任务

导语上篇博客：Text2SQL学习整理（三）：SQLNet与TypeSQL模型简要介绍了WikiSQL数据集提出后两个早期的baseline，那时候像BERT之类的预训练语言模型还未在各种NLP任务中广泛应用

Q同学的nlp笔记·2023-12-20 23:20

UI Grounding 学习笔记

InstructBLIP：指令微调RT-DETRVPGTrans:TransferVisualPromptGeneratoracrossLLMs(NeurIPS2023)：模态对齐预训练，针对类BLIP-2架构Phi：小语言模型

songyuc·2023-12-20 22:21

2023年度佳作：AIGC、AGI、GhatGPT、人工智能大语言模型的崛起与挑战

目录前言01《ChatGPT驱动软件开发》内容简介02《ChatGPT原理与实战》内容简介03《神经网络与深度学习》04《AIGC重塑教育》内容简介05《通用人工智能》目录前言2023年是人工智能大语言模型大爆发的一年

库库的里昂·2023-12-20 22:06

ChatGPT如何计算token数？

GPT不是适用于某一门语言的大型语言模型，它适用于几乎所有流行的自然语言。

双天至尊1992·2023-12-20 21:43

【免费培训 · 明天开课】如何用ChatGPT搞科研？（直播：2023.10.7）

课程背景ChatGPT是一种基于先进语言模型的自然语言处理工具，对于科研人员来说，在语言翻译和润色方面具有重要的价值和意义。

茗创科技·2023-12-20 20:38

使用yolov8和moviepy自动截取视频中人出现的片段

分析不想看分析的直接跳到代码复制^_^1.拿到这个问题，我首先就丢给了gpt和一众大语言模型去解决，因为真的不想动手干这种杂活，懒惰之神上身了。然后我一开始的指令是

XINFINFZ·2023-12-20 18:54

OpenAI官方的Prompt工程指南：你可以这么玩ChatGPT

随着ChatGPT、GPT-4等大型语言模型（LLM）的出现，提示工程（PromptEngineering）变得越来越重要。很多人将prompt视为LLM的咒语，其好坏直接影响模型输出的结果。

智云研·2023-12-20 18:49

整理了上百个开源中文大语言模型，涵盖模型、应用、数据集、微调、部署、评测

自ChatGPT为代表的大语言模型（LargeLanguageModel,LLM）出现以后，由于其惊人的类通用人工智能（AGI）的能力，掀起了新一轮自然语言处理领域的研究和应用的浪潮。

Python算法实战·2023-12-20 17:53

ChatGLM3：打造更智能、更安全的代码解释器和工具使用体验

ChatGLM3是由智谱AI训练的第三代大型语言模型，它不仅能理解和生成人类语言，还能执行代码、调用工具，并以markdown格式进行响应。

超级人工智能·2023-12-20 16:11

大型语言模型：SBERT — Sentence-BERT

@slavahead一、介绍Transformer在NLP方面取得了进化进步，这已经不是什么秘密了。基于转换器，许多其他机器学习模型已经发展起来。其中之一是BERT，它主要由几个堆叠的变压器编码器组成。除了用于情感分析或问答等一系列不同的问题外，BERT在构建词嵌入（表示词的语义含义的数字向量）方面也越来越受欢迎。以嵌入的形式表示单词具有巨大的优势，因为机器学习算法不能处理原始文本，但可以对向量的

无水先生·2023-12-20 16:39

大型语言模型：RoBERTa — 一种稳健优化的 BERT 方法

@slavahead一、介绍BERT模型的出现BERT模型带来了NLP的重大进展。BERT的架构源自Transformer，它在各种下游任务上取得了最先进的结果：语言建模、下一句预测、问答、NER标记等。尽管BERT性能出色，研究人员仍在继续尝试其配置，希望获得更好的指标。幸运的是，他们成功了，并提出了一种名为RoBERTa的新模型-鲁棒优化的BERT方法。在本文中，我们将参考官方RoBERTa论

无水先生·2023-12-20 16:39

CogVLM与CogAgent：开源视觉语言模型的新里程碑

引言随着机器学习的快速发展，视觉语言模型（VLM）的研究取得了显著的进步。今天，我们很高兴介绍两款强大的开源视觉语言模型：CogVLM和CogAgent。

超级人工智能·2023-12-20 16:08

2023ChatGPT浪潮，2024开源大语言模型会成王者？

《2023ChatGPT浪潮，2024开源大语言模型会成王者？》一、2023年的回顾1.1、背景我们正迈向2023年的终点，回首这一年，技术行业的发展如同车轮滚滚。

玄明Hanko·2023-12-20 16:08

回顾 | AutoGen 智能应用开发（二）- AutoGen 应用

继MicrosoftBuild大会上发布的CopilotStack之后，微软针对大语言模型开发，陆续发布了SemanticKernel

MicrosoftReactor·2023-12-20 15:02

文心ERNIE Bot SDK+LangChain：基于文档、网页的个性化问答系统

现在各行各业纷纷选择接入大模型，其中最火且可行性最高的形式无异于智能文档问答助手，而LangChain是其中主流技术实现工具，能够轻松让大语言模型与外部数据相结合，从而构建智能问答系统。

飞桨PaddlePaddle·2023-12-20 14:03

定档12月28日，WAVE SUMMIT+深度学习开发者大会2023狂欢来袭！

回望2023年，大语言模型或许将是科技史上最浓墨重彩的一笔。从技术、产业到生态，大语言模型在突飞猛进中加速重构万物。随着理解、生成、逻辑、记忆四大能力显著提升，大语言模型为通用人工智能带来曙光。

飞桨PaddlePaddle·2023-12-20 14:03

实战干货！基于ERNIE Bot SDK的数字诗人聊天开发教程

随着人工智能技术的不断迭代发展，数字人的开发与应用需求也与日俱增，并且随着大语言模型的发展，数字人也更智能，从最初的语音预制到现在的实时交流，目前已在很多场景都有广泛应用。

飞桨PaddlePaddle·2023-12-20 14:33

数据分析师狂喜！手把手教你用混元大模型做数据分析

导读最近，腾讯发布了自主研发的大型语言模型：混元大模型。该大模型具备多轮对话能力、内容创作能力、逻辑推理能力、搜索增强和知识图谱等特点。

腾讯云开发者·2023-12-20 14:55

DeepMind论文登上Nature：大模型找到数学难题最新解，赢过人类数学家

这次谷歌DeepMind提出了一种使用大语言模型搜索数学和计算机科学新解决方案的方法FunSearch，FunSearch针对历史上一些经典数学难题给出了新的解法，赢过了人类数学家。

夕小瑶·2023-12-20 13:46

DeepMind提出代码链，通过“代码思考”改进推理性能

谷歌DeepMind最近提出了一个简单且高效的方法ChainofCode（CoC），可以优化大语言模型的代码来驱动推理。

夕小瑶·2023-12-20 13:15

20倍压缩比！微软提出大模型提示压缩框架LLMLingua

近期，越来越多研究在探索大型语言模型（LLM）在实际应用中的推理和生成能力。随着ChatGPT等模型的广泛研究与应用，如何在保留关键信息的同时，压缩较长的提示成为当前大模型研究的问题之一。

夕小瑶·2023-12-20 13:45

国货之光，复旦发布大模型训练效率工具 CoLLiE，效率显著提升

在这个信息爆炸的时代，大型语言模型（LLM）成为理解和挖掘文本信息的重要工具。为了更好地适应各种应用场景，对LLM进行定制化训练变得至关重要。

夕小瑶·2023-12-20 13:14

复旦团队提出思维交流框架EoT，由CoT到EoT，可跨模型通信，表现更出色

大型语言模型（LLM）通过利用庞大的训练语料和强大的计算资源，在众多NLP任务中表现卓越。然而，在理解和进行推理方面，这些模型仍显得相对薄弱，仅依靠增加模型的大小无法解决这一问题。

夕小瑶·2023-12-20 13:44

ICLR 2023 | Self-Consistency: Google超简单方法改善大模型推理能力

GoogleResearch,BrainTeam的一篇文章，SELF-CONSISTENCYIMPROVESCHAINOFTHOUGHTREASONINGINLANGUAGEMODELS[1]：利用自洽性提高语言模型中的思维链推理效果这篇文章方法非常简单但是效果非常好

HxShine·2023-12-20 13:25

论文笔记 | ICLR 2023 ReAct：通过整合推理和行动来增强语言模型

|Accept:notable-top-5%：《ReAct:SynergizingReasoningandActinginLanguageModels》一句话总结：ReAct方法在问答任务中通过提示大语言模型生成与任务相关的推理文本

叶庭云·2023-12-20 13:52

推荐频道

N-gram语言模型。