N-gram语言模型第54页

LLM的实践古往今来（持续更新ing...）

代码实践部分主要见：Gitee：llm-throughtout-ages:LLM（预训练语言模型）的代码应用和最佳实践GitHub：PolarisRisingWar/llm-throught-ages:

诸神缄默不语·2023-11-01 07:00

【论文笔记】Unifying Large Language Models and Knowledge Graphs：A Roadmap

（后续更新完善）2.KG-ENHANCEDLLMS2.1KG-enhancedLLMPre-training以往将KGs集成到大型语言模型的工作主要分为三个部分:1)将KGs集成到训练目标中，2)将KGs

·2023-11-01 07:58

学习笔记-简单概念记录

语言模型：衡量一句话是句子的概率假设有句子,根据语言模型计算s的概率为通常还使用n-gram语言模型计算句子概率1-gram语言模型(uni-grammodel):2-gram语言模型(bi-grammodel

Pluto_wl·2023-11-01 07:54

从语言模型到ChatGPT，大模型训练全攻略

文｜python前言你是否想过，为什么ChatGPT能够如此火爆呢？我认为这主要是因为ChatGPT提供了好玩、有用的对话式交互功能，能够为用户提供帮助，而不仅仅是依靠“大”模型的魅力。毕竟，GPT-3在2020年就已经推出了，拥有175B的参数规模，但除了最初的热度之外，它并没有引起社会太多的关注。那么，究竟是什么让ChatGPT能够生成相对客观且富有信息量的回答呢？研究者们基于预训练好的大规模

夕小瑶·2023-11-01 07:17

大型语言模型，真的能够理解人类吗？

作者|BlaiseAguerayArcas译者|弯月出品|CSDN（ID：CSDNnews）简介大型语言模型（Largelanguagemodel，简称LLM）代表了人工智能（AI）的重大进步，特别是朝着类人通用人工智能的目标迈进了一大步

AI科技大本营·2023-11-01 06:38

大型语言模型与文本摘要

大型语言模型与文本摘要基于大型语言模型的抽取式摘要基于大型语言模型的零样本跨语言摘要基于大型语言模型的问答式摘要通过摘要任务评估大型语言模型的事实一致性基于大型语言模型的摘要事实一致性评估器未来方向大型语言模型的自我偏好基于大型语言模型生成提示基于大型语言模型的文本编辑基于大型语言模型的抽取式摘要

梦里年华似烟花·2023-11-01 06:33

语言模型和人类的推理都依赖内容

这篇论文对最先进的大型语言模型和人类进行了评估，发现语言模型反映了人类在这些任务中观察到的许多相同模式--与人类一样，当任务的语义内容更准确时，模型的回答也更准确。这些

极道Jdon·2023-11-01 06:29

微软多模态ChatGPT来了？16亿参数搞定看图答题、智商测验等任务

关注并星标从此不迷路计算机视觉研究院公众号ID｜ComputerVisionGzq学习群｜扫码在主页获取加入方式计算机视觉研究院专栏作者：Edison_G从大型语言模型（LLM）到多模态大型语言模型（MLLM

计算机视觉研究院·2023-11-01 04:49

DevChat：VSCode中基于大模型的AI智能编程助手

它利用了最先进的大语言模型技术，像人类开发者一样高效地理解需求，并提供最佳的代码和项目实现方式。DevChat都可提供智能补全、错误纠正、代码规范

herosunly·2023-11-01 04:47

NLP课程笔记（严睿老师）—— 语言模型（N-grams）

一、probabilisticLanguageModeling目标：计算一个句子或句子中单词出现的概率怎么计算？Thechainrule计算联合概率可以直接用count来估计概率吗？不可以马尔可夫假设（MarkovAssumption）：滑动窗口，只与临近的几个词有关Unigrams:每个单词独立，与其他词没有关系Bigrammodel:认为只与相邻的前一个词有关系（实际上不是很够）N-gramm

AngelaOrange·2023-10-31 23:18

【笔记3-6】CS224N课程笔记 - RNN和语言模型

CS224N（六）RecurrentNeuralNetworksandLanguageModels语言模型语言模型介绍n-gram基于窗口的神经语言模型RNNRNNLossandPerplexityRNN

jessie_weiqing·2023-10-31 23:47

笔记49：53语言模型--课程笔记

本地笔记地址：D:\work_file\DeepLearning_Learning\03_个人笔记\3.循环神经网络\语言模型PS：沐神别怪我，实在是截屏避不开啊，我就留个备忘，在我博客里先委屈一下哈，

恨晨光熹微·2023-10-31 23:16

自相矛盾的LLM幻觉：评估、检测、缓解10.30

自相矛盾的LLM幻觉：评估、检测、缓解摘要引言相关工作定义和激励自我矛盾4触发、检测和减轻自相矛盾的行为5实例化到开放文本生成6实验摘要大型语言模型（LargeLMs）容易产生包含虚构内容的文本。

露葵025·2023-10-31 23:20

[论文笔记]RetroMAE

引言RetroMAE，中文题目为通过掩码自编码器预训练面向检索的语言模型。尽管现在已经在许多重要的自然语言处理任务上进行了预训练，但对于密集检索来说，仍然需要探索有效的预训练策略。

愤怒的可乐·2023-10-31 23:49

验证链（CoVe）降低LLM中的幻觉10.31

执行验证3.4最终验证的回答4实验（直译）4.1任务4.1.1WIKIDATA4.1.2WIKI-CATEGORYLIST4.1.3MULTISPANQA4.1.4生物传记的长篇生成4.2基准摘要在大型语言模型中

露葵025·2023-10-31 23:18

ReuseAndDiffuse笔记

arxiv.org/pdf/2309.03549.pdfhttps://mp.weixin.qq.com/s/pbSK4KOO2hqQU1-uwQzjBA数据集：BLIP-2、MiniGPT4等多模态大语言模型

无名份的浪漫2018·2023-10-31 22:54

ai问答网站有哪些

1、MentalAIMentalAI（https://ai.ciyundata.com/）是一种基于星火大模型和文心大模型的知识增强大语言模型，专注于自然语言处理（NLP）领域的技术研发。

偷拨网线的william·2023-10-31 19:44

世界经济论坛：ChatGPT等生成式AI，对全球23%岗位产生巨大影响

世界经济论坛与全球最大上市咨询公司之一埃森哲合作，联合发布了《未来工作：大语言模型与就业》白皮书。

RPA中国·2023-10-31 16:07

ChatGPT、Llama-2等大模型，能推算出你的隐私数据！

ChatGPT等大语言模型的推理能力有多强大？通过你发过的帖子或部分隐私数据，就能推算出你的住址、年龄、性别、职业、收入等隐私数据。

RPA中国·2023-10-31 16:07

将ChatGPT与物理机器人结合，波士顿动力开发了一只怪物！

波士顿动力表示，ChatGPT等大语言模型展现出了强大的控制和输出能力，这让他们大受启发，可以

RPA中国·2023-10-31 16:37

科技云报道：不堪忍受英伟达霸权，微软、OpenAI纷纷自研AI芯片

英伟达是当之无愧的“AI算力王者”，A100、H100系列芯片占据金字塔顶尖位置，是ChatGPT这样的大型语言模型背后的动力来源。但面对英伟达的独霸天下，科技巨头们都纷纷下场自研AI芯片。

科技云报道·2023-10-31 15:19

BERT-as-service 时隔三年突然更新，这次连名儿都改了

从BERT到BERT-as-service2018年9月，Google一篇BERT模型相关论文引爆全网：该自然语言模型，在机器阅读理解顶级水平测试SQuAD1.1中，连破11项NLP测试记录，两个衡量指标全面超越人类

Jina AI·2023-10-31 14:14

专门解决数学问题的大模型

01项目介绍LLEMMA：一个专门解决数学问题的开源大语言模型，能力超过所有已知的开源模型LLEMMA由多个大学和EleutherAI公司共同研发，模型能够理解和生成数学表达式、解决数学问题，并与其他计算工具

AI 研习所·2023-10-31 13:21

Python调用讯飞星火大模型v3 api接口使用教程

1、获取api接口的ID和key这里我们可以获取星火免费赠送的200万个token使用和测试，获取方法如下:打卡网站讯飞星火认知大模型-AI大语言模型-星火大模型-科大讯飞，登录用户点击免费使用1.1创建应用点击购买首次应该会让创建一个应用

IT大头·2023-10-31 13:40

国内好用的免费ai软件

小名空鵼·2023-10-31 13:39

【论文解读】RLAIF基于人工智能反馈的强化学习

一、简要介绍人类反馈强化学习(RLHF)可以有效地将大型语言模型(LLM)与人类偏好对齐，但收集高质量的人类偏好标签是一个关键瓶颈。

合合技术团队·2023-10-31 12:14

使用Llama index构建多代理 RAG

检索增强生成(RAG)已成为增强大型语言模型(LLM)能力的一种强大技术。通过从知识来源中检索相关信息并将其纳入提示，RAG为LLM提供了有用的上下文，以产生基于事实的输出。

deephub·2023-10-31 10:36

第17期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大型语言模型（LLM）等安全领域应用的知识。

云起无垠·2023-10-31 10:32

第16期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大型语言模型（LLM）等安全领域应用的知识。

云起无垠·2023-10-31 10:01

#Reading Paper# 【LLM】X-LLM: Bootstrapping Advanced Large Language Models by Treating Multi-Modalitie

BootstrappingAdvancedLargeLanguageModelsbyTreatingMulti-ModalitiesasForeignLanguages（X-LLM：通过将多模态视为外语来引导高级大型语言模型

堇禤·2023-10-31 06:26

音视频技术开发周刊 | 317

MIT惊人再证大语言模型是世界模型！LLM能分清真理和谎言，还能被人类洗脑MIT等学者的「世界模型」第二弹来了！

LiveVideoStack_·2023-10-31 04:30

IMYAI-人工智能聊天绘画机器人4.0 - 终身学习者的超级生产力工具！

ChatGPT全名ChatGenerativePre-trainedTransformer(聊天生成性预训练转换模型)说简单点，ChatGPT就是一个AI聊天机器人，背后是一个十分庞大的语言模型，由国外的

图欧学习资源库·2023-10-30 19:10

利用检索和存储访问知识库上增强大型语言模型10.30

利用检索和存储访问知识库上增强大型语言模型摘要引言2相关研究3方法3.1任务定义3.2知识检索3.2.1代码实现3.2.2实体链接3.2.3获取实体信息3.2.4查找实体或值3.2.5查找关系3.3知识存储

露葵025·2023-10-30 19:26

【SIGIR 2022】面向长代码序列的Transformer模型优化方法，提升长代码场景性能

由于self-attention模块的复杂度随序列长度呈次方增长，多数编程预训练语言模型（Programming-basedPretrainedLan

阿里云大数据AI技术·2023-10-30 18:12

请放下偏见：试试“中国版”的chatgpt网站

下面小编给大家分享3个.1.HeiGPTHeiGPT是基于Openai官方GPT-3.5语言模型构架,通过在海量的文本数据上进行训练，具备了强大的自然语言处理能力，

AI 智能大亨·2023-10-30 17:46

亲测！“汉化版”chatgpt国内就能用哦！一起来体验下！

下面小编给大家分享3个.1.l4s.cnHeiGPT是基于Openai官方GPT-3.5语言模型构架,通过在海量的文本数据上进行训练，具备了强大的自然语言处理能力，

AI 智能大亨·2023-10-30 17:46

ChatGPT 账号被封？推荐 5 款国外网站，完美替代！

注：以下国外网站访问可能需要会“魔法"1.Bard网址：https://bard.google.comBard是一个由Google公司推出的免费AI语言模型。

程序员阿狸·2023-10-30 17:44

分享3个类似 ChatGPT 国内AI软件，请及时收藏！

下面小编给大家分享3个.1.HeiGPTHeiGPT是基于Openai官方GPT-3.5语言模型构架,通过在海量的文本数据上进行训练，具备了强大的自然语言处理能力，

AI 智能大亨·2023-10-30 17:41

Data-Centric Financial Large Language Models

以数据为中心的大语言金融模型摘要1引言2背景3方法4实验5结论和未来工作摘要大型语言模型（LLM）有望用于自然语言任务，但在直接应用于金融等复杂领域时却举步维艰。

UnknownBody·2023-10-30 16:45

Who‘s Harry Potter? Approximate Unlearning in LLMs

LLMs中的近似遗忘摘要1引言2我们方法的描述3评估方法4结果5结论摘要大型语言模型（LLM）是在大量的互联网语料库上训练的，这些语料库通常包含受版权保护的内容。

UnknownBody·2023-10-30 16:45

Large Language Models as Generalizable Policies for Embodied Tasks

大型语言模型作为具体任务的可推广策略摘要1引言2相关工作3方法4语言重排问题5实验6结论摘要我们展示了大型语言模型（LLM）可以被调整为用于具体视觉任务的可推广策略。

UnknownBody·2023-10-30 16:14

【操作系统】考研真题攻克与重点知识点剖析 - 第 1 篇：操作系统概述

此前我尝试了完全使用Python或是结合大语言模型对考研真题进行数据清洗与可视化分析，本人技术有限，最终数据清洗结果不够理想，相关CSDN文章便没有发出。

friklogff·2023-10-30 16:13

哈工大发布大模型思维链推理综述：200+文献全面解析大语言模型思维链推理最新进展...

©PaperWeekly原创·作者|初征，陈靖昌，刘铭，秦兵，刘挺单位|哈尔滨工业大学研究方向|自然语言处理论文标题：ASurveyofChainofThoughtReasoning:Advances,FrontiersandFuture论文链接：https://arxiv.org/abs/2309.15402仓库链接：https://github.com/zchuz/CoT-Reasoning-

PaperWeekly·2023-10-30 15:09

港大联合百度开源通用图大模型GraphGPT：让大语言模型读懂图数据

导读图神经网络（GNN）已成为处理和学习图数据的强大工具，在社交网络分析、推荐系统、智慧城市和生物信息等多个领域带来了革命性的进展。图神经网络的核心优势在于其揭示图数据中复杂关联性的能力。通过消息传递和信息聚合，图神经网络能够高效地在图中传递和整合信息，从而理解复杂的图结构知识并做出准确的预测。然而，许多图神经网络方法存在一个明显的缺陷，即它们极大地依赖于高质量的监督信号，这可能导致在处理稀疏和有

PaperWeekly·2023-10-30 15:04

DIY一个智能音箱

十一假期里将蓝牙音箱改造成一个智能音箱,参考了网上的实现方法,后台的大语言模型使用的是百度的文心一言.账号Picovoice唤醒词服务https://console.picovoice.ai/我绑定了github

csdnharrychinese·2023-10-30 15:24

吴恩达《面向开发者的提示词工程》

中英字幕|P01Introduction】2023吴恩达新课《面向开发者的提示词工程》_哔哩哔哩_bilibili对应的笔记ChatGPTPrompt-知乎本课程主要介绍指令微调LLM的最佳实践在大型语言模型或

人鱼线·2023-10-30 12:37

2022-arxiv-P-Tuning v2 Prompt Tuning Can Be Comparable to Fine-tuning Universally Across Scales and

arxiv-P-Tuningv2PromptTuningCanBeComparabletoFine-tuningUniversallyAcrossScalesandTasksP-Tuningv2：快速调优可以与跨规模和任务的普遍微调相媲美提示微调，只用一个冻结的语言模型来微调连续的提示

发呆的比目鱼·2023-10-30 11:00

2021-arxiv-LoRA Low-Rank Adaptation of Large Language Models

arxiv-LoRALow-RankAdaptationofLargeLanguageModelsPaper:https://arxiv.org/abs/2106.09685Code:https://github.com/microsoft/LoRA大型语言模型的

发呆的比目鱼·2023-10-30 11:50

ESM蛋白质语言模型系列

模型总览第一篇《Biologicalstructureandfunctionemergefromscalingunsupervisedlearningto250millionproteinsequences》ESM-1b第二篇《MSATransformer》在ESM-1b的基础上作出改进，将模型的输入从单一蛋白质序列改为MSA矩阵，并在Transformer中加入行、列两种轴向注意力机制，对位点分

B1CK·2023-10-30 10:43

2023年CCF中国开源大会“大模型时代的智能化软件工程新范式”分论坛成功举行...

同济大学特聘研究员、OpenKG发起人王昊奋老师带来了名为“增强大语言模型关键技术与应用范式“的主题报

pengxin_ce·2023-10-30 10:07

推荐频道

N-gram语言模型