NLP损失函数第23页

2024年1月16日Arxiv热门NLP大模型论文：Improved Learned Sparse Retrieval with Corpus-Specific Vocabularies

亚马逊颠覆搜索技术：自定义词汇库提升检索性能，效率提高50%，准确度飙升12%！引言：搜索引擎中的词汇选择与检索效率在搜索引擎的世界中，词汇的选择对于检索效率至关重要。传统的搜索引擎技术，如BM25，依赖于对文档中词汇的频率统计来估计词汇的重要性。然而，随着预训练语言模型（如BERT）的兴起，我们现在可以通过直接优化检索任务来学习文档中词汇的重要性。这些学习到的词汇重要性分数是许多学习型稀疏检索技

夕小瑶·2024-01-17 10:14

2024年1月16日Arxiv最热NLP大模型论文：How Johnny Can Persuade LLMs to Jailbreak Them: Rethinking Persuasion to C

让大语言模型轻松「越狱」，人大研究揭示AI安全新风险，攻击成功率高达92%！引言：人工智能安全的新视角——以人类沟通者的角色挑战大型语言模型（LLMs）随着大型语言模型（LLMs）的日益普及和能力提升，它们在日常互动中的安全性问题也逐渐显现。传统的人工智能（AI）安全研究多从算法角度出发，关注由安全专家开发的基于算法的攻击手段。然而，非专家用户在与LLMs的日常交互中也可能带来风险。本文提出了一种

夕小瑶·2024-01-17 10:43

2024 年1月15日Arxiv最热NLP大模型论文：APAR: LLMs Can Do Auto-Parallel Auto-Regressive Decoding

清华大学让大语言模型自动并行自回归解码，速度提升高达4倍！引言：大型语言模型的高效部署挑战随着大型语言模型（LLMs）在各种人工智能应用中的广泛应用，对于这些模型的高效部署需求日益增长。高效部署在这里指的是低延迟和高吞吐量。然而，LLMs的基础自回归（AR）结构给实现更高效的服务带来了显著挑战。首先，自回归解码过程中，每一个新的词元都是基于之前生成的所有词元条件生成的，这种增量式解码导致生成速度不

夕小瑶·2024-01-17 10:13

2024年1月16日Arxiv热门NLP大模型论文：Multi-Candidate Speculative Decoding

大幅提速NLP任务，无需牺牲准确性！

夕小瑶·2024-01-17 10:03

刘知远LLM入门到实战——自然语言基础

文章目录自然语言处理基础词表示语言模型N-gramModelNeuralLanguageModel:为什么NLP等领域的模型越来越大？大模型会带来哪些新的范式和挑战？

李日音·2024-01-17 08:41

机器学习之Ridge回归与Lasso回归

Ridge回归是一种线性回归算法，通过在损失函数中添加一个正则化项，以控制模型的复杂度。正则化项是模型参数的平方和与一个参数alpha的乘积，alpha越大，惩罚项越大，模型的复杂度越低。

亦旧sea·2024-01-17 08:38

论文笔记（二十）VisuoTactile 6D Pose Estimation of an In-Hand Object using Vision and Tactile Sensor Data

VisuoTactile6DPoseEstimationofanIn-HandObjectusingVisionandTactileSensorData文章概括摘要1.介绍2.背景3.网络结构A.视觉触觉传感器融合B.姿势估计器C.损失函数

墨绿色的摆渡人·2024-01-17 07:40

深入探索智能问答：从检索到生成的技术之旅

一、智能问答概述智能问答(IntelligentQuestionAnswering,IQA)是自然语言处理（NLP）中的一个核心子领域，旨在设计和开发

工业甲酰苯胺·2024-01-17 06:38

神经网络中的损失函数（下）——分类任务

神经网络中的损失函数前言分类任务中的损失函数交叉熵最大似然信息论信息量信息熵最短平均编码长度交叉熵KL散度余弦相似度损失函数总结前言上文主要介绍了回归任务中常用的几个损失函数，本文则主要介绍分类任务中的损失函数

liuzibujian·2024-01-17 05:51

参数优化器

前置知识：机器学习概念，线性回归，梯度下降待优化参数w，损失函数loss，学习率lr，每次迭代一个batch计算t时刻损失函数关于当前参数的梯度：计算t时刻一阶动量mt和二阶动量Vt计算t时刻下降梯度：

惊雲浅谈天·2024-01-17 03:54

java调用Hanlp分词器获取词性；自定义词性字典

一、配置pom，导包：com.hankcshanlpportable-1.6.8二、java代码实现分词：/****hanlp分词*@paraminput*/publicstaticMapgetOut(

你好龙卷风！！！·2024-01-16 21:08

深度学习——第7章项目实战：自己动手写一个神经网络模型

第7章项目实战：自己动手写一个神经网络模型目录7.1导入数据集7.2定义神经网络输入层、隐藏层、输出层神经元个数7.3网络参数W和b初始化7.4正向传播过程7.5损失函数7.6反向传播过程7.7网络参数更新

曲入冥·2024-01-16 21:01

使用PaddleNLP识别垃圾邮件准确率98.5%的垃圾邮件分类器（附数据集下载）

使用PaddleNLP识别垃圾邮件准确率98.5%的垃圾邮件分类器（附数据集下载）。什么是垃圾邮件？垃圾邮件泛指未经请求而发送的电子邮件，例如未经发件人请求或允许而发送的商业广告或非法的电子邮件。

代码讲故事·2024-01-16 21:29

今天的领悟

感谢NLP平台给了我一个机会，感谢马老师精彩的教学，感谢

胖龙_fd9d·2024-01-16 19:48

一周NLP实践记录

幸好在nlp执行师课堂也做过类似的练习。当时和伙伴对练，她要我大声、再大声、再再大声。那时还没搞懂为啥。现在我明白那是给大脑创建新的回路。

晴空壹鹤·2024-01-16 18:31

springboot 通过代码自动生成pid

获取pid有很多种写法，简答粗暴netstat-nlpport|grepport|grep-v。其实springboot本身就有更简单方式来

神易风·2024-01-16 17:06

【AIGC入门一】Transformers 模型结构详解及代码解析

Transformers开启了NLP一个新时代，注意力模块目前各类大模型的重要结构。作为刚入门LLM的新手，怎么能不感受一下这个“变形金刚的魅力”呢？

不想动脑筋的亮亮·2024-01-16 15:59

【大模型】大语言模型前沿技术系列讲座-学习笔记2：Transformer -＞ChatGPT

系列讲座的内容由浅入深，讲解非常细致，没有任何水分，很适合我这种NLP刚入门的小白，听了这些讲座之后感觉收获满满8.26讲座安排（实际时长17：30-21

不雨_亦潇潇·2024-01-16 15:28

自然语言处理实战项目25-T5模型和BERT模型的应用场景以及对比研究、问题解答

T5是一种序列到序列模型，可以处理各种NLP任务，而BERT主要用于预训练语言表示。T5使用了类似于BERT的预训练方式，但采用了更广泛的输入输出形式。

微学AI·2024-01-16 14:40

AIGC大模型必备知识——LLM ，你知道它是如何训练的吗？小白必读深度好文

OJAC近屿智能·2024-01-16 14:03

RAG检索式增强技术是什么——OJAC近屿智能带你一探究竟

OJAC近屿智能·2024-01-16 14:30

【Python相关】anaconda介绍、安装及conda命令详解

❤️觉得内容不错的话，欢迎点赞收藏加关注，后续会继续输入更多优质内容❤️有问题欢迎大家加关注私戳或者评论（包括但不限于NLP算法相关，linux学习相关，读研读博相关......）博主原文链接：https

Chaos_Wang_·2024-01-16 14:52

NLP复习笔记-FA

DFA和NFA的区别1.DFA没有epsilontransaction（必须读入字符）2.对每一个确定的状态和读入字符，最多只能到一个下个状态，（不能有多的选择）Recognitioninputposition:0-ninitialconfiguration:(q0,0)agenda:asetofconfigurations,initialempty如何计算一个新的configuration从ag

乔茜_7b45·2024-01-16 12:28

深度学习：大规模模型分布式训练框架DeepSpeed

特别是在自然语言处理（NLP）等领域，模型大都达到了数十亿甚至数千亿参数的规模，这就需要多卡或者多节点分布式训练。为了有效地训练这些巨型

AI Player·2024-01-16 12:31

NLP 学习资源

红烧肉_2121·2024-01-16 11:10

NeRF算法论文解析与翻译

超爱吃小蛋糕的66·2024-01-16 11:16

【RT-DETR改进涨点】MPDIoU、InnerMPDIoU损失函数中的No.1（包含二次创新）

前言大家好，我是Snu77，这里是RT-DETR有效涨点专栏。本专栏的内容为根据ultralytics版本的RT-DETR进行改进，内容持续更新，每周更新文章数量3-10篇。专栏以ResNet18、ResNet50为基础修改版本，同时修改内容也支持ResNet32、ResNet101和PPHGNet版本，其中ResNet为RT-DETR官方版本1：1移植过来的，参数量基本保持一致(误差很小很小)，

Snu77·2024-01-16 11:03

机器学习在什么场景下最常用-九五小庞

机器学习在多个场景中都有广泛的应用，下面是一些常见的应用场景：自然语言处理（NLP）：如语音识别、自动翻译、情感分析、垃圾邮件过滤等。数据挖掘和分析：如市场分析、用户画像、推荐系统、欺诈检测等。

Up九五小庞·2024-01-16 10:33

开源项目汇总：机器学习前沿探索 | 开源专题 No.60

这些组件与领域无关，被视觉、NLP等领域的研究人员广泛使用。以研究为先导：xFormers包含在pytorch等主流库中还不可用的尖端组件。注重效率：因

开源服务指南·2024-01-16 10:01

LLM论文：ALCE （Enabling Large Language Models to Generate Text with Citations）

这是一篇RAG领域的文章，原文在这：https://aclanthology.org/2023.emnlp-main.398.pdf时间[Submittedon24May2023(v1),lastrevised31Oct2023

__心似大海__·2024-01-16 08:19

【文本到上下文 #5】：RNN、LSTM 和 GRU

一、说明欢迎来到“完整的NLP指南：文本到上下文#5”，这是我们对自然语言处理（NLP）和深度学习的持续探索。

无水先生·2024-01-16 08:42

用Pytorch实现线性回归模型

目录回顾Pytorch实现步骤1.准备数据2.设计模型classLinearModel代码3.构造损失函数和优化器4.训练过程5.输出和测试完整代码练习回顾前面已经学习过线性模型相关的内容，实现线性模型的过程并没有使用到

chairon·2024-01-16 08:49

必示科技联合多家单位发布 OpsEval：运维大语言模型评测榜单

评测榜单：https://opseval.cstcloud.cn/论文链接：https://arxiv.org/abs/2310.0763701/引言大规模语言模型（LLMs）在NLP相关任务如翻译、摘要和生成方面展现出了卓越的能力

BizSeer必示科技·2024-01-16 07:10

人工智能在电影行业的应用

以下是一些人工智能在电影行业中的主要应用：制作阶段：剧本生成：利用自然语言处理（NLP）技术，人工智能能够分析大量的剧本和电影数据库，生成新的剧本概念或辅助编剧。

胡图不迷糊·2024-01-16 07:37

《神奇的NLP：改变人生的非凡体验》第4章

读了这章，我差点又不想读了，前半部分没什么重要的内容。不过还好最后一节有一段很好的内容，即“一致性”。文中描述的这个类型的人正是我想要成为的。第4章：整理你的思想成功的法门1.通用模型：①身份/角色②价值观与信念/看法③能力④行为⑤环境//利用通用模型的关键：有明确的目标第1节：你的目标明确吗2.想要掌控生活，先要了解不适感来自五个层面的哪个：①你扮演的是何种角色？②你有何种价值观与信念？③你是否

掉线王·2024-01-16 05:41

NLP论文阅读记录 - 2021 | WOS 利用 ParsBERT 和预训练 mT5 进行波斯语抽象文本摘要

文章目录前言0、论文摘要一、Introduction1.1目标问题1.2相关的尝试1.3本文贡献二.前提三.本文方法A.序列到序列ParsBERTB、mT5四实验效果4.1数据集4.2对比模型4.3实施细节4.4评估指标4.5实验结果4.6细粒度分析五总结思考前言LeveragingParsBERTandPretrainedmT5forPersianAbstractiveTextSummariza

yuyuyu_xxx·2024-01-16 04:52

NLP论文阅读记录 - 2021 | WOS 基于动态记忆网络的抽取式摘要

文章目录前言0、论文摘要一、Introduction1.1目标问题1.2相关的尝试1.3本文贡献二.前提三.本文方法四实验效果4.1数据集4.2对比模型4.3实施细节4.4评估指标4.5实验结果4.6细粒度分析五总结思考前言ExtractiveSummarizationBasedonDynamicMemoryNetwork（21）0、论文摘要我们提出了一种基于Bert和动态记忆网络的提取摘要模型。

yuyuyu_xxx·2024-01-16 04:51

NLP论文阅读记录 - 2021 | WOS 使用 GA-HC 和 PSO-HC 改进新闻文章的文本摘要

文章目录前言0、论文摘要一、Introduction1.1目标问题1.2相关的尝试二.相关工作三.本文方法3.1总结为两阶段学习3.1.1基础系统3.2重构文本摘要四实验效果4.1数据集4.2对比模型4.3实施细节4.4评估指标4.5实验结果4.6细粒度分析五总结思考前言ImprovedTextSummarizationofNewsArticlesUsingGA-HCandPSO-HC（21）0、

yuyuyu_xxx·2024-01-16 04:51

NLP论文阅读记录 - 2021 | WOS HG-News：基于生成式预训练模型的新闻标题生成

文章目录前言0、论文摘要一、Introduction1.1目标问题1.2相关的尝试1.3本文贡献二.相关工作三.本文方法四实验效果4.1数据集4.2对比模型4.3实施细节4.4评估指标4.5实验结果4.6细粒度分析五总结思考前言HG-News:NewsHeadlineGenerationBasedonaGenerativePre-TrainingModel（2108）0、论文摘要自从神经网络方法应

yuyuyu_xxx·2024-01-16 04:19

将事件抽取看作机器阅读理解（EMNLP2020）

1、写作动机：以前的事件抽取方法通常被建模为分类任务，这些任务需要大量数据，并且存在数据稀缺问题。2、用MRC解决事件抽取的优势：1）通过将EE作为MRC，我们可以利用MRC的最新进展(例如，BERT)来增强EE任务，这可能会极大地加强模型中的推理过程。2）我们可以直接利用丰富的MRC数据集来提高EE的性能，这可能会缓解数据稀缺问题(这被称为跨域数据增强)。第二个优势也为零样本EE打开了一扇门:对

Ly大可爱·2024-01-16 03:31

多语言历史报纸广告事件抽取（ACL2023）

其次，大多数现成的NLP模型是在现代语言文本上训练的，这使得它们在应用于历史语料库时效果显著降低。这对于研究较少的任务以及非英语语言尤为棘手。

Ly大可爱·2024-01-16 03:31

Mindspore 公开课 - gpt2

1seq_len=10embed_dim=768x=Tensor(np.random.randn(batch_size,seq_len,embed_dim),mindspore.float32)frommindnlp

coyote_xujie·2024-01-15 22:08

self-attention机制详解

目前，对于我们的network，给定的input大都是一个向量：但是对于更复杂的情况，我们的input是asetofvec:举例：nlp中的句子，对于每个word都是一个wordembedding：图学习中每个节点有一个

图学习的小张·2024-01-15 21:10

感恩日记第223天20190710

感恩nlp家人约我到群里去做分享！感恩妈妈给机会让我帮他做拍打！

屈玉华·2024-01-15 20:15

AutoGluon安装及示例

AutoGluon安装及示例文章目录AutoGluon安装及示例AutoGluon_BackgroundAutoGluon安装运行示例打印相关配置信息数据预处理过程特征工程模型训练NLP模型训练使用模型

Every DAV inci·2024-01-15 19:03

NLP（五）命名实体识别（NER）

本文将会简单介绍自然语言处理（NLP）中的命名实体识别（NER）。

TFATS·2024-01-15 17:26

NLP论文阅读记录 - 2022 | WOS 用于摘要法律文本的有效深度学习方法

文章目录前言0、论文摘要一、Introduction1.1目标问题二.相关工作三.本文方法四实验效果4.1数据集4.2对比模型4.3实施细节4.4评估指标4.5实验结果4.6细粒度分析五总结前言Effectivedeeplearningapproachesforsummarizationoflegaltexts（22）0、论文摘要数字形式的法律判决文件的可用性为信息提取和应用提供了众多机会。由于这

yuyuyu_xxx·2024-01-15 17:11

NLP论文阅读记录 - 2021 | WOS01 通过对比学习增强 Seq2Seq 自动编码器进行抽象文本摘要

文章目录前言0、论文摘要一、Introduction1.1目标问题1.3本文贡献二.相关工作三.本文方法A文档增强B.自我监督对比学习C.序列到序列架构四实验效果4.1数据集4.2对比模型4.3实施细节4.4评估指标4.5实验结果4.6细粒度分析五总结前言EnhancedSeq2SeqAutoencoderviaContrastiveLearningforAbstractiveTextSummar