hitrjj

【AI视野·今日NLP 自然语言处理论文速览第三十期】Thu, 14 Apr 2022

AI视野·今日CS.NLP 自然语言处理论文速览
Thu, 14 Apr 2022
Totally 35 papers
上期速览✈更多精彩请移步主页

Daily Computation and Language Papers

Fast Few-shot Debugging for NLU Test Suites
Authors Christopher Malon, Kai Li, Erik Kruus
我们研究了基于 Transformer 的自然语言理解模型的少量调试，使用最近流行的测试套件来诊断和纠正问题。给定一些特定现象的调试示例，以及相同现象的测试集，我们的目标是在原始测试集上以最小的准确性成本最大化该现象的准确性。我们研究了几种比完整时期再训练更快的方法。我们引入了一种新的快速方法，该方法从原始训练集中抽取了一些危险示例。

Better Uncertainty Quantification for Machine Translation Evaluation
Authors Chrysoula Zerva, Taisiya Glushkova, Ricardo Rei, Andr F. T. Martins
基于神经的机器翻译 MT 评估指标正在快速发展。但是，这些系统通常难以解释，并且当人工参考或评估有噪音或数据超出域时，可能会产生不可靠的分数。最近的工作利用了不确定性量化技术，例如蒙特卡洛 dropout 和深度集成来提供置信区间，但我们展示的这些技术在几个方面受到限制。在本文中，我们研究了更强大和有效的 MT 评估指标的不确定性预测器，以及它们捕获任意和认知不确定性的潜力。为此，我们使用新的异方差回归、散度最小化和直接不确定性预测目标来训练 COMET 度量。我们的实验显示了 WMT20 和 WMT21 指标任务数据集的改进结果以及计算成本的大幅降低。

Multilingual Event Linking to Wikidata
Authors Adithya Pratapa, Rishubh Gupta, Teruko Mitamura
我们提出了将事件多语言链接到知识库的任务。我们为这项任务自动编译了一个大规模的数据集，包括 44 种语言的 180 万次提及，涉及来自 Wikidata 的超过 10.9K 事件。我们提出了事件链接任务的两种变体 1 多语言，其中事件描述来自与提及相同的语言，以及 2 跨语言，其中所有事件描述都是英语。在两个提议的任务中，我们比较了多个事件链接系统，包括 BM25 Lv 和 Zhai，2011 年，以及 BLINK Wu 等人，2020 年的双编码器和交叉编码器架构的多语言适应。在我们对这两个任务变体的实验中，我们发现 biencoder 和 crossencoder 模型都显着优于 BM25 基线。我们的结果还表明，跨语言任务通常比多语言任务更具挑战性。为了测试提议的链接系统的域外泛化，我们另外创建了一个基于 Wikinews 的评估集。

FactGraph: Evaluating Factuality in Summarization with Semantic Graph Representations
Authors Leonardo F. R. Ribeiro, Mengwen Liu, Iryna Gurevych, Markus Dreyer, Mohit Bansal
尽管最近在抽象摘要方面有所改进，但大多数当前方法生成的摘要实际上与源文档不一致，严重限制了它们在现实世界应用程序中的信任和使用。最近的工作已经显示出使用文本或依赖弧蕴涵在事实性错误识别方面的有希望的改进，但是，他们没有同时考虑整个语义图。为此，我们提出了 FactGraph，一种将文档和摘要分解为结构化的意义表示 MR 的方法，更适合于事实性评估。 MR 描述核心语义概念及其关系，以规范的形式聚合文档和摘要中的主要内容，并减少数据稀疏性。 FactGraph 使用带有结构感知适配器的图形编码器对此类图形进行编码，以捕获基于图形连接性的概念之间的交互，以及使用基于适配器的文本编码器的文本表示。在评估事实性的不同基准上进行的实验表明，FactGraph 的性能比以前的方法高出多达 15 倍。

Study of Indian English Pronunciation Variabilities relative to Received Pronunciation
Authors Priyanshi Pal, Shelly Jain, Anil Vuppala, Chiranjeevi Yarra, Prasanta Ghosh
与英式或美式英语相比，印度英语 IE 的语音级别的标注发音数据很少。这使得研究印度英语的发音变得具有挑战性。此外，由于母语对 L2 英语的影响，IE 种类繁多。过去，一些语言学著作对印度英语进行了研究。他们报告了这种表征的语音规则，但是，它们在多大程度上可以应用于各种大规模的印度发音数据仍有待研究。我们考虑一个语料库 IndicTIMIT，它富含 IE 品种的多样性，并以自然平衡的方式进行管理。它包含来自印度各个地区的 80 位演讲者的数据。我们提出了一种方法来验证 IE 的语音规则以及报告使用数据驱动方式派生的未探索规则，在这个语料库上。

Multilingual Language Model Adaptive Fine-Tuning: A Study on African Languages
Authors Jesujoba O. Alabi, David Ifeoluwa Adelani, Marius Mosbach, Dietrich Klakow
多语言预训练语言模型 PLM 在高资源和低资源语言的多个下游任务中表现出令人印象深刻的性能。但是，对于预训练期间未见的语言，尤其是非洲语言，仍然存在较大的性能下降。适应新语言的最有效方法之一是语言自适应微调 LAFT 使用相同的预训练目标在一种语言的单语文本上微调多语言 PLM。但是，具有大量单语文本的非洲语言很少，并且单独适应每种语言会占用大量磁盘空间并限制了所得模型的跨语言传输能力，因为它们专门针对单一语言。在本文中，我们对 17 种资源最丰富的非洲语言和非洲大陆英语、法语和阿拉伯语广泛使用的其他三种高资源语言执行多语言自适应微调 MAFT，以鼓励跨语言迁移学习。此外，为了进一步专门化多语言 PLM，我们从嵌入层中删除了 MAFT 之前与非非洲文字脚本相对应的词汇标记，从而将模型大小减少了大约 50 。我们对两个多语言 PLM AfriBERTa 和 XLM R 以及三个 NLP 任务 NER、新闻主题分类和情感分类的评估表明，我们的方法与在单个语言上应用 LAFT 相比具有竞争力，同时需要的磁盘空间显着减少。

The Impact of Cross-Lingual Adjustment of Contextual Word Representations on Zero-Shot Transfer
Authors Pavel Efimov, Leonid Boytsov, Elena Arslanova, Pavel Braslavski
大型预训练多语言模型（例如 mBERT 和 XLM R）在许多 NLP 任务中实现了有效的跨语言零镜头迁移。使用小型平行语料库对这些模型进行跨语言调整可能会进一步改善结果。与仅使用并行数据从头开始训练机器翻译系统或多语言模型相比，这是一种数据效率更高的方法。在这项研究中，我们尝试将英语模型零镜头迁移到四种类型不同的语言西班牙语、俄语、越南语和印地语以及三个 NLP 任务 QA、NLI 和 NER。我们对现成的 mBERT 模型进行跨语言调整。我们确认了先前的发现，这种调整使来自不同语言的语义相似词的嵌入彼此更接近，同时将不相关的词分开。然而，从我们工作中引入的配对差异直方图我们可以看到，调整只会适度影响相关词和不相关词之间的相对距离。相比之下，针对特定任务（例如 NER）对英语数据进行 mBERT 微调会使相关和不相关单词的嵌入彼此更接近。 mBERT 的跨语言调整提高了四种语言的 NLI 和两种语言的 NER，而 QA 性能从未提高甚至有时会下降。当我们为特定任务（例如 NLI）微调跨语言调整的 mBERT 时，mBERT 的跨语言调整可能仍会改善相关词和相关词之间的分离，但这仅适用于 XNLI 任务。

Revisiting Markovian Generative Architectures for Efficient Task-Oriented Dialog Systems
Authors Hong Liu, Yucheng Cai, Zhijian Ou, Yi Huang, Junlan Feng
最近，基于 Transformer 的预训练语言模型 PLM，例如 GPT2 和 T5，已被用于构建面向生成任务的对话 TOD 系统。现有基于 PLM 的模型的一个缺点是它们跨轮次的非马尔可夫架构，即，整个历史被用作每个轮次的条件输入，这会导致内存、计算和学习效率低下。在本文中，我们建议重新审视 Markovian Generative Architectures MGA，它已在以前的基于 LSTM 的 TOD 系统中使用，但尚未针对基于 PLM 的系统进行研究。

CRUSH: Contextually Regularized and User anchored Self-supervised Hate speech Detection
Authors Parag Dutta, Souvic Chakraborty, Sumegh Roychowdhury, Animesh Mukherjee
过去十年见证了人们通过社交网络平台进行的互动激增。虽然这些社交平台有几个积极的方面，但扩散导致它们成为网络欺凌和仇恨言论的温床。 NLP 的最新进展经常被用来减轻这种仇恨内容的传播。由于仇恨言论检测任务通常适用于社交网络的上下文，我们介绍了 CRUSH，这是一个使用用户锚定自我监督和上下文正则化的仇恨言论检测框架。

WikiDiverse: A Multimodal Entity Linking Dataset with Diversified Contextual Topics and Entity Types
Authors Xuwu Wang, Junfeng Tian, Min Gui, Zhixu Li, Rui Wang, Ming Yan, Lihan Chen, Yanghua Xiao
多模态实体链接 MEL 旨在将提及与多模态上下文链接到来自知识库（例如 Wikipedia）的参考实体，是许多多模态应用程序的基本任务。尽管 MEL 受到了广泛关注，但现有 MEL 数据集存在的上下文主题和实体类型有限、提及模糊性简化、可用性受限等缺点，给 MEL 的研究和应用带来了很大障碍。在本文中，我们展示了 WikiDiverse，这是一个来自 Wikinews 的具有多种上下文主题和实体类型的高质量人工注释 MEL 数据集，它使用 Wikipedia 作为相应的知识库。采用量身定制的注释程序来确保数据集的质量。基于 WikiDiverse，实现了一系列精心设计的具有模态内和模态间注意力的 MEL 模型，它们比现有的 MEL 模型更充分地利用了图像的视觉信息。进行了广泛的实验分析，以研究不同模式在 MEL 方面的贡献，促进未来对该任务的研究。

A Novel Approach to Train Diverse Types of Language Models for Health Mention Classification of Tweets
Authors Pervaiz Iqbal Khan, Imran Razzak, Andreas Dengel, Sheraz Ahmed
健康提及分类处理包含疾病词的给定文本中的疾病检测。然而，疾病词汇的非健康和比喻性使用给这项任务增加了挑战。最近，作为正则化手段的对抗性训练在许多 NLP 任务中获得了普及。在本文中，我们提出了一种新的方法来训练涉及对抗性训练的推文健康提及分类的语言模型。我们通过使用高斯噪声在不同级别的推文示例的变压器模型的表示中添加扰动来生成对抗性示例。此外，我们采用对比损失作为附加目标函数。我们在 PHM2017 数据集扩展版本上评估所提出的方法。结果表明，与基线方法相比，我们提出的方法显着提高了分类器的性能。此外，我们的分析表明，在早期层添加噪声可以提高模型性能，而在中间层添加噪声会降低模型性能。

HuBERT-EE: Early Exiting HuBERT for Efficient Speech Recognition
Authors Ji Won Yoon, Beom Jun Woo, Nam Soo Kim
使用自监督模型进行预训练，例如 Hidden unit BERT HuBERT 和 wav2vec 2.0，为自动语音识别 ASR 带来了显着的改进。但是，这些模型通常需要昂贵的计算成本才能获得出色的性能，从而降低了推理速度。为了提高模型效率，我们提出了一种 ASR 的早期退出方案，即 HuBERT EE，它允许模型动态停止推理。在 HuBERT EE 中，在中间层添加了多个提前退出分支，每个分支用于决定是否可以提前退出预测。

Call-sign recognition and understanding for noisy air-traffic transcripts using surveillance information
Authors Alexander Blatt, Martin Kocour, Karel Vesel , Igor Sz ke, Dietrich Klakow
空中交通管制 ATC 依靠飞行员和空中交通管制员 ATCO 之间的语音通信。呼号作为每个航班的唯一标识符，由 ATCO 用来称呼特定的飞行员。由于嘈杂的 ATC 语音信道和接收器引入的额外噪声，从通信中提取呼号是一项挑战。语音中的低信噪比 SNR 会导致高字错误率 WER 转录。我们提出了一个新的呼号识别和理解 CRU 系统来解决这个问题。识别器经过训练可以识别嘈杂的 ATC 抄本中的呼号，并将其转换为标准的国际民用航空组织 ICAO 格式。通过结合监控信息，我们可以将呼号准确度 CSA 提高到四倍。

Automatic Multi-Label Prompting: Simple and Interpretable Few-Shot Classification
Authors Han Wang, Canwen Xu, Julian McAuley
基于提示的学习，即提示是一种新兴的范式，用于利用通过预训练的语言模型学习的知识。在本文中，我们提出了自动多标签提示 AMuLaP，这是一种简单而有效的方法，可以自动选择标签映射，用于带提示的少量镜头文本分类。我们的方法利用一对多标签映射和基于统计的算法在给定提示模板的情况下选择标签映射。

TIB-VA at SemEval-2022 Task 5: A Multimodal Architecture for the Detection and Classification of Misogynous Memes
Authors Sherzod Hakimov, Gullal S. Cheema, Ralph Ewerth
在社交媒体上检测令人反感、仇恨的内容是一个具有挑战性的问题，每天都会影响许多在线用户。仇恨内容通常用于根据种族、性别、宗教和其他因素针对一群人。社交平台上对女性的仇恨或蔑视一直在增加。当文本和视觉模式结合形成一个单一的上下文时，厌恶女性的内容检测尤其具有挑战性，例如，嵌入在图像顶部的覆盖文本，也称为 meme。在本文中，我们提出了一种结合文本和视觉特征的多模态架构，以检测厌恶女性的 meme 内容。所提出的架构在 SemEval 2022 任务 5 MAMI 多媒体自动厌女症识别挑战中以团队名称 TIB VA 进行评估。

Curriculum: A Broad-Coverage Benchmark for Linguistic Phenomena in Natural Language Understanding
Authors Zeming Chen, Qiyue Gao
在大型 Transformer 语言模型时代，语言评估在诊断模型能力和自然语言理解的局限性方面发挥着重要作用。然而，目前的评估方法显示出一些明显的缺陷。特别是，它们不能深入了解语言模型如何捕捉语言理解和推理所必需的不同语言技能。因此，他们未能有效地绘制出对现有模型仍然具有挑战性的语言理解方面，这使得很难发现模型和数据集的潜在限制。在本文中，我们介绍了 Curriculum 作为 NLI 基准的一种新格式，用于评估广泛覆盖的语言现象。课程包含一组涵盖 36 种主要语言现象的数据集和一个评估程序，用于诊断语言模型如何捕捉不同类型语言现象的推理技能。我们表明，这种语言现象驱动的基准可以作为诊断模型行为和验证模型学习质量的有效工具。

TangoBERT: Reducing Inference Cost by using Cascaded Architecture
Authors Jonathan Mamou, Oren Pereg, Moshe Wasserblat, Roy Schwartz
基于大型转换器的模型（例如 BERT、RoBERTa 和 XLNet）在许多 NLP 任务中的显着成功伴随着由于其高计算负载和能耗而大大增加了金钱和环境成本。为了减少推理时间的计算负载，我们提出了 TangoBERT，这是一种级联模型架构，其中实例首先由高效但不太准确的第一层模型处理，并且只有部分实例由效率较低但更多准确的第二层模型。是否应用第二层模型的决定基于第一层模型产生的置信度分数。与基于多层变压器模型的标准级联方法相比，我们的简单方法具有几个吸引人的实际优势。首先，它可以实现更高的加速增益，平均更低的延迟。其次，它利用级联的批量大小优化，从而增加了相对推理成本的降低。我们在四个文本分类 GLUE 任务和一个阅读理解任务上报告了 TangoBERT 推理 CPU 加速。

Self-critical Sequence Training for Automatic Speech Recognition
Authors Chen Chen, Yuchen Hu, Nana Hou, Xiaofeng Qi, Heqing Zou, Eng Siong Chng
尽管自动语音识别 ASR 任务通过序列到序列模型取得了显着的成功，但其训练和测试之间存在两个主要的不匹配可能导致性能下降 1 通常使用的交叉熵标准旨在最大化训练数据的对数似然度，而性能是通过单词错误率 WER 来评估的，而不是对数似然度 2 教师强制方法导致训练过程中对 ground truth 的依赖，这意味着模型在测试之前从未暴露于自己的预测。在本文中，我们提出了一种称为自临界序列训练 SCST 的优化方法，以使训练过程更接近测试阶段。作为一种基于强化学习 RL 的方法，SCST 利用定制的奖励函数将训练标准和 WER 关联起来。此外，它消除了对教师强迫的依赖，并在推理过程方面协调了模型。

Can Question Rewriting Help Conversational Question Answering?
Authors Etsuko Ishii, Yan Xu, Samuel Cahyawijaya, Bryan Wilie
问题重写 QR 是对话式问答 CQA 的子任务，旨在通过以自包含的形式重新制定问题来缓解理解对话历史之间依赖关系的挑战。尽管看起来似乎合理，但几乎没有证据证明 QR 可以作为 CQA 的一种缓解方法。为了验证 QR 在 CQA 中的有效性，我们研究了一种强化学习方法，该方法集成了 QR 和 CQA 任务，并且不需要针对目标 CQA 的相应 QR 数据集。然而，我们发现 RL 方法与端到端基线相当。

Probing for Constituency Structure in Neural Language Models
Authors David Arps, Younes Samih, Laura Kallmeyer, Hassan Sajjad
在本文中，我们研究了上下文神经语言模型 LM 在多大程度上隐含地学习了句法结构。更具体地说，我们关注 Penn Treebank PTB 中所代表的组成结构。使用基于诊断分类器的标准探测技术，我们评估了在 RoBERTa 等 LM 的神经元激活中表示不同类别成分的准确性。为了确保我们的探索侧重于句法知识而不是隐式语义概括，我们还试验了一个 PTB 版本，该版本是通过在保持句法结构的同时随机替换成分而获得的，即语义错误但句法良好PTB 的形成版本。我们发现 4 个预训练的变换器 LM 在我们的探测任务中甚至在操纵数据上也获得了高性能，这表明它们表示中的语义和句法知识可以分开，并且选区信息实际上是由 LM 学习的。

A Universality-Individuality Integration Model for Dialog Act Classification
Authors Gao Pengfei, Ma Yinglong
对话法案 DA 揭示了谈话中说话者话语的一般意图。准确预测 DA 可以极大地促进对话代理的开发。尽管研究人员对对话行为分类进行了广泛的研究，但并未充分考虑分类的特征信息。本文提出词线索、词性线索和统计线索可以相互补充，提高识别的基础。此外，三者的不同类型导致其分布形式的多样性，阻碍了特征信息的挖掘。为了解决这个问题，我们提出了一种基于普遍性和个性化策略的新模型，称为 Universality Individuality Integration Model UIIM。 UIIM不仅通过学习普遍性来加深线索之间的联系，而且还利用对个体性的学习来捕捉线索本身的特征。在两个最流行的对话行为分类基准数据集 SwDA 和 MRDA 上进行了实验，结果表明，提取线索之间的普遍性和个性性可以更充分地挖掘话语中的隐藏信息，提高自动对话行为识别的准确率

Efficient Cluster-Based k-Nearest-Neighbor Machine Translation
Authors Dexin Wang, Kai Fan, Boxing Chen, Deyi Xiong
k 最近邻机器翻译 kNN MT 最近被提出作为神经机器翻译 NMT 中域适应的非参数解决方案。它旨在通过与从域数据中构建的基于标记级特征的附加检索模块协调来缓解高级 MT 系统在翻译域语句时的性能下降。先前的研究已经证明，非参数 NMT 甚至优于对域外数据进行微调的模型。尽管取得了成功，但 kNN 检索是以高延迟为代价的，特别是对于大型数据存储。为了使其实用，在本文中，我们探索了一种更有效的 kNN MT，并提出使用聚类来提高检索效率。具体来说，我们首先提出了一个基于集群的紧凑网络，以对比学习的方式进行特征缩减，将上下文特征压缩为 90 个低维向量。然后，我们建议使用基于集群的修剪解决方案来过滤大型数据存储中的 10 40 个冗余节点，同时保持翻译质量。我们提出的方法在几个机器翻译基准上与高级非参数 MT 模型相比，实现了更好或相当的性能，同时减少了多达 57 个推理延迟。

HIT at SemEval-2022 Task 2: Pre-trained Language Model for Idioms Detection
Authors Zheng Chu, Ziqing Yang, Yiming Cui, Zhigang Chen, Ming Liu
相同的多词表达在不同的句子中可能有不同的含义。它们主要可以分为字面意义和惯用意义两大类。非基于上下文的方法在这个问题上表现不佳，我们需要上下文嵌入来正确理解多词表达的惯用意义。

Impossible Triangle: What's Next for Pre-trained Language Models?
Authors Chenguang Zhu, Michael Zeng
大规模预训练语言模型 PLM 的最新发展显着提高了模型在各种 NLP 任务中的能力，包括任务特定微调和零样本少样本学习后的性能。然而，许多此类模型的规模大得令人望而生畏，很少有机构能够负担得起预训练、微调甚至部署的费用，而中等规模的模型通常缺乏强大的泛化少数镜头学习能力。在本文中，我们首先从不可能三角形 1 中等模型大小、2 最先进的少数镜头学习能力和 3 最先进的微调能力方面阐述了当前使用 PLM 模型的障碍。我们认为，所有现有的 PLM 模型都缺乏不可能三角中的一个或多个属性。为了弥补 PLM 的这些缺失特性，人们提出了各种技术，例如知识蒸馏、数据增强和快速学习，这不可避免地为 PLM 在实际场景中的应用带来了额外的工作。

ASQA: Factoid Questions Meet Long-Form Answers
Authors Ivan Stelmakh, Yi Luan, Bhuwan Dhingra, Ming Wei Chang
丰富的数据集和可靠的评估指标的可用性导致事实问答 QA 取得了长足的进步。然而，这一进展并不容易转移到长篇 QA 的任务中，其目标是回答需要深入解释的问题。障碍包括 i 缺乏高质量的数据，以及 ii 缺乏明确定义的答案质量概念。在这项工作中，我们通过发布一个新的数据集和一个任务来解决这些问题，我们称之为 ASQA 对不明确的问题的答案摘要，并且 ii 提出了一个可靠的指标来衡量 ASQA 的性能。我们的任务侧重于模棱两可的事实性问题，即根据解释有不同的正确答案。对模棱两可的问题的答案应该将来自多个来源的事实信息综合成一个长篇摘要，以解决模棱两可的问题。与现有的长格式 QA 任务（例如 ELI5）相比，ASQA 承认一个明确的正确性概念，用户面对一个好的摘要应该能够回答对原始模棱两可问题的不同解释。我们使用这种正确性的概念来定义 ASQA 的自动性能指标。

A Review on Language Models as Knowledge Bases
Authors Badr AlKhamissi, Millicent Li, Asli Celikyilmaz, Mona Diab, Marjan Ghazvininejad
最近，NLP 社区对使用预训练语言模型 LM 作为知识库 KB 的兴趣激增。研究人员表明，在足够大的网络语料库上训练的 LM 将在其参数中隐含地编码大量知识。生成的 LM 可以针对不同类型的知识进行探测，从而充当 KB。与传统 KB 相比，这具有一个主要优势，因为这种方法不需要人工监督。

L3Cube-MahaNER: A Marathi Named Entity Recognition Dataset and BERT models
Authors Parth Patil, Aparna Ranade, Maithili Sabane, Onkar Litake, Raviraj Joshi
命名实体识别 NER 是一项基本的 NLP 任务，主要应用在会话和搜索系统中。它帮助我们识别用于下游应用程序的句子中的关键实体。 NER 或用于流行语言的类似插槽填充系统已在商业应用中大量使用。在这项工作中，我们专注于马拉地语，这是一种印度语言，主要由马哈拉施特拉邦的人民使用。马拉地语是一种低资源语言，仍然缺乏有用的 NER 资源。我们介绍了 L3Cube MahaNER，这是马拉地语中第一个主要的黄金标准命名实体识别数据集。我们还描述了在此过程中遵循的手动注释指南。最后，我们在不同的基于 CNN、LSTM 和 Transformer 的模型（如 mBERT、XLM RoBERTa、IndicBERT、MahaBERT 等）上对数据集进行了基准测试。MahaBERT 在所有模型中提供了最佳性能。

CUNI-KIT System for Simultaneous Speech Translation Task at IWSLT 2022
Authors Peter Pol k, Ngoc Quan Ngoc, Tuan Nam Nguyen, Danni Liu, Carlos Mullov, Jan Niehues, Ond ej Bojar, Alexander Waibel
在本文中，我们描述了我们在 IWSLT 2022 上提交的同步语音翻译。我们探索了在同步环境中利用离线模型而无需修改原始模型的策略。在我们的实验中，我们表明我们的在线化算法几乎与离线设置相当，而在测试集的延迟方面比离线快 3 倍。

A pipeline and comparative study of 12 machine learning models for text classification
Authors Annalisa Occhipinti, Louis Rogers, Claudio Angione
基于文本的通信作为一种通信方法非常受欢迎，尤其是在商业环境中。因此，它经常被滥用，通过发送恶意消息（例如垃圾邮件）来欺骗用户传递个人信息，包括在线账户凭据或银行详细信息。出于这个原因，已经提出了许多用于文本分类的机器学习方法，并将其纳入大多数电子邮件提供商的服务中。

Scalable Training of Language Models using JAX pjit and TPUv4
Authors Joanna Yoo, Kuba Perlin, Siddhartha Rao Kamalakara, Jo o G.M. Ara jo
现代大型语言模型由于其大小而需要分布式训练策略。随着软件和硬件前沿的快速发展，有效和稳健地训练他们面临挑战。

Production federated keyword spotting via distillation, filtering, and joint federated-centralized training
Authors Andrew Hard, Kurt Partridge, Neng Chen, Sean Augenstein, Aishanee Shah, Hyun Jin Park, Alex Park, Sara Ng, Jessica Nguyen, Ignacio Lopez Moreno, Rajiv Mathews, Fran oise Beaufays
我们在真实用户设备上使用联合学习训练了一个关键字发现模型，并观察到将该模型部署到手机上进行推理时的显着改进。为了弥补设备训练缓存中缺少的数据域，我们采用了联合联合集中训练。为了在设备上没有精选标签的情况下学习，我们制定了一种基于用户反馈信号的置信过滤策略，用于联合蒸馏。

What Matters in Language Conditioned Robotic Imitation Learning
Authors Oier Mees, Lukas Hermann, Wolfram Burgard
机器人技术的一个长期目标是制造能够通过其机载传感器获得并仅通过自然语言指定的感知来执行广泛的日常任务的机器人。虽然最近通过利用像素的端到端学习在语言驱动的机器人技术方面取得了重大进展，但由于设置的潜在变化，没有明确且易于理解的过程来进行各种设计选择。在本文中，我们对从离线自由形式模仿数据集中学习语言条件策略的最关键挑战进行了广泛的研究。我们进一步确定了提高性能的架构和算法技术，例如机器人控制学习的分层分解、多模态变压器编码器、离散的潜在计划和对齐视频和语言表示的自我监督对比损失。通过将我们的调查结果与我们改进的模型组件相结合，我们能够提出一种新颖的方法，该方法在具有挑战性的语言条件下的长视野机器人操作 CALVIN 基准测试中显着优于现有技术。我们已经开源了我们的实现，以促进未来的研究，以学习以自然语言指定的方式连续执行许多复杂的操作技能。

Experimental Standards for Deep Learning Research: A Natural Language Processing Perspective
Authors Dennis Ulmer, Elisa Bassignana, Max M ller Eberstein, Daniel Varab, Mike Zhang, Christian Hardmeier, Barbara Plank
深度学习 DL 领域在过去十年中经历了爆炸式增长，对自然语言处理 NLP 也产生了重大影响。然而，与采用深度学习技术的其他领域一样，与更成熟的学科相比，缺乏通用的实验标准。从基本的科学原理开始，我们将正在进行的关于深度学习实验标准的讨论提炼成一个单一的、广泛适用的方法。遵循这些最佳实践对于加强实验证据、提高可重复性和促进科学进步至关重要。

Finding Trolls Under Bridges: Preliminary Work on a Motif Detector
Authors W. Victor H. Yarlott, Armando Ochoa, Anurag Acharya, Laurel Bobrow, Diego Castro Estrada, Diana Gomez, Joan Zheng, David McDonald, Chris Miller, Mark A. Finlayson
主题是民间传说中反复出现的独特元素，在新闻、文学、新闻稿和宣传中具有重要的交流手段。母题简明扼要地暗示了大量的文化相关信息，它们的广泛使用表明它们作为文化知识试金石的认知重要性，使它们的检测成为朝着具有文化意识的自然语言处理任务迈出的有价值的一步。到目前为止，民俗学家和其他对母题感兴趣的人只是手动从叙事中提取母题。我们提交了一份关于开发自动检测基序的系统的初步报告。我们简要描述了为训练主题检测生成数据的注释工作，该工作正在进行中。我们详细描述了我们正在进行的架构，其目的是部分捕捉人们如何确定主题候选者是否以主题方式使用。

InCoder: A Generative Model for Code Infilling and Synthesis
Authors Daniel Fried, Armen Aghajanyan, Jessy Lin, Sida Wang, Eric Wallace, Freda Shi, Ruiqi Zhong, Wen tau Yih, Luke Zettlemoyer, Mike Lewis
代码很少以从左到右的方式编写，而是反复编辑和完善。我们介绍了 InCoder，这是一个统一的生成模型，可以通过从左到右生成以及通过填充进行编辑来执行程序合成。 InCoder 经过训练可以从大量许可代码中生成代码文件，其中代码区域已被随机屏蔽并移动到每个文件的末尾，从而允许代码填充双向上下文。我们的模型是第一个能够直接执行零镜头代码填充的生成模型，我们对具有挑战性的任务进行评估，例如类型推断、评论生成和变量重命名。我们发现，双向上下文条件的能力显着提高了这些任务的性能，同时在标准程序综合基准测试中的表现与从左到右仅以类似规模预训练的模型相比仍然相当。

Chinese Abs From Machine Translation

Papers from arxiv.org

更多精彩请移步主页

pic from pexels.com

你可能感兴趣的:(NLP,Papers,NLP,NLPer,自然语言处理,机器翻译,语言模型)

潜入思维的海洋：SoftCoT++如何让语言模型更聪明步子哥智能涌现语言模型人工智能自然语言处理
在人工智能的浩瀚星空下，大型语言模型（LLMs）如同一颗颗璀璨的恒星，照亮了从文本生成到复杂推理的广阔领域。然而，这些模型在推理任务中往往像是在迷雾中航行——尽管它们能抵达目的地，却常常因为固定的思维路径而错过更优的航线。2025年5月，一篇题为《SoftCoT++:Test-TimeScalingwithSoftChain-of-ThoughtReasoning》的论文如同一盏明灯，照亮了如何让
企业级AI开发利器：Spring AI框架深度解析与实战_spring ai实战 AI大模型-海文人工智能 spring python 算法开发语言 java 机器学习
企业级AI开发利器：SpringAI框架深度解析与实战一、前言：Java生态的AI新纪元在人工智能技术爆发式发展的今天，Java开发者面临着一个新的挑战：如何将大语言模型（LLMs）和生成式AI（GenAI）无缝融入企业级应用。传统的Java生态缺乏统一的AI集成方案，开发者往往需要为不同AI供应商（如OpenAI、阿里云、HuggingFace）编写大量重复的接口适配代码，这不仅增加了开发成本，
Transformer底层原理解析及基于pytorch的代码实现 LiRuiJie 人工智能 transformer pytorch 深度学习
1.Transformer底层原理解析1.1核心架构突破Transformer是自然语言处理领域的革命性架构，其核心设计思想完全摒弃了循环结构，通过自注意力机制实现全局依赖建模。整体架构图如下：以下是其核心组件：1）自注意力机制（Self-Attention）-输入序列的每个位置都能直接关注所有位置-数学公式（缩放点积注意力）：-Q：查询矩阵（当前关注点）-K：键矩阵（被比较项）-V：值矩阵（实际
【深度学习解惑】如果用RNN实现情感分析或文本分类，你会如何设计数据输入？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 分类人工智能机器学习神经网络
以下是用RNN实现情感分析/文本分类时数据输入设计的完整技术方案：1.引言与背景介绍情感分析/文本分类是NLP的核心任务，目标是将文本映射到预定义类别（如正面/负面情感）。RNN因其处理序列数据的天然优势成为主流方案。核心挑战在于如何将非结构化的文本数据转换为适合RNN处理的数值化序列输入。2.原理解释文本到向量的转换流程：原始文本分词建立词汇表词索引映射词嵌入层序列向量关键数学表示：词嵌入表示：
PyTorch教程：LSTM语言模型的动态量化技术解析怀灏其Prudent
PyTorch教程：LSTM语言模型的动态量化技术解析tutorialsPyTorchtutorials.项目地址:https://gitcode.com/gh_mirrors/tuto/tutorials前言在深度学习模型部署过程中，模型大小和推理速度是两个至关重要的考量因素。PyTorch提供的动态量化技术能够在不显著影响模型准确率的前提下，有效减小模型体积并提升推理速度。本文将深入解析如何对
大语言模型(LLM)量化基础知识(一) -派神- RAG NLP ChatGPT 语言模型人工智能自然语言处理
承接各类AI相关应用开发项目(包括但不限于大模型微调、RAG、AI智能体、NLP、机器学习算法、运筹优化算法、数据分析EDA等)!!!有意愿请私信!!!随着大型语言模型(LLM)的参数数量的增长,与其支持硬件（加速器内存）增长速度之间的差距越来越大，如下图所示：上图显示，从2017年到2022年，语言模型的大小显著增加：2017年：Transformer模型（0.05B参数）2018年：GPT（0
大模型读过的书，终将成为人类的新血肉：一场知识炼金术的深度剖析黑巧克力可减脂 AIGC AIGC 人工智能
“吾生也有涯，而知也无涯。以有涯随无涯，殆已！”庄子千年前的慨叹，在信息爆炸的今天更显沉重。人类个体穷尽一生，所能阅读、理解、吸收的书籍不过沧海一粟。然而，一种前所未有的“数字读者”正在悄然改变这一困境——大语言模型以其近乎贪婪的“阅读”能力，正对浩如烟海的书籍进行前所未有的批量处理与深度总结。这并非冰冷的机械扫描，而是一场静默却影响深远的知识炼金术。巨量“吞噬”：大模型如何“阅读”万卷书？数据洪
配置不当的MCP服务器使AI代理系统面临入侵风险 FreeBuf- 服务器人工智能运维
风险概述：默认配置暴露命令执行漏洞数百台用于连接大语言模型（LLM）与第三方服务、数据源及工具的模型上下文协议（ModelContextProtocol，MCP）服务器存在默认配置缺陷，可能导致用户面临未授权的操作系统命令执行等风险。随着代理型AI（AgenticAI）的兴起，MCP服务器正迅速成为增强AI模型推理上下文的关键工具。但安全研究人员警告，大量公开共享的MCP服务器存在不安全配置，攻击
从实验到生产：DeepSeek大模型工程化部署的关键步骤与风险控制一ge科研小菜菜人工智能人工智能
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注一、引言：大模型部署迈入“工程化时代”随着DeepSeek等开源大语言模型（LLM）的发展，大模型不再是AI实验室的专属工具，越来越多的企业正尝试将其纳入业务生产系统，应用于客服问答、合同审查、数据分析、自动写作等场景。但模型的能力≠可用的系统。从模型下载到模型上线，中间隔着“部署的鸿沟”：资源配置、服务稳定性、响应效率、安全控制、上线合规……一
【人工智能】微调的秘密武器：释放大模型的无限潜能蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在人工智能迅猛发展的今天，大规模语言模型（LLMs）以其强大的通用能力席卷各行各业。然而，如何让这些通用模型在特定领域或任务中发挥最大潜力？答案是微调（Fine-tuning）。本文深入探讨微调的理论基础、技术细节与实践方法，揭示其作为解锁大模型隐藏潜力
基于Transformer实现机器翻译 yyyyurina. transformer 机器翻译深度学习
目录一、前言1.1什么是Transformer?1.2Transfomer的基本结构1.2Transformer的重要组成部分1.2.1位置编码（PositionalEncode）1.2.2自注意力机制（Self-Attention）1.2.3多头注意力（Multi-HeadAttention）1.2.4位置感知前馈层（Position-wiseFFN）1.2.5残差连接与层归一化二、AutoDL
利用人工智能做python爬虫
在Python爬虫领域，人工智能（AI）可以从多个维度赋能，提升爬虫的效率、智能性和应对复杂反爬策略的能力。下面从数据提取、反反爬、自动化脚本生成等方面，介绍如何结合AI技术实现更强大的Python爬虫：一、利用大语言模型辅助爬虫开发1.代码生成与优化大语言模型（如GPT系列、文心一言、通义千问等）可以根据自然语言描述快速生成Python爬虫代码。例如，你可以向模型输入“写一个Python爬虫，抓
VLLM：虚拟大型语言模型（Virtual Large Language Model）大霸王龙语言模型人工智能自然语言处理
VLLM：虚拟大型语言模型（VirtualLargeLanguageModel）VLLM指的是一种基于云计算的大型语言模型的虚拟实现。它通常是指那些由多个服务器组成的分布式计算环境中的复杂机器学习模型，这些模型能够处理和理解大量的文本数据。VLLM的核心是“大型语言模型”，这是一种通过深度神经网络训练的算法，能够在理解和生成人类语言方面表现出极高的能力。解释：虚拟：意味着这个模型不是在单个物理设备
vLLM（Virtual Large Language Model）框架：一个开源的高性能推理和服务的框架彬彬侠大模型 vLLM 高性能推理 PagedAttention python 大模型
vLLM（VirtualLargeLanguageModel）是一个开源的高性能推理和服务的框架，专为大语言模型（LLM）设计，旨在优化推理速度、内存效率和吞吐量。它通过创新的内存管理和调度技术（如PagedAttention）解决了传统LLM推理中的内存瓶颈和性能问题，广泛应用于对话系统、文本生成、实时翻译等场景。以下是对vLLM框架的详细介绍，包括其核心特性、工作原理、架构、优势、局限性以及使
Python爬虫实战：研究TextBlob相关技术 ylfhpy 爬虫项目实战 python 爬虫开发语言 html TextBlob
1.引言1.1研究背景与意义随着互联网技术的飞速发展，社交媒体已成为人们获取信息和表达观点的重要平台。每天在社交媒体上产生的海量文本数据蕴含着丰富的情感信息和社会舆情，分析这些文本情感倾向，有助于企业了解消费者对产品和服务的评价，政府部门监测社会舆论动态，研究机构探索公众对热点事件的态度。情感分析（SentimentAnalysis）作为自然语言处理的重要分支，旨在通过计算方法识别和提取文本中的主
对话云蝠智能：大模型如何让企业呼叫系统从 “成本中心” 变身 “价值枢纽”？ MARS_AI_ 人工智能自然语言处理信息与通信交互
在人工智能重塑企业服务的浪潮中，云蝠智能（南京星蝠科技有限公司旗下品牌）以深厚的技术积累和行业实践，逐步成长为国内智能外呼领域的标杆企业。其发展路径揭示了技术自主创新与场景深度结合的必然性。一、技术架构：全栈自研奠定领先基础云蝠智能的核心竞争力源于其全链路自研技术体系。该架构覆盖语音识别（ASR）、自然语言处理（NLP）、语音合成（TTS）及软交换六大层级，实现从基础设施到操作层的闭环设计。这一分
Jenkins JNLP与SSH节点连接方式对比及连接断开问题解决方案 tianyuanwo devops jenkins ssh 运维
一、JNLPvsSSH连接方式优缺点对比对比维度JNLP（JavaWebStart）SSH（SecureShell）核心原理代理节点主动连接Jenkins主节点，通过加密通道通信，支持动态资源分配。Jenkins通过SSH协议远程登录代理节点执行命令，需预先配置SSH服务。适用场景容器化环境（如Kubernetes）、需要跨平台或动态扩缩容的场景。传统物理机/虚拟机、静态节点或简单命令执行场景。安
解决OpenAI API国内使用难题：从注册、支付到代码集成的完整教程技术程序猿华锋 AIGC资讯 gpt-3 ai
对于国内开发者而言，接入并使用OpenAIAPI是探索大型语言模型能力的重要途径。然而，在实际操作中，开发者普遍会遇到注册流程受阻、支付渠道不便等挑战。本文旨在提供一份清晰、完整的技术操作指南，系统性地介绍两种获取和使用OpenAIAPIKey的主流方式，并重点强调APIKey的安全管理与成本优化策略，帮助开发者扫清障碍，高效、安全地将OpenAI的能力集成到自己的项目中。核心安全提示：APIKe
OpenAI O3 大模型深度解析：功能、API Key 获取、Python 代码开发教程 (附代码) 技术程序猿华锋 AIGC资讯 python 开发语言 ChatGPT ai
引言：OpenAIo3大模型：新一代推理引擎的崛起人工智能领域正经历着前所未有的飞速发展，其中大型语言模型(LLM)的能力边界不断被拓宽。OpenAI作为该领域的领军者之一，继其广受关注的o1模型之后，推出了新一代的o3大模型系列。这一系列模型的问世，不仅代表了技术的又一次重要迭代，更预示着人工智能在复杂推理和自主能力方面迈向了新的台阶。o3模型的诞生背景与意义OpenAIo3是作为OpenAIo
如何解析JSON输出: 尝试使用JsonOutputParser tt_jishu json python 人工智能
在当今AI驱动的世界中，能够获得结构化的输出是利用大型语言模型（LLM）的关键。尽管一些模型提供商支持内置方式来返回结构化输出，但并不是所有的模型都有这种能力。因此，使用输出解析器（OutputParser）来帮助用户通过提示指定任意JSON模式，并查询符合该模式的模型输出，最后将该模式解析为JSON，是一种常见而有效的方法。技术背景介绍输出解析器是使语言模型生成结构化数据的工具。这在许多应用场景
入选 ICML 2025！哈佛医学院等推出全球首个 HIE 领域临床思维图谱模型，神经认知结果预测任务上性能提升 15% hyperai
在人工智能技术突飞猛进的当下，大型视觉-语言模型（LVLMs）正以惊人的速度重塑多个领域的认知边界。在自然图像与视频分析领域，这类模型依托先进的神经网络架构、海量标注数据集与强大算力支持，已能精准完成物体识别、场景解析等高阶任务。而在自然语言处理领域，LVLMs通过对TB级文本语料的学习，在机器翻译、文本摘要、情感分析等任务上达到专业级水准，其生成的学术摘要甚至能精准提炼医学文献的核心结论。然而当
合规视角下银行智能客服风险防控 AI 智能服务智能客服人工智能 AIGC 数据库 chatgpt
1.AI驱动金融变革的政策与技术背景政策导向：我国《新一代人工智能发展规划》明确提出发展智能金融，要求：构建金融大数据平台，提升多媒体数据处理能力；创新智能金融产品与服务形态；推广智能客服、监控等技术应用；建立智能风控预警体系。技术支撑：云计算、大数据技术成熟为AI发展奠定了基础。深度学习算法的突破则引爆了本轮AI浪潮，显著提升了复杂任务处理精度，进而推动了计算机视觉、机器学习、自然语言处理（NL
GRU与Transformer结合：新一代序列模型 AI大模型应用工坊 gru transformer 深度学习 ai
GRU与Transformer结合：新一代序列模型关键词：GRU、Transformer、序列模型、结合、深度学习摘要：本文深入探讨了GRU与Transformer结合所形成的新一代序列模型。先介绍了GRU和Transformer各自的核心概念及工作原理，然后阐述了二者结合的原因、方式和优势。通过代码实际案例展示了如何搭建结合的模型，还探讨了其在自然语言处理、语音识别等领域的实际应用场景。最后对未
《AI办公类工具PPT系列之七——智谱清言》再见孙悟空_ 【2025 AI工具合集】人工智能 iSlide AI AI智能PPT powerpoint AI PPT PPT
一.简介官网地址为chatglm.cn智谱清言（也被称为ChatGLM）是一款基于大模型技术的人工智能产品，旨在通过其强大的自然语言处理能力，为用户提供高效、智能的交互体验。该产品不仅具备广泛的应用场景，还能够在多个领域内实现深度学习和自我优化。二.功能介绍内容创作：创意写作：帮助用户进行故事、诗歌等文学作品的创作。媒体写作：辅助撰写新闻稿、社交媒体帖子等内容。写作辅助：提供写作建议、结构安排和编
PNAS顶刊：使用 GPT-4 揭示概念的语义
GaëlLeMens、BalázsKovács、MichaelT.HannanandGuillemPros合作的题为“UncoveringthesemanticsofconceptsusingGPT-4”的文章，发表于ProceedingsoftheNationalAcademyofSciences。摘要最近的大型语言模型（LLM），如GPT-3.5和GPT-4生成类似人类的文本的能力表明，社会科
开源浪潮之巅：当前最热门的开源项目全景图万能小贤哥开源
开源世界活力澎湃，无数项目推动着技术边界。以下精选当前最受关注、社区活跃的热门开源项目，涵盖人工智能、开发工具、基础设施等关键领域：一、人工智能与机器学习：引领创新前沿Llama系列(MetaAI):核心价值：Meta开源的大语言模型家族(Llama2,Llama3)，性能媲美顶尖闭源模型。提供多种规模版本，支持商用，极大降低了企业和研究者使用先进LLM的门槛。热度体现：GitHub星标飞速增长，
LangChain异步编程的应用与源码解析(67) Android 小码蜂 LangChain框架入门 langchain microsoft 人工智能深度学习
LangChain异步编程的应用与源码解析一、LangChain异步编程概述1.1异步编程的必要性在LangChain构建的大语言模型应用中，大量操作存在I/O密集特性，如与外部API（OpenAI等）交互、访问向量数据库、读取文件等。传统同步编程模式下，程序在执行这些操作时会处于阻塞状态，导致资源利用率低、响应速度慢，无法充分发挥系统性能。异步编程允许程序在等待I/O操作完成时，切换去执行其他任
LangChain大语言模型接口层源码与调用机制深度解析(68) Android 小码蜂 LangChain框架入门 langchain 语言模型网络人工智能深度学习
LangChain大语言模型接口层源码与调用机制深度解析I.接口层概述1.1接口层在LangChain中的定位LangChain大语言模型接口层是连接外部大语言模型（LLM）与上层应用逻辑的核心枢纽。它通过标准化的接口封装不同厂商的LLM服务，如OpenAI、Anthropic、HuggingFace等，使开发者能够以统一方式调用各类模型，而无需关注底层API细节。这种设计极大提升了框架的扩展性和
LangChain基础抽象类与接口的设计思想及实现源码级分析(66) Android 小码蜂 LangChain框架入门 langchain 人工智能深度学习
LangChain基础抽象类与接口的设计思想及实现源码级分析I.抽象类与接口设计的核心意义1.1构建统一规范与标准在LangChain框架中，抽象类与接口的设计旨在为各类组件建立统一的行为规范。通过定义抽象方法和接口契约，确保不同功能模块（如语言模型、记忆模块、嵌入模型等）具备一致的调用方式和数据交互格式。例如，所有嵌入模型都需继承自BaseEmbeddings抽象类，并实现embed_docum
LnagChain思维链提示技术解析：原理、架构与源码实现(13) Android 小码蜂 LangChain框架入门架构人工智能 langchain
LANGCHAIN思维链提示技术解析：原理、架构与源码实现一、LangChain思维链提示概述1.1思维链提示的基本概念思维链提示（ChainofThought,CoT）是一种通过引导大型语言模型（LLM）生成中间推理步骤来提高复杂问题解决能力的技术。与传统的直接提问相比，思维链提示要求模型在给出最终答案之前，先展示其思考过程。这种方法最早由Wei等人在2022年的论文中提出，实验表明，思维链提示
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它

【AI视野·今日NLP 自然语言处理论文速览 第三十期】Thu, 14 Apr 2022

Daily Computation and Language Papers

你可能感兴趣的:(NLP,Papers,NLP,NLPer,自然语言处理,机器翻译,语言模型)

【AI视野·今日NLP 自然语言处理论文速览第三十期】Thu, 14 Apr 2022