Hi-Cloud

A Language-Independent Neural Network for Event Detection

【文章来源】

Feng X, Huang L, Tang D, et al. A Language-Independent Neural Network for Event Detection[C]// Meeting of the Association for Computational Linguistics. 2016:66-71.

【原文链接】

一种与语言无关的事件检测神经网络：http://wing.comp.nus.edu.sg/~antho/P/P16/P16-2011.pdf

摘要

由于在各种上下文中编码单词语义的困难，事件检测仍然是一个挑战。以前的方法很大程度上依赖于语言特定知识和预先存在的自然语言处理（NLP）工具。但是，与英语相比，并非所有语言都有这样的资源和工具。更有前途的方法是从数据中自动学习有效特征，而不依赖于特定语言的资源。在本文中，我们开发了一个混合神经网络来捕获特定上下文中的序列和块信息，并使用它们来训练多种语言的事件检测器，而不需要人工编码任何特性。实验表明，我们的方法可以为多种语言（英语，中文和西班牙语）实现稳健，高效和准确的结果。

1 介绍

事件检测旨在提取事件触发器（通常是单个动词或名词）并将它们精确地分类为特定类型。这是事件提取的一个关键且非常具有挑战性的子任务，因为相同的事件可能以各种触发器表达式的形式出现，而表达式可能在不同的上下文中表示不同的事件类型。图1显示了两个例子。在S1中，“release”是动词的概念和“Transfer-Money”事件的触发器，而在S2中，“release”是名词的概念和“Release-Parole”事件的触发器。

图1 事件类型和句法分析结果的示例句子。

大多数先前的方法（Ji等人，2008; Liao等人，2010; Hong等人，2011; Li等人，2013; Li等人，2015b）将事件检测视为分类问题并且设计了很多词汇和句法特征。尽管这些方法表现得相当好，但是特征通常来自特定语言的资源以及预先存在的自然语言处理工具箱（例如，名称标记器和依赖性解析器）的输出，这使得这些方法难以应用于不同的语言。序列和块是用于事件检测的两种有意义的与语言无关的结构。例如，在S2中，当预测触发候选“释放”的类型时，诸如“court法院”的前向序列信息可以帮助分类器标签“释放”作为“释放 - 假释”事件的触发器。但是，对于特征工程方法，很难在“court”和“release”之间建立关系，因为它们之间没有直接的依赖路径。此外，考虑到S1，“欧盟”和“2000万欧元”是两个块，这表明这句话与组织和金融活动有关。这些线索非常有助于推断“释放”作为“转账”事件的触发器。但是，分块和解析器仅适用于少数高源语言，其性能差异很大。

最近，深度学习技术已被广泛用于复杂结构建模，并被证明对许多NLP任务有效，例如机器翻译（Bahdanau等，2014），关系提取（Zeng等，2014）和情感分析（Tang 等，2015a）。双向长期短期记忆（Bi-LSTM）模型（Schuster等，1997）是一种双向递归神经网络（RNN）（Mikolov等，2010），它可以捕获每个单词的前后上下文信息。卷积神经网络（CNN）（LeCun等，1995）是另一种有效的模型，用于提取语义表示和捕获平面结构中的显着特征（Liu等，2015），例如块。在这项工作中，我们开发了一个混合神经网络，包含两种类型的神经网络：Bi-LSTM和CNN，以从特定的上下文中建模序列和块信息。利用单词语义表示，我们的模型可以摆脱手工制作的功能，因此很容易适应多种语言。

我们针对各种语言的事件检测任务评估我们的系统，其中可以获得地面实况事件检测注释。在英语事件检测任务中，与现有技术相比，我们的方法实现了73.4％的F值，与最先进的相比平均3.0%的绝对改进。对于中文和西班牙文，实验结果也具有竞争力。我们证明了我们的组合模型在跨语言的泛化性能方面优于传统的基于特征的方法，原因在于：（i）通过捕获序列和块信息来模拟每个单词的语义表示的能力；（ii）使用文字嵌入来引发触发候选人的更一般的表示。

2 我们的方法

在本节中，我们介绍了一种混合神经网络，它结合了双向LSTM（BiLSTM）和卷积神经网络来学习句子中每个单词的连续表示。该表示用于预测该单词是否是事件触发器。具体来说，我们首先使用Bi-LSTM来编码每个单词的语义及其前后信息。然后，我们添加一个卷积神经网络来捕获来自本地上下文的结构信息。

2.1 Bi-LSTM

在本节中，我们将介绍用于事件检测的双向LSTM模型。 Bi-LSTM是一种双向递归神经网络（RNN），它可以同时模拟单词表示与其前后信息。 Word表示可以自然地被视为检测触发器及其事件类型的功能。如（Chen等，2015）所示，我们将整个句子的所有单词作为输入，并通过查找单词嵌入来转换每个标记。具体来说，我们使用SkipGram模型预先训练单词嵌入来表示每个单词（Mikolov等，2013; Bahdanau等，2014）。

图2 我们的事件触发器提取模型的说明（此处触发器候选是“release”）。 Fv和Bv是Bi-LSTM的输出，C2，C3是CNN的输出，具有宽度为2和3的卷积滤波器。

我们在图2中给出了用于事件触发器提取的Bi-LSTM的细节。可以看出，Bi-LSTM由两个LSTM神经网络组成，一个是前向LSTMF模型，另一个是后向LSTMB模型，分别对下面的上下文进行建模。LSTMF的输入是前面的上下文以及单词作为候选触发词，并且LSTMB的输入是以下上下文加上作为触发候选的单词。我们从句子的开头到结尾运行LSTMF，并从句子的结尾到句子的开头运行LSTMB。然后，我们将LSTMF的输出Fv和LSTMB的Bv连接为Bi-LSTM的输出。人们还可以尝试对LSTMF和LSTMB的最后隐藏向量进行平均或求和作为替代。

2.2 卷积神经网络

由于卷积神经网络（CNN）擅长从一系列对象中捕获显着特征（Liu 等，2015），我们设计了一个CNN来捕获一些局部块。在以往的研究中，该方法被用于事件检测（Nguyen和Grishman，2015; Chen等，2015）。具体来说，我们使用具有不同宽度的多个卷积滤波器来产生局部上下文表示。原因是它们能够捕获各种粒度的n-gram的局部语义，这被证明是事件检测的强大功能。在我们的工作中，宽度为2和3的多个卷积滤波器在一个句子中编码双格bigrams和三格trigrams的语义。这些局部信息还可以帮助我们的模型修复由于词汇歧义而产生的一些错误。

图3 CNN结构

图3中给出了具有三个卷积滤波器的CNN的图示。让我们表示由n个单词组成的句子 $\left \{\omega _{1},\omega _{2},\cdots ,\omega _{i},\cdots,\omega _{n} \right \}$ ，并且每个单词 $\omega _{i}$ 被映射到其嵌入表示 $e_{i}\in \mathbb{R}^{d}$ 。另外，我们添加位置特征（PF），其被定义为当前单词和触发候选之间的相对距离。卷积滤波器是具有共享参数的线性层列表。我们将卷积滤波器的输出馈送到MaxPooling层，并获得具有固定长度的输出向量。

2.3 输出

最后，我们从Bi-LSTM中学习到双向序列特征：F和B，以及局部上下文特征：C2和C3，它们是具有宽度为2和3的卷积滤波器的CNN的输出，如单个矢量O = [F, B, C2, C3]。然后，我们利用softmax方法来识别触发候选者并将每个触发候选者分类为特定事件类型。

2.4 训练

在我们的模型中，损失函数是事件触发器识别和触发器分类的交叉熵误差。我们初始化所有参数以形成均匀分布U（-0.01,0.01）。我们将卷积滤波器的宽度设置为2和3，特征映射的数量为300，PF的维数为5。表1说明了我们实验中三种语言的设置参数（Zeiler，2012）。

3实验

在本节中，我们将描述详细的实验设置并讨论结果。我们用精度(P)、召回率(R)和F-measure (F)来评估所提出的方法在各种语言(英语、汉语和西班牙语)上的应用。表1显示了我们实验中使用的数据集的详细描述。我们将模型缩写为HNN（混合神经网络）。

表1 我们在三种语言的实验中使用的超参数和文档数量

3.1基线方法

我们将我们的方法与以下基线方法进行比较：

MaxEnt：一种基于特征的基线方法，它训练了一个具有一些词法和句法特征的最大熵分类器(Ji 等，2008)；
跨事件(Liao等，2010)：使用文档级信息来提高ACE事件提取的性能；
跨实体(Hong等，2011)：使用跨实体推理提取事件；
联合模型(Li和 Ji，2014)：一种联合结构感知方法，结合多层次语言特征，同时提取事件触发器和参数，以便可以相互改进局部预测；
模式识别(Miao and Grishman, 2015)，使用模式扩展技术提取事件触发器；
卷积神经网络(Chen et al.，2015)，利用动态多池卷积神经网络进行事件触发检测。

3.2在英语上的比较

表2 不同的英语事件检测方法的比较

表2显示了ACE2005英语语料库中所有方法的整体性能。我们可以看到，我们的方法明显优于以前的所有方法。 HNN的更好性能可以通过以下原因进一步解释：

（1）与基于特征的方法（如MaxEnt，交叉事件，跨实体和联合模型）相比，基于神经网络的方法（包括CNN，Bi-LSTM，HNN）表现更好，因为它们可以更好地利用单词语义信息，避免错误传播的NLP的工具可能会阻碍事件检测的性能。

（2）Bi-LSTM可以捕获前后序列信息，这比依赖路径更丰富。例如，在S2中，“court”的语义可以通过我们的方法中的前向序列来传递。这是一个重要的线索，可以帮助预测“release释放”作为“ReleaseParole”的触发器。对于基于特征的显式方法，由于属于不同的条款，且之间没有直接的依赖路径，无法建立“法院”与“释放”之间的关系。在我们的方法中，“court法院”的语义可以通过前向序列传递给释放。

（3）跨实体系统实现了更高的召回率，因为它不仅使用句子级信息，还使用文档级信息。它利用事件一致性来基于跨句子推断来预测本地触发器的事件类型。例如，“攻击”事件更可能发生在“杀死”或“死亡”事件而不是“结婚”事件中。然而，这种方法在很大程度上依赖于词法和句法特征，因此精度低于基于神经网络的方法。

（4）RNN和LSTM的表现略差于Bi-LSTM。一个明显的原因是RNN和LSTM只考虑触发器的前面序列信息，这可能会遗漏一些重要的后续线索。再次考虑S1，当提取触发器“释放”时，两个模型将错过以下序列“2000万欧元到伊拉克”。这可能严重阻碍RNN和LSTM用于事件检测的性能。

3.3 在中文上的比较

对于中文，我们遵循以前的工作（Chen 等，2012）并使用语言技术平台（Liu 等，2011）进行分词。

表3 中文事件检测的结果

表3显示了我们的模型与现有技术方法之间的比较结果（Li 等，2013; Chen 等，2012）。MaxEnt（Li等，2013）是一种管道模型，它采用人类设计的词法和句法特征。Rich-C由Chen（2012）等人开发，其中还包含中文特色功能，以改善中文事件检测。我们可以看到，我们的方法优于基于人类设计的事件触发器识别特征的方法，并实现了事件分类的可比较的F分数。

3.4 西班牙语提取

表4 西班牙语事件检测的结果

表4显示了我们的方法在西班牙ERE语料库中的表现。结果表明，HNN方法比LSTM和Bi-LSTM表现更好。这表明我们提出的模型可以在多种语言中实现最佳性能，而不是其他神经网络方法。我们没有将我们的系统与其他系统进行比较（Tanev等，2009），因为他们在非标准数据集上报告了结果。

4 相关工作

事件检测是信息提取和自然语言处理中的一个基本问题（Li等, 2013; Chen 等, 2015），其目的在于检测句子的事件触发（Ji等, 2008）。大多数现有方法将此问题视为分类任务，并使用具有手工特征的机器学习方法，例如词法特征（例如，完整单词、pos标签），句法特征（例如，依赖特征）和外部知识特征(WordNet)。还有一些研究利用更丰富的证据，如跨文件（Ji 等, 2008），跨实体（Hong等, 2011）和联合推理（Li和Ji，2014）。

尽管基于特征的方法有效，但我们认为手工设计特性模板通常需要大量的劳动。此外，特征工程需要专业知识和丰富的外部资源，这对于一些低资源语言来说并不总是可用的。此外，理想的方法应该能够自动从数据中学习信息表示，以便它可以很容易地适应不同的语言。近年来，神经网络作为一种从数据中自动学习文本表示的强大方法，在各种NLP任务中取得了良好的性能。

对于事件检测，最近的两项研究（Nguyen和Grishman，2015; Chen等，2015）探索神经网络以学习连续的单词表示，并将其视为推断单词是否是触发器的特征。 Nguyen（2015）提出了一种卷积神经网络，其中实体类型信息和单词位置信息作为额外的特征。然而，他们的系统将上下文限制为固定的窗口大小，这导致长句子的单词语义表示的丢失。我们引入了一个混合神经网络来学习连续的单词表示。与基于特征的方法相比，此方法不需要特征工程，可以直接应用于不同的语言。与以前的神经模型相比，我们保留了卷积神经网络（Nguyen和Grishman，2015）在捕获局部上下文方面的优势。此外，我们还采用了双向LSTM来模拟单词的前后信息，因为人们普遍认为LSTM擅长捕获序列中的长期依赖性（Tang等, 2015b; Li等, 2015a）。

5 结论

本文引入了一种混合神经网络模型，该模型将双向LSTMs和卷积神经网络相结合，以捕获来自特定上下文的序列和结构语义信息，用于事件检测。与传统的事件检测方法相比，我们的方法不依赖于任何语言资源，因此可以轻松应用于任何语言。我们对各种语言（英语，汉语和西班牙语）进行了实验。实验结果表明我们的方法在英语和中文竞争结果中取得了最佳表现。我们还发现双向LSTM在远距离捕获前后上下文时，对触发器提取非常有效。

第N4周：NLP中的文本嵌入 OreoCC 自然语言处理人工智能
本人往期文章可查阅：深度学习总结词嵌入是一种用于自然语言处理（NLP）的技术，用于将单词表示为数字，以便计算机可以处理它们。通俗的讲就是，一种把文本转为数值输入到计算机中的方法。之前文章中提到的将文本转换为字典序列、one-hot编码就是最早期的词嵌入方法。Embedding和EmbeddingBag则是PyTorch中的用来处理文本数据中词嵌入（wordembedding）的工具，它们将离散的词
打造RAG系统：四大向量数据库Milvus、Faiss、Elasticsearch、Chroma 全面对比与选型指南橙子小哥的代码世界数据库数据库 milvus faiss 人工智能深度学习神经网络 elasticsearch
在当今信息爆炸的时代，检索增强生成（Retrieval-AugmentedGeneration，简称RAG）系统已成为自然语言处理（NLP）领域的重要工具。RAG系统通过结合生成模型和信息检索技术，能够在大规模数据中高效地获取相关信息，生成更为精准和有针对性的内容。而在构建RAG系统时，选择合适的向量数据库是确保系统性能和可扩展性的关键一步。本文将深入对比四大主流向量数据库——Milvus、Fai
利用大型语言模型进行市场分析与预测 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战 AI实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着信息技术的飞速发展，企业积累了海量的文本数据，例如社交媒体帖子、产品评论、新闻报道等。这些数据蕴藏着丰富的市场信息，可以帮助企业更好地了解消费者需求、预测市场趋势、优化营销策略。然而，传统的数据分析方法往往难以有效地处理和分析这些非结构化文本数据。近年来，随着自然语言处理（NLP）技术的进步，大型语言模型（LLMs）在文本分析领域展现出强大的能力，为市场分析与预测带来了新的机遇。L
深入探讨如何在LangChain中将参数从一个步骤传递到下一个步骤：高级技巧与实际应用 m0_57781768 langchain
深入探讨如何在LangChain中将参数从一个步骤传递到下一个步骤：高级技巧与实际应用在现代软件开发中，特别是在复杂的自然语言处理（NLP）和人工智能应用中，数据的传递和处理是至关重要的。LangChainExpressionLanguage(LCEL)为开发者提供了一种强大的工具，能够有效地管理数据流，并确保任务链中的每一步都能顺利进行。在这些任务链中，开发者常常需要将数据从一个步骤无缝地传递到
使用LangChain实现最新NLP研究成果 eahba langchain 自然语言处理人工智能 python
近年来，自然语言处理（NLP）领域的研究取得了显著的进展，而LangChain通过实现这些最新的研究成果，为开发者和研究人员提供了强大的工具与服务。在本文中，我们将探讨一些被LangChain所引用的arXiv研究论文，并展示如何通过API调用和具体示例来实现这些前沿技术。技术背景介绍LangChain作为一个强大且灵活的开源工具，旨在简化大语言模型（LLMs）的开发与应用。通过对最新研究的集成，
AIGC技术研究与应用 ---- 下一代人工智能：新范式！新生产力！（2.1-大模型发展历程之背景与开端） shiter AI重制版】人工智能系统解决方案与技术架构人工智能 AIGC 深度学习
文章大纲按照目标不同，AI大模型可分为四类，多模态为未来方向NLP大模型CV大模型科学计算大模型多模态大模型2022年是大模型技术的拐点,前期技术铺垫奠定了基础生成式模型的开端VAE与GANVAEGAN参考文献与学习路径GPT系列模型解析前序文章模型进化券商研报陆奇演讲按照目标不同，AI大模型可分为四类，多模态为未来方向NLP大模型自然语言处理（NaturalLanguageProcessing，
【开源项目】2024最新PHP在线客服系统源码/带预知消息/带搭建教程于飞SEO 免费资源分享开源 php 开发语言
简介随着人工智能技术的飞速发展，AI驱动的在线客服系统已经成为企业提升客户服务质量和效率的重要工具。本文将探讨AI在线客服系统的理论基础，并展示如何使用PHP语言实现一个简单的AI客服系统。源码仓库地址：ym.fzapp.top在线客服系统的理论基础AI在线客服系统通过自然语言处理（NLP）、机器学习（ML）和深度学习（DL）技术，能够理解和响应客户的查询。这些系统通常包括以下几个关键组件：自然语
人工智能引领技术革命：ChatGPT与深度学习的突破性进展撒旦骑路西法，大战吕布国内外安全资讯人工智能
在全球科技快速发展的今天，人工智能（AI）正以前所未有的速度渗透到各个行业，成为推动社会变革的重要力量。特别是在自然语言处理（NLP）领域，OpenAI的ChatGPT凭借深度学习技术的持续突破，展现了AI在理解、推理、对话生成等方面的惊人进步。本文将深入探讨ChatGPT及深度学习的最新突破，以及它对不同行业的深远影响。1.ChatGPT：AI语言模型的革新者1.1什么是ChatGPT？Chat
【自然语言处理-NLP】情感分析与主题建模云博士的AI课堂深度学习哈佛博后带你玩转机器学习自然语言处理人工智能情感分析主题建模深度学习机器学习 NLP
以下内容详细剖析了NLP中情感分析（SentimentAnalysis）和主题建模（TopicModeling）的技术与方法，分别展示如何从文本中提取情感倾向和潜在主题，并提供示例代码和讲解，可在Python环境下直接运行。目录情感分析（SentimentAnalysis）1.1概念与方法概览1.2传统机器学习方法1.3深度学习与预训练模型1.4代码示例：基于机器学习的情感分类主题建模（Topic
python搭建NPL模型的详细步骤和代码百锦再@新空间代码工作室包罗万象 python 开发语言 django flask pygame pip
目录**一、环境准备****二、数据准备****三、文本预处理****1.清理文本****四、特征工程****1.TF-IDF****2.Word2Vec****五、搭建NLP模型****1.逻辑回归****2.LSTM深度学习模型****六、使用预训练的BERT模型****七、模型评估****八、部署模型****总结**1.**人机交互的核心技术**2.**推动AI技术发展的动力**3.**广泛
专业英语程序员爱德华英语专业英语
文章目录一、计算机1.计算机基础(1)计算机组成原理(2)计算机网络(3)数据库(4)编译原理(5)离散数学2.软件开发(1)编程词汇(2)开发术语(3)Linux(4)软件3.就业领域(1)职场(2)芯片(3)自动驾驶(4)嵌入式硬件4.深度学习(1)论文(2)深度学习DL(3)计算机视觉CV(4)自然语言处理NLP(5)推荐系统(6)计算机图形学二、数学三、机械、材料四、医药五、英美计量单位一
1.6 从 GPT-1 到 GPT-3.5：一路的风云变幻少林码僧 AI大模型应用实战专栏 gpt gpt-3
从GPT-1到GPT-3.5：一路的风云变幻人工智能的进步一直是科技领域的一个重要话题，而在自然语言处理（NLP）领域，GPT（GenerativePre-trainedTransformer）系列模型的发布，标志着一个又一个技术突破。从2018年发布的GPT-1到2022年推出的GPT-3.5，OpenAI的每一次更新都在推动着人工智能的发展，改变了我们与计算机互动的方式。本文将带你一起回顾GP
使用Python和机器学习技术对高中物理题目进行分类的示例代码 max500600 python 机器学习 python 分类
以下是一个使用Python和机器学习技术对高中物理题目进行分类的示例代码。我们将使用自然语言处理（NLP）技术处理题目的文本信息，并使用朴素贝叶斯分类器进行分类。步骤概述数据准备：准备包含高中物理题目的数据集，每个题目都有对应的类别标签。文本预处理：对题目文本进行清洗和特征提取。模型训练：使用训练数据训练分类模型。模型评估：使用测试数据评估模型的性能。预测：使用训练好的模型对新的物理题目进行分类。
Python 自然语言处理实战： NLTK 与 spaCy，文本分析的左右护法清水白石008 python Python题库 python 自然语言处理 easyui
Python自然语言处理实战：NLTK与spaCy，文本分析的左右护法引言在信息爆炸的时代，文本数据以前所未有的速度增长，蕴藏着巨大的信息和价值。从社交媒体的评论，到浩如烟海的文档，文本数据无处不在，成为了解用户意图、挖掘商业情报、洞察社会趋势的关键来源。然而，文本数据本质上是非结构化的，计算机难以直接理解和处理。自然语言处理(NaturalLanguageProcessing,NLP)技术应运而
【Hugging Face】datasets 库：加载、处理和分享大规模数据集彬彬侠大模型 datasets Hugging Face
HuggingFaceDatasets库HuggingFace的datasets库是一个轻量级、高性能的库，用于加载、处理和分享大规模数据集，特别适用于自然语言处理（NLP）、计算机视觉（CV）和语音任务。1.为什么使用Datasets？在深度学习中，处理大规模数据集通常面临以下挑战：数据集太大，无法一次性加载到内存不同任务的数据格式不统一数据预处理和转换较慢需要快速流式加载数据datasets库
自然语言处理（NLP）领域大语言模型学习目录大全彬彬侠大模型自然语言处理 NLP 大模型 LLM GPT BERT GLM
本文主要收集了自然语言处理（NLP）领域的大语言模型，可以可以通过点击标题链接查看具体的详情。GPT系列GPT-1（GenerativePre-trainedTransformer1）模型GPT-1（GenerativePre-trainedTransformer1）是OpenAI在2018年6月提出的第一代GPT模型，也是第一个基于Transformer结构的自回归（Autoregressive
DeepSeek时代：AI如何重塑软件开发的每个阶段，效率提升全解析阿三0404 人工智能
在软件开发领域，时间就是竞争力。传统的瀑布模型和敏捷开发流程中，需求偏差、重复编码、测试遗漏等问题不断消耗团队精力。随着以DeepSeek为代表的AI技术突破，从需求分析到运维监控的每个环节都在发生效率革命。本文将深入解析AI在开发全流程中的具体应用，并通过真实数据揭示其带来的效率跃升。一、需求分析阶段：从模糊需求到精准拆解（效率提升65%）AI工具：自然语言处理（NLP）、需求图谱生成应用场景：
DeepSeek：如何通过自然语言生成HTML文件与原型图？阿三0404 ai 人工智能 html 机器学习深度学习
在当今快节奏的开发与设计环境中，快速生成HTML文件或原型图是每个开发者与设计师的迫切需求。虽然DeepSeek无法直接生成图片，但它却能够通过自然语言生成流程图、原型图以及交互式页面，甚至可以直接输出HTML代码。本文将详细介绍如何与DeepSeek高效交流，生成你想要的HTML文件或原型图，并分享一些实用技巧。1.DeepSeek的核心功能与优势DeepSeek是一款基于自然语言处理（NLP）
svn 通过127.0.01能访问但通过公网IP不能访问，这是什么原因？行思理运维 Linux svn linux 防火墙
连接失败的提示如下1、SVN的启动方法方法一：svnserve-d-r/mnt/svn方法二：svnserve-d--listen-port3690-r/mnt/svn方法三：svnserve-d-r/mnt/svn--listen-host0.0.0.02、首先检查svn服务器是否启动方法一：netstat-tunlp|grepsvn演示如下如上状态，说明已启动方法二：svnserve--ver
Spring AI 实战：手把手教你打造一个智能客服机器人！ Leaton Lee spring 人工智能机器人
前言：为什么要做一个智能客服机器人？在当今数字化时代，智能客服机器人已经成为企业提升用户体验和服务效率的重要工具。无论是解答用户问题、处理订单咨询，还是提供技术支持，智能客服机器人都能够高效地完成任务。SpringAI框架为我们提供了一个强大的工具集，结合自然语言处理（NLP）技术，我们可以轻松地构建一个功能强大的智能客服机器人。本文将从零开始，一步步教你如何利用SpringAI和相关技术打造一个
Unity AI 技术浅析（二）爱研究的小牛 AIGC—游戏制作 AIGC—虚拟现实 unity 人工智能游戏引擎 AIGC 机器学习深度学习
UnityAI是Unity引擎中集成的智能技术，旨在为游戏开发者、虚拟现实（VR）和增强现实（AR）应用开发者提供强大的AI工具和功能。UnityAI涵盖了从智能代理（Agents）、机器学习（MachineLearning）到自然语言处理（NLP）等多个领域。一、UnityAI的工作原理1.智能代理（Agents）UnityAI的核心之一是智能代理（Agents），这些代理可以模拟游戏中的非玩家
人工智能基础知识 yzx991013 人工智能
首先分为两大类：一：机器视觉cv1.特征比较明显2.经典模型：cnn，resnet，deepface，yolov（1-12），vi-transformer。缺点：不能解决收听问题。3.落地，无人识别，轨道追踪，无人驾驶，（主要解决看的东西）。二：自然语言处理nlp（语音识别）处理（文本）方面解决（说和听的问题），RNN，LSTM，attention，transformer（基于规则的翻译，超越普通
基于NLP的客户意见分析：从数据到洞察 Echo_Wish Python 算法 Python 笔记自然语言处理人工智能
友友们好！我的新专栏《Python进阶》正式启动啦！这是一个专为那些渴望提升Python技能的朋友们量身打造的专栏，无论你是已经有一定基础的开发者，还是希望深入挖掘Python潜力的爱好者，这里都将是你不可错过的宝藏。在这个专栏中，你将会找到：●深入解析：每一篇文章都将深入剖析Python的高级概念和应用，包括但不限于数据分析、机器学习、Web开发等。●实战案例：通过丰富的实战案例，带你一步步实现
RAG 检索增强生成：技术详解与应用展望君君学姐 RAG检索增强生成
RAG检索增强生成：技术详解与应用展望一、引言随着人工智能技术的飞速发展，自然语言处理（NLP）领域迎来了前所未有的变革。其中，检索增强生成（Retrieval-AugmentedGeneration，简称RAG）作为一种新兴的技术框架，正逐渐成为大模型应用中的热门选择。RAG通过结合信息检索（IR）和自然语言生成（NLG）的能力，旨在提升模型在回答问题、生成文本等任务中的准确性和可靠性。本文将深
目前市场上的人工智能大模型有哪些？国货崛起大模型人工智能人工智能
截至最后更新时间（2024年3月中旬），以下是国内外部分知名的人工智能大模型，按类别和用途大致分类如下：国外：自然语言处理（NLP）大模型：OpenAIGPT系列：GPT-3：迄今为止最为知名的自然语言处理大模型之一，具备强大的文本生成、理解和对话能力。GPT-4：后续版本，性能和参数量比GPT-3更高，各项指标均有所提升。Google的Transformer系列：BERT（Bidirection
详解：Grok中文版 _Grok 3 国内中文版本在线使用人工智能
GrokAI是由XAI公司推出的一款尖端人工智能系统。作为该公司核心技术之一，GrokAI专注于推动人工智能在各行各业的实际应用，尤其在数据分析、自然语言处理（NLP）、自动化决策、机器学习等领域表现出色。Grok的最大亮点在于其强大的数据处理能力。它能够高效地从大量复杂数据中提取有价值的信息，并做出精准预测。借助深度学习与强化学习等先进技术，GrokAI具备自我学习的能力，可以通过不断的训练来优
如何结合NLP（自然语言处理）技术提升OCR系统的语义理解和上下文感知能力？金智维科技官方自然语言处理 ocr 人工智能
光学字符识别（OCR）技术能够快速从文档、图像中提取文本信息，目前已经广泛应用于金融、教育、医疗、物流等领域。然而，传统OCR技术的功能主要集中在字符提取和简单的结构化输出上，难以处理复杂场景中涉及的语义理解与上下文感知问题。而通过将自然语言处理（NLP）技术与OCR相结合，可以极大提升系统对文本的语义理解能力，为多场景应用赋予更高的智能化水平。虽然OCR在文本识别的准确性和速度上不断提升，但面对
基于Python 和 DeepSeek API 实现文本分类修破立生大模型 python 人工智能
在自然语言处理（NLP）领域，文本分类是一项非常重要的任务，它可以帮助我们将大量的文本数据自动归类到不同的类别中。传统的文本分类方法有很多，而近年来，利用大模型进行文本分类逐渐成为一种流行且高效的方式。本文将介绍如何使用Python编写代码，结合DeepSeekAPI实现文本分类的功能，并探讨使用大模型方法进行文本分类与其他方法的区别。1代码概述我们的代码主要实现了以下几个功能：创建一个DeepS
OLMo 7B：推动自然语言处理领域的技术革新单皎娥
OLMo7B：推动自然语言处理领域的技术革新OLMo-7B项目地址:https://gitcode.com/hf_mirrors/ai-gitcode/OLMo-7B引言随着人工智能技术的飞速发展，自然语言处理（NLP）领域取得了显著的进步。然而，在实际应用中，NLP技术仍然面临着诸多挑战，如语境理解、信息抽取、情感分析等。为了解决这些问题，艾伦人工智能研究所（AI2）推出了OLMo系列模型，其中
AI 外呼产品架构解读：让智能外呼更精准高效 MARS_AI_ 人工智能架构自然语言处理信息与通信
在人工智能（AI）技术迅猛发展的今天，AI外呼系统已成为呼叫中心领域的新宠。本文将剖析AI外呼产品的基本架构，帮助读者理解其背后的技术逻辑和应用价值。一、支撑能力层：AI外呼的基石AI外呼系统的底层架构，即支撑能力层，为整个系统提供了坚实的技术基础。这一层主要包括以下三个核心组成部分：1.AI基础能力AI基础能力涵盖了语音识别（ASR）、自然语言处理（NLP）和语音合成（TTS）等技术。这些技术使
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found