精分天秤座的mystery

RESIN: A Dockerized Schema-Guided Cross-document Cross-lingual Cross-media Information Extraction an

RESIN: A Dockerized Schema-Guided Cross-document Cross-lingual
Cross-media Information Extraction and Event Tracking System
摘要：我们提出了一种新的信息提取系统，可以从来自多个来源、多种语言(我们的实验中为英语和西班牙语)和多种数据模式(语音、文本、图像和视频)的新闻文档集合中自动构建现时的事件图谱。该系统从两个方面进行了改进:
(1)从句子级事件提取扩展到跨文档、跨语言、跨媒体事件提取、共引用消解和时间事件跟踪;
(2)利用人工策划事件模式库进行匹配，提高抽取输出。我们已经在GitHub1上公开了这个dockerized系统，用于研究目的，并提供了演示视频。
介绍：
事件提取和跟踪技术可以帮助我们理解海量新闻数据中描述的真实事件，以及它们之间的相互联系。这些技术已经被证明在各种应用领域很有帮助，包括新闻分析(Glavaš和Štajner, 2013;Glavaš等，2014;Choubey等人，2020年)，协助自然灾害救援工作(Panem等人，2014年;Zhang等，2018;Medina Maza et al.， 2020)，财务分析(Ding et al.， 2014, 2016;Yang等人，2018;Jacobs等人，2018;恩多等人，2019年;Özbayoglu等人，2020年)和医疗监测(Raghavan等人，2012年;Jagannatha和Y u, 2016;Klassen等人，2016;杰布里和赫斯特，2018)。
然而，与实体相关的信息相比，记住事件相关的信息要困难得多。例如大多数美国人能够回答“哥伦比亚大学位于哪个城市？”，但很少有人能给出“谁死于COVID-19?”的完整答案
。自然语言理解和计算机视觉的进步已经能够自动化进行部分事件理解，但是目前，第一代，自动化事件理解过于简单，，因为大多数方法都专注于句子级别的序列标记来提取事件，现有的复杂时间理解方法也缺乏以抽象事件模式（复杂事件模板）存储库的形式整合知识，通过时间事件跟踪理解时间进程，使用背景知识以及执行全局推断和增强。为了解决这些限制，在本文中将展示一个新的端到端的开源dockerized研究系统，从多个来源、多个语言（我们实验用的时英语和西班牙语）和多种数据模式（语音、文本、图像和视频）的新闻文档中时间有序的事件。我们的系统由一系列组件组成，包括模式引导实体、关系和复杂事件抽取，实体和事件共同引导解析、时间时间跟踪和跨媒体实体和事件接地。事件模式编码事件及其联系的典型结构。我们的端到端系统已经被dockerized并且公开用于研究目的。
2、方法
2.1 综述
我们的架构图如下所示；
系统从多语言、多媒体文档集群中提取信息。每个文档集群包含关于特定复杂事件的文档，我们的文本管道从文本和转录的演讲中获取输入。它首先提取实体、关系和事件提及(章节2.2-2.3)，然后执行跨文档、跨语言的实体和事件相互引用解析(章节2.4)。然后通过时间关系提取对提取的事件进行排序(第2.5节)。我们的视觉管道将图像和视频作为输入，从视觉信号中提取事件和参数，并且通过跨模态事件相互引用解析将提取的知识元素置于我们提取的图谱中，最后我们的系统从模式存储库中选择与提取的IE图最匹配的模式，并且合并这两个知识图谱，系统可以提取DARPA KAIROS本体中定义的24种实体、46种关系和67种事件。
2.2 语音与文本中的联合实体、关系与事件提及提取与关联
对于语音输入，我们使用Amazon Transcribe API用于将英语和西班牙语语音转换为文本。当未指定语言时，将从音频信号中自动检测语言。它返回带有对每个检测到的单词的开始和结束时间的转录，以及潜在的替代转录。
然后，从语音识别结果和文本输入中，我们使用OneIE (Lin et al.， 2020)提取实体、关系和事件提及数，这是一种最先进的用于句子级信息提取的联合神经模型。给定一个句子，本模块的目标是提取一个信息图G = (V, E)，其中V是包含实体提及和事件触发器的节点集，E是包含实体关系和事件参数链接的边集。我们使用一个预先训练的BERT编码器(Devlin et al.， 2018)来获得输入句子的上下文化单词表示。接下来，我们采用独立的基于条件随机字段的标记器从句子中识别实体提及和事件触发广度。我们通过平均空间中单词的向量来表示每个空间或信息图中的节点。然后我们使用单独的任务特定网络的前馈神经网络计算每个节点或边的标签分数，为了捕获知识元素之间的交互，我们在解码信息图谱时加入了模式引导的全局特征。对于候选图G，我们定义了一个全局特征向量 $f={f_{1}(G),\cdot \cdot \cdot f_{M}(G)}$ ,其中 $f_{i}(\cdot )$ 是一个计算G能够匹配特定的全局特征的函数，我们计算全局特征得分 $u f$ ,其中 $u$ 是一个可学习的权重向量，组后我们使用一个基于波束搜索二解码器来生成全局得分最高的信息图，在我们提取了这些提及之后，我们应用语法分析器(Honnibal et al.， 2020)来扩展提及头词的范围。然后我们应用跨语言实体链接器(Pan等人，2017)链接实体提到WikiData (Vrandeˇci´c和Krötzsch, 2014)
2.3 文档级别的事件参数抽取
前一个模块只能在句子层面上运行，特别是，事件参数经常在相邻的句子中找到。为了弥补这一点，我们进一步开发了一个文档级的事件参数提取模型，并且使用从两个模型中提取的参数联合作为最终输出，我们将参数提取问题表述为条件文本生成，模型可以在不需要调优阈值的情况下处理相同角色中缺少参数和多个参数的情况。并可以在一次传递中提取所有参数。条件由原始文档和一个空白事件模板组成。例如，Transportation事件类型的模板是arg1，将arg3中的arg2从arg4位置传输到arg5位置。所需的输出是一个带有参数的填充模板。
我们的模型基于BART (Lewis et al.， 2020)，这是一个编码器-解码器语言模型。为了利用编码器-解码器LM进行参数提取，构造了~~模板文档~~的输入句子，模板中的所有参数名（arg1，arg2等）都被一个特殊的占位符取代，该模型通过直接优化生成概率以端到端的方式进行训练，为了将提取到的参数与文档进行对齐，采用一种简单的后处理过程，并且找到最接近相应事件触发器的匹配文本跨度。
2.4 跨文档、跨语言实体和事件引用解析
在提取所有提及的实体和事件之后，我们应用了我们的跨文档跨语言实体共同引用解析模型，这是e2e-coref模型的扩展(Lee等人，2017)。使用多语言的XLM-RoBERTa（XLM-R）Transformer 模型），以便于我们的共同参考分辨率模型可以处理非英语数据，其次，我们将e2e-coref模型移植到跨语言阔文档设置给定N个混合的英语和西班牙语输入文档，我们创建N（N-1)/2对文档并将每对文档视为单个的“巨型文档”。将我们的模型应用于每个巨型文档，最后，聚合所有巨型文档的预测，以提取共同引用集群。我们还应用了一个简单的启发式规则，该规则防止两个提到的实体，如果它们以高置信度链接到不同的实体被合并在一起，，我们的事件共引用解析方法类似于实体共引用解析，同时合并了事件类型信息等额外的符号特征。如果输入文档都是关于一个特定的复杂事件，我们应用一种模式引导启发式规则来进一步细化神经事件共引用解析模型的预测。例如，在轰炸图式中，通常只有一个轰炸事件。因此，在一个文档集群中，如果有两个提到类型轰炸的事件，并且它们有几个共同的论点，这两个提到将被认为是互相引用的
2.4 跨文档时间事件排序
基于上面描述的事件相互引用解析组件，我们将所有提及分组到集群中。接下来，我们将按照时间轴对事件进行排序。我们跟随Zhou等人(2020)设计了一个用于时序事件排序的组件。具体来说，我们进一步用远时间有序监督信号预训练T5模型(rafael et al.， 2020)。这些信号通过两组语法模式获取:1)文本中的关键字之前/之后，2)显式提到日期和时间。我们采用这样一个预训练的时间T5模型，并在MA TRES上对其进行微调(Ning等人，2018b)，并将其用作时间事件排序的系统。我们对一个文档中的所有事件提及对进行成对时间关系分类。我们在MA TRES (Ning等人，2018b)上对RoBERTa (Liu等人，2019)进行微调，进一步训练另一个模型。该模型也成功地应用于事件时间预测(Wen et al.， 2021;Li等人，2020a)。我们只考虑相邻句子中的事件提及对，或者可以由共享参数连接。除了模型预测，我们还从模式存储库中学习高自信的模式。我们把经常出现的时间关系当作我们的先验知识。对于每个给定的文档簇，我们将这些模式作为高精度模式分别应用于两个统计时间排序模型之前。模式匹配算法将从两个图中选择最佳匹配作为最终实例化的模式结果。因为非英语数据的注释可能昂贵且耗时，所以时间事件跟踪组件只针对英语输入进行训练。为了将时间事件跟踪能力扩展到跨语言设置，我们应用谷歌云神经机器翻译将西班牙语文档翻译成英语，并应用FastAlign算法(Dyer et al.， 2013)获得单词对齐
2.6 跨媒体信息建立与融合
视觉事件和论证角色提取:我们的目标是从视觉数据(即图像和视频)中提取视觉事件及其论证角色。为了从视觉数据中训练事件提取器，我们通过使用18个与视觉概念相关的事件原语作为搜索关键词，在Youtube新闻频道上搜索，收集了一个名为Video M2E2的新数据集，其中包含1500对视频文章。我们对视频进行了大量的注释，并对关键帧进行了采样，用于注释参数角色的边界框。
我们的视觉事件和参数角色提取系统由一个事件分类模型(ResNet-50 (He等人，2016))和一个参数角色提取模型(JSL (Marasovi´c等人，2020))组成。为了提取时间和相关的参数角色，我们利用了一个名为“基于背景的情况”(SWiG)的公共数据集(Marasovi´c et al.， 2020)来预训练我们的系统，SWiG是为基于对象的图像中的事件和参数理解而设计的，但它有不同的本体。我们将SWiG中的事件类型、参数角色类型和实体名称映射到我们的本体(涵盖12个事件子类型)，以便我们的模型能够从图像和视频中提取事件信息。对于视频，我们以每秒1帧的帧率对帧进行采样，并将它们作为单独的图像处理。这样，我们就有了图像和视频输入的统一模型。
多模态事件共引用:我们进一步扩展了之前的视觉事件提取模型，以发现视觉事件和文本事件之间的共引用联系。对于检测到事件的视频帧，我们应用弱监督接地模型(Akbari等人，2019)来寻找帧与句子高度相似的句子和视频帧，表示与视频帧内容相似的句子内容。采用一种基于规则的方法来确定一个视觉事件提及和一个文本事件提及是否相互参照:(1)它们的事件类型匹配;(2)同一论证角色在不同模式下的实体类型不存在矛盾。(3)视频帧和句子的语义相似度较高。基于该管道，我们能够在事件图中添加可视化的事件来源。此外，我们能够向事件图添加仅可见的参数，这使事件图更具信息性
2.7 模式匹配
一旦我们通过模式归纳方法(Li等人，2020c)获得了一个大规模的模式存储库，我们可以将其视为提供了一个脚手架，我们可以使用传入的数据实例化来构建时间事件图。根据每个文档集群，我们需要从模式存储库中找到最准确的模式。我们进一步设计了一个模式匹配算法，可以将提取的事件、实体和关系与模式对齐。
我们首先对IE图和模式图进行基于时间关系的事件拓扑排序，从而得到按时间顺序线性化的事件序列。然后，对每一对IE图和模式图，应用最长公共子序列(LCS)方法寻找最佳匹配。我们的模式匹配考虑了相互引用和相互关系，当只考虑事件序列时，会破坏最优子结构。我们对算法进行了扩展，将子问题的最佳结果替换为一束具有排序的候选结果，排序来自考虑匹配事件、参数和关系的评分指标。候选对象由匹配的事件对组成，然后我们贪婪地匹配它们的参数和关系来得分。我们将最匹配的IE图和模式图合并，形成最终的实例化模式。
3、实验：
3.1 数据
我们进行了包括模式匹配和模式引导信息抽取的评估
3.2 量化性能
模式归纳。为了诱发图式，我们收集了描述与简易爆炸装置(IED)相关的复杂事件的维基百科文章，并应用我们的IE系统提取事件图。数据统计如表1所示。我们通过在训练数据的事件路径上应用路径语言模型(Li et al.， 2020c)来归纳模式，并将排名靠前的路径合并到模式图中，以供人类管理。人工策划模式存储库的统计信息如表2所示。
Schema-guided信息提取。各部件性能如表3所示。在包含多语言多媒体文档集群的复杂事件语料库(LDC2020E39)上，我们评估了系统的端到端性能。数据统计如表4所示。我们在ACE 2005 (Walker et al.， 2006)和ERE (Song et al.， 2015)上训练我们的提及提取成分;ACE 2005 (Walker et al.， 2006)和RAMS (Ebner et al.， 2020)文档级参数提取；ACE 2005、EDL 20167, EDL 20178, OntoNotes (Prad-
han et al., 2012), ERE (Song et al., 2015), CoNLL 2002 (Tjong Kim Sang, 2002), DCEP (Dias, 2016) and SemEval 2010 (Recasens et al., 2010)的共同引用成分(Walker等）；MATRES上的时间顺序分量(Ning等人，2018b);对视频M2E2和SWiG进行视觉事件和参数提取，我们输出的统计数据如表5所示。DARPA项目的第一阶段人类对25%系统输出的评估表明，大约70%的事件被正确提取。
3.3 定性分析
图2展示了从我们的端到端系统获得最佳匹配结果的示例子集。可以看到我们的系统可以提取事件、实体和关系，并将它们与所选的模式很好地对齐。最后实例化的模式是合并匹配元素的两个图的混合。
相关工作：文本信息提取。现有的端对端信息抽取(IE)系统(Wadden等人，2019;Li等人，2020b;Lin等，2020;Li等人，2019)主要关注从单个句子中提取实体、事件和实体关系。相反，我们在全局文档上下文中提取和推断参数。此外，我们的IE系统是由一个模式存储库指导的。提取的图将用于实例化一个模式图，该模式图可用于预测未来的事件。
多媒体信息提取。以前的多媒体IE系统(Li等人，2020b;Yazici等人，2018)只包括通过将提取的视觉实体接地到文本的跨媒体实体的相互引用分辨率。我们率先进行跨媒体联合事件提取和共引用解析，从文本、图像和视频中获取共引用事件。
指称相同分辨率：以前的事件相互引用解析的神经模型使用非上下文(Nguyen等人，2016;Choubey等人，2020;黄等人，2019年)或上下文单词表征(Lu等人，2020年;Y u et al.， 2020)。我们融入了广泛的符号特征(Chen和Ji, 2009;Chen等人，2009;Sammons等人，2015;Lu, Ng, 2016, 2017;Duncan等人，2017)，例如事件属性和类型，使用上下文相关的门机制，进入我们的事件共同引用解析模块。
时间事件排序。提取相邻事件在一句话中的时间关系(Ning等人，2017,2018a, 2019;Han等人，2019)，忽略了跨句子事件之间的时间依赖性。我们执行文档级事件排序，并通过共享参数传播时态属性。此外，我们利用模式存储库知识，使用事件类型之间频繁的时间顺序来指导事件之间的顺序。
5 结论和未来工作
我们演示了一个最先进的模式引导的跨文档、跨语言、跨媒体的信息提取和事件跟踪系统。这个系统向公众开放，使用户能够有效地利用来自各种来源、语言和方式的丰富信息。未来，我们计划开发更先进的基于图神经网络的模式匹配和模式引导事件预测方法。
6、更广泛的影响
我们开发跨文档、跨语言、跨媒体的信息提取和事件跟踪系统的目标是推进最先进的技术，并增强该领域从多种来源、语言和方式充分理解真实世界事件的能力。我们相信，要在以事件为中心的自然语言理解方面取得真正的进展，我们不应该只关注数据集，还应该将我们的工作根植于现实世界的应用程序中。我们关注的应用程序是导航新闻，这里展示的例子和在论文中展示了潜在的应用在新闻理解。在我们的演示中，有益使用和有害使用之间的区别部分取决于数据。正确使用该技术要求输入的文件/图像是合法和合乎道德的获取。我们特别感到兴奋的是，这些技术可能用于具有广泛社会影响的应用，例如灾害监测和应急反应。训练和评估数据往往存在偏差，这限制了系统在代表性较差的人群和新领域中的准确性。在实验部分中报告的系统组件的性能是基于特定的基准数据集，这可能会受到数据偏差的影响。因此，关于普遍性和公平性的问题应仔细考虑。确保正确而非恶意地应用双重用途技术的一般方法应:在系统设计的每一步都将道德考虑作为一阶原则，在整个系统中保持数据、算法、模型和功能的高度透明度和可解释性。我们打算将我们的软件作为开源和共享的docker容器提供给公众进行验证和审计，并探索保护的对策去保护易受攻击的种群。

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
音视频知识图谱 2022.04 关键帧Keyframe
前些时间，我在知识星球上创建了一个音视频技术社群：关键帧的音视频开发圈，在这里群友们会一起做一些打卡任务。比如：周期性地整理音视频相关的面试题，汇集一份音视频面试题集锦，你可以看看《音视频面试题集锦2022.04》。再比如：循序渐进地归纳总结音视频技术知识，绘制一幅音视频知识图谱。下面是2022.04月知识图谱新增的内容节选：1）图谱路径：**采集/音频采集/声音三要素/响度******主观计量响
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
Humanize 项目教程尤嫒冰
Humanize项目教程humanizeAJSlibraryforaddinga“humantouch”todata.项目地址:https://gitcode.com/gh_mirrors/humani/humanize项目介绍Humanize是一个开源项目，旨在将机器生成的文本转换为更加自然、人性化的文本。该项目通过先进的算法和自然语言处理技术，使得AI生成的内容更加贴近人类的表达方式，从而提高
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f

RESIN: A Dockerized Schema-Guided Cross-document Cross-lingual Cross-media Information Extraction an

你可能感兴趣的:(自然语言处理,知识图谱,人工智能)