Trouble..

自然语言处理和计算机视觉相关论文总结

 
  自然语言处理 
  命名实体识别 
   
     论文名称 
     期刊/会议 
     时间 
     解读 
     特点 
     代码 
    
     Unified Named Entity Recognition as Word-Word Relation Classification 
     AAAI 
     2022 
     W2NER 
     本文建立了一个统一的命名实体识别模型，解决了NER领域当前嵌套实体、不连续实体的难题，其思想和TPLinker有异曲同工之处。将NER建立成2维网格，提出了多粒度卷积进行网格优化，推动了NER任务的统一。 
     W2NER 
    
  关系抽取 
   
     论文名称 
     期刊/会议 
     时间 
     解读 
     特点 
     代码 
    
  事件抽取 
  综述 
   
     论文名称 
     期刊/会议 
     时间 
     解读 
     特点 
     代码 
    
     A Survey on Deep Learning Event Extraction: Approaches and Applications 
     TANNLS 
     2022 
     解读 
     本文回顾了2022年以前事件抽取模型进展，主要针对深度学习模型的研究。并为事件抽取模型进行文献分类，总结了事件抽取的范式和模型。分析了未来的研究方向。 
     - 
    
  事件检测/事件触发词抽取 
   
     论文名称 
     期刊/会议 
     时间 
     解读 
     特点 
     代码 
    
     Saliency as Evidence: Event Detection with Trigger Saliency Attribution 
     ACL 
     2022 
     SaliencyED解读 
     本文将事件触发词检测分为两种情况，一种是更依赖触发词的，另一种是更依赖上下文的。本文采用触发词显著归因将其进行划分，对于第一种采用正常的序列标注模型，对于第二种将会先检测上下文中部分词显著性较高的词(非触发词)，引入外部知识进行强化。 
     SaliencyED 
    
     DESED: Dialogue-based Explanation for Sentence-level Event Detection 
     COLING 
     2022 
     DESED解读 
     本文提出使用GPT在原始句子的基础上生成对应提示上下文，并提出了三种简单的对话解释，并采用注意力机制将原始句子和生成句子进行融合，从而实现原句增强 
     DESED 
    
     Event Detection with Dual Relational Graph Attention Networks 
     COLING 
     2022 
     DualGAT解读 
     在句子级事件检测的基础上，使用句法关系和语义关系构建了一个对偶关系增强的注意力网络(重点在于句法图和语义图构建和剪枝)，在对偶关系图的基础上使用图注意力网络进行知识增强，最后进行联合知识解码 
     DualGAT 
    
     KiPT: Knowledge-injected Prompt Tuning for Event Detection 
     COLING 
     2022 
     KiPT解读 
     在句子级事件检测的基础上，引入外部知识WordNet和软知识进行特征增强，外部知识引入是根据每个词的词性进行针对性增强，在使用生成模型进行条件解码 
     - 
    
  事件论元抽取 
   
     论文名称 
     期刊/会议 
     时间 
     解读 
     特点 
     代码 
    
     Prompt for Extraction? PAIE: Prompting Argument Interaction for Event Argument Extraction 
     ACL 
     2022 
     PAIE解读 
     本文根据提示在每个角色的输入文本中选择开始/结束标记，引入了两个span选择器，它通过多角色提示捕获论元交互，并通过二部匹配损失(优化算法)进行最优跨度分配的联合优化。PAIE是将提示输入到解码器中，提供了不同的角度去分析论元角色 
     PAIE 
    
     Multilingual Generative Language Models for Zero-Shot Cross-Lingual Event Argument Extraction 
     ACL 
     2022 
     X-GEAR解读 
     本文设计了一种与语言无关的提示模板，兼容了各种语言的事件论元结构。在多语言生成模型上进行微调，来生成最终从输入段落中抽取的论元填充，并分析了各种语言迁移的效果 
     X-Gear 
    
  句子级事件抽取 
  数据集 
   
     论文名称 
     期刊/会议 
     时间 
     解读 
     特点 
     代码 
    
     Title2Event: Benchmarking Open Event Extraction with a Large-scale Chinese Title Dataset 
     EMNLP 
     2022 
     Title2Event解读 
     提出了一种中文新闻标题句子级事件抽取数据集，数据形式类似于三元组，中文数据集。 
     Title2Event 
    
     MEE: A Novel Multilingual Event Extraction Dataset 
     EMNLP 
     2022 
     添加链接描述 
      
  基于 分类 的方法 
  流水线抽取 
   
     论文名称 
     期刊/会议 
     时间 
     解读 
     特点 
     代码 
    
     EventGraph: Event Extraction as Semantic Graph Parsing 
     CASE 
     2022 
     EventGraph解读 
     语义图解码方式 
     EventGraph 
    
     CasEE: A Joint Learning Framework with Cascade Decoding for Overlapping Event Extraction 
     ACL 
     2021 
     CasEE解读 
     CasEE依次执行(类型检测、触发词抽取和论元抽取)(前者)，其中重叠的目标根据前者的特定预测分别抽取。 
     CasEE 
    
     Query and Extract: Refining Event Extraction as Type-oriented Binary Decoding 
     ACL 
     2022 
     Query and Extract解读 
     本文提出了一种新颖的事件抽取框架，该框架使用事件类型和论元角色作为自然语言查询，从输入文本中抽取候选触发词和论元。通过数据集中触发词和论元角色的分布进行上下文特征增强 
     Event_Query_Extract 
    
  联合抽取 
   
     论文名称 
     期刊/会议 
     时间 
     解读 
     特点 
     代码 
    
     Joint Information Extraction with Cross-Task and Cross-Instance High-Order Modeling 
     Arixv 
     2022 
     HighIE解读 
     设计了两类高阶因子(同质因子和异质因子)，可以在训练和推理过程中结合跨任务和跨实例交互 
     HighIE 
    
     OneEE: A One-Stage Framework for Fast Overlapping and Nested Event Extraction 
     COLING 
     2022 
     OneEE解读 
     很新颖的想法，将TPlinker关系抽取的思想用于事件抽取，实现了联合抽取触发词和论元，在使用自适应事件融合函数加强事件间的交互。解决了错误传播和事件触发词，论元嵌套的问题 
     OneEE 
    
     Abstract Meaning Representation Guided Graph Encoding and Decoding for Joint Information Extraction 
     NAACL 
     2021 
     AMR-IR解读 
     本文利用抽象语义表示AMR进行辅助事件抽取，利用AMR语义聚合器和AMR引导图解码，分别加强了触发词和抡元之间的交互，触发词和论元之间的解码。 
     AMR-IE 
    
     Cross-Task Instance Representation Interactions and Label Dependencies for Joint Information Extraction with Graph Convolutional Networks 
     NAACL 
     2021 
     FourIE解读 
     本文先进行触发词识别和实体识别，然后构建触发词和实体交互图，利用GCN对图特征进行增强对最后结果进行预测。将预测的结果和真实的情况在重建图，得到预测和真实之间的图损失值进行强化训练。 
     - 
    
     Joint Extraction of Entities, Relations, and Events via Modeling Inter-Instance and Inter-Label Dependencies 
     NAACL 
     2022 
     GraphIE解读 
     本文提出从数据中诱导任务实例之间的依赖关系图来促进表示学习。为了更好地捕获实例标签之间的依赖关系，通过条件随机场直接估计它们的联合分布。引入噪声对比估计来解决模型训练中难以处理的联合似然的最大化问题。最后，为了改进之前工作中的贪心搜索或束搜索的解码，提出了模拟退火，以便在解码时更好地找到实例标签的全局最优分配。 
     - 
    
     A Joint Neural Model for Information Extraction with Global Features 
     ACL 
     2020 
     OneIE解读 
     本文首次提出了事件联合抽取模型，利用识别的触发词和实体提及构建局部图分类器，在使用beam search全局搜索最优图。解码阶段利用全局特征捕获跨实例和跨任务的交互，从而优化结果。 
     OneIE 
    
  基于 问答/提示 的方式 
   
     论文名称 
     期刊/会议 
     时间 
     解读 
     特点 
     代码 
    
     Event Extraction as Machine Reading Comprehension 
     EMNLP 
     2020 
     RCEE论文解读 
     首次将事件抽取转化为机器阅读理解问题，生成特定问题进行事件抽取。 
     RCEE 
    
     Global Constraints with Prompting for Zero-Shot Event Argument Classification 
     EACL 
     2023 
     论文解读 
     提出了一种利用前缀提示进行零样本事件抽取的方法。 
     Code 
    
     Dynamic Prefix-Tuning for Generative Template-based Event Extractio 
     ACL 
     2022 
     GTEE-DYNPREF论文解读 
     基于生成模板的动态前缀事件抽取，通过集成上下文信息和特定类型的前缀来学习每个上下文的特定上下文前缀。 
     - 
    
     DEGREE: A Data-Efficient Generation-Based Event Extraction Model 
     NAACL 
     2022 
     DEGREE解读 
     给定一篇句子和一个手动设计的提示，DEGREE学会将句子中提到的事件总结成一个遵循预定义模式的自然句子。然后用确定性算法从生成的句子中抽取出最终的事件。 
     DEGREE 
    
     Prompt for Extraction? PAIE: Prompting Argument Interaction for Event Argument Extraction 
     ACL 
     2022 
     PAIE解读 
     本文根据提示在每个角色的输入文本中选择开始/结束标记，引入了两个span选择器，它通过多角色提示捕获论元交互，并通过二部匹配损失(优化算法)进行最优跨度分配的联合优化。PAIE是将提示输入到解码器中，提供了不同的角度去分析论元角色 
     PAIE 
    
     Event Extraction by Answering (Almost) Natural Questions 
     EMNLP 
     2020 
     EEQAj解读 
     本文首次将事件抽取任务转化为QA任务，通过问答形式进行抽取事件触发词和论元角色，并且在零样本时也具有一定的效果。 
     EEQA 
    
     Retrieval-Augmented Generative Question Answering for Event Argument Extraction 
     EMNLP 
     2022 
     RGQA解读 
     本文提出了一种用于事件论元抽取的检索增强生成QA模型（R-GQA），检索与文本最相似的QA对，并将其作为当前示例上下文的提示，然后将论元解码为答案。采用聚类的采样策略对少样本学习及逆行深入分析。 
     RGQA 
    
  对比学习 
   
     论文名称 
     期刊/会议 
     时间 
     解读 
     特点 
     代码 
    
     CLEVE: Contrastive Pre-training for Event Extraction 
     ACL 
     2021 
     CLEVE解读 
     CLEVE在与训练过程中使用自动解析器(AMR)去获取大量的无监督数据和语义信息进行预训练，有一个学习语义的文本编码器，一个学习事件语义结构的图编码器 
     CLEVE 
    
  迁移学习 
   
     论文名称 
     期刊/会议 
     时间 
     解读 
     特点 
     代码 
    
     A Multi-Format Transfer Learning Model for Event Argument Extraction via Variational Information Bottleneck 
     COLING 
     2022 
     UnifiedEAE解读 
     不同数据集之间标注可能存在差距，事件记录可能很复杂，很难用统一的模型来抽取。本文采用变分信息瓶颈消除数据集间的不相关信息，保留数据集的共享信息，学习不同数据间的格式 
     - 
    
  文档级事件抽取 
  数据集 
   
     论文名称 
     期刊/会议 
     时间 
     解读 
     特点 
     代码 
    
     DocEE: A Large-Scale and Fine-grained Benchmark for Document-level Event Extraction 
     NAACL 
     2022 
     DocEE解读 
     提出了一个文档级事件抽取数据集，该数据集具有大规模手动标注、细粒度论元类型和面向应用程序三大特点。该数据集是英文的。 
     DocEE 
    
  方法 
   
     论文名称 
     期刊/会议 
     时间 
     解读 
     特点 
     代码 
    
     Document-Level event Extraction via human-like reading process 
     ICASSP 
     2022 
     解读 
     将文档级事件抽取分解为粗略阅读和精细阅读两个迭代阶段。第一个阶段浏览文档以检测事件的发生，第二个阶段用于抽取特定的事件论元。 
     - 
    
     A Two-Stream AMR-enhanced Model for Document-level Event Argument Extraction 
     NAACL 
     2022 
     TSAR解读 
     TSAR通过双流编码模块从不同角度对文档进行编码，解决论元分散问题。此外，TSAR还引入了基于局部和全局的AMR语义图的AMR引导交互模块，以捕获句内和句间特征。引入一种辅助边界损失来显式增强文本跨度的边界信息。 
     TSAR 
    
     RAAT: Relation-Augmented Attention Transformer for Relation Modeling in Document-Level Event Extraction 
     NAACL 
     2022 
     RAAT解读 
     提出了一种针对事件触发词和论元角色之间关系依赖进行增强的Transformer机制，有效地解决DEE论元分散问题 
     RAAT 
    
     Document-Level Event Role Filler Extraction using Multi-Granularity Contextualized Encoding 
     ACL 
     2020 
     Multi-Granularity Reader解读 
     本文采用一个折中策略来解决DEE，提出了K_sentence阅读器和段落级阅读器，结合两者的特征形成一个多粒度阅读器进行DEE任务 
     Multi-Granularity Reader 
    
     Document-level Event Extraction via Heterogeneous Graph-based Interaction Model with a Tracker 
     ACL 
     2021 
     GIT解读 
     本文针对DEE论元分散和事件间相关性建模问题，提出了带有跟踪器的异构图交互模型，该模型可以捕捉不同句子实体提及的交互，不同事件之间的交互 
     GIT 
    
     Doc2EDAG: An End-to-End Document-level Framework for Chinese Financial Event Extraction 
     EMNLP 
     2019 
     Doc2EDAG解读 
     本文针对DEE任务，提出了一个无触发词的DEE任务，来简化事件标记。利用抽取出来的实体构建实体有向无环图进行交互，融合句子信息、文档信息进行解码 
     Doc2EDAG 
    
     Document-level Event Extraction via Parallel Prediction Networks 
     ACL 
     2021 
     DEPPN解读 
     采用不同粒度解码器进行解码事件和论元角色，并提出了一种新的匹配损失优化计算 
     DE-PPN 
    
     CLIO: Role-interactive Multi-event Head Attention Network for Document-level Event Extraction 
     COLING 
     2022 
     CLIO解读 
     本文提出了一种面向DEE的角色交互多事件头注意力网络。通过将不同的事件映射到多个子空间，将DEE分解为多个子步骤，以处理嵌套的论元和多个事件。为了进一步优化事件表示，应用事件表示增强策略来正则化对比预训练的嵌入空间，使其更加各向同性 
     - 
    
  事件因果关系识别 
   
     论文名称 
     期刊/会议 
     时间 
     解读 
     特点 
     代码 
    
     Event Causality Extraction with Event Argument Correlations 
     COLING 
     2022 
     DualCor解读 
     传统的事件因果关系识别忽略了关键事件结构和因果关系，DualCor提出了一种双网格标记来捕获事件内和事件间因果关系，进而增强事件因果关系识别 
     DualCor 
    
  预训练语言模型 
   
     论文名称 
     期刊/会议 
     时间 
     解读 
     特点 
     代码 
    
     RoFormer: Enhanced Transformer with Rotary Position Embedding 
     Arxiv 
     2021 
     ReFormer解读 
     提出了一种高效的旋转位置编码，并对当前的位置编码进行综述。 
     ReFormer 
    
  其他 
  句子嵌入 
   
     论文名称 
     期刊/会议 
     时间 
     解读 
     特点 
     代码 
    
     SimCSE: Simple Contrastive Learning of Sentence Embeddings 
     EMNLP 
     2021 
     SimCSE解读 
     本文提出了一种句子级对比学习的模型，既可以监督方式也可以无监督方式进行句子嵌入，使用该模型可以得到一个句子的向量表示。 
     SimCSE 
    
  计算机视觉 
  通用视觉骨干网络 
   
     论文名称 
     期刊/会议 
     时间 
     解读 
     特点 
     代码 
    
     Training data-efficient image transformers & distillation through attention 
     ICML 
     2021 
     DEIT解读 
     提出了一种针对vision transformer的数据蒸馏方式，以及卷积模型和vision transformer分别作为教师模型和学生模型的策略。 
     DEIT 
    
     BEIT: BERT Pre-Training of Image Transformers 
     ICLR 
     2022 
     BEIT解读 
     针对vision transformer提出了一种自监督的预训练方式，掩码图像建模，类似于文本的MLM。 
     BEIT 
    
     IS ATTENTION BETTER THAN MATRIX DECOMPOSITION? 
     ICLR 
     2021 
     Hamburger解读 
     提出了Hamburger结构，将全局信息建模转化为低秩补全问题，利用矩阵分解和梯度优化对其及进行求解。 
     Hamburger 
    
     Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 
     ICCV 
     2021 
     Swin-Transformer解读 
     在ViT的基础上提出了分层Transformer的概念，并提出了移位窗口高效的特征交互和计算效率，推动了Vision Transformer的后续发展。 
     Swin-Transformer 
    
     An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale 
     ICLR 
     2020 
     ViT解读 
     首次在视觉领域提出了Transformer的概念，将图像进行分块处理，输入到Transformer模型上进行计算。本文也算Transformer应用到视觉领域的开山之作，打破了CNN在视觉领域的绝对领导地位。 
     ViT 
    
  语义分割网络 
   
     论文名称 
     期刊/会议 
     时间 
     解读 
     特点 
     代码 
    
     The Fully Convolutional Transformer for Medical Image Segmentation 
     WACV 
     2023 
     FCT解读 
     提出了卷积注意力机制，极大提升了实验效果 
     FCT 
    
     SegNeXt: Rethinking Convolutional Attention Design for Semantic Segmentation 
     NeurIPS 
     2022 
     SegNext解读 
     重新设计了卷积结构，结合Hamburger解码器实现了SOTA 
     SegNext 
    
     Segment Anything 
     Arxiv 
     2023 
     SAM解读 
     首次将提示用于语义分割领域，号称图像的GPT-3，提供了点、框、文本三种提示方式增强语义分割，开源了一个巨大的语义分割数据集 
     SAM 
    
     Segmenter: Transformer for Semantic Segmentation 
     ICCV 
     2021 
     Segmenter解读 
     本文在ViT的基础上提出了Mask Transformer的语义分割解码器，将类嵌入和ViT提取的特征进行特征增强，得到更好的语义分割结果 
     segmenter 
    
     SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers 
     NeurIPS 
     2021 
     SegFormer解读 
     SegFormer是专门设计的语义分割网络，采用层次编码结构（类似于Swin-Transformer），可以输出多尺度特征，并且不需要位置嵌入。其次，SegFormer避免了复杂的解码器，使用MLP解码。 
     SegFormer 
    
     Swin-Unet: Unet-like Pure Transformer for Medical Image Segmentation 
     ECCV 
     2021 
     Swin-Unet解读 
     本文利用Swin-Transformer构建了一个U型语义分割网络，并没有按照官方给出的大模型结构，而是自己搭建了一个更小的模型进行预训练，独特之处在于解码器的上采样层不是upsample，而是Swin-Transfromer的path merge的逆过程，有效提升了模型的精度 
     Swin-Unet 
    
     Unified Perceptual Parsing for Scene Understanding 
     ECCV 
     2018 
     UperNet解读 
     本文针对层级图像特征的抽取结果进行分析，将不同层级的特征用于处理不同粒度的任务。该模型的目前广泛被用于语义分割，层级编码器的解码网络 
     UperNet 
    
  多模态 
  表征学习 
   
     论文名称 
     期刊/会议 
     时间 
     解读 
     特点 
     代码 
    
     Efficient Self-supervised Learning with Contextualized Target Representations for Vision, Speech and Language 
     - 
     2022 
     Data2Vec解读 
     提出了一种视觉、语音和文本的统一自监督模型，相对之前的统一表示模型，现在效率更高、花费更少。 
     data2vec

论文名称	期刊/会议	时间	解读	特点	代码
Unified Named Entity Recognition as Word-Word Relation Classification	AAAI	2022	W2NER	本文建立了一个统一的命名实体识别模型，解决了NER领域当前嵌套实体、不连续实体的难题，其思想和TPLinker有异曲同工之处。将NER建立成2维网格，提出了多粒度卷积进行网格优化，推动了NER任务的统一。	W2NER

论文名称	期刊/会议	时间	解读	特点	代码
A Survey on Deep Learning Event Extraction: Approaches and Applications	TANNLS	2022	解读	本文回顾了2022年以前事件抽取模型进展，主要针对深度学习模型的研究。并为事件抽取模型进行文献分类，总结了事件抽取的范式和模型。分析了未来的研究方向。	-

论文名称	期刊/会议	时间	解读	特点	代码
Saliency as Evidence: Event Detection with Trigger Saliency Attribution	ACL	2022	SaliencyED解读	本文将事件触发词检测分为两种情况，一种是更依赖触发词的，另一种是更依赖上下文的。本文采用触发词显著归因将其进行划分，对于第一种采用正常的序列标注模型，对于第二种将会先检测上下文中部分词显著性较高的词(非触发词)，引入外部知识进行强化。	SaliencyED
DESED: Dialogue-based Explanation for Sentence-level Event Detection	COLING	2022	DESED解读	本文提出使用GPT在原始句子的基础上生成对应提示上下文，并提出了三种简单的对话解释，并采用注意力机制将原始句子和生成句子进行融合，从而实现原句增强	DESED
Event Detection with Dual Relational Graph Attention Networks	COLING	2022	DualGAT解读	在句子级事件检测的基础上，使用句法关系和语义关系构建了一个对偶关系增强的注意力网络(重点在于句法图和语义图构建和剪枝)，在对偶关系图的基础上使用图注意力网络进行知识增强，最后进行联合知识解码	DualGAT
KiPT: Knowledge-injected Prompt Tuning for Event Detection	COLING	2022	KiPT解读	在句子级事件检测的基础上，引入外部知识WordNet和软知识进行特征增强，外部知识引入是根据每个词的词性进行针对性增强，在使用生成模型进行条件解码	-

论文名称	期刊/会议	时间	解读	特点	代码
Prompt for Extraction? PAIE: Prompting Argument Interaction for Event Argument Extraction	ACL	2022	PAIE解读	本文根据提示在每个角色的输入文本中选择开始/结束标记，引入了两个span选择器，它通过多角色提示捕获论元交互，并通过二部匹配损失(优化算法)进行最优跨度分配的联合优化。PAIE是将提示输入到解码器中，提供了不同的角度去分析论元角色	PAIE
Multilingual Generative Language Models for Zero-Shot Cross-Lingual Event Argument Extraction	ACL	2022	X-GEAR解读	本文设计了一种与语言无关的提示模板，兼容了各种语言的事件论元结构。在多语言生成模型上进行微调，来生成最终从输入段落中抽取的论元填充，并分析了各种语言迁移的效果	X-Gear

论文名称	期刊/会议	时间	解读	特点	代码
Title2Event: Benchmarking Open Event Extraction with a Large-scale Chinese Title Dataset	EMNLP	2022	Title2Event解读	提出了一种中文新闻标题句子级事件抽取数据集，数据形式类似于三元组，中文数据集。	Title2Event
MEE: A Novel Multilingual Event Extraction Dataset	EMNLP	2022	添加链接描述

论文名称	期刊/会议	时间	解读	特点	代码
EventGraph: Event Extraction as Semantic Graph Parsing	CASE	2022	EventGraph解读	语义图解码方式	EventGraph
CasEE: A Joint Learning Framework with Cascade Decoding for Overlapping Event Extraction	ACL	2021	CasEE解读	CasEE依次执行(类型检测、触发词抽取和论元抽取)(前者)，其中重叠的目标根据前者的特定预测分别抽取。	CasEE
Query and Extract: Refining Event Extraction as Type-oriented Binary Decoding	ACL	2022	Query and Extract解读	本文提出了一种新颖的事件抽取框架，该框架使用事件类型和论元角色作为自然语言查询，从输入文本中抽取候选触发词和论元。通过数据集中触发词和论元角色的分布进行上下文特征增强	Event_Query_Extract

论文名称	期刊/会议	时间	解读	特点	代码
Joint Information Extraction with Cross-Task and Cross-Instance High-Order Modeling	Arixv	2022	HighIE解读	设计了两类高阶因子(同质因子和异质因子)，可以在训练和推理过程中结合跨任务和跨实例交互	HighIE
OneEE: A One-Stage Framework for Fast Overlapping and Nested Event Extraction	COLING	2022	OneEE解读	很新颖的想法，将TPlinker关系抽取的思想用于事件抽取，实现了联合抽取触发词和论元，在使用自适应事件融合函数加强事件间的交互。解决了错误传播和事件触发词，论元嵌套的问题	OneEE
Abstract Meaning Representation Guided Graph Encoding and Decoding for Joint Information Extraction	NAACL	2021	AMR-IR解读	本文利用抽象语义表示AMR进行辅助事件抽取，利用AMR语义聚合器和AMR引导图解码，分别加强了触发词和抡元之间的交互，触发词和论元之间的解码。	AMR-IE
Cross-Task Instance Representation Interactions and Label Dependencies for Joint Information Extraction with Graph Convolutional Networks	NAACL	2021	FourIE解读	本文先进行触发词识别和实体识别，然后构建触发词和实体交互图，利用GCN对图特征进行增强对最后结果进行预测。将预测的结果和真实的情况在重建图，得到预测和真实之间的图损失值进行强化训练。	-
Joint Extraction of Entities, Relations, and Events via Modeling Inter-Instance and Inter-Label Dependencies	NAACL	2022	GraphIE解读	本文提出从数据中诱导任务实例之间的依赖关系图来促进表示学习。为了更好地捕获实例标签之间的依赖关系，通过条件随机场直接估计它们的联合分布。引入噪声对比估计来解决模型训练中难以处理的联合似然的最大化问题。最后，为了改进之前工作中的贪心搜索或束搜索的解码，提出了模拟退火，以便在解码时更好地找到实例标签的全局最优分配。	-
A Joint Neural Model for Information Extraction with Global Features	ACL	2020	OneIE解读	本文首次提出了事件联合抽取模型，利用识别的触发词和实体提及构建局部图分类器，在使用beam search全局搜索最优图。解码阶段利用全局特征捕获跨实例和跨任务的交互，从而优化结果。	OneIE

论文名称	期刊/会议	时间	解读	特点	代码
Event Extraction as Machine Reading Comprehension	EMNLP	2020	RCEE论文解读	首次将事件抽取转化为机器阅读理解问题，生成特定问题进行事件抽取。	RCEE
Global Constraints with Prompting for Zero-Shot Event Argument Classification	EACL	2023	论文解读	提出了一种利用前缀提示进行零样本事件抽取的方法。	Code
Dynamic Prefix-Tuning for Generative Template-based Event Extractio	ACL	2022	GTEE-DYNPREF论文解读	基于生成模板的动态前缀事件抽取，通过集成上下文信息和特定类型的前缀来学习每个上下文的特定上下文前缀。	-
DEGREE: A Data-Efficient Generation-Based Event Extraction Model	NAACL	2022	DEGREE解读	给定一篇句子和一个手动设计的提示，DEGREE学会将句子中提到的事件总结成一个遵循预定义模式的自然句子。然后用确定性算法从生成的句子中抽取出最终的事件。	DEGREE
Prompt for Extraction? PAIE: Prompting Argument Interaction for Event Argument Extraction	ACL	2022	PAIE解读	本文根据提示在每个角色的输入文本中选择开始/结束标记，引入了两个span选择器，它通过多角色提示捕获论元交互，并通过二部匹配损失(优化算法)进行最优跨度分配的联合优化。PAIE是将提示输入到解码器中，提供了不同的角度去分析论元角色	PAIE
Event Extraction by Answering (Almost) Natural Questions	EMNLP	2020	EEQAj解读	本文首次将事件抽取任务转化为QA任务，通过问答形式进行抽取事件触发词和论元角色，并且在零样本时也具有一定的效果。	EEQA
Retrieval-Augmented Generative Question Answering for Event Argument Extraction	EMNLP	2022	RGQA解读	本文提出了一种用于事件论元抽取的检索增强生成QA模型（R-GQA），检索与文本最相似的QA对，并将其作为当前示例上下文的提示，然后将论元解码为答案。采用聚类的采样策略对少样本学习及逆行深入分析。	RGQA

论文名称	期刊/会议	时间	解读	特点	代码
CLEVE: Contrastive Pre-training for Event Extraction	ACL	2021	CLEVE解读	CLEVE在与训练过程中使用自动解析器(AMR)去获取大量的无监督数据和语义信息进行预训练，有一个学习语义的文本编码器，一个学习事件语义结构的图编码器	CLEVE

论文名称	期刊/会议	时间	解读	特点	代码
A Multi-Format Transfer Learning Model for Event Argument Extraction via Variational Information Bottleneck	COLING	2022	UnifiedEAE解读	不同数据集之间标注可能存在差距，事件记录可能很复杂，很难用统一的模型来抽取。本文采用变分信息瓶颈消除数据集间的不相关信息，保留数据集的共享信息，学习不同数据间的格式	-

论文名称	期刊/会议	时间	解读	特点	代码
Document-Level event Extraction via human-like reading process	ICASSP	2022	解读	将文档级事件抽取分解为粗略阅读和精细阅读两个迭代阶段。第一个阶段浏览文档以检测事件的发生，第二个阶段用于抽取特定的事件论元。	-
A Two-Stream AMR-enhanced Model for Document-level Event Argument Extraction	NAACL	2022	TSAR解读	TSAR通过双流编码模块从不同角度对文档进行编码，解决论元分散问题。此外，TSAR还引入了基于局部和全局的AMR语义图的AMR引导交互模块，以捕获句内和句间特征。引入一种辅助边界损失来显式增强文本跨度的边界信息。	TSAR
RAAT: Relation-Augmented Attention Transformer for Relation Modeling in Document-Level Event Extraction	NAACL	2022	RAAT解读	提出了一种针对事件触发词和论元角色之间关系依赖进行增强的Transformer机制，有效地解决DEE论元分散问题	RAAT
Document-Level Event Role Filler Extraction using Multi-Granularity Contextualized Encoding	ACL	2020	Multi-Granularity Reader解读	本文采用一个折中策略来解决DEE，提出了K_sentence阅读器和段落级阅读器，结合两者的特征形成一个多粒度阅读器进行DEE任务	Multi-Granularity Reader
Document-level Event Extraction via Heterogeneous Graph-based Interaction Model with a Tracker	ACL	2021	GIT解读	本文针对DEE论元分散和事件间相关性建模问题，提出了带有跟踪器的异构图交互模型，该模型可以捕捉不同句子实体提及的交互，不同事件之间的交互	GIT
Doc2EDAG: An End-to-End Document-level Framework for Chinese Financial Event Extraction	EMNLP	2019	Doc2EDAG解读	本文针对DEE任务，提出了一个无触发词的DEE任务，来简化事件标记。利用抽取出来的实体构建实体有向无环图进行交互，融合句子信息、文档信息进行解码	Doc2EDAG
Document-level Event Extraction via Parallel Prediction Networks	ACL	2021	DEPPN解读	采用不同粒度解码器进行解码事件和论元角色，并提出了一种新的匹配损失优化计算	DE-PPN
CLIO: Role-interactive Multi-event Head Attention Network for Document-level Event Extraction	COLING	2022	CLIO解读	本文提出了一种面向DEE的角色交互多事件头注意力网络。通过将不同的事件映射到多个子空间，将DEE分解为多个子步骤，以处理嵌套的论元和多个事件。为了进一步优化事件表示，应用事件表示增强策略来正则化对比预训练的嵌入空间，使其更加各向同性	-

论文名称	期刊/会议	时间	解读	特点	代码
Event Causality Extraction with Event Argument Correlations	COLING	2022	DualCor解读	传统的事件因果关系识别忽略了关键事件结构和因果关系，DualCor提出了一种双网格标记来捕获事件内和事件间因果关系，进而增强事件因果关系识别	DualCor

论文名称	期刊/会议	时间	解读	特点	代码
RoFormer: Enhanced Transformer with Rotary Position Embedding	Arxiv	2021	ReFormer解读	提出了一种高效的旋转位置编码，并对当前的位置编码进行综述。	ReFormer

论文名称	期刊/会议	时间	解读	特点	代码
SimCSE: Simple Contrastive Learning of Sentence Embeddings	EMNLP	2021	SimCSE解读	本文提出了一种句子级对比学习的模型，既可以监督方式也可以无监督方式进行句子嵌入，使用该模型可以得到一个句子的向量表示。	SimCSE

论文名称	期刊/会议	时间	解读	特点	代码
Training data-efficient image transformers & distillation through attention	ICML	2021	DEIT解读	提出了一种针对vision transformer的数据蒸馏方式，以及卷积模型和vision transformer分别作为教师模型和学生模型的策略。	DEIT
BEIT: BERT Pre-Training of Image Transformers	ICLR	2022	BEIT解读	针对vision transformer提出了一种自监督的预训练方式，掩码图像建模，类似于文本的MLM。	BEIT
IS ATTENTION BETTER THAN MATRIX DECOMPOSITION?	ICLR	2021	Hamburger解读	提出了Hamburger结构，将全局信息建模转化为低秩补全问题，利用矩阵分解和梯度优化对其及进行求解。	Hamburger
Swin Transformer: Hierarchical Vision Transformer using Shifted Windows	ICCV	2021	Swin-Transformer解读	在ViT的基础上提出了分层Transformer的概念，并提出了移位窗口高效的特征交互和计算效率，推动了Vision Transformer的后续发展。	Swin-Transformer
An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale	ICLR	2020	ViT解读	首次在视觉领域提出了Transformer的概念，将图像进行分块处理，输入到Transformer模型上进行计算。本文也算Transformer应用到视觉领域的开山之作，打破了CNN在视觉领域的绝对领导地位。	ViT

论文名称	期刊/会议	时间	解读	特点	代码
The Fully Convolutional Transformer for Medical Image Segmentation	WACV	2023	FCT解读	提出了卷积注意力机制，极大提升了实验效果	FCT
SegNeXt: Rethinking Convolutional Attention Design for Semantic Segmentation	NeurIPS	2022	SegNext解读	重新设计了卷积结构，结合Hamburger解码器实现了SOTA	SegNext
Segment Anything	Arxiv	2023	SAM解读	首次将提示用于语义分割领域，号称图像的GPT-3，提供了点、框、文本三种提示方式增强语义分割，开源了一个巨大的语义分割数据集	SAM
Segmenter: Transformer for Semantic Segmentation	ICCV	2021	Segmenter解读	本文在ViT的基础上提出了Mask Transformer的语义分割解码器，将类嵌入和ViT提取的特征进行特征增强，得到更好的语义分割结果	segmenter
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers	NeurIPS	2021	SegFormer解读	SegFormer是专门设计的语义分割网络，采用层次编码结构（类似于Swin-Transformer），可以输出多尺度特征，并且不需要位置嵌入。其次，SegFormer避免了复杂的解码器，使用MLP解码。	SegFormer
Swin-Unet: Unet-like Pure Transformer for Medical Image Segmentation	ECCV	2021	Swin-Unet解读	本文利用Swin-Transformer构建了一个U型语义分割网络，并没有按照官方给出的大模型结构，而是自己搭建了一个更小的模型进行预训练，独特之处在于解码器的上采样层不是upsample，而是Swin-Transfromer的path merge的逆过程，有效提升了模型的精度	Swin-Unet
Unified Perceptual Parsing for Scene Understanding	ECCV	2018	UperNet解读	本文针对层级图像特征的抽取结果进行分析，将不同层级的特征用于处理不同粒度的任务。该模型的目前广泛被用于语义分割，层级编码器的解码网络	UperNet

论文名称	期刊/会议	时间	解读	特点	代码
Efficient Self-supervised Learning with Contextualized Target Representations for Vision, Speech and Language	-	2022	Data2Vec解读	提出了一种视觉、语音和文本的统一自监督模型，相对之前的统一表示模型，现在效率更高、花费更少。	data2vec

Open3D 点云DBSCAN聚类算法 MelaCandy 算法聚类 numpy 计算机视觉图像处理 3d
目录一、DBSCAN基本原理二、代码实现2.1关键函数2.2完整代码三、实现效果3.1原始点云3.2聚类后点云Open3D点云算法汇总及实战案例汇总的目录地址：Open3D点云算法与点云深度学习案例汇总（长期更新）-CSDN博客一、DBSCAN基本原理DBSCAN（Density-BasedSpatialClusteringofApplicationswithNoise）是一种基于密度的聚类算法，
目标检测领域总结：从传统方法到 Transformer 时代的革新 DoYangTan 目标检测系列目标检测 transformer 人工智能
目标检测领域总结：从传统方法到Transformer时代的革新目标检测是计算机视觉领域的一个核心任务，它的目标是从输入图像中识别并定位出目标物体。随着深度学习的兴起，目标检测方法已经取得了显著的进展。从最早的传统方法到现如今基于Transformer的先进算法，目标检测的发展经历了多个重要的阶段。本文将详细总结目标检测领域的演进，涵盖传统方法、两阶段检测方法、单阶段检测方法和基于Transform
2024MathorCup数学建模之——MathorCup奖杯”获得者经验思路分享美赛数学建模数学建模
一、经验分享1.工具选择：顺手即可。Matlab和Python都是比较主流的选择，二者的应用场合各有不同。Python在数据分析、深度学习方面的优势愈发明显，而Matlab更适合进行物理仿真和数值计算。不过随着Python社区不断发展，其功能也愈发全面与强大，因此我们比较推荐学有余力的情况下可以更早接触Python。2.模型算法：多多益善。不一定要精通所有的算法，但是手上至少要准备一些常用的算法（
AI人工智能软件开发方案：开启智能时代的创新钥匙广州硅基技术官方人工智能
一、引言：AI浪潮下的软件开发新机遇近年来，人工智能（AI）技术的迅猛发展如同一股汹涌澎湃的浪潮，席卷了全球各个领域。从最初的概念提出到如今的广泛应用，AI历经了漫长的发展历程，终于迎来了属于它的黄金时代。回首过去，AI的发展并非一帆风顺，早期由于计算能力和算法的限制，经历了多次起伏。但随着大数据、云计算、机器学习、深度学习等技术的不断突破，AI迎来了爆发式增长。如今，AI已经深入到人们生活和工作
深度学习框架PyTorch——从入门到精通（6.2）自动微分机制 Fansv587 深度学习 pytorch 人工智能经验分享 python 机器学习
本节自动微分机制是上一节自动微分的扩展内容自动微分是如何记录运算历史的保存张量非可微函数的梯度在本地设置禁用梯度计算设置requires_grad梯度模式（GradModes）默认模式（梯度模式）无梯度模式推理模式评估模式（`nn.Module.eval()`）自动求导中的原地操作原地操作的正确性检查多线程自动求导CPU上的并发不确定性计算图保留自动求导节点的线程安全性C++钩子函数不存在线程安全
Pytorch深度学习教程_9_nn模块构建神经网络 tRNA做科研深度学习保姆教程深度学习 pytorch 神经网络
欢迎来到《深度学习保姆教程》系列的第九篇！在前面的几篇中，我们已经介绍了Python、numpy及pytorch的基本使用，进行了梯度及神经网络的实践并学习了激活函数和激活函数，在上一个教程中我们学习了优化算法。今天，我们将开始使用pytorch构建我们自己的神经网络。欢迎订阅专栏进行系统学习：深度学习保姆教程_tRNA做科研的博客-CSDN博客目录1.理解nn模块：(1)使用nn.Sequent
如何使用Langchain加载AZLyrics网页到可用文档格式 dgay_hua langchain python
##技术背景介绍在处理歌词数据时，尤其是从网页上获取歌词文本内容，用于自然语言处理或文本分析是常见的需求。AZLyrics是一个提供歌词的主要平台，为我们提供了大量的歌词数据。如果我们可以将这些网页内容自动加载到结构化的文档格式中，将极大地提升我们处理和分析歌词的效率。##核心原理解析Langchain提供了一种简单的方式来将网页内容转换为可用的文档格式。通过使用其文档加载器（DocumentLo
Radiance Fields from VGGSfM和Mast3r:两种先进3D重建方法的比较与分析 2401_87458718 3d
VGGSfM和Mast3r:3D场景重建的新方向在计算机视觉和3D重建领域,如何从2D图像重建3D场景一直是一个充满挑战的研究课题。近年来,随着深度学习技术的发展,一些新的方法被提出并取得了显著的进展。本文将重点介绍两种最新的基于深度学习的3D重建方法:VGGSfM和Mast3r,并通过GaussianSplatting技术对它们的性能进行全面比较和分析。VGGSfM:基于视觉几何的深度结构运动恢
基于 PyTorch 的 MNIST 手写数字分类模型欣然～ pytorch 分类人工智能
一、概述本代码使用PyTorch框架构建了一个简单的神经网络模型，用于解决MNIST手写数字分类任务。代码主要包括数据的加载与预处理、神经网络模型的构建、损失函数和优化器的定义、模型的训练、评估以及最终模型的保存等步骤。二、依赖库torch：PyTorch深度学习框架的核心库，提供了张量操作、自动求导等功能。torch.nn：PyTorch的神经网络模块，包含了各种神经网络层、损失函数等。torc
使用Titan Takeoff进行高效的自然语言处理模型推理 scaFHIO 自然语言处理人工智能 python
在自然语言处理(NLP)领域，每一家企业都在寻求更高效的模型训练和推理解决方案。TitanML的平台通过训练、压缩和推理优化帮助企业构建和部署更佳、更小、更便宜、更快速的NLP模型。特别是其推理服务器TitanTakeoff，使得在本地硬件上轻松部署大语言模型(LLMs)成为可能。技术背景介绍TitanTakeoff是TitanML提供的一项服务，它允许用户在本地硬件上运行推理工作负载。支持大多数
探索Google AI聊天模型的集成和使用 qahaj 人工智能 python
随着人工智能的飞速发展，GoogleAI的聊天模型提供了强大的自然语言处理能力，可以应用于多种场景中。本文将为你介绍如何通过GoogleAI和LangChain库来使用这些聊天模型。技术背景介绍GoogleAI提供了一系列强大的聊天模型，这些模型具备不同的功能和参数设置。它们不仅可以通过GoogleAI服务访问，还可以通过GoogleCloudVertexAI以企业级功能使用。在本文中，我们将重点
高效快速教你DeepSeek如何进行本地部署并且可视化对话大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
科技文章：高效快速教你DeepSeek如何进行本地部署并且可视化对话摘要：随着自然语言处理（NLP）技术的进步，DeepSeek作为一款基于深度学习的语义搜索技术，广泛应用于文本理解、对话系统及信息检索等多个领域。本文将探讨如何高效快速地在本地部署DeepSeek，并结合可视化工具实现对话过程的监控与分析。通过详尽的步骤、案例分析与代码示例，帮助开发者更好地理解和应用DeepSeek技术。同时，本
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
【论文阅读】实时全能分割模型万里守约论文阅读论文阅读图像分割图像处理计算机视觉
文章目录导言1、论文简介2、论文主要方法3、论文针对的问题4、论文创新点总结导言在最近的计算机视觉领域，针对实时多任务分割的需求日益增长，特别是在交互式分割、全景分割和视频实例分割等多种应用场景中。为了解决这些挑战，本文介绍了一种新方法——RMP-SAM（Real-TimeMulti-PurposeSegmentAnything），旨在实现实时的多功能分割。RMP-SAM结合了动态卷积与高效的模型
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
深度学习 | pytorch + torchvision + python 版本对应及环境安装 zfgfdgbhs 深度学习 python pytorch
目录一、版本对应二、安装命令（pip）1.版本（1）v2.5.1~v2.0.0（2）v1.13.1~v1.11.0（3）v1.10.1~v1.7.02.安装全过程（1）选择版本（2）安装结果参考文章一、版本对应下表来自pytorch的github官方文档：pytorch/vision:Datasets,TransformsandModelsspecifictoComputerVisionpytor
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
哈尔滨工业大学DeepSeek公开课人工智能：大模型原理技术与应用-从GPT到DeepSeek｜附视频下载方法你觉得205 人工智能机器学习大数据 ai 知识图谱 python 运维
导读INTRODUCTION今天继续哈尔滨工业大学车万翔教授带来了一场主题为“DeepSeek技术前沿与应用”的报告。本报告深入探讨了大语言模型在自然语言处理（NLP）领域的核心地位及其发展历程，从基础概念出发，延伸至语言模型在机器翻译、拼音输入法、语音识别等任务中的关键作用。强调了语言模型不仅辅助其他NLP任务，本身也蕴含大量知识，如地理信息、语义理解和推理能力。随着技术的发展，尤其是trans
When Large Language Models Meet Speech: A Survey on Integration Approaches UnknownBody LLM Daily Survey Paper 语言模型人工智能自然语言处理
主要内容研究背景：大语言模型（LLMs）在自然语言处理领域取得显著进展，其与语音的融合具有广泛应用前景，但缺乏相关集成方法的综述。文章将语音与LLMs集成方法分为基于文本、基于潜在表示和基于音频令牌三大类。集成方法基于文本的集成：通过级联集成、LLM重打分和LLM生成式错误纠正等方式，利用文本作为LLMs的输入和输出，处理语音相关任务，但存在信息损失和准确性与多样性平衡的问题。基于潜在表示的集成：
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
大模型Agent 和 RAG 的关系大数据追光猿大模型语言模型人工智能学习方法 transformer
Agent和RAG（Retrieval-AugmentedGeneration）是两种在自然语言处理（NLP）和人工智能领域中广泛使用的技术，它们在功能、目标和实现方式上既有区别又有联系。以下是它们的关系及其协同作用的详细分析。1.Agent和RAG的定义（1）Agent定义：Agent是一种智能体，能够感知环境并采取行动以完成特定任务。在NLP领域，Agent通常指一个基于大语言模型（LLM）的
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
Opencv之计算机视觉一闭月之泪舞计算机视觉计算机视觉 opencv python
一、环境准备使用opencv库来实现简单的计算机视觉。需要安装两个库：opencv-python和opencv-contrib-python，版本可以自行选择，注意不同版本的opencv中的某些函数名和用法可能不同pipinstallopencv-python==3.4.18.65-ihttps://pypi.tuna.tsinghua.edu.cn/simplepipinstallopencv-
计算机视觉总结 Trank-Lw 计算机视觉深度学习人工智能
以下是针对上述问题的详细解答，并结合代码示例进行说明：1.改进YOLOv5人脸检测模块，复杂光照场景准确率从98.2%提升至99.5%优化具体过程：光照补偿：在数据预处理阶段，采用自适应光照补偿算法，对图像进行实时增强，以减少光照变化对人脸检测的影响。数据增强：在训练数据中增加复杂光照场景下的样本，如强光、弱光、背光等，通过数据增强提高模型对不同光照条件的适应性。模型调整：对YOLOv5模型的网络
深度学习 Deep Learning 第8章深度学习优化 odoo中国 AI编程人工智能深度学习人工智能优化
深度学习第8章深度学习的优化章节概述本章深入探讨了深度学习中的优化技术，旨在解决模型训练过程中面临的各种挑战。优化是深度学习的核心环节，直接关系到模型的训练效率和最终性能。本章首先介绍了优化在深度学习中的特殊性，然后详细讨论了多种优化算法，包括随机梯度下降（SGD）、动量法、Nesterov动量法、AdaGrad、RMSProp和Adam等。此外，还探讨了参数初始化策略、自适应学习率方法以及二阶优
景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name

自然语言处理和计算机视觉相关论文总结

自然语言处理

命名实体识别

关系抽取

事件抽取

综述

事件检测/事件触发词抽取

事件论元抽取

句子级事件抽取

数据集

基于分类的方法

流水线抽取

联合抽取

基于问答/提示的方式

对比学习

迁移学习

文档级事件抽取

数据集

方法

事件因果关系识别

预训练语言模型

其他

句子嵌入

计算机视觉

通用视觉骨干网络

语义分割网络

多模态

表征学习

你可能感兴趣的:(自然语言处理,计算机视觉,深度学习)

论文名称	期刊/会议	时间	解读	特点	代码
DocEE: A Large-Scale and Fine-grained Benchmark for Document-level Event Extraction	NAACL	2022	DocEE解读	提出了一个文档级事件抽取数据集，该数据集具有大规模手动标注、细粒度论元类型和面向应用程序三大特点。该数据集是英文的。	DocEE

自然语言处理和计算机视觉相关论文总结

自然语言处理

命名实体识别

关系抽取

事件抽取

综述

事件检测/事件触发词抽取

事件论元抽取

句子级事件抽取

数据集

基于 分类 的方法

流水线抽取

联合抽取

基于 问答/提示 的方式

对比学习

迁移学习

文档级事件抽取

数据集

方法

事件因果关系识别

预训练语言模型

其他

句子嵌入

计算机视觉

通用视觉骨干网络

语义分割网络

多模态

表征学习

你可能感兴趣的:(自然语言处理,计算机视觉,深度学习)

基于分类的方法

基于问答/提示的方式