开放知识图谱

技术动态 | 知识相结合的提示学习研究综述

转载公众号 | 专知

近年来,提示学习方法由于可以充分激发预训练语言模型的潜能而得到了研究者越来越多的关注,特别是在知识抽取任务中取得了较好进展。为了提升提示学习性能,研究者也开展了基于知识的提示学习模板工程、答案工程优化等多项研究。该文对提示学习与知识相结合的相关研究进行了系统综述,包括知识抽取中的提示学习方法以及基于知识约束的提示学习相关进展。在此基础上,该文还探讨了目前方法存在的局限性,展望了提示学习与知识相结合的发展趋势。

http://jcip.cipsc.org.cn/CN/Y2023/V37/I7/1

知识抽取是通过识别、理解、筛选和格式化，将文本中的各个知识点抽取出来，并以一定形式存入知识库中的过程[1]。它是构建知识图谱的关键一环，在自然语言处理领域备受瞩目，其方法也随着自然语言处理方法的发展而发展。早期的自然语言处理方法大多是完全监督学习方法，这类方法严重依赖特征工程[2-3]。

随着神经网络的出现，自然语言处理出现了新范式——基于神经网络的深度学习[4-5]。虽然这种方法不需要手动设置特征，但仍需精心设计最适配下游任务的网络架构。近几年，随着预训练语言模型（Pre-trained Language Model, PLM）如GPT[6]、BERT[7]、BART[8]等的出现，“预训练”+“微调”成为了分激发预训练语言模型的潜力，提升了任务的性能。表1展示了不同任务的示例。对于不同任务，通过设计特定的模板，无论是分类任务、序列标注任务还是生成任务，均可以被重构为掩码语言模型任务。这使得下游任务与预训练语言模型无需借助“微调”的方式来适配。提示学习拓展了预训练语言模型的适用性，并且打破了不同任务之间统一建模的困难。

目前，提示学习相关工作尚处于初期探索阶段，还面临巨大挑战。Liu等人[10]已指出，提示模板设计是影响提示学习效果的一个重要问题，并指出与知识相结合可能是解决该问题的一条路径。近两年间，提示学习与知识抽取相结合的方向已经逐步成为新的研究热点。基于提示学习的知识抽取在各具体任务中取得了领先水平，同时在提示学习中引入知识的相关研究也崭露头角。

提示学习的动机是帮助预训练语言模型回忆“知识”，而对于知识抽取任务而言，其目的是抽取知识。与此同时，利用抽取的知识也能提升提示学习的效果，二者相辅相成。因此，开展提示学习与知识相结合的研究将成为一个重要趋势。对该领域进行全面总结和系统梳理将有助于研究者了解相关研究前沿和主要挑战。区别于Liu等人[10]对整个提示学习从基本概念到各种任务应用的系统综述，本文主要关注基于提示学习的知识抽取任务和基于知识的提示学习相关文献。因此，本文在归纳整理了表2所列文献的基础上，尝试归纳总结拓展该方向的概念与方法，旨在为感兴趣的研究人员提供参考。

1. 提示学习基本概念

本节对提示学习中涉及的概念进行阐述，以Liu等人[10]的规范为主要参考。提示学习的核心是重构下游任务，例如情感分类任务。原有任务的输入为“今天的天气真好”，输出则是“正面情绪”类别。如果运用提示学习，输入通过提示函数被改写为“今天的天气真好，我的心情是[MASK]的。”，输出则是“开心”。然后通过标签词映射，将“开心”识别为“正面情绪”标签。

具体而言，在提示学习中，需要以下三个步骤：

① 模板构建：用提示函数fprompt(x)将输入的文本x修改为提示x'=fprompt(x)；

② 答案搜索：将x'传给预训练模型，得到“最高分”的输出；

③ 标签词映射：在第二步中得到的输出是满足预训练任务形式的输出，可能会与下游任务的输出形式存在差别，需要一个函数映射来进行转换。

模板构建步骤通常被称为提示工程，而标签词映射通常被称为答案工程。

1.1 提示工程

提示工程（也可称为模板工程）是创建提示函数fprompt(x)的过程，这会影响下游任务的表现。对于提示工程而言，首先要考虑提示的模式，然后再考虑采用人工或者自动化的方式创建所需模式的提示。提示的模式主要分为完型填空式提示和前缀提示两种。完型填空式提示就是表1中的模板给出的示例，用于填充文本字符串中的空白部分。而前缀提示则是在输入文本前添加一组可训练的向量作为提示[31]，训练时固定预训练语言模型中的其余参数，并对这些向量进行优化。在最新研究中，前缀提示的概念也在不断扩充，例如，在特定字符串周围使用一些特殊的标记来进行标注作为提示，这种方法也纳入到了前缀提示的范畴，例如"@ Bill@ was born in# Seattle#."，其中Bill实体和Seattle实体周围都有特殊标记。

传统的提示工程主要依靠人工构建模板[11-12,18]，过于依赖专家知识。同时，研究者还探索了自动构建提示模板的方法，主要包括离散提示[32]和连续提示[21]两种。离散提示是指让计算机自行搜索添加文本字符串。考虑到构建提示的目的是找到让语言模型能够有效执行任务的方式，而不是供人类阅读或使用，因此衍生出了由连续向量构成的连续提示，避免了语言模型参数对模板的限制。此外，还有人工设计和自动生成相结合的混合提示，采取在人工设计的提示中插入一些可训练的向量[33]。在上述自动构建提示的探索中，研究者们已经发现在提示中引入知识，对构建过程进行约束能够取得更好的效果[28]。

1.2 答案工程

答案工程旨在设计合适的映射，即从预训练语言模型输出到答案空间中所对应标签词的过程，这同样需要考虑模式和设计方法。答案的模式有标记[34]（Token）、跨度[35]（Span）、句子[31]（Sentence）这三种。在实践中，答案模式的选择取决于执行的任务，例如，标记、跨度模式可以用于实体抽取和关系抽取任务，跨度、句子模式可以用于文本生成任务。答案模式设计方法分为手动设计、离散答案搜索、连续答案搜索这三种。手动设计即人为定义映射函数[35]。离散答案搜索常用的方法有：①扩充原答案空间，使用回译的方法，将答案翻译成另一种语言，然后返回生成多个释义答案的列表[36]；②先剪枝再进行搜索，先利用模型生成可能的答案，组成初始答案空间，即对所有答案的搜索空间进行剪枝，然后再使用一个具体的算法在这个剪枝后的空间内进一步搜索以选择最终答案[37]；③标签分解[14]，将标签分解为组成的词，并将这些词作为答案。目前，连续答案搜索在具体工作中运用较少，使用梯度下降的方式能够优化可变长答案标记[21]。

1.3 多提示学习

多提示学习是指在模板构建的过程中使用多个提示，这能进一步增强提示学习的效果。常用的多提示学习方式包括提示融合[25]、提示增强[15]、提示合成[26]和提示分解[12]。

提示融合：在预测时使用多个未回答的提示作为输入，最终使用均值、加权平均、投票等多种方案得到输出。这种提示融合的方式可以很好利用不同提示之间的互补优势，降低搜索出表现最好提示的成本，避免不同提示的差异对模型表现产生的影响，稳定下游任务的性能。
提示增强：又可以称作演示学习，通过为语言模型提供带有答案的示例作为提示，相当于一种数据增强，在一定程度上能解决小样本问题[38]。例如，给模型输入“湖南的省会是[Z]”作为提示时，在提示前面加上“江苏的省会是南京”等示例。这种方式利用了预训练模型学习重复模式的能力，可以很好处理小样本问题，但存在示例选择和示例排序[39]问题，后文中会探讨示例选择的解决方案[15]。
提示合成：指在处理一些可以分解成更基础的子任务时，使用多个子提示，每个子提示对应一个子任务，然后将这些子提示组合为一个完整的提示。这种方法常用于关系抽取任务中，利用子提示处理实体识别和关系分类，然后根据标签映射完成关系抽取任务。
提示分解：是将完整的提示分解为不同的子提示，然后分别对每个子提示进行预测。这种方法往往用于序列标注任务，例如命名实体识别任务。在输入中可能存在多个实体，同时预测出所有实体的类型极其困难，因此需要为可能是实体的跨度创建子提示，分别对每个跨度进行预测。

1.4 提示学习的应用

提示学习在自然语言处理的各类任务中应用广泛。例如，Wang等人[40]利用提示学习重新建模了对话和推荐任务，用一个预训练语言模型就可以实现两个任务的统一；Rajagopal等人[41]利用提示学习，引入特定域的概念，实现了序列到序列模型的跨域推理；Zhao等人[42]利用提示学习在一定程度上解决了对话摘要任务中的领域迁移问题，减少了对大量标注数据的依赖。此外，提示学习还运用于机器翻译[43]、语义解析[44]等任务。

2 基于提示学习的知识抽取

知识抽取的主要任务有实体抽取、关系抽取和事件抽取,这些任务在具体场景中会受到不同目标、异构结构和特定需求的影响,存在迁移性弱、域适应受限、重新训练代价高的问题。通过提示学习,可以进一步挖掘大规模预训练语言模型的能力。实际上,因为知识抽取任务的形式与完型填空任务较为接近,提示学习的方法可以有效指导模型自适应地完成抽取任务,减轻人工标注大量数据的负担,提升模型在小样本与领域迁移场景下的表现.

2.1 基于提示学习的实体抽取

传统的实体抽取采用序列标注的方式[45],而基于提示学习的方法则将其通过掩码很自然地表述为完型填空问题,能更充分地利用预训练语言模型蕴含的知识,在实验中取得不错的效果。基于提示学习方法进行实体抽取的基本模型框架如图1所示,将输入文本和提示输入预训练语言模型,再通过标签词映射将[MASK]预测为城市实体。通过完型填空式提示的方式实现对实体的预测,并将实体发现、实体分类两个子任务分解为两个子提示,但提示分解方法跨度检测时会受错误传播影响,且候选跨度过多增加了构造提示的代价。研究者们尝试采用前缀提示或提示增强的方式来解决问题。

2.2 基于提示学习的关系抽取对于关系抽取任务,提示学习通过引入前缀标记提示,让模型更多地关注句子中的实体信息,充分激发模型的性能。

2.3 基于提示学习的事件抽取

从自然语言文本中抽取事件实例是一个关键又十分具有挑战性的工作。目前对事件抽取的任务研究大多数都遵守 ACE2005评测会议[49]中的规范进行抽取。目前主流的事件抽取方法分为基于序列标注的方法[50-51]、基于问答的方法[52-54]和基于生成的方法 (TANL [55],Text2Event [56]),这些方法依赖大量的训练数据或精心设计的高质量问题,无法适应事件抽取的实际需要,研究者们希望通过引入提示学习, 减轻数据处理的负担,完成在小样本情况下的事件抽取任务。当前,基于提示学习的事件抽取主要有以下研究方向:面向要素抽取的提示学习、面向流水线模式事件抽取的提示学习、基于提示融合的事件抽取。这些方法都是建立在编码器-解码器模型的基础上的,基本模型架构如图4所示。(1)将文本和提示输入编码器(Encoder); (2)解码层(Decoder)负责输出文本; (3)对输出文本进行处理得到结构化数据。

3. 基于知识的提示学习

基于提示学习的方法已经在知识抽取等任务上取得较好效果，但如何针对具体任务构造出最合适的提示模板和标签映射，从而进一步提高任务性能成为研究者面临的一个重大挑战。从GPT-3[38]、AutoPrompt[32]到P-tuning[33]，模板构造经历了从人工构造到自动生成离散或连续模板三个阶段。然而在其快速发展的背后，提示学习仍然面临构造提示的成本高、无法应对专业领域场景、缺乏常识性知识等问题。

针对上述问题，研究者尝试引入外部知识来辅助模板生成，通过知识约束提升模型对任务和领域的感知。

3.1 知识约束方法

知识约束方法是指在构建提示和标签映射的过程中注入外部知识,压缩搜索空间。主要介绍 PTR [26]、KPT [27]、KnowPrompt [28]等;其中,PTR是利用逻辑规则构建提示;KPT 是通过知识库来扩展标签映射;KnowPrompt在模板构建和标签映射过程中均注入了知识,上述方法的示意图见图6和图7。

3.2 选择性知识植入方法

由于知识噪声和异构性问题,并不是所有的外部知识都能有助于提示学习模型性能提升。针对这一问题,OntoPrompt [30]基于知识线性转化和注意力掩码矩阵实现了本体知识的选择性注入.

3.3 小结

目前,基于知识的提示学习方法在文本分类、关系抽取、事件抽取等任务中验证了模型的性能,并在小样本场景下取得了很好的效果,证明了知识注入、知识选择可以对模板构建、标签映射进行指导,减轻人工设计的负担,提升小样本环境下的迁移能力。追本溯源,提示学习主要从预训练语言模型里面获取和任务相关的知识,这对预训练模型的规模、预训练数据的来源等都提出了要求[60]。而提示工程、答案工程都是为了能更好的指导如何从预训练模型中获取任务相关知识,人工设计模板的方法主要也是利用了专家知识;因此,基于知识约束及辅助的提示工程、答案工程必然会在提示学习研究中发挥越来越重要的作用。

4. 当前挑战与未来研究趋势

4.1 当前挑战

提示学习的方法不仅在知识抽取任务上取得了较好表现，对小样本场景下的运用也进行了探索，同时在自然语言处理的各个方向上有了一定的突破。然而，从构建、原理和选择三个具体角度来看，仍然面临着提示学习的模板设计问题以及预训练模型的选择问题。这些问题制约了提示学习的深入研究和广泛应用，亟待后续研究加以解决。

4.1.1 提示学习的模板设计问题

目前应用提示学习的工作大多集中于分类工作和生成工作，而其他工作相对较少。此外，需要解决“模板”和“标签词”的分割问题。模型的效果同时依赖于应用“模板”和“标签词”的映射，自动生成最优的连续模板或者搜索出最优的答案空间都是非常复杂的工作，同时让二者达到最优也是具有挑战性的。此外，提示学习的模板设计效果存在可解释性差的问题，部分意义相近的模板可能对模型性能产生巨大影响。例如，Liu等人对LAMA-TRExP17案例进行分析，对哥伦比亚阳光海岸的所属国家进行提问，模板中的“In”使准确率存在20%的波动，见表3。结合知识开展提示工程和答案工程的一体化设计，并通过知识约束使提示学习的模型更稳定、效果更可解释，这可能是解决提示学习设计问题的可行之道。

4.1.2 提示学习的预训练模型选择问题

提示学习的效果会受到预训练模型选择的影响。目前各种自动生成提示和自动搜索答案的方法层出不穷，然而，研究者们忽略了对预训练语言模型的选择，也没有探究不同的自动生成方法和自动搜索方法在不同预训练模型下的表现。此外，面向大规模知识图谱的图预训练模型中蕴含了更为密集的知识，而当前提示学习方法忽略了图预训练模型中知识的利用；对于知识密集型任务，提示学习也没有进行针对性的预训练模型优化。结合基于大规模知识图谱的图表示和图预训练模型，开展提示学习以及结合提示学习进行知识抽取，可能会取得更好的效果。

4.2 未来研究趋势

4.2.1 联合知识抽取的探索

在基于提示学习的知识抽取方面，对于关系抽取和事件抽取，目前基于提示学习的方法都是流水线模式的，这种模式存在固有的错误传播问题，会影响模型的性能。近期，百度与中科院的UIE基于提示学习，统一了抽取任务，并在13个数据集的全监督、低资源、少样本设置下均达到目前最佳模型的性能，证明了基于提示学习的联合抽取方法是极具价值的研究方向。

4.2.2 更复杂的知识注入

在结合知识的提示学习方面，目前注入的知识以三元组中的实体关系为主，注入的方法仅为简单的谓词逻辑或前缀提示；但知识图谱蕴含的知识结构信息和推理信息尚未得到充分利用。因此，如何设计更好的知识约束方法，将这些复杂的知识通过提示学习的方式引入模型中，是基于知识的提示学习方法未来发展的重点方向。

5. 总结

本文对提示学习方法在知识抽取任务上的运用进行了综述，对具体方法中的提示工程、答案工程和多提示学习进行了分类和对比分析。已有的研究表明提示学习适用于知识抽取任务。针对提示学习中模板和标签映射的构造问题，阐述了基于知识约束的解决方案与知识选择注入方法，并分析了与知识相结合的提示学习研究面临的问题和未来发展趋势。从目前形势看，在基于提示学习的知识抽取方面，联合抽取方法是极具价值的研究方向；在基于知识的提示学习方面，更复杂的知识注入与针对图模型的提示学习可能是未来的重点发展方向。相信随着更深入的研究，与知识相结合的提示学习方法将会成为自然语言处理的一个新范式。人划

OpenKG

OpenKG（中文开放知识图谱）旨在推动以中文为核心的知识图谱数据的开放、互联及众包，并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文，进入 OpenKG 网站。

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
RocketMQ 基础教程-应用篇-死信队列码炫课堂-码哥 rocketmq专题 rocketmq java
作者简介：大家好，我是smart哥，前中兴通讯、美团架构师，现某互联网公司CTO联系qq：184480602，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬学习必须往深处挖，挖的越深，基础越扎实！阶段1、深入多线程阶段2、深入多线程设计模式阶段3、深入juc源码解析阶段4、深入jdk其余源码解析
OKHttp3源码分析——学习笔记 Sincerity_ 源码相关 Okhttp 源码解析读书笔记 httpclient cache
文章目录1.HttpClient与HttpUrlConnection的区别2.OKHttp源码分析使用步骤:dispatcher任务调度器,（后面有详细说明）Request请求RealCallAsyncCall3.OKHttp架构分析1.异步请求线程池,Dispather2.连接池清理线程池-ConnectionPool3.缓存整理线程池DisLruCache4.Http2异步事务线程池,http
JavaScript 基础09：Web APIs——日期对象、DOM节点梦想当全栈 JavaScript javascript 前端开发语言
JavaScript基础09：WebAPIs——日期对象、DOM节点进一步学习DOM相关知识，实现可交互的网页特效能够插入、删除和替换元素节点。能够依据元素节点关系查找节点。一、日期对象掌握Date日期对象的使用，动态获取当前计算机的时间。ECMAScript中内置了获取系统时间的对象Date，使用Date时与之前学习的内置对象console和Math不同，它需要借助new关键字才能使用。1.实例
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）基于历史对话重新生成Query？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain RAG
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Q
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）其他Query优化相关策略？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？一
传奇修改map地图教程_传奇技能第三祭：NPC的增加、隐藏和脚本修改垃圾箱博物馆传奇修改map地图教程
技能献祭，Get新技能：传奇技能——NPC功能与实现跟航家学技能，用干货带你飞，现学现用，底部有配套学习资源本篇内容简介：通过对游戏内NPC的控制，可以让NPC出现在地图中的任意位置，还可以控制外观显示、自定义命名，新增与隐藏以及脚本功能的实现。一、NPC总控制文本所在路径：D:MirServerMir200EnvirEnvir目录下，找到NPC总控制文本：Merchant，游戏内的所有NPC都在
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
AI Agent开发学习系列 - langchain之Chains的使用(7)：用四种处理文档的预制链轻松实现文档对话 alex100 AI Agent 学习人工智能 langchain prompt 语言模型 python
在LangChain中，四种文档处理预制链（stuff、refine、mapreduce、mapre-rank）是实现文档问答、摘要等任务的常用高阶工具。它们的核心作用是：将长文档切分为块，分步处理，再整合结果，极大提升大模型处理长文档的能力。stuff直接拼接所有文档内容到prompt，一次性交给大模型处理。适合文档较短、token不超限的场景。refine递进式摘要。先对第一块文档生成初步答案
.NET 一款基于BGInfo的红队内网渗透工具 dot.Net安全矩阵网络 .net 安全 .netcore web安全矩阵
01阅读须知此文所提供的信息只为网络安全人员对自己所负责的网站、服务器等（包括但不限于）进行检测或维护参考，未经授权请勿利用文章中的技术资料对任何计算机系统进行入侵操作。利用此文所提供的信息而造成的直接或间接后果和损失，均由使用者本人负责。本文所提供的工具仅用于学习，禁止用于其他方面02基本介绍在内网渗透过程中，白名单绕过是红队常见的技术需求。Sharp4Bginfo.exe是一款基于微软签名工具
Python学习笔记5|条件语句和循环语句 iamecho9 Python从0到1学习笔记 python 学习笔记
一、条件语句条件语句用于根据不同的条件执行不同的代码块。1、if语句基本语法：if布尔型语句1:代码块#语句1为True时执行的代码示例：age=int(input("请输入你的年龄:"))ifage>=18:print("你已成年")2、if-else语句如果if条件不成立，则执行else代码块：if布尔型语句1:代码块#语句1为True时执行的代码else:代码块#语句1为False时执行的代
2025年渗透测试面试题总结-2025年HW(护网面试) 43（题目+回答）独行soc 2025年护网面试职场和发展 linux 科技渗透测试安全护网
安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录2025年HW(护网面试)431.自我介绍与职业规划2.Webshell源码级检测方案3.2025年新型Web漏洞TOP54.渗透中的高价值攻击点5.智能Fuzz平台架构设计6.堆栈溢出攻防演进7.插桩技术实战应用8.二进制安全能力矩阵9.C语言内存管理精要10.Pyth
Javaweb学习之Vue模板语法（三）不要数手指啦 vue.js 学习前端
目录学习资料前情回顾本期介绍（vue模板语法）文本插值Vue的Attribute绑定使用JavaScript表达式综合实例代码：学习资料Vue.js-渐进式JavaScript框架|Vue.js(vuejs.org)前情回顾项目的创建大家可以看这篇文章Vue学习之项目的创建-CSDN博客本期介绍（vue模板语法）首先，找到我们编写代码的地方找到自己项目的src文件夹，打开之后点击component
AI问答之手机相机专业拍照模式的主要几个参数解释 piaopiaolanghua 拍摄曝光时间 ISO感光度
一、背景近期突然想了解下手机的专业拍照模式，了解如何拍出拖尾效果，譬如拍摄运动的车辆，长曝光拍摄星空，甚至能够拍到卫星（再来个漂亮的拖尾），因此想到先了解下手机相机专业模式的参数再说，通过AI问答，学习了下，也就有了本文。二、主要参数详细解释截图显示了在“专业”模式下设置的典型核心参数。这些参数共同决定了照片的曝光、清晰度、色彩和焦点。下面逐一解释每个参数及其典型用法：1、ISO640解释：ISO
Python selenium 库 AI老李 python python selenium 开发语言
关键要点PythonSelenium库用于自动化Web浏览器，适合测试和爬虫，中文教程资源丰富。推荐菜鸟教程、CSDN博客和Selenium-Python中文文档，涵盖基础到进阶。学习需注意浏览器驱动匹配和动态加载处理，可能需显式等待。资源推荐以下是适合初学者和中级学习者的中文教程：菜鸟教程：提供全面的Selenium教程，包括安装和示例，详见Selenium教程。Selenium-Python中
Python3 内置函数 AI老李 python python
关键要点Python3的内置函数是解释器直接提供的，无需导入即可使用，涵盖数据类型转换、数学操作、序列处理等多种功能。推荐使用官方文档、菜鸟教程和腾讯云开发者社区的中文资源，适合初学者和中级学习者。资源提供详细解释和示例，学习时可结合实际项目实践。简介Python3的内置函数是编程中常用的工具，方便用户快速实现各种操作。以下是几个主要资源，帮助您学习这些函数的用法。资源推荐Python官方文档：内
three前置课程知识
学习中文网(1.threejs文件包下载和目录简介|Three.js中文网)threejs官方文件包所有版本：https://github.com/mrdoob/three.js/releases更新迭代较快，要选择对应版本使用---下载zip压缩包Threejs官网中文文档链接：https://threejs.org/docs/index.html#manual/zh/重要的内容docs包:文档
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR

技术动态 | 知识相结合的提示学习研究综述

你可能感兴趣的:(学习)