阿里技术

如何向大模型注入知识？达摩院通义对话模型SPACE系列探索

作者：李永彬、惠彬原、黄非

如何将人类先验知识低成本融入到预训练模型中一直是个难题。达摩院对话智能团队提出了一种基于半监督预训练的新训练方式，将对话领域的少量有标数据和海量无标数据一起进行预训练，从而把标注数据中蕴含的知识注入到预训练模型中去，打造了SPACE 1/2/3 系列模型。

SPACE-1：注入对话策略知识，AAAI 2022长文录用；
SPACE-2：注入对话理解知识，COLING 2022长文录用，并获best paper award推荐；
SPACE-3：集对话理解+对话策略+对话生成于一体的模型， SIGIR 2022长文录用；

达摩院对话大模型 SPACE-1/2/3 在11个国际对话数据集取得SOTA，相关论文及代码可至文末查看。

图1 SPACE系列模型在11个国际对话数据集取得SOTA，包含Intent Prediction、Slot Filling、Dialog State Tracking、Semantic Parsing、End-to-End Generation五大类对话任务

一、关于人机对话和预训练模型的简介

1.1 什么是人机对话？

人机对话的终极目的是让机器（对话系统）和人类（用户）能像人和人一样进行自由的对话。通常来说，对话系统和人类的对话过程主要分为三个主要阶段，分别是对话理解（Understanding）、对话策略（Policy）和对话生成（Generation）。如下图所示，当用户说了一句 "查询水费"，对话系统首先要理解用户说的是什么意思（What do you say ?），然后要根据理解的结果，需要判断自己该如何去回答（How Shold I say ?)，第三步要通过自然语言的方式返回给用户（What should I say ?）。

图 2 人机对话系统简介

1.2 “无知识，不对话”

人机对话都是基于知识构建起来的，即“无知识，不对话”。目前的对话系统大概可以分为三个类别，包括对话、问答和闲聊。对话主要是指任务型对话，通过具体的业务流程知识来构建，围绕一个流程完成某个具体的任务；问答根据知识形态的不同，分为了很多种，比如基于知识图谱的问答（KBQA）、基于表格或者数据库的问答（TableQA）、基于文档的问答（DocQA）等；闲聊主要是利用一些开放域知识，完成与人类的聊天等。除此之外，所有的对话都可能会依赖人类标注的知识、世界知识和各种常识等。

图3 无知识不对话，知识是对话系统的基础

举个例子，比如在办理汽车保险的场景中，相关的多轮对话受业务逻辑流程约束的：首先需要验证个人信息，然后系统调用验收报告，如果验收报告通过，接下来就要填写保单，最终完成保险的办理；如果验车不通过，需要反馈给用户原因，最终完成整个对话的流程。在这个例子中，对话流程体现的是业务流程知识；需要验证的个人信息包括姓名等，依赖于世界知识，比如姓名中的“弓长张木子李”；最后，这个项目如果想达到交付效果要求，还需要标注训练样本训练模型，这里面就包含人工标注知识。

1.3 预训练对话模型

近些年来，预训练模型引爆了 NLP 的技术变革，比如 BERT [1]、GPT [2]、T5 [3] 等。这些模型基于自监督的训练方式（MLM）在大规模无监督语料上进行学习，而其背后的本质是语言模型（Language Model），回答什么样的句子更像一个合理的句子。典型的预训练语言模型主要由三个主要组件构成：1）海量的自由文本作为输入；2）利用 Transformer [4] 网络架构作为模型；3）通过自监督的预训练目标 MLM 作为优化目标。

图4 预训练语言模型及其组成

但是对话数据和普通文本数据有非常显著的差异，相比于普通的文本数据，对话作为语言的高级应用，至少有如下的特点：

1）对话是口语化的，人在对话的时候表述随意，也不一定符合语法，可能存在噪音及 ASR 错误；

2）对话是分角色多轮次的，至少有两个参与主题，轮次间存在省略、指代、状态继承等特点；

3）对话都存在垂直的知识约束；

4）对话需要深层语义理解，比如涉及到意图槽位，逻辑推理等；

5）对话是讲究策略的，为了完成特定的任务目标，模型需要知道自己该如何决策。

直接利用预训练语言模型作为对话模型的基座存在天然的不适配，我们需要针对对话的数据及特点，设计独特的对话预训练模型，来增强对话系统的效果。从 2020 年开始，面向对话的专用预训练对话模型开始涌现。目前预训练对话模型的建模，基本按照对话理解和对话生成两大任务类进行建模，利用类似于 BERT或者 GPT-2的loss在对话语料上进行预训练。例如，针对话理解，常见模型有PolyAI的 ConvRT [5]，Salesforce的 TOD-BERT [6] 和亚马逊的ConvBERT [7]，针对对话生成，常见模型有微软的 DialoGPT [8]，谷歌的Meena [9] 和 Meta 的 Blender [10] 。这些预训练对话模型仍然存在很多不足：

1）数据上，大部分只用了开放域数据；

2）模型上，大多只面向回复生成进行建模；

3）训练机制上，只利用了自监督预训练目标。

综上，一方面，无知识不对话，知识是对话的基础；另一方面，预训练对话模型对于对话系统是刚需。基于此，我们希望在数据和知识双驱动的预训练对话模型方向上进行深入探索。

二、SPACE-1: 从自监督训练到半监督训练

2.1 从自监督到半监督

如何向模型中注入标注知识依旧是一个尚未充分探索的方向。早期工作中，谷歌的T5 就已经尝试了将有标和无标数据统一成语言生成任务进行学习，但是实验却表明简单地混合有标无标数据训练反而会带来负面影响。经过大量的实验探索，我们发现如果还是基于原先的两大预训练范式，难以很好地进行预训练。首先，单利用自监督预训练或者有监督预训练是无法同时利用好有标和无标的预训练数据，仅自监督损失函数是无法学习出标注知识中的高层语义的，有监督损失函数亦不能学出无标语料中的通用底层语义；其次，在大规模预训练中，由于所使用的预训练数据往往存在着少量有标数据和海量无标数据之间的数量鸿沟，如果简单混合两种预训练，会使得标注知识的信息要么淹没在无标数据中，要么就会出现严重的过拟合，因此我们需要全新的预训练范式来解决该问题。

基于上述动机，我们期待能够通过一种新的训练方式，将人类知识注入到预训练对话模型中。这里我们提出半监督预训练对话模型 SPACE （Semi-supervised Pre-trAined Conversation ModEl） 。如下图所示，半监督预训练从迁移学习的角度来看，可以认为是一个前两种范式的自然延伸，通过构造半监督学习的损失函数来充分综合利用有限的标注知识和大量的无标数据。在半监督学习理论里 [11]，模型既需要在无标数据上进行自我推断，根据结果进一步约束优化，也需要利用有标数据进行一定程度的有监督，指导自监督预训练的过程，同时避免模型参数陷入平凡解。

图5 三种预训练方式：有监督、自监督及半监督，参考 [16] 修改

如下图所示，传统的半监督学习主要是通过无标注数据来辅助有标注数据，从而减少学习所需要的标注样本量。而我们关注的不再是如何降低对标注数据量的依赖，而是如何更加高效地融入特定标注知识。

图6 我们提出的半监督预训练与之前半监督的不同点

半监督预训练是我们 SPACE 系列模型的核心思路，基于这个思路，我们该从哪个方向进行探索呢？当前的预训练对话模型主要可以分为对话理解、对话策略、对话生成几个方向，对话理解和对话生成都有一些相关的工作了，而对话策略的研究却比较薄弱，但对话策略又是连接对话理解和对话生成的核心环节，它指导着对话生成的正确性，同时对于多轮对话能否完成目标（对话完成率）也至关重要。所以我们先从对话策略进行入手，将策略知识注入到预训练对话模型中。

图 7 针对对话策略的预训练对话模型还处于空白

2.2 对话策略知识

什么是对话策略呢？对话策略最早是 1995 年在语言学被提出，用来对人类的语言交流进行行为建模的，将对话动机或者对话行为抽象为具体的类型，在 wiki 百科中的解释为 “A dialog act is a tag for an utterance, in the context of a conversational dialog, that serves a function in the dialog”。随着领域的发展，人机对话也开始采取这种标签体系，称之为 dialog act （DA），比如哥伦比亚大学的 Zhou Yu 老师团队提出以用户为中心的 DA 体系，一共 23 个 DA 标签，凭借这套对话策略的标签，拿下了当年的 Alexa Prize 的冠军，证明了这种策略知识对于人机对话任务也是非常重要的。

图8 对话策略（Dialog Act）的发展历史

但是目前的 DA 标注体系都比较零散，每个研究的标注体系都不相同，毕竟用一个小规模的、具体的集合来描述整个人类的语言描述，还是非常有挑战的。为了推进这个方向的研究，我们将学术界面向任务型对话的策略体系进行了整合，最终梳理出 5 大类、20小类的统一标签体系。最终我们打造出最大的统一 DA 的对话数据集 UniDA，共计 100w 条 utterance，同时我们还整理了学术界所有的大规模无标注语料 UniDIal，共计 3500w 条 utterance。

图9 我们总结突出的DA体系，基于此梳理发布了学术界最大的统一DA的对话数据集UniDA

目前我们已经整理好了用于预训练的知识和数据，接下来需要考虑如何设计模型。首先我们将对话策略进行显式建模，给定对话历史，直接预测下一轮系统端的 DA 标签。比如下面这个例子，用户首先说“帮我查一下上个月的水费”，机器人说“好的，请问你的户号是多少？”然后这个用户就会把他的水卡的号说出来。那么再下一句，机器人应该说什么呢？我们要预测机器人的这个对话策略，就是选择继续询问，或者选择回答信息，还是要进行澄清，这些行为就是模型就要预测机器人的这个对话策略。那么这样一个预测的过程，可以直接建模为分类问题进行处理。

图10 对话策略的建模方式

2.3 半监督预训练

如何将这个分类问题进行半监督训练呢？目前学界对于半监督的利用主要分为 3 种：基于判别式的方法，比如 self-prediction、co-training 等；基于生成式的方法，比如 VAE、GAN 等，还有基于对比学习的方法，比如有负样本的对比和无负样本的对比。其中，在我们的实验中，基于判别式（self-prediction）和生成式（VAE）由于缺乏显式的 loss 约束及隐变量的不确定性，效果都不尽人意。

图11 NLP中常用的半监督方法

我们最后选择基于对比学习的半监督训练方法。具体的，针对无标对话数据，我们采用了 R-drop [12] 的思路，如下图所示，给定同样的对话输入c（context），经过两次带有dropout的forward得到了两次经过随机扰动后在对话动作空间（DA）上预测的不同分布，然后通过双向KL正则损失函数（L_KL）来约束两个分布。针对有标对话数据，我们则直接利用基础的有监督交叉熵loss（L_DA）来优化对话动作预测。理论可以证明，在满足低密度假设下（即分类边界处于低密度分布），通过对同一个样本进行扰动后分类结果仍然具备一定程度上的一致性（即分布接近或预测结果接近），那么最终基于一致性正则的半监督学习可以保证找到正确的分类面。最终模型的预训练损失将和回复选择任务（L_select）和回复生成任务（L_gen）进行联合优化。

图12 半监督Loss设计

2.4 SAPCE-1 结果

最终 SPACE-1 借助半监督注入策略知识的能力，在这些经典的对话榜单上均大幅超过了之前的SOTA模型，端到端混合分数在 In-Car，MultiWOZ2.0 和 MultiWOZ2.1分别提升 2.5、5.3 和 5.5 个点：

图13 SPACE-1 在MultiWoz 2.0等数据集上带来显著提升

以上的结果充分证明了半监督预训练的效果。进一步详细分析如下图所示，Success 是对话完成率指标，BLEU 是对话生成指标，对话策略对于这两个指标有重要影响，注入对话策略知识后的大模型，在这两个这两个指标上带来了显著提升。

图14 SPACE-1 效果详细分析

三、SPACE-2：从封闭集知识到开放集知识

3.1 开放集知识

SAPCE-1 主要将对话策略知识注入到预训练模型的过程中，但是仍然存在一些局限，首先 DA 标签体系比较简单，因为只有 20 个类别；其次，DA 的标签体系是一个封闭集，虽然对于人机对话是非常重要的，但从知识的角度来看，仍然是比较简单。对于整个对话系统来说，语言理解所涉及的知识会更加复杂，比如一个 query “市中心有什么好吃的吗？”，首先这句话有意图信息（找餐馆），其次对于餐馆位置等属性一般作为是槽位信息。在广泛的对话场景下，对于意图和槽位的人类标注，其实也可以看做知识的一种形态。所以我们希望 SPACE-2 能完成从简单封闭集知识到复杂开放集知识的跃迁，很好的利用已有的标注数据。

图15 两种知识形态：简单的封闭集知识和复杂的开放集知识

3.2 语义树标签

沿着这个思路，我们首先要解决一个难点，已有的复杂开放集知识不是一个简单的封闭集合的分类任务，不同数据集的体系更加复杂不一致。我们通过提出语义树结构对所有任务型对话数据集的用户侧理解标签进行统一，从 domaim、intent、slot、value 等四个层次进行树状标签的构建。比如对于 query “附近有好吃的川菜馆吗”，其 domain 为 restaurant，intent 是查找餐厅，slot 是菜系，value 是川菜，就可以完成一颗语义树的构建。利用这个思路，我们整合学术界已有的 32 个有标对话数据，提出 AnPreDial（300万），同时整合已有的19个无标对话数据，提出 UnPreDial（1900万），作为 SPACE-2 的预训练数据。

图16 语义树标签

3.3 半监督对比学习

与 SPACE-1 类似，我们仍然采用半监督对比学习的思路进行知识注入，有标注样本采用有监督对比学习，无标注样本采用自监督对比学习。而对于有监督对比学习，当前的语义树知识不是独热（one-hot）的，而是可度量的相似度标签。比如 query A 表达的是“能不能帮我在城东找一家比较便宜的宾馆”，而 query B 表达的是“你能不能在城西帮忙找一家便宜的宾馆”，这两句话的语义树标签之间的相似度是可度量的，具体的度量方式我们通过两个 query 标签解析出的语义树进行计算，将语义数按照节点和路径的组合，拆分为 10 种不同的情况 {D, I, S, V, DI, IS, SV, DIS, ISV, DISV} 其中 D 表示 domain，I 表示 intent，S 表示 slot，V 表示 value。最终按照路径和节点的重合程度，计算 Jaccard 距离作为 soft label 值，最终作为半监督学习的标签。

图17 语义树相似度度量

因为两个样本之间，可能只有部分是相似的，所以根据语义树的特点，我们进一步提出了 Multi-view scoring 的学习策略，在最后预测的过程中加入不同子空间的映射矩阵，用不同子空间对部分相似的样本进行显式建模。

图18 采用多视角（Multi-View）分别对不同的子结构进行显式建模

通过这种策略，可以通过 soft label 度量 batch 内任意两个样本的相似度，最后通过 weighted 对比学习的方式进行优化。下图可以看出，相比于自监督的对比学习（自己和自己作为正例，batch 内其他样本作为负例）和全监督的对比学习（正负标签作为对比学习标签），SPACE-2基于树结构的半监督对比学习方式，既能有效的利用标注信息，又能很弹性的退化为自监督对比学习，非常适合对话理解任务。

图19 基于树结构的半监督对比学习

3.4 SPACE-2 结果

SPACE-2 在面向对话理解的榜单 DialoGLUE 上（意图识别、填槽、对话跟踪）全量测试和小样本测试总分均为第一，其中在全量测试上，SPACE-2 相比之前的 SOTA 提升 1.1%，在小样本测试上，SPACE-2 相比之前的 SOTA 提升 3.41，由此可以证明开放集知识对于对话理解的增益。

图20 SPACE-2 注入了对话理解知识，在对话理解榜单DialoGLUE取得full-data和few-shot双榜单第一名

四、SPACE-3: 从单模块建模到一体化建模

面向单模块的预训练模型存在几个问题：

1）首先，模型的泛化性有限，无法很好的泛化到其他对话任务中，比如面向对话理解的模型很难再对话策略上有很好的效果；

2）对话任务具有流程型和时序性，理解 -> 策略 -> 生成是有先后顺序及相辅相成的，同时建模多个任务将能更充分的挖掘数据特征；

3）不同任务的标签知识如果能够同时以半监督的方式注入到预训练模型中，标注信息的增多，对于模型的优化也更有帮助。

为了克服这些问题，所以我们提出了 SPACE-3，希望将对话理解、对话策略、对话生成都统一到一个预训练对话模型中。

4.1 一体化模型

我们换个角度来看人机对话，首先多轮对话是流动的，是对话双方不停地进行交互，但之前的预训练对话模型都是从单侧（用户侧 or 系统侧）进行建模，没有考虑他们之间相互的影响。另外，语义树是对用户侧的语言（utterance）进行理解的，DA 是对系统侧的语言（response）进行理解的，那么就可以将理解知识和策略知识进行双侧理解统一建模。

图21 换个角度看人机对话

基于这个思路，我们希望能够模拟人类对话的思考路径，通过三个 Decoder 依次做理解、策略和生成，中间的结果可以用在各类对话下游任务上。在模型技术选型上，我们采取 UniLM 作为 backbone，将 1 Encoder + 1 Decoder 扩展为 1 Encoder + 3 Decoder 的结构，其中 Dialog Encoder 作为基础编码器通过 MLM loss 完成基础语言理解，而三个 Decoder 各司其职，Understanding Decoder 通过半监督对比学习进行对话理解，Policy Deocder 通过语义策略正则 loss 进行对话策略建模，最后 Response Decoder 通过传统的生成 loss 进行对话生成。

图22 SPACE-3 模型架构

4.2 双侧理解建模

策略 loss 的设计体现了我们对双侧理解的思想，首先在用户侧时刻，根据上下文和用户utterance，经过Policy Decoder 的预测的结果，和直接利用 Understanding Decoder 对下一轮 response 理解的结果，二者具有一致性。比如在下面的例子中，当模型接受 U1 + R1 + U2 为 context 的输入时 Policy Decoder 模块的结果，需要与U1 + R1 + U2 + R2 为 context 的输入时 Understanding Decoder模块的结果进行一致性约束，来引导模型对策略进行建模。

图23 策略LOSS建模示例

同样的，在用户侧时刻，根据上下文和系统 response，经过Policy Decoder的预测的结果，和直接利用Understanding Decoder 对用户 utterance 理解的结果，二者具有一致性。当模型接受 U1 + R1 + U2 + R2 为 context 的输入时 Policy Decoder 模块的结果，需要与U1 + R1 + U2 + R2 + U3 为 context 的输入时 Understanding Decoder模块的结果进行一致性约束，来引导模型对策略进行建模。

图24 策略LOSS建模示例

4.3 SPACE-3 结果

最后，我们同时在对话理解任务、对话策略任务和对话生成任务上同时评测了 SPACE-3 的效果，在包含理解、策略和生成的8个数据集的综合评价上，取得当前最好效果。

图25 SPACE-3 模型结果

五、SPACE-1/2/3 系列模型总结

这一年多来，我们通过提出半监督预训练新范式，向预训练对话模型中注入人类标注知识，打造了SPACE系列模型，共在 11 个国际对话数据集取得SOTA，并且三个工作分别侧重对话策略、对话理解及统一建模。相关的论文已经被顶级会议接收，其中，SPACE-1 融合对话策略知识，被 AAAI 2020 录用；SPACE-2 融合对话理解知识，被 COLING 2022 录用；SPACE-3 集理解、策略、生成一体，被 SIGIR 2022 录用。

图26 SPACE 1/2/3 系列模型

六、未来展望

1）拓展更多任务：半监督预训练作为一个通用的预训练技术，不仅可以用于对话任务，对于更多的NLP任务, 甚至其他模态的任务都有应用的潜力；

2）融入更多知识：本文中我们对分类标注知识和树形语义知识做了探索，除此之外还有很多其他知识形态，如何进行更好的形式化表示，统一地融入到一个预训练模型中也是一个开放问题；

3）设计更好算法：目前的探索是基于一致性正则化的半监督预训练方案，但整个半监督领域还有self-taught, co-training, deep generative modeling 等诸多方法，如何综合利用或设计更优的算法是一个重要研究课题；

4）放松数据约束：半监督学习要求标注数据和无标数据具有类似的数据分布，这一要求在真实场景中具有局限性，如何设计泛化性更强的半监督学习方法，放松对于无标数据分布的假设，是未来的一个发展方向。

特别鸣谢

灵骏为本项目提供智能算力支持，显著性加速了SPACE大规模预训练过程。作为阿里云自主研发的新一代智能计算服务，灵骏通过软硬件一体的系统性创新优化，使端到端计算效率得到了飞跃式升级。支持自然语言处理、图形图像识别、搜索广告推荐等多种应用场景，高性能、高效率、高资源利用率等特性，在大模型等前沿AI技术中提供了高拓展可预期的计算服务。

参考文献

[1] Devlin J, Chang M W, Lee K, et al. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. NAACL 2019.

[2] Brown T, Mann B, Ryder N, et al. Language Models are Few-Shot Learners. NeurIPS 2020.

[3] Raffel et al. Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer. JMLR 2020.

[4] Vaswani A, Shazeer N, Parmar N, et al. Attention Is All You Need. NeurIPS 2017.

[5] Henderson M, Casanueva I, Mrkšić N, et al. Convert: Efficient and accurate conversational representations from transformers. EMNLP-findings 2019.

[6] Wu C S, Hoi S, Socher R, et al. TOD-BERT: pre-trained natural language understanding for task-oriented dialogue. EMNLP 2020.

[7] Zihang Jiang, Weihao Yu, Daquan Zhou, et al. ConvBERT: Improving BERT with Span-based Dynamic Convolution. NeurIPS 2020.

[8] Zhang Y, Sun S, Galley M, et al. DialoGPT: Large-Scale Generative Pre-training for Conversational Response Generation. ACL system demonstration 2020.

[9] Adiwardana D, Luong M T, So D R, et al. Towards a human-like open-domain chatbot. arXiv preprint arXiv:2001.09977, 2020.

[10] Roller S, Dinan E, Goyal N, et al. Recipes for building an open-domain chatbot. arXiv preprint arXiv:2004.13637, 2020.

[11] Xiaojin Jerry Zhu. Semi-supervised learning literature survey. 2005.

[12] Liang X, Wu L, Li J, et al. R-Drop: Regularized Dropout for Neural Networks. NeurIPS 2021.

[13] He W, Dai Y, Zheng Y, et al. SPACE: A Generative Pre-trained Model for Task-Oriented Dialog with Semi-Supervised Learning and Explicit Policy Injection. AAAI 2022.

[14] He W, Dai Y, Hui B, et al. SPACE-2: Tree-Structured Semi-Supervised Contrastive Pre-training for Task-Oriented Dialog Understanding. COLING 2022.

[15] He W, Dai Y, Yang M, SPACE-3: Unified Dialog Model Pre-training for Task-Oriented Dialog Understanding and Generation. SIGIR 2022.

[16] Xu H, Zhengyan Z, Ning D, et al. Pre-Trained Models: Past, Present and Future [J]. arXiv preprint arXiv:2106.07139, 2021.

你可能感兴趣的:(深度学习,人工智能,机器学习,nlp)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，