默默无闻的[UNK]

[COLING 2022] DPTDR: Deep Prompt Tuning for Dense Passage Retrieval

Motivation

在工业应用的多任务场景中，基于fine-tuning (FT) 的方法在部署成本方面是不友好的。每次检索都必须重新部署一个backbone模型，因为每个任务中的backbone模型的权重是微调的，因此略有不同。Deep Prompt Tuning (DPT) 享有参数高效的特点，其中产生的prompt是轻量级的，可以很容易地传递给在线PLM服务，从而克服了FT的上述挑战。本文探究DPT是否能达到与SOTA FT方法可比的性能。因为在性能相当的情况下，DPT在部署上比FT更友好。

Methodology

DPT in Dense Retrieval

如图一左侧所示，为了给dual-encoder预设多层prompts，我们为PLM的每一层初始化一个大小为 $l \times d$ 的可训练的前缀矩阵 $M$ ，其中 $l$ 是prompt的长度， $d$ 是PLM的隐藏层大小。由于prompt位于PLM的深层，它有充分的能力引导PLM向预期的方向发展，并为question和passage输出有意义的稠密向量。设 $E^{\prime}_q, E^{\prime}_p$ 分别是 prompted question encoder 和prompted passage encoder，question和passage之间的相似度分数计算如下：
$s^{\prime}(q, p) = E^{\prime}_q(q) \cdot E^{\prime}_p(p)$
Training

训练目标是学习稠密向量，使相关的question和passage对之间的相似度高于不相关对的。给定一对问题 $q$ 和相关段落 $p_i$ ，以及n个不相关段落，损失函数为相关段落的negative log-likelihood:
$L(q_i,p_i^+,\{p_{i,j}^-\}_{j=1}^n) = -log\frac{e^{s^{\prime}(q_i, p_i^+)}}{e^{s^{\prime}(q_i, p_i^+)}+\sum_{j=1}^ne^{s^{\prime}(q_i, p_{i,j}^-)}}$
在训练期间，我们冻结backbone PLM的参数，只更新prompts，其中大约0.1%-0.4%的PLM参数得到训练。

Inference

如图1右边部分所示，由于backbone PLM是冻结的，所以可以提前部署在线服务，然后将训练好的prompt作为预先计算好的键值与输入一起传递，得到稠密向量。这是本文节省部署的努力和成本，提高计算资源的效用的核心部分。

虽然DPT带来了很多优势，但它并没有加快推理速度，因为前向计算略有增加（增加了前缀）。

Retrieval-oriented Intermediate Pretraining (RIP) for DPT

RIP的目标是通过对比学习预训练prompts或PLMs。任务如下： $C$ 为包含 $N$ 个passages的语料库，对于passage $p_i$ , 我们将它分为 $l$ 个句子： $s_i^1,...,s_i^l$ 。对于一个句子 $s_i^j$ , 预训练的目标是从其他passage $s_k^l (k\neq i)$ 的句子中区分出它的上下文 $s_i^{j^{\prime}}$ 。形式上，我们从每个passage中随机选择一对句子作为上下文句子，形成一批训练数据 $B=\{s_i^1, s_i^2\}_{i=1}^m$ ，其中m是batch size。然后，我们将 $s_i^j$ 在该批数据上的对比损失定义为:
$L_c(s_i^j) = -log \frac{e^{s(s_i^1,s_i^2)}}{\sum_{k=1}^m\sum_{l=1}^2e^{s(s_i^j,s_k^l)}},ij\neq kl$
在对比学习任务下，存在两种DPT的预训练方式，它们取决于预训练的对象:

Pre-train deep prompts

用PLM来预训练prompts。之后，我们使用预先训练好的prompts和PLM来初始化一个基于DPT的检索器。然而，第4.4节中的实验表明，它受到灾难性遗忘的影响，与随机初始化的prompt相比，没有表现出优越的性能。

Pre-train the PLM

另一种是预训练一个PLM，然后我们使用随机初始化的prompts和预训练的PLM来初始化基于DPT的检索器。我们打算让任何PLM都能轻松地进行DPT的预训练，这样用户就可以采用他们自己的PLM。因此，我们不修改任何模型结构。在表8中，它产生了比coCondenser (对比预训练的SOTA，但是进行了模型结构的修改) 更好的性能。因此，我们使用PLM的预训练作为RIP的策略。

对于所有PLM，我们还保留其原有的自监督任务，如MLM任务，表示为 $L_s$ 。因此，预训练的最终损失为：
$\frac{1}{2m}\sum_{i=1}^m\sum_{j=1}^2L_s(s_i^j)+L_c(s_i^j)$
经过预训练后，产生的模型可以作为在线服务部署，并作为DPT训练的backbone模型。

Unified Negative Mining (UNM)

我们还为DPT开发了统一的负例挖掘，即 “多检索器和混合采样”。"多个检索器 "是指从尽可能多的检索器中选取负例。我们使用BM25检索器作为初始检索器，并使用BM25的负例训练一个基于DPT的检索器。然后，我们把从BM25检索器和第一个基于DPT的检索器中检索到的负例作为未去噪的难负例。"混合抽样 "是指从上述多个检索器检索出的未去噪的难负例中选择去噪的难负例。我们借用RocketQA发布的re-ranker，并选择那些具有高置信度的负例。为了训练最终的基于DPT的检索器，我们将去噪的难负例、未去噪的难负例和来自batch内或交叉batch训练的简单负例混合起来。

Experiments

Datasets

Results

Main results

Comparing FT with and without RIP and UNM Strategies

Analysis on DPT

Sensitivity on prompt length

从表4中，我们观察到prompt长度为8的性能已经在MS-MARCO上实现了强大的MRR@10，达到38.6。当我们把长度增加到128时，它使MRR@10达到了39.1的最强表现。更长的prompt意味着更多的可训练参数，这获得了更多引导PLM的力量。然而，我们也想指出，DPT检索器表现出对prompt长度不敏感，因为在不同的长度下，其性能总体上是可比的。因此，我们在主要实验中选择32作为默认的prompt长度和其他超参数，以加速对MS-MARCO的消融研究。

Impact of reparameterization

使用MLP对prompt进行重参数化导致MS-MARCO的MRR@10的性能下降。由于MLP打破了层间prompt的独立性，我们猜测这给密集检索带来了优化的困难。

Analysis on RIP

Whether to pre-train deep prompts or not?

我们试图研究预训练的prompt是否能提高基于DPT的检索器的性能。我们使用预训练的和随机初始化的prompt来初始化基于DPT的检索器。如表6所示，与随机初始化的prompt相比，预训练的prompt并没有提高性能。它揭示了深层prompt可能很容易遭受灾难性的遗忘。

RIP on text spans or sentences

使用句子的预训练比使用文本span的预训练效果更好。这可能是由于基于文本跨度的RIP没有考虑自然句子的（开始和结束）边界，因此破坏了其语义的完整性。

RIP’s effectiveness and comparison with coCondenser

zero-shot和full-shot实验都表明，RIP的效果比精心修改的模型结构更好。因此，我们猜测PLM的多层transformer在适当的对比学习任务下，对密集检索来说已经有足够的表现力。然而，额外的模型结构可能会带来优化困难，特别是当增加的参数数量很大时。

Analysis on UNM

使用BM25负例的DPT实现了36.8的MRR@10的基线。当结合来自多个检索器的未去噪负例时，我们看到性能在MRR@10上取得了明显的改善，提高了1.5分。当结合由re-ranker选择的去噪难负例时，性能进一步得到提升，其中MRR@10增加了0.4点。结果表明，多检索器和混合采样都对稠密检索有积极的贡献。

你可能感兴趣的:(Information,Retrieval,双塔模型,文本匹配,nlp,人工智能,深度学习)

Pytorch实现之GIEGAN（生成器信息增强GAN）训练自己的数据集这张生成的图像能检测吗 GAN系列 pytorch 生成对抗网络人工智能深度学习计算机视觉机器学习 python
简介简介：在训练数据样本之前首先利用VAE来推断潜在空间中不同类的分布，用于后续的训练，并使用它来初始化GAN。与ACGAN和BAGAN不同的是，提出的GIEGAN有一个分类器结构，这个分类器主要判断生成的图像或者样本图像属于哪个类，而鉴别器仅判断图像是来自于生成器还是真实样本。论文题目：GeneratorInformationEnhancementGenerativeAdversarialNet
本地运行stable-diffusion3.5 wisfy_21 stable diffusion
本地运行stable-diffusion3.5本地运行stable-diffusion3.5准备工作下载ComfyUI和需要的模型文件需要下载以下几类SD3.5文件启动ComfyUI启动在工作流中分别选中三个Clip模型sd3.5_large_turbo准备本地运行stable-diffusion3.5AI时代不可阻挡，给老机器加了个406016G显卡，尝试本地运行stable-diffusion
Redis为什么速度快、性能高？我荔枝呢！ redis java 数据库 Redis速度快高性能
1.内存存储数据存储在内存中：Redis将所有数据保存在内存中，内存的访问速度远快于磁盘，因此读写操作非常迅速。持久化可选：虽然Redis主要依赖内存，但它也支持将数据持久化到磁盘，确保数据不会因重启而丢失。2.单线程模型避免上下文切换：Redis采用单线程处理命令，避免了多线程的上下文切换和竞争条件，简化了设计并提升了性能。高效的事件驱动：Redis使用I/O多路复用技术（如epoll、kque
hash冲突及hash冲突的4种解决方案我荔枝呢！哈希算法散列表算法
哈希出现冲突的情况：输入域与输出域不匹配：哈希函数的输入可以是任意长度的数据，组合无限，而哈希值的长度固定，输出域有限，根据鸽巢原理，必然会有不同输入映射到同一个输出值。（鸽巢原理：这是哈希冲突的根本原因。根据鸽巢原理（也称为抽屉原理），如果将n+1n+1个元素放入nn个容器中，则至少有一个容器包含多于一个元素。在哈希表中，这意味着当输入数据的数量超过哈希表的容量时，必然会发生冲突。）哈希函数设计
阿里 WANX 2.1 视频生成模型即将开源，视频文字两开花三花AI 三花AI 人工智能 AI作画
WanX团队昨晚宣布即将开源其最新的WANX2.1视频生成模型。目前还没有更多信息，关注我为你持续跟进。具体效果可以看官方发布的视频来感受下。
@ApiModel weixin_51687565 python 开发语言
@ApiModel是Swagger(现在通常被称为OpenAPI)中的一个注解，用于在RESTfulWeb服务中描述API的模型。Swagger允许开发人员为RESTfulWeb服务生成、描述、调用和可视化API文档。通过使用Swagger的注解（如@ApiModel），开发人员可以自动地生成这些文档，而无需手动编写和维护它们。@ApiModel注解通常用于Java类的顶部，这些类代表API响应或
petalinux-build ERROR Ret0 嵌入式硬件
最近编译Xilinx的固件的时候报了一个错，看的我云里雾里，一度认为ubuntu的版本跟petalinux的版本不匹配，想要重新安装操作系统和编译环境，想想都头大。petalinux-create-tproject--templatezynqMP-npetalinux-config--get-hw-description=./petalinux-build第二条命令导入的zu11eg的hdf然后就
腿足机器人之十- SLAM地图如何用于运动控制 shichaog 腿足机器人机器人
腿足机器人之十-SLAM地图如何用于运动控制腿足机器人SLAM地图的表示与处理全局路径规划：地形感知的路径搜索基于A*的三维路径规划基于RRT*的可行步态序列生成局部运动规划：实时步态调整与避障动态窗口法的腿足适配模型预测控制（MPC）与步态优化稳定性控制与SLAM定位的协同BostonDynamicsAtlas机器人的SLAM导航相比于轮式机器人（如人形轮式机器，可以看成是扫地机器人之上加了一个
HTML5、CSS3面试题 Xu.Youth 大数据
目录1、说一说H5新标签？2、CSS3的新特性？3、如何实现一个盒子水平垂直居中？4、你是怎么理解BFC的？5、说一说盒子模型？6、如何画一个三角形？7、说一些块级元素和行内元素8、简单聊一聊重排和回流？9、文本超出部分显示省略号？10、说一说清除浮动的方式？11、请你说一说css的选择器，以及优先级12、来说一说CSS3的过渡？13、简单聊一聊CSS3的2D、3D转换14、说一说CSS3的动画？
本地部署DeepSeek的硬件配置建议冷冷清清中的风风火火笔记 AI ai 人工智能
本地部署DeepSeek的硬件配置需求因模型参数规模和部署工具不同而有所差异，以下是综合多个来源的详细要求：1.基础配置（适用于7B参数模型）内存：最低8GB，推荐16GB及以上；若使用Ollama工具，基础级需16GB内存。显卡：GTX1060（6GB显存）或更高，推荐RTX3060（8GB显存）；若需流畅运行7B模型，建议RTX4060显卡。存储：至少20GB剩余空间，推荐NVMe固态硬盘。2
Mybatis中 #{} 和 ${} 的区别是什么？《小书生》 Mybatis mybatis
${}是Properties文件中的变量占位符，它可以用于标签属性值和sql内部，属于原样文本替换，可以替换任意内容示例：根据参数按任意字段排序select*fromusersorderby${orderCols}#{}是sql的参数占位符，MyBatis会将sql中的#{}替换为?号，在sql执行前会使用PreparedStatement的参数设置方法，按序给sql的?号占位符设置参数值，比如p
【深度学习】Unet的基础介绍牧歌悠悠深度学习人工智能算法深度学习人工智能 U-net
U-Net是一种用于图像分割的深度学习模型，特别适合医学影像和其他需要分割细节的任务。如图：Unet论文原文为什么叫U-Net？U-Net的结构像字母“U”，所以得名。它的结构由两个主要部分组成：下采样（编码器）：图像逐渐被缩小并且提取特征。上采样（解码器）：逐渐恢复图像的尺寸，并通过“跳跃连接”将高分辨率的特征与低分辨率的特征结合，以保持细节。网络结构U-Net通常包括以下几部分：（1）下采样（
C++ 动态字符串String的介绍及经典用法展示幸存者letp 算法竞赛池 c++java 开发语言
std::string:在C++中，std::string是标准模板库（STL）中的一个类，用于表示和操作字符串。std::string提供了丰富的功能来处理文本数据，包括字符串的创建、修改、搜索、比较和转换等操作。std::string的特点：1.动态字符串：std::string是一个动态字符串类，它可以根据需要自动调整大小。2.操作简便：std::string提供了类似于C风格字符串的接口，
【数据结构与算法】栈与队列：从基础到实战，代码案例+应用场景全解析！ Leaton Lee java 开发语言算法数据结构
开篇互动：你的代码中是否还在手动管理数据顺序？“是否还在为数据先进先出、后进先出的顺序而烦恼？”栈（Stack）和队列（Queue）是计算机科学中最基础且最重要的数据结构之一。无论是浏览器的前进后退、打印机的任务处理，还是括号匹配、迷宫求解，栈和队列的身影无处不在。这篇文章将从栈和队列的基础概念出发，结合代码案例、经典问题和实际应用场景，手把手教你掌握这两个数据结构的核心知识！文末还有常见问题解答
【Java八股文】07-Redis面试篇 bblb Java八股文系列 java redis 面试复习分布式分布式锁 canal
【Java八股文】07-Redis面试篇Redis面试篇认识redis为什么用Redis作为MySQL的缓存？数据结构讲一下Redis底层的数据结构ZSet底层是由什么实现的线程模型Redis是单线程吗？Redis怎么进行I/O多路复用的？Redis采用单线程为什么还这么快？事务Redis锁有哪几种实现方式如何实现redis原子性？Redis中incr命令保证原子性的原理是什么redis分布式锁的
Webpack 的 require.context 和 Vite 的 import.meta.glob 的详细介绍和使用小纯洁w webpack 前端 node.js
Webpack的require.context和Vite的import.meta.glob的详细介绍和使用示例：Webpack的require.context语法#JavaScriptrequire.context(directory,useSubdirectories,regExp);directory：要搜索的目录。useSubdirectories：布尔值，是否搜索子目录。regExp：匹配
Python 正则表达式全攻略：从入门到精通实战教程 tekin Python python Python 正则表达式
正则表达式在文本处理领域占据着举足轻重的地位，它能够帮助开发者高效地进行复杂字符串的匹配、提取和替换操作。本教程聚焦于Python中的正则表达式，以re模块为核心，从基础概念到高级应用，全方位深入剖析其使用技巧。无论是编程新手还是经验丰富的开发者，都能通过丰富的示例代码、清晰的图文及表格对比，获取实用知识，大幅提升文本处理能力。正则表达式基础概念定义与用途：正则表达式是嵌入Python并通过re模
DeepSeek Prompt指南 deepseek
序本文主要研究一下如何写出更适合DeepSeek的Prompt官方提示库DeepSeekAPI文档-提示库提供了一些DeepSeek提示词样例。比较有用的是这个【模型提示词生成】你是一位大模型提示词生成专家，请根据用户的需求编写一个智能助手的提示词，来指导大模型进行内容生成，要求：1.以Markdown格式输出2.贴合用户需求，描述智能助手的定位、能力、知识储备3.提示词应清晰、精确、易于理解，在
通俗理解 CAD CAM CAE 七贤岭双花红棍 c++
CAD、CAM和CAE是工程设计和制造领域中常用的三种技术，它们分别代表不同的功能和应用场景。下面用通俗的语言来解释它们：1.CAD（计算机辅助设计，Computer-AidedDesign）通俗理解：CAD就像是用电脑画图的工具，但它比手绘更精确、更高效。设计师可以用CAD软件在电脑上绘制产品的三维模型或二维图纸，比如设计一个手机外壳、一座桥梁或一辆汽车。作用：帮助工程师和设计师快速创建、修改和
Markdown语法 SY.ZHOU macos
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML图表FLowchart流程图导出与导入导出导入欢迎使用Mark
CentOS上远程连接SSH常用操作命令整理 luckyext centos ssh linux
1.SSH服务状态查询，查看SSH服务是否正在运行的命令sudosystemctlstatussshd2.SSH服务的启动及设置系统启动时自动运行命令sudosystemctlstartsshdsudosystemctlenablesshd3.SSH服务的重启命令sudosystemctlrestartsshd4.SSH的主要配置文件是/etc/ssh/sshd_config，可以用文本编辑器vi
WinForm开发核心基础之事件驱动设计 dotnet研习社 C#开发基础 .net dotnet
引言在Windows窗体应用程序（WinForm）开发中，事件驱动设计是构建用户交互式应用的核心机制。无论是按钮点击、键盘输入还是窗口重绘，所有用户与程序的交互行为本质上都是通过事件来驱动执行的。理解事件驱动模型不仅能够帮助我们构建响应式的界面，更是深入GUI编程的关键一步。本文将深入解析WinForm中事件驱动设计的原理、实现方式及最佳实践。一、什么是事件驱动设计？1.1传统程序与事件驱动程序的
神经网络新手入门（2）基础认知：神经网络发展简史 caridle 神经元网络神经网络人工智能深度学习
第一阶段：基础认知：神经网络发展简史让我们用武侠小说的方式打开这段科技史，你会发现神经网络的发展史比金庸江湖还要精彩：第一章：江湖初现（1943-1958）1943年，两位奇侠麦卡洛克和皮茨在《神经活动中内在思想的逻辑演算》中打造了江湖第一把"宝剑"——M-P神经元模型。这把剑虽然简陋（只能做简单的逻辑运算），却奠定了整个武林的基础，就像武侠世界里最早的内功心法。1943年，两位奇侠麦卡洛克和皮茨
edge-tts微软文本转语音库 caridle edge python
Edge-TTS是一个Python库,比较好用，直接pip安装。pipinstalledge-tts输入edge-tts，输出提示信息，安装完成。usage:edge-tts[-h][-tTEXT][-fFILE][-vVOICE][-l][--rateRATE][--volumeVOLUME][-OOVERLAPPING][--write-mediaWRITE_MEDIA][--write-su
正则表达式（Regular expresssion）玖龍的意志正则表达式 python
正则表达式匹配单次.：匹配任意一个字符[]：匹配[]里举例的任意一个字符/d：匹配数字0-9/D：匹配非数字/s：匹配空白或tab建/S：匹配非空白/w：匹配非特殊字符，a-z,A-Z,0-9,汉字/W：匹配特殊字符匹配不定次数*：匹配前一个字符出现0次到无数次+：匹配前一个字符出现至少一次?：匹配前一个字符出现1次或0次{m}：匹配前一个字符出现m次```bash[0-9]{6}匹配一串字符串的
Redis 会存在线程安全问题吗豪宇刘 redis
Redis是一个高性能的键值存储系统，广泛用于缓存、消息队列和实时数据分析等场景。由于其单线程架构设计，许多人认为Redis是天然线程安全的。然而，实际情况要稍微复杂一些。本文将详细探讨Redis是否存在线程安全问题，并解释其原因。一、Redis的单线程模型Redis的核心操作（如GET、SET、DEL等命令）是由一个单一的主线程来处理的。这个主线程负责接收客户端请求、执行命令并将结果返回给客户端
【CI/CD】持续集成及 Jenkins Karoku066 ci/cd jenkins 运维 kubernetes 容器云原生 docker
文章目录传统与敏捷开发流程对比CI/CD持续集成（CI）持续交付/部署（CD）JenkinsPipeline语法实施CI/CD的典型流程常见问题与解决方案~传统与敏捷开发流程对比1.瀑布模型（WaterfallModel）核心特点：线性顺序开发，严格分阶段（需求→设计→开发→测试→部署），各阶段需完全完成后进入下一阶段。缺点：周期长（通常数月到数年），难以应对需求变更，测试滞后导致缺陷修复成本高。
BeautifulSoup、lxml/XPath和正则表达式在数据爬取中的核心差异及适用场景程序员小王꧔ꦿ beautifulsoup 正则表达式
一、性能与效率对比工具/方法解析速度（万次耗时）内存占用适用数据规模lxml/XPath0.5秒低10万+级数据正则表达式(regex)1.1秒中非结构化文本BeautifulSoup5.5秒高小规模复杂结构*注：测试环境为Python3.6.5二、功能特性对比1.BeautifulSoup（需配合解析器）优势✅容错性强，能处理残缺HTML（如未闭合标签）✅支持CSS选择器和find_all链式调
系统架构设计基础 xuegao0807 系统架构
1.软件架构的概念软件架构，即软件体系结构，为软件系统提供一个结构、行为和属性的高级抽象。软件架构作用：1）项目干系人进行交流的手段2）可传递和复用的模型，通过研究软件架构可预测软件的质量3）使推理和控制的更改更加简单，有助于循序渐进的原型设计阶段作用和意义需求分析阶段软件需求模型到软件架构模型转换关注的问题：1.如何根据需求模型构建软件架构模型（SA模型）2.保证模型转换的可追踪性设计阶段软件架
匹配算法：向下就近原则，向下没有就向上一点也不想取名算法 java
匹配算法：向下就近原则，向下没有就向上实现方式一实现方式二总结实现方式一privatestaticListfindMatches(ListsourceList,ListsearchValues){ListsortedList=sourceList.stream().filter(Objects::nonNull).sorted().collect(Collectors.toList());Setf
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他