呆呆的猫

【多模态】23、RO-ViT | 基于 Transformer 的开发词汇目标检测（CVPR2023）

文章目录

- 一、背景
- 二、方法
- - 2.1 基础内容
  - 2.2 Region-aware Image-text Pretraining
  - 2.3 Open-vocabulary Detector Finetuning
- 三、效果
- - 3.1 细节
  - 3.2 开放词汇目标检测效果
  - 3.3 Image-text retrieval
  - 3.4 Transfer object detection
  - 3.5 消融实验

论文：Region-Aware Pretraining for Open-Vocabulary Object Detection with Vision Transformers

代码：暂无

出处：CVPR2023

贡献：

本文提出的 RO-ViT 解决了 image-text pretraining 到 open-vocabulary object finetuning 之间的 positional embedding 问题
证明了 image-text pretraining 使用 focal loss 比 CE loss 更好
使用 novel object proposals 提高了开放词汇目标检测 fine-tuning 效果
在 LVIS 上得到 SOTA 32.4 APr，超越了当前最好的方法 6.1 APr

一、背景

近期，open-vocabulary detection task (OVD) 得到了很多关注，其被提出是为了解决传统目标检测的限制性，开放词汇目标检测最大的特点是将类别看做 text embedding，而不是离散的 id，所以，开放词汇目标检测能够更灵活的预测在训练过程中没见过的类别。

现有的很多方法是使用大量的 image-text pairs 来进行预训练，为模型引入丰富的语义信息，很多方法用的是 CNN，但随着对图像理解的更强的需求和多模态任务的出现，使用 vision transformer 来实现也很重要

我们已知现有的方法很多都是使用预训练好的 vision-language model，然后再微调一下来解决 image-level 预训练和 object-level fine-tuning 之间的 gap

本文提出了 RO-ViT，将预训练好的 vision transformer 迁移到 region-aware 上来实现开放词汇的目标检测

本文和前面的方法最大的不同在于，本文作者探索了如何更好的使用 vision transformer 来预训练 VLMs，更好的适用于开放词汇检测

然后使用预训练的权重来初始化检测器的 backbone，将 backbone 冻住后训练检测器的 neck 和 head 等特殊部件

二、方法

2.1 基础内容

1、contrastive image-text pretraining

一般的对比学习都是 two-tower 的结构，由 image encoder 和 text encoder 构成

image encoder：可以是 CNN 或者 ViT 的
text encoer：一般是 transformer 的

对比学习的目标是在 embedding space 中，将一对儿的 image-text 距离拉近，非一对儿的 image-text 距离拉远

一般使用的 loss 是 softmax CE loss

2、开放词汇目标检测

使用基础类别训练，但是测试的时候需要同时能够检测基础类别和新类别

一般的方法就是将原本的固定尺寸的全连接分类器使用 text embedding 来替换，因为 text embedding 来自于预训练的 text encoder 中，所以预训练中的开放语义知识能很好的保留

作者对于 background 类别使用 “background” 词汇来作为类别词汇

训练过程中，作者会给每个 region $r$ 计算对应的 detection score $p_i$ ，计算方法是计算 RoI-Align feature（region embedding）和基础类别的 text embedding 的 cosine similarity，然后使用 softmax 规范化

在测试过程中，text embedding 扩展到了基础类别和新类别的 embedding，并且加上了 background，在 ViT backbone的输出 feature map 上使用 RoI-Align 来获得region $i$ 的 VLM embedding，并且计算这个区域 embedding 和 text embedding 的 cosine similarity，得到 region score $z_i$ ，detection score 计算如下， $\alpha, \beta \in [0,1]$ 用了控制基础类别和新类别的 weights

作者使用预训练好的 ViT 模型来初始化 detector 的 backbone

2.2 Region-aware Image-text Pretraining

现有的 vision-language model 基本上都是使用整张图和 text 来进行匹配

然而，这种预训练没有考虑到 region-level 特征和 text token 之间的关系，而这种关系又对开发词汇目标检测很重要

所以，作者提出了一种新的 Cropped Positional Embedding（CPE）的方法来解决 image 和 region 之间的 gap，并且发现使用 focal loss 从难样本中挖掘很有益处

CPE：

transformer 中，positional embedding 是很重要的，能够保留每个元素的相对位置，这种信息对下游的识别和定位任务都很重要
但现有的 contrastive pretraining 和 open-vocabulary detection fine-tuning 的 positional embedding 之间有一定的不对齐，pretraining 方法一般都在训练时对全图位置进行编码，在下游的任务也是使用全图的位置编码。但是 detection fine-tuning 中，需要将全图的位置编码泛化到 region 的编码

为了解决这个 gap，作者提出了 CPE，如图 2 所示：

首先，对于 pretraining，将 positional embedding 从图像大小（224）上采样到检测任务大小（如 1024）
然后，从上采样的 positional embedding 中随机 crop 一个 region 并 resize，来作为预训练时候的 image-level 的 positional embedding
这样一来，就能让模型将图像看做从更大的未知图像中随机 crop 出的 region，而非一个整图，能更好的适应于下游检测任务

CPE 可视化：

每个小格子是一个 patch 和其他 patches 的余弦相似度
相近的 patches 有着更相似的位置编码

Focal loss：

作者认为更细致的控制 hard 样本的权重比使用 CE loss 更好

假设：

$v_i$ 和 $l_i$ 是归一化后的 image embedding 和 text embedding
Image-to-text（I2T）对比学习 loss 分别设置为 CE loss 和 Focal loss 来对比，公式如下
Text-to-image（T2I）对比学习 loss 和 I2T 的是对称的
总 loss 是两个 loss 之和

2.3 Open-vocabulary Detector Finetuning

虽然 backbone 可以使用预训练权重来初始化，但检测器的 neck 和 head 还是全新的

现有的方法一般不会对新类或未标注的类进行 proposal generation

但本文提出了一个新的生成 proposal 的方法，使用 localization quality-based objectness（如 centerness 等）来衡量 proposal 的得分，而不是使用 object-or-not 的二分类得分来衡量

OVD score： $S_i^{OVD}=o_i^{\delta} .s_i^{OVD}$ ， $o_i^{\delta}$ 是预测的 objectness score

三、效果

3.1 细节

预训练：

本文的 pretraining 是作者从头训练的，使用 ViT-B/16 和 ViT-L/16 来作为 image encoder
输入图像大小为 224x224，patch size 为 16x16，共 14x14 个 positional embedding
为了生成 CPE，作者首先将 positional embedding 插值到 64x64，然后随机 crop 一个 region（scale ratio 为 [0.1,1.0]，aspect ration 为 [0.5, 2.0]），然后将 region crop resize 为 14x14，驾到 patch embedding 上
在 ViT 最后一层使用 global average pooling 来得到 image embedding
text encoder 是 12 层的 transformer，最长的 text encoder 是 64
数据集：LAION-2B [44]

下游检测的细节：

LVIS： iters = 46.1k，img size =1024，batch = 256，SGD weight decay 1e-4，lr 0.36，momentum=0.9
COCO：iters = 11.3k，img size =1024，batch = 128，SGD weight decay 1e-2，lr 0.02，momentum=0.9
使用 CLIP prompt 模版，对每个类别的 text embedding 求平均
在 RPN 阶段使用 OLN-RPN，使用 centerness 作为 objectness，每个位置上有一个 anchor，使用 IoU loss，RPN NMS 在训练时 threshold=0.7，测试时为 1.0

3.2 开放词汇目标检测效果

LVIS：

使用基础类别训练，rare 类别作为新类来测试，测试了 3 次取了平均
APr 取得 32.4

COCO：

使用 48 个基础类别训练，17 个新类测试

3.3 Image-text retrieval

zero-shot image-text retrieval on coco and Flickr30k

3.4 Transfer object detection

3.5 消融实验

你可能感兴趣的:(多模态,开放词汇目标检测,多模态)

LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
2018/02/12 Tracy_zhang
人生并不在于获取，更在于放得下。放下一粒种子，收获一棵大树;放下一处烦恼，收获一个惊喜;放下一种偏见，收获一种幸福;放下一种执著，收获一种自在。放下既是一种理性抉择，也是一种豁达美。只要看得开放得下，何愁没有快乐的春莺在啼鸣，何愁没有快乐的泉溪在歌唱，何愁没有快乐的鲜花绽放!
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
Shell、Bash、Zsh这都是啥啊小白码上飞 bash linux 开发语言
Zsh和Bash都是我们常用的Shell，那先搞明白啥是shell吧。Shell作为一个单词，他是“壳”的意思，蛋壳坚果壳。之所以叫壳，是为了和计算机的“核”来区分，用它表示“为使用者提供的操作界面”。所以这个命名其实很形象，翻译成中文，直译过来叫“壳层”。个人认为这个叫法很奇怪，意译貌似也没有什么好的词汇来匹配。就还是叫shell吧。维基百科给的定义是：Incomputing,ashellisa
女儿考研完报考雅思捡拾流年
是否我过于焦虑？会不会无形间让女儿觉得压力太大了啊。2022年对于我们家来说是不平常的一年。女儿今年大四，为了准备考研，暑假也没回家，年初去了学校到了年末才回家。女儿自己一个人面对考研，没有参加培训，大四学校作业论文等课业也多，她同时也是很努力复习考研的。在疫情开放很多羊的时期，女儿终于顺顺利利参加12月24、25号的考研，我们和家人都觉得女儿回家来要好好休息调养。可女儿回到家，我再查阅考研信息，
人与人之间的相遇，是天意，人与人之间的分离，常在人为。雨墨笔谈
人际关系，是我们生活中不可或缺的一部分。然而，如何与他人和谐相处，维系友情和爱情，却是一门艺术，需要智慧、耐心去领悟。不强求才是人与人之间最舒服的相处方式。这一理念代表着我们与世界相处的智慧，也是我们与他人建立持久友情和幸福感情的关键。理解与尊重人际关系中，理解和尊重是金科玉律。当我们能够以开放的心态去理解他人，不仅可以减少冲突，还可以建立更深刻的关系。正如有这样一句话说到：“你无法选择你的亲人，
等缓光
心数实验显示，量子场不能单纯回应我们的愿望（情感要求），也不能单纯回应我们的目的（想法）；只有当这两者同调时，或者说，当他们一致传播出相同的信号时，量子场才会有所回应。当我们结合高昂的情绪、开放的心，有意义的意念及明确的思维，我们将能发送出信息，使量子场以令人惊喜的方式回应我们。然而，量子场并非回应我们想要的，而是反应了我们是怎样的存在！摘自《未来预演》让心❤与脑一起演化出我们真正的存在吧！
[数据集][目标检测]汽车头部尾部检测数据集VOC+YOLO格式5319张3类别 FL1623863129 数据集目标检测汽车 YOLO
数据集制作单位：未来自主研究中心(FIRC)版权单位：未来自主研究中心(FIRC)版权声明：数据集仅仅供个人使用，不得在未授权情况下挂淘宝、咸鱼等交易网站公开售卖,由此引发的法律责任需自行承担数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：5319标注数量(xml文件
「鲸灵」获数千万美元B+轮融资，旗下日日团打造团购电商新时代想想再说可以吗
小编获悉，社交电商鲸灵集团（以下简称鲸灵）已完成数千万美元B+轮融资，由启明创投领投，IDG资本联合领投，老股东跟投。鲸灵刚于7月完成数亿元B轮融资，由腾讯领投，IDG资本、险峰长青、元璟资本跟投。据小编了解，鲸灵旗下的日日团业务单日交易额已突破100万元。鲸灵创始人&CEO邬强强（花名：鬼谷）曾在阿里巴巴任职9年，曾任聚划算事业部总经理、淘宝开放平台创始人。针对本轮融资，邬强强告诉小编：“社交电
如何给QQ邮箱自动发邮件？无惧「小爱」下线！代码全公开，两步搞定 AI码上来 AI实战微信人工智能 python
前两天，搞了个微信AI小助理-小爱(AI)，爸妈玩的不亦乐乎。零风险！零费用！我把AI接入微信群，爸妈玩嗨了，附教程（下）最近一直在迭代中，挖掘小爱的无限潜力:链接丢给它，精华吐出来！微信AI小助理太强了，附完整提示词拥有一个能倾听你心声的「微信AI小助理」，是一种什么体验？小爱打工，你躺平！让「微信AI小助理」接管你的文件处理，一个字：爽！我把多模态大模型接入了「小爱」，痛快来一场「表情包斗图」
7.29领导者作对10条，员工死心塌地的追随路途赵晶
1.理解员工的行为和需求:鼓励员工和表扬员工2.建立员工的自信心。员工遇到困难，我们应该给与帮助提高员工的自信心。3.沟通:鼓励员工实话实说，根据不同的员工我们选择适合他们的沟通方式进行沟通和交流。4.信任与承诺有耐心的去倾听员工的内心。5.积极的态度。不要给员工传播负面情绪，管理者时刻保持积极的乐观的心态。6.开放封闭的思维。应该敢于挑战与创新。不要把自己的思想封闭起来。7.冲突处理。管理者有不
三角洲行动内测资格怎么获得三角洲行动内测服怎么进入会飞滴鱼儿
手游内测资格怎么获得？这是每款新游戏开放内测的时候，玩家问的最多的一个问题，其实现在大多数游戏在上线之前官方都会开启几轮的内测测试，每轮测试之后，官方会收集全部运行过程中的数据，来进行优化和改进，至此这也是每款游戏的定律，但是有一个问题的就是，不管哪款游戏，开启测试的时候，名额都是有限的，经常都有很多玩家想要测试资格，却无论怎么也不会获得，本期小编就来给大家整理几个方法，让大家抢先一步！游戏内测资
第三世界 — 来！给你一次重新投胎的机会沧的海
一、投胎系统用户可自行选择来生的方方面面，包括国度、家庭、事业、技能、容貌、寿命等等；赢利点来了：选择好的方面自然要付出一定的代价啦，比如更长的寿命、更好的容貌等等；二、生活系统投胎转世后即进入生活系统，生活系统包括：1、设施系统街头、旅游、KTV、电影院、酒吧、餐厅…世界的一开始、即原始时期是没有这些设施的，官方只提供土地资源，开放接口给第三方开发者，集众力、创世界；2、任务系统你可以在此发布或
感悟不断学习的重要。小琳er
在这个不断变化的世界里，如果把人看成是静态的，那就有些太落伍了。其实，人随着时间的推移，也是在不断变化的。尽管有时候这种变化是被动的，但是这也是人为适应环境所作出的本能反应。人如果能主动去接受这种变化，并视这样的变化是积极的，那人能做且必须做的就是——不断学习。学习，可以说是人想改变命运、实现自由的最好方式。一个开放的人，也注定是一个肯学习、愿意接受新鲜事物的人。图片发自App这个世界没有天生的王
腾讯发表多模态综述，一文详解多模态大模型存内计算开发者社区多模态大模型人工智能 chatgpt AIGC 量子计算 AI-native gpt agi
多模态大语言模型（MLLM）是近年来兴起的一个新的研究热点，它利用强大的大语言模型作为大脑来执行多模态任务。MLLM令人惊讶的新兴能力，如基于图像写故事和无OCR的数学推理，在传统方法中是罕见的，这表明了一条通往人工通用智能的潜在道路。在本文中，追踪多模态大模型最新热点，讨论多模态关键技术以及现有在情绪识别上的应用。腾讯AILab发表了一篇关于多模态大模型的最新综述《MM-LLMs:RecentA
韩愈《题榴花》：倾听花落的声音墙头草说
无论有没有人欣赏，时节一到，花儿自然就会开放，这是自然的规律。但是多情的人们总以为花儿是为自己而开，于是在赏花之时，或惊叹于造化之功，或沉醉于迷人花香，或伤悼于满地落红……唐代诗人韩愈在观赏石榴花时，也生发出深沉的感慨，于是写下了《题榴花》一诗，原文如下：五月榴花照眼明，枝间时见子初成。可怜此地无车马，颠倒青苔落绛英。“五月榴花照眼明”，五月如火的石榴花映入眼帘格外鲜明。五月份，正是石榴花开得正盛
莆田鞋多少钱的质量好（盘点莆田鞋零售价格一览表）美鞋之家
莆田鞋多少钱的质量好（盘点莆田鞋零售价格一览表）莆田鞋，这一词汇在鞋子领域中可谓家喻户晓，以其平易近人的价格和良好的质量赢得了许多消费者的喜爱。那么，莆田鞋的价格到底是多少？它的质量又如何呢？让我们一起来盘点一下。微信:chaodao3(下单赠送精美礼品)莆田鞋零售价格在200元至700元之间，其中主要受鞋子的款式、材质和工艺影响。比如，一双常规的莆田运动鞋大约在250-400元左右，而一双高品质
2022-11-17 珍惜dxz
中原焦点团队网络初、中级28期杜小珍坚持分享第534天坚持读书第436天读《建构解决之道》收获:当情况变更糟时的可贵应对1.当情况变得更糟时，咨询师必须问明详情，了解让他们变差的情况与因素。咨询师需以尊重地态度倾听与接纳当事人描述一些突如其来的其他事件如何影响他们的生活，并多加援用“应对问句”，将会非常重要而有用。同时，咨询师还需要用开放的心去关注当事人在处理这些情境时，是否有与过去不同之处。2.
超越免费奔向自由的路上
在这个互联时代，由于社会的进步，我们亨受了很多免费的东西，比如免费的电脑操作软件，免费的杀毒软件，免费的搜索服务，雅虎的杨致远和费罗首创让互联网成为一个开放，免费的工具。后来微软用免费的方式压浏览器市场打败了当时一家独大的网景公司，一时之间，免费成了趋势，互联网传播的本质，起到了一个巨大的复印件的作用。免费带来的一个结果是迅速形成垄断，造就了googlefacebook和阿里巴巴这样的经典掉板，然
go语言安装快速入门吉祥鸟hu
[TOC]go语言是什么Go是一个开源的编程语言，它能让构造简单、可靠且高效的软件变得容易。Go是从2007年末由RobertGriesemer,RobPike,KenThompson主持开发，后来还加入了IanLanceTaylor,RussCox等人，并最终于2009年11月开源，在2012年早些时候发布了Go1稳定版本。现在Go的开发已经是完全开放的，并且拥有一个活跃的社区如何安装环境笔者这
Joey-晓得-2023-02-21 晓楠得一录
#HAIO#H:今天的HAIO恰巧是健康之我见，发现这我自己这方面的知识匮乏；聊早起，聊睡眠发现没有相关的知识做支撑~A:后面在读《心态》这本书的时候，才会明白，应该可以介绍成长型的心态，进取型的心态，开放型和外向型的心态；在说服力的介绍中明白该怎么介绍了。比如，参加HAIO的好处有:①学会成长，每日的朗读，早起，都让我们在做有价值的输入，每天正能量开启我们的生活；②学会分享，共读一本书，当听别人
【合伙人来信】它真的可以让一切问题迎刃而解吗？创业者知世
我叫张玲，今年35岁了，是两个孩子的母亲。我二十六岁结婚，婚后两年生活稳定了才要孩子，第一胎七个月的时候我在婆婆的强烈要求下辞职回家待产，因为生孩子的时候赶上老家秋收，所以从待产到坐月子都是我自己一个人。在大宝半岁的时候我准备出去工作，请婆婆从老家过来帮我带孩子，每个月给她开3000块工资，但是被她拒绝了，后来由老公出面和她聊，她才勉为其难的同意。近年二胎政策开放，婆婆一直催我再生一个，说要凑齐儿
《从怕学习到爱学习》多元思考力之科学思维瑞蔓
一、收获新知1.科学思维是一种独立思考和开放的思考方式。2.提高科学思维的方法:家长给孩子独立空间，弱化孩子依赖性。孩子的新想法和疑问，不反对，不嘲笑。鼓励孩子发表意见和想法并一起讨论。引导孩子了解世界复杂性和多变性，万事都不绝对。二、改变就知1.总担心孩子小，好多事儿考虑不到，遇到事儿家长大包大揽，没有给孩子独处学会思考的能力。2.孩子有些疑问和想法，家长总感觉是孩子不成熟的想法，没有认真对待。
以太坊DApp开发指南 Kirn
DApp架构设计DApp架构.png如上图，DApp的架构我们可以简单分为以上三种类型：轻钱包模式、重钱包模式和兼容模式。轻钱包模式轻钱包模式下我们需要有一个开放HttpRPC协议的节点与钱包通信，这个节点可以是任意链上的节点。轻钱包通常会作为一个浏览器插件存在，插件在运行时会自动注入Web3框架，DApp可以通过Web3与区块链节点通信。当DApp只是单纯的获取数据时是不需要钱包介入的，但是当D
php 实现JWT 每天瞎忙的农民工 php php
在PHP中，JSONWebToken(JWT)是一种开放标准(RFC7519)用于在各方之间作为JSON对象安全地传输信息。JWT通常用于身份验证系统，如OAuth2或基于令牌的身份验证。以下是一个基本的PHP实现JWT生成和验证的代码示例。JWT的组成部分JWT包含三个部分：Header（头部）：说明算法和令牌类型。Payload（有效载荷）：包含声明（如用户数据、过期时间等）。Signatur
母婴群如何引流？母婴社群引流和运营技巧古楼
随着三胎的开放，母婴产品的市场前景大好，但是很多做母婴产品的朋友都不知道该如何去引流，在朋友圈当中也就那么一些宝妈，局限性是很大的。今天就来和大家分享下母婴群引流的方法和技巧。大家好，我是飞儿导师，使用【高省app】网购，更便宜更划算！高省app上不但有内部优惠券，还有返利佣金，高省的返利佣金是全网最高的！手机应用商城搜索【高省】直接下载，注册时填写高省邀请码198198，直升2皇冠会员，返利佣金
2023-07-28 云汐若
书名:昆虫记文章：黑肚皮的塔兰图拉毒蛛作者：法布尔优美词汇：温柔可人、面不改色、泰然自若、天经地义、没心没肺凯旋而归、毫不客气、地地道道、稀奇古怪、三三两两丑陋不堪、豺狼虎豹、忽如其来、兴趣盎然、熠熠生辉悄无声息、黯然失色、仪态万方、一无所知、怪模怪样精彩句段：蜘蛛是真正的纺织高手、聪明的猎人，悲惨的婚姻，还有其他吸引人的特征。赏析：对蜘蛛特点的总结，体现了作者对他们进行了认真而又仔细的研究。蜘蛛
nfs服务搭建 GHope
nfs是什么？基哥度娘网络文件系统(NFS)是sun微系统最初开发的分布式文件系统协议,[1]允许客户端计算机上的用户通过计算机网络访问文件很像本地存储被访问。NFS与许多其他协议一样,在开放网络计算远程过程调用(很久以前RPC)系统上建立。NFS是在请求注释(RFC)中定义的开放标准,允许任何人实现协议。NFSNFS优势：节省本地存储空间，将常用的数据存放在一台NFS服务器上且可以通过网络访问，
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他