乄洛尘

Language Adaptive Weight Generation for Multi-task Visual Grounding 论文阅读笔记

一、Abstract
二、引言
三、相关工作
- 3.1 指代表达式理解
- 3.2 指代表达式分割
- 3.3 动态权重网络
四、方法
- 4.1 总览
- 4.2 语言自适应权重生成
- - 语言特征聚合
  - 权重生成
- 4.3 多任务头
- 4.4 训练目标
五、实验
- 5.1 数据集和评估指标
- - 数据集
  - 评估指标
- 5.2 实施细节
- - 训练
  - 推理
- 5.3 与 SOAT 方法的比较
- - REC 任务
  - RES 任务
  - 指代表达式的长度分析
- 5.4 消融分析
- 5.5 定量分析
六、结论和限制

写在前面

新的一周开始了，冲冲冲~
这篇文章是上一篇博文的参考文献之一，遂找来读读，粗略一扫，论文创新点挺好的，可惜没有提供源代码。话说，上篇浙大的不开源，这篇难道也不开源吗？那以后可能得绕道了。。。

论文地址：Language Adaptive Weight Generation for Multi-task Visual Grounding
代码地址：原文未提供
收录于： CVPR 2023
Ps：2023 年每周一篇博文阅读笔记，主页更多干货，欢迎关注呀，期待 5 千粉丝有你的参与呦~

一、Abstract

之前的方法通常以一种被动的方式利用视觉 Backbone，即以固定权重提取视觉特征，而没有表达式的参与。理想情况下，视觉 Backbone 应当主动根据表达式来提取视觉特征。于是本文基于语言自适应权重 Language Adaptive Weights（VG-LAW），提出一种主动感知视觉定位框架。通过不同表达式生成的动态权重将视觉 Backbone 作为一个特定表达式的特征提取器，不需要额外的跨模态交互模块。实验表明方法很有效。

二、引言

首先指出视觉定位的含义，难点，应用。之前的方法通常采用通用的目标检测框架，且重点关注跨模态交互模块的设计。然而采用固定结构来提取视觉特征可能会导致提取出的视觉特征和表达式不匹配，例如存在缺失或冗余的特征。如下图所示：

一些特征可视化例子如下图所示：

有一些方法已经注意到这一现象并提出相应的解决办法，例如 QRNet 和 LAVT，通过嵌入设计的交互模块，例如 QD-ATT、PWAN 到每个阶段的末尾。然而这一先提取后调整的策略无法避免包含大量固定权重提取出来的特征。于是本文采用一种更简单且细粒度的计划来修改视觉 Backbone 的权重。如图 1 c 所示。
本文基于语言自适应权重 Language Adaptive Weights（VG-LAW），提出一种主动感知视觉定位框架。通过将指代表达式注入权重中，从而动态调整视觉 Backbone 的权重。具体来说，VG-LAW 首先通过两个连续的特征聚合和权重生成得到语言特征的自适应权重，用于视觉 Backbone。然后语言感知的视觉 Backbone 能在无需手动修改视觉 Backbone 结构的情况下提取相关表达式的视觉特征，因此无需额外的跨模态融合。进一步地，基于表达式的相关特征，提出一种轻量、整洁的多任务预测头用于指代表达式理解 REC 和指代表达式分割 RES 任务。

文本贡献总结如下：

基于语言自适应权重 Language Adaptive Weights（VG-LAW），提出一种主动感知视觉定位框架。能够在无需手动修改视觉 Backbone 框架的情况下主动地提取相关表达式的视觉特征。
能够直接用于 REC 和 RES 任务，无需设计跨模态注意力模块。
实验表明达到了 SOTA 的结果。

三、相关工作

3.1 指代表达式理解

得益于注意力机制，最近基于 Transformer 的方法能够有效捕捉模态内部和模态间的上下文交互信息。

3.2 指代表达式分割

最近的研究利用 Transformer 来实现跨模态交互，已达到优越的性能，但所有的这些方法要么通过调整输入，要么修改固定网络权重的结构来实现跨模态交互。

3.3 动态权重网络

网络能够自适应地动态调整权重。根据其生成方式，大致分为三种：使用可学习的 embedding 或中间特征作为输入，使用全连接层直接生成动态权重；将可学习权重进行求和，这被认为是混合专家，可能会导致优化困难；用矩阵分解的方式得到权重，最终的权重通过计算一些矩阵的乘法生成。

四、方法

4.1 总览

VG-LAW 框架由四个部分组成，语言 Backbone、语言自适应权重生成器、视觉 Backbone、多任务头。

给定一个指代表达式，N 层的 BERT 语言编码器将表达式 tokenizes，再前置一个 [CLS] token，提取出语言特征 $F_l\in\times{R}^{L\times d_l}$ ，其中 $L$ 和 $d_l$ 分别表示 token 的数量和维度。之后将 $F_l$ 送入语言自适应权重生成器得到权重，用于视觉 Backbone。

接下来，给定一张图像 $I\in\times{R}^{3\times H\times W}$ ，通过视觉 Backbone 提取出表达式感知的视觉特征 $F_v\in\mathbb{R}^{C\times\frac{H}{s}\times\frac{W}{s}}$ ，其中 $C$ 、 $s$ 分别表示通道数量和步长。最后，将 [CLS] token 表示的语言特征 $F_l^1\in\mathbb{R}^{{d}_l}$ 和视觉特征送入多任务头中，预测指代表达式的 bounding box 和 mask。

4.2 语言自适应权重生成

语言特征聚合

考虑到指代表达式对应的是不同数量的语言 tokens，且视觉 Backbone 的每层可能会倾向于不同的语言 tokens，于是尝试用固定尺寸聚合每层的语言特征。根据多头注意力机制，引入一个可学习的特定层 embedding $e_i\in\mathbb{R}^{d_l}$ 用于视觉 Backbone 的第 $i$ 层，动态提取特定层的语言特征。将 $e_i$ 和 $F_l$ 分为 $G$ 组，对于每一个组 $g$ ，令逐 token 注意力 $\alpha_{i}^{g}\in[0,1]^{L}$ 为 $e_i^g$ 和 $F_l^{g}$ 的 Softmax 点乘：
$\alpha_{i}^{g}=\mathrm{Softmax}([e_{i}^{g}\cdot F_{l}^{g,1},e_{i}^{g}\cdot F_{l}^{g,2},\cdots,e_{i}^{g}\cdot F_{l}^{g,L}])$ 然后对特征拼接得到聚合的语言特征 $h_0^i\in\mathbb{R}^{d_l}$ ：
${h_{0}^{i,g}}=\sum_{j=1}^{L}\alpha_{i}^{g,j}F_{l}^{g,j}$ 最后，使用全连接层 (FC) 减少其维度，用于视觉 Backbone 的第 $i$ 层：
$h_{1}^{i}=\delta(W_{1}^{i}h_{0}^{i})$ 其中 $W_{1}^{i}\in\mathbb{R}^{d_l\times d_h}$ 将维度降低为 $d_h=d_l/r$ ， $r$ 为减少比例， $\delta$ 表示 GeLU 激活函数。

权重生成

基于指代表达式，生成语言自适应的权重用于生成视觉 Backbone 中的 qeury $X_q$ ，Key $X_k$ ，Value $X_v$ ：
$X_q=\theta(X;W_q),X_k=\theta(X;W_k),X_v=\theta(X;W_v)$ 其中 $\theta(\cdot;W)$ 表示线性投影， $X$ 表示输入的视觉特征。 $W_q,W_k,W_v{\in}\mathbb{R}^{d_{out}\times d_{in}}$ 是用于生成 query，key，value 的动态投影权重。 $d_{in}$ 和 $d_{out}$ 是特征 $X$ 和 query/key/value 的维度。

$d_{out}\times d_{in}$ 还不足以用全连接层直接生成权重，例如 Hypernetworks。通过 K 个静态核的加权求和生成权重，DynamicConv 和 CondConv 能够缓解这一问题，但很难优化。于是根据动态通道融合 dynamic channel fusion，尝试用矩阵分解的方法生成动态权重。拿第 $i$ 层的 ViT 块举例：
$[W_q^i,W_k^i,W_v^i]=W_0^i+P\Phi(h_1^i)Q^T$ 其中 $W_0^i\in\mathbb{R}^{d_{out}\times d_{in}}$ 为特定层的静态可学习权重。 $P\in\mathbb{R}^{d_{out}\times d_{w}}$ 和 $Q\in\mathbb{R}^{d_{in}\times d_{w}}$ 也是静态可学习权重，在所有 ViT 块中共享。 $\Phi(h_1^i)$ 为全连接层，以聚合的语言特征 $h_1^{i}$ 为输入，生成形状为 $d_w\times d_w$ 的动态矩阵。

dynamic channel fusion：Yunsheng Li, Yinpeng Chen, Xiyang Dai, Dongdong Chen, Ye Yu, Lu Yuan, Zicheng Liu, Mei Chen, Nuno Vasconcelos, et al. Revisiting dynamic convolution via matrix decomposition. In ICLR, 2020. 3, 4

4.3 多任务头

多任务头中有两个分支分别用于 REC 和 RES 任务。

对于 REC 分支，直接应用坐标回归来预测指代目标的 Bounding box。为了池化 $2 - d$ 视觉特征，提出一个语言自适应的池化模块 language adaptive pooling module (LAP)，使用语言自适应的注意力来聚合视觉特征。具体来说，视觉特征 ${\{F_{v}^{i,j}\}}\in\mathbb{R}^{C\times\frac{H}{s}\times\frac{W}{s}}$ 和语言特征 $F_l^1\in\mathbb{R}^{d_l}$ 首先投影到低维度空间 $\mathbb{R}^{k}$ ，并计算其点乘相似度的 softmax 归一化后的注意力权重 $A\in\mathbb{R}^{\frac Hs\times\frac Ws}$ 。然后通过计算注意力权重 $A$ 的求和来聚合视觉特征。最后，将聚合后的视觉特征送入三层全连接层，Sigmoid 函数用于预测指代的 bounding box $\hat b=(\hat x,\hat y,\hat w,\hat h)$ 。

对于 RES 分支，应用二分类沿着视觉特征的空间维度来预测指代目标的 mask。具体来说，视觉特征 $F_v$ 首先采用连续的转置卷积上采样到 $\hat{F_{v}}\in\mathbb{R}^{d_{l}\times\frac{{H}}{4}\times\frac{W}{4}}$ ，然后在每个视觉特征上使用线性投影 $\theta(\cdot;W)$ 得到中间的分割图 $\bar{s}\in\mathbb{R}^{\frac H4\times\frac W4}$ ，其中 $W=F_l^1$ 。最后在 $\bar s$ 上使用双线性插值上采样得到全分辨率分割 mask $\hat s\in\mathbb{R}^{H\times W}$ ，后接一个 Sigmoid 函数。

4.4 训练目标

对于 REC，给定预测的 bounding box ${\hat{b}}=(\hat{x},{\hat{y}},\hat{w},\hat{h})$ 和 GT box $b = (x, y, w, h)$ ，检测损失为：
$\mathcal{L}_{det}=\lambda_{L1}\mathcal{L}_{L1}(b,\hat{b})+\lambda_{giou}\mathcal{L}_{giou}(b,\hat{b})$ 其中 $\mathcal{L}_{L1}(\cdot)$ 和 $\mathcal{L}_{giou}(\cdot)$ 分别表示 L1 损失和通用 IoU 损失， $\lambda_{L1}$ 和 $\lambda_{giou}$ 为控制损失函数的相关权重。
对于 RES，给定预测的 mask $\hat s$ 和 GT $s$ ，分割损失定义为：
$\mathcal{L}_{seg}=\lambda_{focal}\mathcal{L}_{focal}(s,\hat{s})+\lambda_{dice}\mathcal{L}_{dice}(s,\hat{s})$ 其中 $\mathcal{L}_{focal}(\cdot,\cdot)$ 和 $\mathcal{L}_{dice}(\cdot,\cdot)$ 分别表示 focal 损失和 DICE/F-1 损失， $\lambda_{focal}$ 和 $\lambda_{dice}$ 为控制两个分割损失的相关权重。本文提出的框架可以同时训练 REC 和 RES 任务，其共同训练损失函数为：
$\mathcal{L}_{total}=\mathcal{L}_{det}+\mathcal{L}_{seg}$

五、实验

5.1 数据集和评估指标

数据集

RefCOCO、RefCOCO+、RefCOCOg、ReferItGame。

评估指标

分别使用 $P rec @0.5$ 和 $m I o U$ 来评估 REC 和 RES 的性能。

5.2 实施细节

训练

输入图像尺寸 $448\times448$ 。视觉 Backbone ViT-Base，采用 ViTDet 中的自适应方法将视觉 Backbone 应用于高分辨率图像。预训练使用 Mask R-CNN 在 MS-COCO 上，除去 val/test 子集。 $W_0^i$ 和 $\Phi(h_1^i)$ 采用相应的视觉 Backbone 权重和 0 来初始化。表达式的最大长度 40，无级联的 6 层 BERT 作为语言 Backbone 来提取语言特征。 $\lambda_{L1}$ 和 $\lambda_{giou}$ 设为 1， $\lambda_{focal}$ 和 $\lambda_{dice}$ 设为 4。减少率 $r$ 设为 16。视觉和语言 Backbone 的初始学习率 $4 e - 5$ ，剩下部分的学习率 $4 e - 4$ 。AdamW 优化器，90 epochs，batch size 256，权重衰减 $1 e - 4$ 。在第 10 和 60 个 epochs 乘 10%。数据增强：水平翻转。NVIDIA A100 GPUs（不差钱）。

推理

推理时，输入图像尺寸 $448\times448$ ，表达式的最大长度 40。RES 的二值化阈值设为 0.35。无需后处理，直接输出 bounding box 和分割 mask。

5.3 与 SOAT 方法的比较

REC 任务

RES 任务

指代表达式的长度分析

5.4 消融分析

5.5 定量分析

六、结论和限制

基于语言自适应权重，本文提出一种主动感知框架 VG-LAW 用于视觉定位。VG-LAW 能够直接注入表达式的信息到视觉 Backbone 的权重中而无需修改其结构。实验效果很好。

限制主要有两点：VG-LAW 在可解释性方面差，整体推理过程隐式，很难理解推理过程；多任务头一次预测一个实例，限制了其在短语定位中的应用。

写在后面

这篇文章创新点很足，算是打开了另一种思路。写作上也不拖沓，就是代码能不能开源呀？这么好的文章就别藏着掖着了。看看人家 LAVT。

JQ实现异步请求的几种方法 CsharpDev-奶豆哥开发语言 javascript
在jQuery中，实现异步请求（AJAX）有多种方法。以下是几种常见的实现方式及其示例代码。1.$.ajax()方法$.ajax()是jQuery中最通用的AJAX方法，支持高度定制化。示例$.ajax({url:'你的请求地址',//请求URLmethod:'GET',//请求方法dataType:'json',//预期返回的数据类型success:function(response){cons
使用Java实现Oracle表结构转换为PostgreSQL的示例方案(AI) 秉承初心 AI创造 java oracle postgresql
核心代码importjava.sql.*;importjava.util.ArrayList;importjava.util.HashMap;importjava.util.List;importjava.util.Map;publicclassOracleToPGConverter{//类型映射表privatestaticfinalMapTYPE_MAPPING=newHashMapcolumn
【3D模型】【游戏开发】【Blender】Blender模型分享-狮头木雕附导入方法踏雪无痕老爷子资源介绍 3d blender
导入方法：[Blender]如何导入包含纹理的.blend模型文件在3D建模和渲染工作中，Blender是一款功能强大的免费开源软件。很多时候，我们需要导入.blend后缀的模型文件，同时确保纹理（textures）文件夹中的贴图能够正确加载。本文将介绍详细的导入步骤以及可能遇到的问题和解决方案。1.直接打开.blend文件如果你的.blend文件是一个完整的工程文件，包含了模型和纹理，直接打开即
小黑笔记本，写的todolist效果，增删效果，显示隐藏，全部清除效果。 YangHuan3 html
先说一下总的大致要去实现的效果：1.新增2.删除3.统计4.清除5.隐藏给大家看一下todoList的大致样式吧！第一个效果：新增1.生成列表结构（v-for数组）2.获取用户输入（v-model）3.回车获取数据（v-on，enter添加数据）第二个效果：删除1.点击删除指定的内容（v-onsplice索引）通过对应的下标删除指定的元素，并且v-for指定的内部是可以获取到当前循环元素下标的，这
【OpenCV C++】如何快速高效的计算出图像中大于值的像素个数？遍历比较吗？ No，效率太低！那么如何更高效？ R-G-B OpenCV C++opencv c++计算机视觉
文章目录1问题2分析3代码实现（两种方法实现）方法1:使用cv::compare方法2:使用cv::threshold3.2compare和threshold看起来都有二值化效果？那么二者效率？4compare函数解释4.1参数解释4.2底层行为规则4.3应用示例4.4典型应用场景1问题一幅图像的目标区域ROI尺寸为60*35的灰度图，快速计算出大于backVal的像素个数，其中backVal=2
10 分钟学会SpringValidation数据校验和全局异常处理 ohn.yu spring spring boot java
以下是一个使用Spring开发的简单RESTAPI小程序，通过对一张user表进行操作，代码演示如何RestAPI开发中实现数据校验、全局异常处理和返回Json格式数据。使用的核心框架包括SpringBootSpringWebSpringDataJPABeanValidation（JSR-303）Lombok1.项目依赖（pom.xml）创建一个Maven项目，添加以下依赖："xmlns:xsi=
leetcode501-二叉搜索树中的众数记得早睡~ 算法小课堂 leetcode 算法 javascript 数据结构
leetcode501思路由于是二叉搜索树，那么我们知道它的特性：使用中序遍历得到的是从小到大排序的，所以我们利用这个规则，使用count来统计每次出现一个新的数的总个数，maxCount统计最大的个数值，result来存储二叉树中的众数，也就是要得到的结果值，pre用于统计前一个节点值初始化定义好值以后，我们需要使用中序遍历，中间处理逻辑值当pre还不存在的时候或者前一个节点跟后一个节点不相同时
leetcode530-二叉搜索树的最小绝对值记得早睡~ 算法小课堂 leetcode typescript javascript 算法数据结构
leetcode530思路这里题目有确切说明这个二叉树是：二叉搜索树那么我们可以想到二叉搜索树的特性，利用中序遍历：左中右得到的结果是从小到达排列的所以我们就只需要计算出每一个节点和前一个节点之间的差值，然后保存最小的差值就是本题答案所以我们在中序遍历的过程中需要存储最小的差值，我们首先初始化result为无穷大，还需要存储前一个节点，用于进行比较，每次遍历到一个节点的时候，我们比较resul和r
在Ubuntu上安装MEAN Stack的4个步骤 ubuntu
在Ubuntu上安装MEANStack的4个步骤为：1.安装MEAN；2.安装MongoDB；3.安装NodeJS，Git和NPM；4.安装剩余的依赖项。什么是MEANStack？平均堆栈一直在很大程度上升高为基于稳健的基于JavaScript的开发堆栈。名称的意思是指其组件;MongoDB，ExpressJS，Angularjs和NodeJS。第1步：安装MEAN对于此安装，我们将在本指南中使用
NestJs bull 用法在你之后 node.js
bull简介队列bullbull用法https://github.com/OptimalBits/bullBulliscurrentlyinmaintenancemode,weareonlyfixingbugs.FornewfeaturescheckBullMQ,amodernrewrittenimplementationinTypescript.Youarestillverywelcometou
设计模式-单一职责原则 qq_26920109 java java 设计模式深圳
单一职责原则（SRP：Singleresponsibilityprinciple）又称单一功能原则，原话解释是：thereshouldneverbemorethanareasonofaclasstochange,也就是引起类的变化原因不能超过一个，面向对象五个基本原则（SOLID）之一。该原则由罗伯特·C·马丁（RobertC.Martin）于《敏捷软件开发：原则、模式和实践》一书中给出的。马丁表
设计模式六大原则(一)--单一职责原则 109702008 #java 单一职责原则人工智能设计模式
GPT-4o(OpenAI)单一职责原则（SingleResponsibilityPrinciple，SRP）是面向对象设计中的一条基本原则。该原则的核心思想是：一个类应该只有一个引起它变化的原因。换句话说，一个类应该只有一个职责（即一个功能或动机）。单一职责原则的要点包括：1.职责单一：一个类只负责完成一类功能，并且尽量将功能模块化，使其职责清晰。例如，如果一个类既负责数据处理，又负责数据展示，
【ES6】05-Promise + Fetch + Axios + 模块化 + 同步异步 beibeibeiooo ES6【已完结】es6 javascript 前端
本文介绍Promise+Fetch+Axios+模块化+同步异步目录1.Promise1.1Promise简介1.2resovle1.3reject&finally2.Fetch2.1get请求2.2post请求3.Axios4.模块化开发5.同步异步同步异步asyncawait1.Promise1.1Promise简介Promise是一个对象，表示承诺在未来的某个时刻可能会完成并返回结果对于某些
HPC综合-心得与笔记【19】 sakura_sea HPC and 3D Graphics Engine 线性规划
Dijkstra算法【2】基础距离数组dist，设置起点距离为0，其他节点距离为无穷大（∞）用最小堆创建优先队列，将起点放入队列。从队列中取出当前距离最小的节点u。遍历u的每个邻接节点v，计算从起点到v的路径长度：alt=dist[u]+weight(u,v)。如果altdist[u]:continue#遍历邻接节点forv,weightingraph[u].items():alt=dist[u]
C++20 新特性全面解析：从概念到协程的编程革命小乌龟登顶记 java 算法数据结构
一、引言：C++20的里程碑意义2020年发布的C++20标准被公认为继C++11之后最重要的版本更新，带来了4大核心特性和20+项重大改进。这些变革不仅提升了代码表达力，更从根本上改变了C++的编程范式。本文将深入解析C++20的关键特性，并通过实战代码示例演示其应用场景。二、四大核心特性详解2.1概念（Concepts）：模板编程的革命基本概念类型约束：通过requires子句限制模板参数类型
《算法笔记》9.4小节——数据结构专题(2)-＞二叉查找树（BST）问题 A: 二叉排序树圣保罗的大教堂《算法笔记》算法
题目描述输入一系列整数，建立二叉排序数，并进行前序，中序，后序遍历。输入输入第一行包括一个整数n(1#include#include#include#include#include#include#include#include#include#include#include#include#include#defineINF0x3f3f3f3f#definedb1(x)coutleft);Fre
Selenium实战-模拟登录淘宝并爬取商品信息_使用selenium模拟真实登录行为,并爬取商品评论数据。 2401_84009899 程序员 selenium python 测试工具
模拟淘宝登录deflogin_taobao():print(‘开始登录…’)try:login_url=‘https://login.taobao.com/member/login.jhtml’driver.get(login_url)input_login_id=wait.until(EC.presence_of_element_located((By.ID,‘fm-login-id’)))in
小红书app复制链接转换为直接可访问链接，网页版链接，小红书短链转长链（最新版）才华是浅浅的耐心 python 爬虫开发语言
简介：小红书手机app分享的链接需要点击才能获取完成链接，本文教大家如何通过代码的方式将xhs的短连接转化为长链接。1.正常我们分享的链接是这样的：44小猪吃宵夜发布了一篇小红书笔记，快来看吧！KeA1GIGiSMXGWy7http://xhslink.com/a/sT7omKb6ijX6，复制本条信息，打开【小红书】App查看精彩内容！转换后是这样的：https://www.xiaohongsh
uniapp微信小程序分享给好友朋友圈-封装全局分享不法 uniapp 小程序 uni-app 小程序前端
不封装直接使用onLoad同级onLoad(){},//1.发送给朋友onShareAppMessage(res){console.log("res",res);console.log("page",uni.$u.page());if(res.from==='button'){//来自页面内分享按钮return{title:'首页',path:'/pages/home/home',imageUrl
uniapp接口请求封装api(超简单) 不法 uniapp javascript 前端 json uni-app
最下面有使用方法进阶点击查看进阶封装根目录创建api.jsconstcommoneUrl="http://192.168...";//公共路径//post请求封装functionpostRequest(url,data){varpromise=newPromise((resolve,reject)=>{varpostData=data;uni.request({url:commoneUrl+url
纳米尺度仿真软件：Quantum Espresso_（21）.并行计算与性能优化 kkchenjj 分子动力学2 性能优化模拟仿真分子动力学仿真模拟
并行计算与性能优化在纳米尺度仿真中，计算资源的需求往往非常庞大。为了提高计算效率和缩短计算时间，并行计算和性能优化成为不可或缺的技术手段。QuantumEspresso作为一个开源的量子力学仿真软件，提供了多种并行计算的机制和性能优化的方法。本节将详细介绍如何在QuantumEspresso中实现并行计算和性能优化，以提升仿真任务的效率。并行计算的基本概念并行计算是指同时使用多个计算资源（如多核处
纳米尺度仿真软件：Quantum Espresso_（19）.输运性质计算 kkchenjj 分子动力学2 模拟仿真仿真模拟分子动力学
输运性质计算在纳米尺度仿真软件中，输运性质计算是研究材料和器件中电荷和热能输运的重要工具。QuantumEspresso提供了多种方法来计算输运性质，包括使用非平衡格林函数（NEGF）和传输矩阵方法（TMM）。本节将详细介绍如何使用QuantumEspresso及其相关模块进行输运性质的计算，包括设置计算参数、运行模拟以及分析结果。1.非平衡格林函数（NEGF）方法1.1.原理非平衡格林函数（NE
uniapp的安卓app 定位权限被拒绝后，询问是否开启授权并跳转到手机设置页面绣**** 前端基础 uni-app
uniapp的安卓app定位权限被拒绝后，询问是否开启授权并跳转到手机设置页面询问是否授权定位->拒绝定位授权->再次访问提示是否打开授权->跳转至手机设置页面uni.getLocation({type:'gcj02',success:res=>{this.latitude=res.latitudethis.longitude=res.longitude},fail:error=>{console
高级java每日一道面试题-2025年3月03日-微服务篇[Eureka篇]-Eureka自我保护机制是什么? java我跟你拼了 java每日一道面试题 java 微服务 eureka SpringCloud SpringBoot 自我保护机制出发条件
如果有遗漏,评论区告诉我进行补充面试官:Eureka自我保护机制是什么?我回答:在Java高级面试中，Eureka的自我保护机制（Self-PreservationMode）是一个非常重要且常被提及的话题。理解这一机制的工作原理及其应用场景对于构建高可用性的微服务架构至关重要。以下是结合提供的内容对Eureka自我保护机制的详细解析和综合概述：自我保护机制的概念Eureka的自我保护机制是一种容错
thinkphp5模型查询数据库，查出来的字段直接修改成另外的名字知码客个人随笔 thinkphp5 php开发
在ThinkPHP5中，如果你希望在查询数据库时将返回的字段名直接修改为其他名称，可以通过以下几种方式实现：方法1：使用field方法指定字段别名在查询时通过field方法直接为字段指定别名（使用AS关键字）。示例代码：//使用Db类查询$result=Db::name('user')->field('idASuser_id,nameASfull_name')->select();//使用模型查询
使用 request 的 axios 状态码分析 fridayCodeFly 前端 servlet
request.interceptors.response.use(function(response){},function(error){})后端返回结果code===400不经过response,直接跳到error。当后端返回状态码为400时直接进入error回调而不经过response回调，这是因为axios默认会将状态码不在200-299范围内的响应视为错误。解决1.修改validate
C# 技术使用笔记：如何高效处理字符串 caifox菜狐狸 C#技术使用笔记 c#笔记 string StringBuilder Substring Replace Split
1.C#字符串基础概念1.1字符串不可变性在C#中，字符串具有不可变性，这意味着一旦创建了一个字符串对象，其内容就不能被修改。例如，当我们执行以下代码时：stringstr="Hello";str=str+"World";实际上，str+"World"并是修改了原来的"Hello"字符串，而是创建了一个全新的字符串对象"HelloWorld"，并将str的引用指向了这个新对象，原来的"Hello"
uniapp实现全局拖拽按钮学如逆水，不进则退 uni-app vue.js javascript
要先引入“vue3-draggable-resizable”:“^1.6.5”1.创建DragComponent组件import{ref,onMounted,onUnmounted}from'vue';importVue3DraggableResizablefrom'vue3-draggable-resizable';import'vue3-draggable-resizable/dist/Vue
TCP/IP学习笔记(5) --IP选路 ox0080 Linux 网络 linux网络
静态IP选路一个简单的路由表选路是IP层最重要的一个功能之一。前面的部分已经简单的讲过路由器是通过何种规则来根据IP数据包的IP地址来选择路由。这里就不重复了。首先来看看一个简单的系统路由表。命令:routeprint|more对于一个给定的路由器，可以打印出五种不同的flag。U表明该路由可用。G表明该路由是到一个网关。如果没有这个标志，说明和Destination是直连的，而相应的Gatewa
FerretDB 2.0：开源 MongoDB 替代品的安装与使用指南田猿笔记 MongoDB 开源数据库 FerretDB
介绍FerretDB2.0是一个开源数据库，旨在作为MongoDB的替代品。它与MongoDB5.0+的驱动程序和工具兼容，适合需要避免MongoDB许可复杂性的开发者。它的核心特点是使用PostgreSQL作为后端，并通过DocumentDB扩展提升性能，研究表明某些工作负载可快20倍。安装与使用安装FerretDB2.0使用dockercompose需要以下步骤：创建docker-compos
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S

Language Adaptive Weight Generation for Multi-task Visual Grounding 论文阅读笔记

Language Adaptive Weight Generation for Multi-task Visual Grounding 论文阅读笔记

一、Abstract

二、引言

三、相关工作

3.1 指代表达式理解

3.2 指代表达式分割

3.3 动态权重网络

四、方法

4.1 总览

4.2 语言自适应权重生成

语言特征聚合

权重生成

4.3 多任务头

4.4 训练目标

五、实验

5.1 数据集和评估指标

数据集

评估指标

5.2 实施细节

训练

推理

5.3 与 SOAT 方法的比较

REC 任务

RES 任务

指代表达式的长度分析

5.4 消融分析

5.5 定量分析

六、结论和限制

你可能感兴趣的:(RIS_REC,论文阅读,笔记,transformer,深度学习,REC,RES)