乄洛尘

Regularizing Attention Networks for Anomaly Detection in Visual Question Answering 论文笔记

一、Abstract
二、Introduction
三、The Framework of VQA Models
四、Definition of Anomalies in VQA
- 4.1 Out-of-distribution Image & Question
- - 4.1.1 Task 1: Image from Out-of-Distribution
  - 4.1.2 Question from Out-of-distribution
  - 4.1.3 Image/Question from Out-of-Distribution
- 4.2 Unanswerable Pair of Image & Question
- - 4.2.1 Task 4: Irrelevant Question
  - 4.2.2 Undefined Answer
- 4.3 Anomaly Detection in VQA
- - 4.3.1 Confidence-based Anomaly Detector
  - 4.3.2 Attention-based Anomaly Detection
  - 4.3.3 Regularization of Attention Networks for Anomaly Detection
五、实验
- 5.1 Experimental Setup
- - 5.1.1 VQA Models
  - 5.1.2 Datasets
  - 5.1.3 Traing Setup
  - 5.1.4 Evaulation
- 5.2 Compared Methods for Anomaly Detection
- 5.3 Evaluation of VQA Accuracy
- 5.4 Out-of-Distribution Detection (Task 1-3)
- 5.5 Attention-based Anomaly Detection
- 5.6 The Effect of Regularization of Attention Networks
- 5.7 Irrelevant Question Detection (Task 4)
- 5.8 Undefined Answer Detection (Task 5)
- 5.9 Ablation Study
- - 5.9.1 Selection of Anomaly Datasets for Regularization
  - 5.9.2 Scope of Post-Training for Outlier Exposure
六、相关工作
七、Conclusions

写在前面
这是一篇关于VQA模型鲁棒性的文章，笔者也是第二次接触这类文章，(打个小广告，上一次的文章已经写出来了，关注一下即可获取最新关于VQA论文解读)，文章读起来还是有那么一点拗口的，主旨是提出了对于VQA模型的5种反常场景，判断模型能不能够识别出来 and 作者提出的注意力方法来识别这五种场景。

论文地址：gularizing Attention Networks for Anomaly Detection in Visual Question Answering
代码地址：Github，开源了但是没全开，估计得等一段时间
收录于 AAAI 2021

一、Abstract

目前仅有少量研究关注于VQA模型可能会遇到反常/异常场景的问题，本文评估了VQA模型对5种反常场景下的鲁棒性。之前单模态方法不能从VQA模型的输出的最大置信度答案中检测出输入是否不正常，一些后训练VQA模型输出的方法，例如离群值曝光，也不行。
因此，本文提出一种基于注意力的方法，在输入的图像和问题之间进行置信度推理。此外，本文表明了一种最大正则化的注意力网络能够显著提升基于注意力的VQA模型对于异常场景的检测精度。另外，本文提出的方法可以应用到不同的跨模态注意力VQA模型中，进一步增强了对反常输入的鲁棒性。

二、Introduction

先讲一下视觉问答的意义，接下来提出问题：对于VQA模型的鲁棒性评估还停留在早期的研究上。
接下来对单模态如何处理进行举例，例如maximum softmax probability (MSP) 或者后训练的方法，那么问题来了，这些方法只能关注图像 or 文本方面单模态的异常检测，而对于多模态的输入，例如VQA之前还没有这么干（研究）过。本文根据两种标准：1、是否图像 and/or 问题来自同一分布或者不同分布；2、同一分布内的图像和问题能否被模型回答，将VQA中的反常场景分成五类。对于这五类分布，所划分的类别是不连续的，并且全都是并行的，其中包括有最糟糕的场景；最频繁的场景；当前VQA模型受限制的场景。
之后，作者提出一种简单的基于注意力的方法来校正VQA模型预测出的置信度并且需要探测出VQA模型的反常输入。作者的发现：使用率最高的MSP方法仅仅能够探测出答案在候选样本集合中的样本，对于那些最糟糕的场景 or 最频繁的场景——那些非同一图像/问题分布以及无关的图像问题对都不能检测出来。因此本文采用一种跨模态注意力VQA模型来关联输入图文对中最相关的视觉目标和问题词。然而对于异常的输入，VQA模型，跨模态注意力同样不能关联到所给的图像和问题，但是这种反常输入可以根据maximum attention probability (MAP) 对那些低置信度的值进行简单的检测。
为了增强VQA模型对于反常输入的鲁棒性，本文提出一种跨模态注意力分布的最大交叉熵正则化方法用于不同的VQA模型。与后训练离群值的方法相比，将本文提出的方法应用于后训练中，能够显著增强MAP的异常检测能力，同时保持VQA模型的精度。另外作者也对用于后训练的反常场景的选择进行了讨论，因为这些样本需要增强VQA模型的鲁棒性。
本文的主要贡献如下：

第一个研究了VQA模型本文所定义的五种反常情景下的表现及鲁棒性，表明了单模态中管用的反常检测方法不能简单地泛化到例如VQA这样的多模态任务中；
提出的基于注意力的反常检测方法是模型无关的，简单且有力，能够用于不同的注意力模型；提出的最大化交叉熵正则化能够增强VQA模型鲁棒性并保持VQA模型的精度。
本文提出的跨模态注意力模型对于检测多模态输入中的反常情况来说是最关键的。

三、The Framework of VQA Models

这一块就直接过了，正常的VQA模型流程，总结起来就一个公式：
$\theta^{*}=\underset{\theta}{\operatorname{argmax}} \mathbb{E}_{p_{\mathcal{D}}}\left[\log p_{\theta}(\mathbf{a} \mid \mathbf{v}, \mathbf{q})\right]$

四、Definition of Anomalies in VQA

考虑3种情况：1、最糟糕的场景；2、最频繁的场景；3、当前VQA模型的限制。根据这三点，将反常情形大致定义为分布外的图像/问题以及无法回答出的图像问题对（包含无关的问题和尚未定义的答案），因此有这5种反常情形来评估VQA模型的鲁棒性：

这五种类型并不相交且为平行关系，下面是具体案例：

4.1 Out-of-distribution Image & Question

典型的反常场景，例如VQA-CPv2数据集，即反常样本的来源与训练数据来源不同。

4.1.1 Task 1: Image from Out-of-Distribution

第一种类型，只有图片来源于外部数据，表示为 $p(V_{out})$ ，这种情况下的问题仍然是能够回答的，但是回答出的答案不能保证，只能选择置信度最大的答案进行输出。这种情况下的模型总是不可靠的或者出现过拟合训练集的答案，如VQA-CPV2数据集，举例：

4.1.2 Question from Out-of-distribution

第二种反常类型，问题来源于外部分布，即输入的问题是之前没见过的类型，表示为： $p(q_{out})$ ，那么没见过的只有没有疑问词的陈述句了。而对于这类问题，VQA模型的输出只能是拒绝回答，因为没有正确答案可供选择。本文评估模型是否能够区分出这种陈述句的问题。

4.1.3 Image/Question from Out-of-Distribution

这种就是上面两种的组合了，图像和问题均来源于外部分布，表示为 $p(V_{out})~ \& ~p(q_{out}))$ 。尽管现实中很难见到这种分布，但是为了使分布完整，所以就包含了这种类型。

4.2 Unanswerable Pair of Image & Question

由于问题无关导致或者模型能力受限，导致正确答案不存在，所以使得问题回答不出来，而这也是最频繁的反常场景，因为每个图像-问题对对于训练样本来说都是类似的？(如何理解？)

4.2.1 Task 4: Irrelevant Question

第四种任务，每一个样本都有一个和图像不相关的问题。与4.1不包含疑问词的问题不同，这里的问题指的是问题与所给输入图像无关，分布外的问题同样也包含在这个任务内，当然也包含一些分部内的问题对，表示为 $p_{out}(q_{in}|v_{in})$ 。对于任务4来说，如果图像-问题对之间彼此无关联，那么正确答案要么需要外部知识或者答案并不存在。

4.2.2 Undefined Answer

第五种反常类型，每一个样本都有一种未定义的答案，该答案不存在于预定义的答案候选集合 $p({\text a}_{out}\mid{v_{in}},q_{in})$ 。而未定义的问题不能被回答，原因不在于任何输出对的反常，而是受到预定义的答案集合的限制。主要原因可能是：混乱的问题，匿名以及颗粒度的答案？需要阅读数量或者文本足够多？

4.3 Anomaly Detection in VQA

这一部分就是对反常检测的引入了，前提假设不涉及外部数据或者模型结构的修改。具体来说：首先，介绍一种基于置信度的反常检测器及其限制；之后提出最大注意力得分作为推理置信度来校准预测的得分。坑的地方在这里，作者所说进一步分类这种检测到的问题留待将来的工作，也就是说本文只提出问题，不解决？

4.3.1 Confidence-based Anomaly Detector

给出一个反常检测器:
$g(\mathbf{v}, \mathbf{q})=\left\{\begin{array}{cc} 1 & \text { if } S(\mathbf{v}, \mathbf{q}) \leq \delta \\ 0 & \text { else } \end{array}\right.$
得分为 $S$ ，当 $S\leq \delta$ 时，即为反常场景，这里最重要的就是阈值 $\delta$ 的选择了，一般采用额外的验证集用于查明该值。接下来是 $S$ 值的计算，采用softmax的方式加载MSP上，即：
$\begin{aligned} S(\mathrm{v}, \mathrm{q} ; T) &=\max _{i} p_{\theta}\left(\mathrm{a}_{i} \mid \mathrm{v}, \mathrm{q} ; T\right) \\ &=\max _{i} \frac{\exp \left(f_{i}(\mathrm{v}, \mathrm{q}) / T\right)}{\sum_{j=1}^{N} \exp \left(f_{j}(\mathrm{v}, \mathrm{q}) / T\right)}, \end{aligned}$ 其中 $f_{j}$ 为最后一层类别分类器的输出， $N$ 为答案候选集合的数量， $T$ 为温度超参数，从 $T = 1$ 增加意味着提升数据外分布的校准置信度。这里给出为什么要采用温度尺度的原因：能够检测到OOD的样本，采用BCE训练，原因是有多种正确的答案。
但是MSP仍然不行，原因：

MSP对于检测指标来说还不具有极高说服力，无论输入是否来源于反常分布。因为图像和问题的分布不同，MSP都不能直接衡量 $p(v_{in},q_{in})$ ，而是衡量答案的概率分布 $p(a_{in}\mid v_{in},q_{in})$ ，即 $p(a_{out}\mid v_{in},q_{in})$ 。但是有个问题，MSP总是对反常的 $p (v, q)$ ，包括 $p(v_{out})$ ， $p(q_{out})$ ，即任务1-4检测失败；
在多模态特征融合后，反常的模态源消失了，因为融合后的特征很难用于区分反常的输入。

4.3.2 Attention-based Anomaly Detection

本文提出一种基于注意力的反常检测来探测不同的反常场景，用公式可表示为：
$\begin{aligned} A(\mathbf{v}, \mathbf{q} ; T) &=\max _{i, j} A_{i j}(\mathbf{v}, \mathbf{q} ; T) \\ &=\max _{i, j} \frac{\exp \left(a\left(\mathbf{v}_{i}, \mathbf{q}_{j}\right) / T\right)}{\sum_{k=1}^{K} \sum_{m=1}^{M} \exp \left(a\left(\mathbf{v}_{k}, \mathbf{q}_{m}\right) / T\right)} \end{aligned}$ 其中 $a$ 为VQA模型中的跨模态注意力层， $A_{ij}$ 为第 $i$ 个视觉区域和地 $j$ 个词的注意力得分， $K ， M$ 分别是视觉区域的个数、问题词的个数。温度参数 $T$ 仅仅在推理时使用，因为增大 $T$ 会影响预测结果。
假设MAP并不能直接估计出 $p (v, q)$ ，但是可以从 $p(v_{out},q_{out}),p_{out}(q_{in}\mid v_{in})$ 中探测出反常输入。因为反常则MAP低，正常则MAP高。MAP模型无关所以能够应用到不同的注意力机制上面。如果注意力层并不会使用所有的问题词，而是使用问题词的上下文向量，那么就令 $M = 1$ 。当采用多头注意力时，对每个头的最大注意力得分取平均。

4.3.3 Regularization of Attention Networks for Anomaly Detection

当直接应用离群值曝光(OE)，VQA模型中的反常检测并不会提升太多。本文引入了一种正则化注意力网络来增强VQA模型的反常检测能力：
$\begin{array}{c} \mathbb{E}_{(\mathbf{v}, \mathbf{q}) \sim P_{\text {in }}}\left[\log p_{\theta}(\mathbf{a} \mid \mathbf{v}, \mathbf{q})\right] \\ +\lambda \mathbb{E}_{\left(\mathbf{v}^{\prime}, \mathbf{q}^{\prime}\right) \sim P_{\text {anomaly }}}\left[\sum_{i=1}^{K} \sum_{j=1}^{M} \log \left(1-A_{i j}\left(\mathbf{v}^{\prime}, \mathbf{q}^{\prime}\right)\right)\right] \end{array}$ 其中 $(v^{'}, q^{'})$ 是从反常数据集中选择的样本， $P_{\text{anomaly}}$ , ${\lambda}$ 为超参数。对于上式来说，在同一个分布内的图像问题对能够获得到最大归一化最优解： $\sum_{i=1}^{K} \sum_{j=1}^{M} A_{i j}=1$ ， $A_{ij}\in[0,1]$ ，最大化注意力分布的交叉熵会使得MAP对于反常场景的得分接近0，所以VQA模型能够很容易从MAP的分数中区分出反常场景。

五、实验

5.1 Experimental Setup

5.1.1 VQA Models

BUTD、MHB+ATT、BAN、MCAN

5.1.2 Datasets

训练集：VQA v2
分布外测试集：MINST、SVHN、FashionMNIST；CIFAR-10，Ting-ImageNet
分布外的问题数据集：20 Newsgroup、Reuter 52、and IMDB movie review
不相关的问题数据集：Visual vs. Non-visual Question (VNQ)，Question Relevance Prediction and Explanation(QRPE)
答案集合：在VQA数据集中预定义的超过9次出现的答案。另外VQA数据集中有4303个样本没有定义的答案，这意味着在训练集出现的次数少于9次。

5.1.3 Traing Setup

36个目标采用BUTD类似的特征，2048维度，ResNet-152，问题词14个单词，Glover预训练，批量大小256；
归一化网络所用的数据集：TinyImage，VNQ，QRPE；
采用微调的训练VQA模型，第15个epoch时的权重， $\lambda=0.00001$ ，为了平衡原始损失和归一化损失。采用warm-up策略。

5.1.4 Evaulation

首先将正常和反常样本混合，然后评估模型能否从正常样本中区分出反常样本（数据外分布和无定义的答案检测），采用一种无阈值的指标，即处于感知操作特征曲线(?)下的区域——(AU-ROC)。注意，单就检测器来说，有50%的AUROC。

5.2 Compared Methods for Anomaly Detection

两种基线模型：MSP和MAP(本文提出的)，然后用AUROCs来评估三种MSP和MAP的变体( $T$ ，离群值曝光(OE)，正则化注意力网络(RA))，结果RA-MAP > RA-MSP， MAP > OE-MAP

5.3 Evaluation of VQA Accuracy

离群值曝光相比于本文提出的方法降低了更多的精度。OE离群值曝光影响VQA模型的所有训练参数，很容易使得模型不稳定，但是本文提出的归一化/正则化方法只影响了与注意力网络相关的权重。

5.4 Out-of-Distribution Detection (Task 1-3)

MAP，RA-MAP > MSP, OE-MSP

5.5 Attention-based Anomaly Detection

MSP效果不行，统计的 $p(a\mid v,q)$ ，而非 $p (v, q)$

5.6 The Effect of Regularization of Attention Networks

同表3。

5.7 Irrelevant Question Detection (Task 4)

5.8 Undefined Answer Detection (Task 5)

5.9 Ablation Study

5.9.1 Selection of Anomaly Datasets for Regularization

5.9.2 Scope of Post-Training for Outlier Exposure

表2。

六、相关工作

本文是第一个在多模态任务VQA上进行的外部数据监测，表明了MSP未能检测室外部数据或者不相关的问题。本文归一化/正则化了注意力网络来提升VQA模型对于多种异常的鲁棒性。

七、Conclusions

本文根据外部数据以及能否回答将反常输入划分为5种情形，在单模态中使用的MSP和OE对于检测异常不起作用。本文提出一种基于注意力的方法和归一化注意力网络来显著提升VQA模型对于反常检测能力。此外，包含多种注意力头的VQA模型的精度在后训练中很容易衰减。
写在后面
老实说，不建议读这篇论文，写的比较乱，主要是MAP和MSP这两种方法绕来绕去，读者对其不熟悉，另外，本文提出的5种场景对应的评估指标似乎也没仔细说明白？咋说呢，这篇文章也是属于鸡肋的文章吧，说具有创新性吧，也有，也算可以，就是读起来不咋地~~
没注意到作者新开源的第二版文章已经进行了大量的补充，应该还可以看懂一些~

SSM卫生人员评审专家申报系统浅浅学姐课程设计毕业设计服务器运维 java 开发语言数据库后端
点赞+收藏+关注→添加文档最下方联系方式咨询本源代码、数据库本人在Java毕业设计领域有多年的经验，陆续会更新更多优质的Java实战项目希望你能有所收获，少走一些弯路。关注我不迷路项目视频SSM347的卫生人员项目申报评审管理系统资料介绍一、设计说明1.1研究背景面对大量的信息，传统的管理系统，都是通过笔记的方式进行详细信息的统计，后来出现电脑，通过电脑输入软件将纸质的信息统计到电脑上，这种方式比
SSM卫生人员评审专家申报系统 Plume98 课程设计毕业设计服务器运维 java 开发语言数据库后端
点赞+收藏+关注→添加文档最下方联系方式咨询本源代码、数据库本人在Java毕业设计领域有多年的经验，陆续会更新更多优质的Java实战项目希望你能有所收获，少走一些弯路。关注我不迷路项目视频SSM347的卫生人员项目申报评审管理系统资料介绍一、设计说明1.1研究背景面对大量的信息，传统的管理系统，都是通过笔记的方式进行详细信息的统计，后来出现电脑，通过电脑输入软件将纸质的信息统计到电脑上，这种方式比
北斗导航 |低轨导航研究进展单北斗SLAMer 卫星导航人工智能北斗三号 GNSS 算法低轨导航
低轨导航作为空天信息网络的重要组成部分，近年来在技术研发、系统构建及实际应用方面均取得显著进展。以下是基于最新研究动态的总结：一、技术研发与系统构建低轨导航增强系统技术突破2025年1月，青岛召开的低轨卫星导航增强系统技术发展研讨会汇集了国内26家单位的60名专家，重点讨论了低轨星座与现有导航系统（如北斗、GPS）的融合增强技术。例如：巨型导航星座数字仿真试验系统：国防科技大学刘文祥团队提出通过数
【人工智能】大模型的幻觉问题：DeepSeek 的解决策略与实践蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界大语言模型（LLM）的“幻觉”问题，即模型生成与事实不符或脱离上下文的内容，是限制其广泛应用的关键挑战之一。本文深入探讨了幻觉问题的成因，包括训练数据的偏差、推理过程中的过度泛化以及缺乏外部验证机制。以DeepSeek系列模型为研究对象，我们分析了其在解
WPF 控件保存图片显示不全的问题，和后台代码添加控件不能显示的问题 lijiaweizuishuai WPF WPF 控件截图
这几天研究自动生成货物标签，想着在WPF中做一个自定义标签生成控件，然后点击那个标签控件生成打印，本来是个挺简单的功能，WPF控件保存图片有现成的API方法。没想到是个坑。现在把他填一下有两种解决方案1、https://blog.csdn.net/u012366767/article/details/81461432这是一种还有一种是我发现当一个控件想生成图片的时候是根据当前图片上层最近的一个Pa
Android Compose 线性布局（Row、Column）源码深度剖析(十) &有梦想的咸鱼& Androiod Compose原理 Android开发大全 android
AndroidCompose线性布局（Row、Column）源码深度剖析一、引言在Android应用开发的领域中，UI布局是构建用户界面的核心工作之一。良好的布局设计不仅能提升用户体验，还能使应用在不同设备上保持一致的视觉效果。随着Android开发技术的不断演进，JetpackCompose作为新一代的声明式UI框架应运而生。它以简洁的代码、高效的性能和强大的可维护性，逐渐成为开发者的首选。线性
网页版 123 分身数字人源码搭建，OEM贴牌 18538162800=余音视频矩阵
在数字化时代的浪潮下，数字人技术蓬勃发展，网页版123分身数字人源码搭建为众多开发者和企业提供了实现个性化数字人应用的可能。本文将深入探讨其技术开发过程，从底层架构到关键技术实现，全方位解析如何构建一个功能强大的网页版数字人系统。技术架构设计前端展示层HTML5与CSS3：构建数字人的可视化界面，实现流畅的动画效果和交互元素。利用CSS3的过渡、动画属性，为数字人的动作、表情变化提供细腻的视觉呈现
IPv6网络的可操作安全考虑——RFC9099解析（四）黑带架构湿 IPv6安全网络安全安全
2.6记录和监控为了在发生安全事件或检测到异常行为的情况下进行取证（forensic）研究，网络运营商应记录多个信息片段。在某些情况下，这需要通过网络管理站对设备进行频繁的轮询。日志包括但不限于：在可用时，使用网络的所有应用程序（包括用户空间和内核空间）的日志(例如，网络运营商管理的web服务器；IPFIX数据【RFC7011】；SNMPMIBs或来自RESTCONF/NETCONF的YANG数据
GPU计算的历史与CUDA编程入门己见明 GPU计算 CUDA C 数据并行性 CUDA程序结构向量加法内核
GPU计算的历史与CUDA编程入门背景简介GPU计算的历史可以追溯到早期的并行计算研究，如今已发展成为计算机科学中的一个重要分支。本文将探讨GPU计算的发展史，重点分析《ComputerGraphics:PrinciplesandPractice》等关键文献，以及CUDAC编程模型的引入及其对现代软件开发的影响。历史回顾回顾历史，GPU计算的发展始于1986年Hillis与Steele在《Comm
【机会约束、鲁棒优化】机会约束和鲁棒优化研究优化【ccDCOPF】研究（Matlab代码实现）科研_G.E.M. matlab 概率论开发语言
‍个人主页欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述机会约束、鲁棒优化与ccDCOPF研究综述1.机会约束规划（ChanceConstrainedProgramming,CCP）在电力系统中的应用2.鲁棒优化（RobustOptimization,RO）在电力系统中的应用3.机会约束与鲁棒优化的协同方法
基于交替方向乘法（ADMM）的PAPR约束下传输波束成形器设计的方法研究（Matlab代码实现）创新优化代码学习 matlab 前端算法
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述2运行结果3参考文献4Matlab代码、数据、文章下载1概述上一次介绍的是用Python代码编程的，这次用Matlab代码实现。回顾见：基于交替方向乘法（ADMM）的PAPR约束下传输波束成形器设计的方法研究（Python代码实现）摘要本文研究了峰值平均功率比(
AI时代个人财富增长实战指南：从零基础到精通变现的完整路径 A达峰绮人工智能
（本文基于人工智能技术发展规律，结合互联网经济底层逻辑，为普通从业者构建系统性AI应用框架）一、建立AI认知基础：技术理解与工具掌握技术分类认知人工智能工具分为四大功能模块：自然语言处理（文本生成、对话交互）、计算机视觉（图像视频处理）、数据分析（预测建模）、自动化控制（流程优化）。建议新手首先掌握语言类工具的基础操作，逐步扩展到其他领域。工具操作逻辑通用AI工具通常包含三大核心功能模块：输入界面
【北上广深杭大厂AI算法面试题】计算机视觉篇...如何解决多尺度问题？努力毕业的小土博^_^ AI算法题库人工智能算法计算机视觉深度学习神经网络
【北上广深杭大厂AI算法面试题】计算机视觉篇…如何解决多尺度问题？【北上广深杭大厂AI算法面试题】计算机视觉篇…如何解决多尺度问题？文章目录【北上广深杭大厂AI算法面试题】计算机视觉篇...如何解决多尺度问题？前言数据级别的多尺度模型架构上的多尺度表示FPN代码示例（PyTorch）说明其他多尺度处理方法总结欢迎铁子们点赞、关注、收藏！祝大家逢考必过！逢投必中！上岸上岸上岸！upupup大多数高校
个人陈述华中科技大学管理学院财务金融系 alexhus 力学AI有限元保研
t今天怀着无比激动的心情来向各位老师陈述我本科三年来的个人学习科研情况，并且十分感谢各位老师能够在百忙之中抽出时间阅读这份陈述。我来自安徽省淮北市，2009年9月通过高考进入华中科技大学学习，现为管理学院财务金融系财务管理0901班的学生。下面我将从学术背景、科研经历、学术兴趣、研究生阶段学习计划等方面来做具体的陈述。学术背景通过在华中科技大学管理学院财务金融系近三年的学习与积累，我在公司财务管理
202年充电计划——自学手册网络安全（黑客技术）网安康sir web安全安全网络 php 开发语言
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包前言什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习
基于LangChain-Chatchat实现智能问答系统 2301_79125431 java
题解|#统计输入正数个数#5.6importjava.util.*;publicclassMain{publics广汽丰田发动机薪酬福利待遇1、工作时间：基本上为5天8小时工作制；2、薪资结构：基本工资+加班工资+各类补贴津贴+各类慰问金+小红书24届春招和25届实习，内部推荐小红书24届春招和25届实习，推荐码为:0T019BWYNARK，内推码仅适用于校招内推及微信小程序题解|#试卷发布当天作
24远景能源-动力，10月最后一周面试！【NTAKYsW】 2301_79125642 java
大模型公司收实习啦，入局好机会，全是大佬不卷后端研发实习生简历投递请联系我，牛客会屏蔽邮箱日常实习：面向全体在校生，为符合岗位要求的同学提供为期3个月及以上的项目实践机会。公司介绍下午移动笔试，晚上联通笔试我看到好多投移动都去面试了，但是我没有面试也没有任何消息，而且智联校园上面hr也没有查看，这是怎么回事，难道是随便发的笔试吗...应该投的是什么AI研究中心联通许愿美团商分octl:一面-10.
112：vue+cesium 设置镜头光晕效果还是大剑师兰特 #cesium综合教程200+大剑师 cesium教程 cesium示例 cesium高级 Cesium API
作者：还是大剑师兰特，曾为美国某知名大学计算机专业研究生，现为国内GIS领域高级前端工程师，CSDN知名博主，深耕openlayers、leaflet、mapbox、cesium，canvas，echarts等技术开发，欢迎加微信（gis-dajianshi），一起交流。查看本专栏目录-本文是第:112`篇文章文章目录一、示例效果图:二、示例介绍三、配置说明四、示例源代码（共171行）五、核心方法
Tinyflow AI 工作流编排框架 v0.0.7 发布自不量力的A同学人工智能
目前没有关于TinyflowAI工作流编排框架v0.0.7发布的相关具体信息。Tinyflow是一个轻量的AI智能体流程编排解决方案，其设计理念是“简单、灵活、无侵入性”。它基于WebComponent开发，前端支持与React、Vue等任何框架集成，后端支持Java、Node.js、Python等语言，助力传统应用快速AI转型。该框架代码库轻量，学习成本低，能轻松应对简单任务编排和复杂多模态推理
景联文科技入选中国信通院发布的“人工智能数据标注产业图谱” 景联文科技科技人工智能
近日，由中国信息通信研究院、中国人工智能产业发展联盟牵头，联合中国电信集团、沈阳市数据局、保定高新区等70多家单位编制完成并发布《人工智能数据标注产业图谱》。景联文科技作为人工智能产业关键环节的代表企业，入选图谱中技术服务板块。图谱按照国家数据局技术创新、行业赋能、生态培育、标准应用、人才就业、数据安全等六个方面任务展开，由上游资源提供方、中游数据标注核心服务方、下游配套支撑方三部分组成。其中上游
Deepseek-R1-Distill-Llama-8B + Unsloth 中文医疗数据微调实战 LuckyAnJo LLM相关 llama python 自然语言处理人工智能
内容参考至博客与Bin_Nong1.环境搭建主要依赖的库(我的版本)：torch==2.5.1unsloth==2025.2.15trl==0.15.2transformers==4.49.0datasets=3.3.1wandb==0.19.62.数据准备-medical_o1_sft_Chinese经过gpt-o1的包含cot(思考过程)的中文医疗问答数据，格式与内容如下:"Question"
科学与《易经》碰撞（4）：阴阳算子：新型代数逻辑系统构建 1079986725 AI 科学量子计算量子计算算法
核心论点阴阳互变规律可以抽象为一种新型代数逻辑系统中的基本算子。这种“阴阳算子”不仅满足传统布尔代数的基本性质，还引入了动态平衡与相互转化的特性，从而为模糊逻辑、量子逻辑和复杂系统建模提供了新的数学工具。研究路径阴阳算子的定义与公理化定义阴阳算子⊗：满足⊗²=¬（非操作），即连续两次阴阳转化回到原状态引入动态平衡条件：⊗(A)与⊗(¬A)之间存在对称关系构建包含⊗的代数系统：定义阴阳代数的基本公理
EnerVerse：智元机器人提出首个机器人4D世界模型，在动作规划任务中达到SOTA水平强化学习曾小健机器人
EnerVerse：智元机器人提出首个机器人4D世界模型，在动作规划任务中达到SOTA水平PNP机器人PNP机器人2025年02月10日21:04上海本文来自：公众号智元机器人https://sites.google.com/view/enerverse，出于学术/技术分享进行转载，如有侵权，联系删文。EnerVerse的科研核心团队由智元机器人研究院的具身算法精英组成。黄思渊，作为上海交通大学与
【面经&八股】搜广推方向：面试记录（十三）秋冬无暖阳° 搜广推等—算法面经面试职场和发展
【面经&八股】搜广推方向：面试记录（十三）文章目录【面经&八股】搜广推方向：面试记录（十三）1.自我介绍2.实习经历问答3.八股之类的问题4.编程题5.反问6.可以1.自我介绍。。。。。。2.实习经历问答挑最熟的一个跟他讲就好了。一定要熟~3.八股之类的问题极大似然估计和贝叶斯估计，区别与联系建议参考这个链接transformer为什么要使用多头关键点在于集成，使语义更加完善圆上随机去三个点，三个
不搞花里胡哨！CMU最新开源：极简风格的LiDAR全景分割+跟踪！ 3Ｄ视觉工坊 3D视觉从入门到精通 3D视觉
来源：3D视觉工坊在公众号「3D视觉工坊」后台，回复「原论文」可获取论文pdf、代码链接添加微信：dddvisiona，备注：三维点云，拉你入群。文末附行业细分群1.笔者个人体会激光雷达全景分割（LPS）一般遵循自下而上的以分割为中心的范式，利用聚类获得对象实例来建立语义分割网络。但是最近CMU&Meta等大佬们重新思考了这种方法，并提出了一个简单而有效的检测中心网络，用于LPS和跟踪。这项工作也
国产Cursor来了？字节跳动出品AI编程工具——Trae使用全解析码云逸栈 AI编程
Trae是什么？Trae是字节跳动最近发布的一款AIIDE，对标Cursor、Windsurf、Copilot这类AI编程工具。它是国产工具，在语言和易用性上更符合国人习惯，且现阶段完全免费！Trae提供智能问答、代码自动补全以及基于Agent的AI自动编程能力，帮助开发者在项目开发中与AI灵活协作，大幅提升开发效率。想深入了解可查看官网文档：docs.trae.ai/docs/what-i安装下
用故事与视觉化打造“高光“统计报告：5个实战技巧梦想画家数据分析工程数据工程分析工程
你是否有过这样的经历？花费数小时整理的数据报告，却被同事评价为"又厚又臭"？别担心，这绝不是你的错——90%的统计报告都毁在不会讲故事。本文将带你用叙事经济学+视觉设计思维，把冷冰冰的数据变成让人欲罢不能的"数据故事会"，掌握让数据开口说话的秘密。1.别让数据成了"睡美人"：唤醒它的故事基因想象你正在给董事会讲一个悬疑剧：“去年Q2销售额神秘下滑（悬念），我们像福尔摩斯一样追查线索（行动），发现竟
使用 Resilience4j 实现重试树懒_Zz Spring spring cloud spring boot spring
在本文中，我们将首先简要介绍Resilience4j，然后深入研究其重试模块。我们将了解何时以及如何使用它，以及它提供哪些功能.什么是Resilience4j？应用程序通过网络通信时，许多事情都可能出错。由于连接中断、网络故障、上游服务不可用等原因，操作可能会超时或失败。应用程序可能会相互过载、无响应，甚至崩溃。Resilience4j是一个Java库，可帮助我们构建具有弹性和容错能力的应用程序。
Apache Tomcat 远程代码执行漏洞复现(CVE-2025-24813)（附脚本） iSee857 漏洞复现 apache tomcat java web安全安全
免责申明：本文所描述的漏洞及其复现步骤仅供网络安全研究与教育目的使用。任何人不得将本文提供的信息用于非法目的或未经授权的系统测试。作者不对任何由于使用本文信息而导致的直接或间接损害承担责任。如涉及侵权，请及时与我们联系，我们将尽快处理并删除相关内容。0x01产品描述：ApacheTomcat是一个开源的JavaServlet容器和Web服务器，支持运行JavaServlet、JavaServerP
微软Data Formulator：用AI重塑数据可视化的未来几道之旅人工智能智能体及数字员工人工智能信息可视化
在数据驱动的时代，如何快速将复杂数据转化为直观的图表是每个分析师面临的挑战。微软研究院推出的开源工具DataFormulator，通过结合AI与交互式界面，重新定义了数据可视化的工作流。本文将深入解析这一工具的核心功能、安装方法及使用技巧，助你轻松驾驭数据之美。一、DataFormulator是什么？DataFormulator是一款基于大语言模型（LLM）的AI工具，旨在帮助用户通过自然语言和界
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f

Regularizing Attention Networks for Anomaly Detection in Visual Question Answering 论文笔记