Jason66661010

Separate to Adapt: Open Set Domain Adaptation via Progressive Separation论文笔记

Abstract

Domain adaptation问题在利用源域的标注数据为未标记的目标域学习准确的分类器方面已经有较大成功，但是Open Set Domain Adaptation问题中的目标域中存在未知类，而未知类所占的比例对解决问题的方案的性能影响很大。在源域与目标域对齐的时候，如果不将目标域中的未知类排除，会造成已知类与未知类的不匹配而形成负迁移。

本文提出分离适配（Separate to Adapt (STA)），一种端到端的开集域适配方法。这种方法采用由粗到细的加权机制，逐步分离未知类和已知类的样本，同时加权它们对特征分布对齐的影响。

经过验证，该方法适用于目标域的各种开放类型且效果很好。

Introduction

背景

目前计算机视觉方面的提升大多数是得益于大量带注释的训练数据，而在实际的运用中这样的数据并不多。而不同领域的数据又来自不同的分布。领域差距可能导致模型在目标领域做出错误预测。而现有的领域适应方法无论是通过特征级还是像素级的分布匹配来弥补领域差距，其方法大都假设源域和目标域共享相同的标签，即封闭集域适应。

本文研究的背景是在开集域适应(OSDA)中，目标域拥有源域中所有的类，而且目标域中存在未知类。

开集域适配的两个挑战

（1）减轻域间差异的影响

（2）未知类的存在可能会造成负迁移

已知处理OSDA问题的少数方法的缺陷：

迭代分配变换（Assign-and-Transform-Iteratively (ATI) ）：使用一个基于距离的度量来迭代地标记未知样本

开集反向传播（Open Set Back-Propagation (OSBP) ）：尝试解决源域中没有未知类的问题

两种方法都需要一些阈值超参数来区分已知类和未知类，而设置超参数还需要目标域类别的先验知识，而在现实中的开放性可能是变化比较大的，所以超参数难以选择，而且依赖于预定义超参数的方法需要大量的超参数选择工作

⭐作者的方法

文章提出分离适应（ Separate to Adapt (STA)），在不同的开放程度下解决开集域适应问题。

作者使用域间对抗学习的框架，并且为源域中的分类器添加了一个类：unknown class。

目标域中的已知类与未知类的主要区别在于：目标域的已知类与源域的已知类区别仅在于分布偏移，而目标域的未知类与源域的未知类区别更大，既有域间隙，也有语义间隙。

由此，作者开发了一个由粗到细的分离管道组成的渐进分离机制。

第一步是用源数据训练多二元分类器，以估计目标域中的数据和每个源类之间的相似性。

第二步中，我们选择相似度极高和极低的数据作为已知和未知类别的数据，并用它们训练细粒度二元分类器，对所有目标域样本进行精细分离

在这两个步骤之间迭代，并使用实例权重来拒绝对抗域适应中未知类的样本

图中左边表示在进行了源数据训练多二元分类器之后，通过产生的初步权值来从目标域中区分出未知类。图中的虚线是二元分类器为每个类产生的决策边界。

图中中间是训练细粒度二元分类器来得到更精确的权重，目标域中的已知类以及未知类都已经分离开来。

图中的右边表示经过最后的分布对齐，目标域中的共享类已经域源域的相应类别对齐。

Related Work

封闭域自适应（Closed Set Domain Adaptation）

封闭集域自适应方法寻求减轻由域差异带来的性能下降。典型的方法是最小化特征分布之间的距离

深度自适应网络(Deep Adaptation Network (DAN) )：增加了自适应层，最小化分布的内核嵌入之间的最大平均差异(MMD)
中心矩差异（Central Moment Discrepancy (CMD) ）：通过仅匹配一阶和二阶矩同样实现了域自适应。
剩余转移网络（Residual Transfer Network (RTN)）：通过增加一个快捷连接和熵最小化标准来改进DAN
联合适应网络（Joint Adaptation Network (JAN)）：匹配源域和目标域的特征和标签的联合分布。
领域对抗神经网络（Domain Adversarial Neural Network (DANN)）、对抗性区分域适应（Adversarial Discriminative Domain Adaptation (ADDA)）：使用领域鉴别器来区分两个领域，同时学习特征提取器来混淆领域对抗训练范例中的领域鉴别器
条件域对抗网络（Conditional Domain Adversarial Network (CDAN)）：通过匹配标签和特征的联合分布来改进DANN

开集识别（Open Set Recognition）

即如何能正确的区分已知类别并拒绝其它未知类别。

1-vs-set模型：从边际距离描绘决策空间，开放集SVM分配概率分数以拒绝未知样本，进一步改进了紧凑的减少概率模型。
引入OpenMax层：利用深层神经网络进行开集识别

在开放集识别场景中，存在不属于训练数据集中的类的离群值。然而，在开放集域自适应中，两个域的共享类中的目标样本和源样本进一步遵循不同的分布，使得任务更具挑战性。

开集域自适应（Open Set Domain Adaptation）

分配和变换迭代（Assign-and-Transform-Iteratively (ATI)）利用每个目标域样本的特征和每个源类别的中心之间的距离来决定目标样本属于源类别之一还是未知类别。

开集反向传播（Open Set Back-Propagation (OSBP) ）：训练特征生成器来衡量目标域的样本偏离预训练的阈值而被分为未知类的概率。在对抗训练框架中训练其特征提取器和分类器。

两种方法在开集的开放度变化很大的情况下会出现问题。

作者开发的分离适配网络（Separate to Adapt (STA) ）不需要在已知类和未知类之间手动选择阈值参数。

Method

Open Set Domain Adaptation

基本的符号说明

$D_s = {(X_i^s,Y_i^s)}^{n_s}_{i=1}$ 表示源域的 $n_s$ 个有标注的数据； $D_t = \{{X_j^t}\}^{n_t}_{j=1}$ 表示 $n_t$ 个无标签的数据。

$C_s$ 表示源域中的类别； $C_t$ 表示目标域中的类别，而且 $C_s⊂C_t$ ；而 $C_{t/s}$ 统一表示目标域中的未知类

源域所在的分布：p ；目标域所在的分布：q

在标准的域适应中，q!=p ；在开集自适应中，p!=q $C_s$ , $C_s$ 表示目标域中的已知类所在的分布

定义的开放度：O=1 - | $C_s$ |/| $C_t$ |

Separate to Adapt

开放域自适应存在浅显的两个挑战：负迁移以及已知类与未知类的分离，而这两个挑战之间也是有联系的。

首先一味地将整个目标域与源域进行匹配，而不将目标域的未知类分离，将导致预测结果在目标域效果不佳（出现负迁移），而要想解决负迁移的问题就要解决已知类与未知类的分离。

所以正确的逻辑应该是分离目标域中的已知类和未知类，只对已知类样本进行特征自适应。

STA结构

作者的网络架构由图中的虚线分为两部分：

上面的 $G_c$ 表示多二元分类器， $G_b$ 表示二元分类器：生成拒绝目标域未知类的权值w。

下面的 $G_f$ 表示特征提取器，而 $G_y$ 表示分类器， $G_d$ 表示对抗域自适应。

$Z_s$ $Z_t$ 表示提取器提取到的特征； $\hat{y}_s$ $\hat{y}_t$ 表示预测的标签

Progressive Separation（渐进式分离）⭐

为了将目标域中的未知类数据从已知类中分离出来，作者设计了一个由粗到细的过滤措施。作者使用多二元分类器来衡量目标域的样本域源域中的类相似性。每一个二元的分类器都是只由源域的数据训练的。

所有分类器的loss表示为：

$L_{bce}$ 表示二值交叉熵的loss，如果 $y^s_i$ =c，则I( $y^s_i$ ,c)=1， $y^s_i$ ！=c，则I( $y^s_i$ ,c)=0

filtering strategy one

分类器 $G_c$ 输出的为目标域样本被分类为源域中该类的概率，即可表示目标域数据与源域该类的相似性。可以预知：目标域中的未知类的概率一定比目标域的已知类概率要低，而作者使用这些概率的最大值来表示该样本对应的源域中的类别，相应的未知类的相似性就没有已知类的高。

于是作者将目标域中的所有样本的相似性进行排序，分别使用排序最高的与最低的输入 $G_b$ 二元分类器进行训练。

优点：

由于只使用了相似性在极限值的数据，所以过滤相对粗糙但是拥有较高的可信度
无需手动调整超参数，鲁棒性强

filtering strategy two

将目标域中的所有样本的相似性分为highest（ $S_h$ ）, midium lowest( $S_l$ )三类，当 $S_j>S_h$ 则标为已知类；当 $S_jSj<Sl$

$G_b$ 二元分类器的loss表示为：

（ $X^‘$ 表示多二元分类器过滤样本集； $d_j$ 表示样本是已知类（0）还是未知类（1））

这样一来，通过 $G_c$ 多二元分类器以及 $G_b$ 二元分类器，作者实现了由粗到细的过滤，将目标域中的已知类与未知类成功分开。

Weighted Adaptation（加权适应）

在模型的对抗域适应部分，左侧定义的源域的损失为：

$L_y$ 是交叉熵的loss，而 $G_y$ 表示添加到源域中的那一个表示为unknown class的特定分类器

$G_y^{1:|C_s|}$ 表示将每个样本分配给已知类的概率。

在上面 $G_b$ 的过滤后，作者并没有将 $G_b$ 分类的输出作为最后结果，而是作为一个权值wj，使用wj来定义共享标签空间Cs中特征分布的对抗性适应的加权损失

于是运用该权值为 $G_d$ 定义loss：

另外还需要在目标域中选取未知类的样本，以训练 $G_f$ 获得额外的unknown类。基于度量已知类和未知类分离度的权重wj，判别unknown类的加权损失定义为：

其中 $l_{uk}$ 表示为unknown类，而 $G_y^{|C_s|+1}$ 表示目标域的样本为分类为未知类的概率。

进一步在已知的目标域类上加入熵最小化损失 $L_e$ ，以保证决策边界包裹目标域中的低密度区域

作者只将目标样本预测为已知类的进行熵最小化，所以使用了wj作为权重。

Training Procedure

known/unknown separation step

首先开始训练特征提取器 $G_f$ 以及对源域进行分类的分类器 $G_y$ ，而多二元分类器是目标域样本与源域所有类别进行一对多的训练。
之后进一步选择目标域中相似性高的、低的输入细粒度 $G_b$ 二元分类器进行训练。

$G_f$ 输出的参数： $θ_f$ $G_y$ 输出的参数： $θ_y$ $G_b$ 输出的参数： $θ_b$ $G_c^{|C_s|}$ 输出的参数： $θ_c|^{|C_s|}_{c=1}$

最优的参数 $\hat{θ}_f$ $\hat{θ}_y$ $\hat{θ}_b$ $\hat{θ}_c|^{|C_s|_{c=1}}$ 的选择是:

weighted adversarial adaptation step

实现对抗性自适应，使目标域中已知类的特征分布与源域保持一致，并利用未知类中的数据为额外类训练Gy

$θ_d$ 表示 $G_d$ 的参数：

（λ是一个用于权衡熵损失的超参数）

利用分离适配（STA）模型，可以有效分离目标域中已知类和未知类的数据。

步骤1拒绝异常值以避免在步骤2中分散未知类的注意力，而步骤2执行对抗性调整以使步骤1中的拒绝管道更准确。

由于在整个过程中不需要手动选择阈值超参数，所以在实际场景中，当开放度O变化时，我们可以避免痛苦的调整。

Experiments

Setup

数据集

Office-31：Amazon来自商场的2817张办公室用品图片；webcam795张低分辨率的图片与DSLR498张高分辨率的图片。（各个域间共享31个分类）

Office-Home：通过网络爬取，其中包括4个域，Artistic (Ar), Clipart (Cl), Product (Pr) and Real-World (Rw)。每个域包含来自65个类别的图像，前25个类设置为源域域目标域的共享类，而剩下的属于未知类。4个域两两互换顺序作为源域域目标域，共12个任务，由于未知类的个数比已知类多，所以该数据集的域间差异较大，难度也较大。

VisDA-2017：拥有两个域，其中一个拥有152397张合成的2D图像，另外一个包括55388张真实的图片，两个域拥有12个共享类。

Digits：拥有三个标准的数据集：MNIST , USPS and SVHN.作者构建了三个任务：SVHN → MNIST, MNIST → USPS 和USPS → MNIST.

Caltech-ImageNet：由ImageNet-1K与Caltech-256 datasets构建。已知类设置为84个类，而未知类从0~916变化区测试不同开放度中模型的鲁棒性。

baseline

Open Set SVM (OSVM) ：OSVM是一种基于支持向量机的方法，对每个类使用阈值来识别样本和剔除异常值

MMD+OSVM 、DANN+OSVM：是OSVM的两个变体，包含最大平均差异OSVM中的域对抗网络

OpenMax ：是一种深开放集识别方法，其模块设计用于异常值剔除

ATI-λ：通过将目标域中的图像分配给已知类别，将源域的特征空间映射到目标域（在作者设置中，没有特定于源代码的类。因此通过交叉验证手动选择ATI-λ的超参数λ）

OSBP：是最新的一种开放集域自适应方法，通过对抗性分类器来处理未知类的样本，达到了最先进的性能

对于闭集方法，我们使用置信阈值来判断样本是否来自未知类。在我们的实验中，我们运行每种方法三次，并报告平均精度

说明

OS：所有类的标准化精度，包括unknown 类

OS*：仅在已知类上的标准化精度

all：所有实例的精度（不包括类的平均精度）

UNK：未知样本的精度。

对比实验

使用Digits 与VisDA-2017 数据集，在OSBP方法上进行实验作为比较。
在所有的对比方法上用Office-31数据集做对比，使用resnet50网络作为主干网络
在Office-Home 与Caltech-ImageNet数据集上使用resnet50网络研究OS的精度。

对于非数字的数据集，作者使用在ImageNet上预训练的模型VGGNet 与 ResNet50进行训练。

对于数字数据集，作者使用了LeNet网络模型。

对抗域的网络域DANN 是一样的，从零开始训练的所有层的学习率是预先训练层的10倍。

Results

STA在digits数据集上的表现优异，而且在SVHN → MNIST情况中域间差异是比较大的，但是STA比OSBP效果好很多。

STA在VisDA-2017数据集中在大部分的类别的识别中得分较高，表示STA在大尺寸的图片以及域间差异较大（合成图片与真实图片）的数据集上表现较好。

在office31数据集上STA基本在每个类上都得到了最高的分数，而我们可以看到一些在封闭集经常使用的方法在这里甚至还不如直接使用resnet网络的效果好，原因就是在目标域的未知类较多的时候，此时的未知类不能忽略，否则就会发生负迁移。

在Office-Home数据集上，STA同样基本在每个类上都得到了最高的分数，而一些在封闭集经常使用的方法在这里依然还不如直接使用resnet网络的效果好，STA算法在分布匹配前分离未知类样本，对较大的域间隔和标签空间差异具有较强的鲁棒性。

Analysis

Ablation Study

1.STA优于STA w/o w（缺少对抗域训练的目标域样本的权重→对已知类和未知类的样本进行加权分离是必要的

2.STA优于STA w/o c（缺少多二元分类器中的softmax分类层）→多二元分类器可以产生更好的相似度，独立地度量目标样本与每个源类之间的关系

3.STA优于STA w/o b（缺少二元分类器 $G_b$ ）→二元分类器可以根据多个二元分类器的结果来细化未知类和已知类样本之间的分离

4.STA优于STA w/o j（缺少Training Procedure中的两个steps的迭代）→联合分离和适应的有效性

Openness

为了验证STA在不同程度的开放度下的鲁棒性，作者在office31数据集以及Caltech-ImageNet数据集上，让开放度：O=1 - | $C_s$ |/| $C_t$ |从0~1变化。

结果显示传统的OSDA方法在开放度于0.5左右的表现较好，当开放性接近0或1时，性能会急剧下降，因为这些方法容易混淆已知类和未知类。而 ATI-λ于OSBP虽然表现较好，但在训练之前需要先验知识，这种方法在显示世界中是不太可行的。

而STA在开放度的变化中表现的比较稳定，而且当开放度为0的时候，STA的得分比DANN好，表示该噪声分离机制可以在已知的样本中均匀地输出。

Weight Quality

作者在任务A → W以及VisDA-2017数据集上进行了有关 $G_b$ 二元分类器输出的权重w大小与相应目标域的分类情况的变化：当源域与目标域的数据比较相似时，w接近于0，相反则是1.

Feature Visualization

作者在Amazon → DSLR任务中展示了 ResNet, DANN, OSBP 与STA的最后一层的特征数据。

其中（a）（b）未知类特征与一些已知类的特征已经混合在一起，表示ResNet 与DANN并不能很好的区分已知类与未知类。

（c）目标域的已知类并没有很好的分开，因为OSBP在不稳定的源域与目标域的关系中表现不是很好。

（d）STA精确地将目标域的样本与源域对齐，并且分离目标域中的未知类。

（绿色的为源域的特征，蓝色的为目标域特征，红色的为未知类特征）

Conclusions

本文提出了一种新的分离适配（STA）模型，解决了开放集域自适应中的关键挑战，即开放性。该模型以递进机制清晰地分离未知类和已知类的样本，并在源域和目标域之间匹配已知类样本的特征。通过在不同的基准数据集上的验证，该模型能够在不同的领域差异和不相交的类下实现开放性健壮的开放集域适应。

医学顶会 MICCAI‘24 | LKM-UNet: 大型内核视觉 Mamba UNet 用于医学图像分割小白学视觉医学图像处理论文解读 MICCAI 深度学习医学图像顶会医学图像处理论文解读
本文内容只为星球内部成员学习和学术交流，请勿用作他用本文内容只为星球内部成员学习和学术交流，请勿用作他用论文信息题目：LKM-UNet:LargeKernelVisionMambaUNetforMedicalImageSegmentationLKM-UNet:大型内核视觉MambaUNet用于医学图像分割作者：JinhongWang,JintaiChen,DannyChen,JianWu源码链接：
【系统架构设计师】论文：论微服务架构及其应用（高分论文3篇）数据知道系统架构设计师(软考高级)架构系统架构微服务软考高级系统架构设计师论文
更多内容请见：备考系统架构设计师-专栏介绍和目录文章目录论文一摘要正文论文二摘要正文论文三摘要正文论文一摘要我作为系统分析师兼任系统架构师参与了××航空公司物流综合平台4.0的建设工作。该物流平台旨在整合该公司航空物流、仓储、冷链运输、快递、支付、信用等多个相关业务，提供统一的点到点的综合物流配送服务。该综合平台采用了微服务的系统架构进行开发。平台最终在2021年6月初步上线运行，后又陆续进行了4
[论文笔记] llama-factory 微调qwen2.5、llama3踩坑心心喵论文笔记深度学习人工智能
一、bug1、pre-tokenize的时候,会OOM解决：在yaml文件中添加streaming参数#tokenizestreaming:Truemax_steps:10000https://github.com/hiyouga/LLaMA-Factory/blob/3a023bca2a502810a436cfba7708df164754ea62/src/llamafactory/hparams
YOLOv10涨点改进：特征融合创新 | 多层次特征融合（SDI），小目标涨点明显，| UNet v2，比UNet显存占用更少、参数更少 AI小怪兽 YOLOv10魔术师 YOLO 目标检测算法人工智能目标跟踪
本文独家改进：多层次特征融合（SDI），能够显著提升不同尺度和小目标的识别率如何引入到YOLOv10：1)替代原始的Concat；改进结构图如下：《YOLOv10魔术师专栏》将从以下各个方向进行创新：【原创自研模块】【多组合点优化】【注意力机制】【卷积魔改】【block&多尺度融合结合】【损失&IOU优化】【上下采样优化】【小目标性能提升】【前沿论文分享】【训练实战篇】订阅者通过添加WX:AI_C
YOLO11涨点优化：特征融合创新 | 多层次特征融合（SDI），小目标涨点明显| UNet v2，比UNet显存占用更少、参数更少 AI小怪兽 YOLO11魔术师深度学习目标检测计算机视觉目标跟踪神经网络 python
本文独家改进：多层次特征融合（SDI），能够显著提升不同尺度和小目标的识别率如何引入到YOLO11：1)替代原始的Concat；改进结构图如下：《YOLOv11魔术师专栏》将从以下各个方向进行创新：【原创自研模块】【多组合点优化】【注意力机制】【卷积魔改】【block&多尺度融合结合】【损失&IOU优化】【上下采样优化】【小目标性能提升】【前沿论文分享】【训练实战篇】订阅者通过添加WX:AI_CV
2025毕设springboot 猫舍管理系统分析与设计论文+源码 zhihao508 课程设计 spring boot 后端
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容选题背景关于猫舍管理系统的研究，现有研究主要集中在宠物店的信息化管理、宠物医院的业务流程优化以及宠物寄养服务的数字化升级等方面。然而，专门针对猫舍管理系统的分析与设计研究相对较少，尤其是针对猫咪养殖、销售、预约及品种管理等综合功能的系统化研究更为稀缺。当前，许多猫舍仍采用传统的手工管理
100个高质量ChatGPT学术论文写作提示词分享--系列（一）迪娜学姐人工智能深度学习论文阅读
我是娜姐@迪娜学姐，一个SCI医学期刊编辑，探索用AI工具提效论文写作和发表。ChatGPT学术论文写作高质量提示词分享，今天先分享50个，涵盖论文写作、文献综述、研究方法设计、数据分析、学术演讲准备等方面。1.论文写作(ThesisWriting)1.为[研究主题]制定一个引人入胜的论文标题，突出其创新性和重要性。Craftanengagingthesistitlefor[researchtop
100个高质量ChatGPT学术论文写作提示词分享--系列（二）迪娜学姐论文阅读论文笔记人工智能 chatgpt
我是娜姐@迪娜学姐，一个SCI医学期刊编辑，探索用AI工具提效论文写作和发表。ChatGPT学术论文写作高质量提示词分享，之前分享过50个，涵盖论文写作、文献综述、研究方法设计、数据分析、学术演讲准备等方面：100个高质量ChatGPT学术论文写作提示词分享--系列（一）今天继续分享50个，包括论文修改与编辑、写作技巧与提升、参考文献引用及编辑、论文投稿和课题申请：6论文修改与编辑(ThesisR
【附源码】基于flask框架奶茶连锁管理系统 (python+mysql+论文) JAVA程序设计 python flask mysql
本系统（程序+源码）带文档lw万字以上文末可获取本课题的源码和程序系统程序文件列表系统的选题背景和意义选题背景：
CT-Mamba:一种用于低剂量CT降噪的混合卷积状态空间模型论文解读 ZcZc__1 深度学习人工智能图像处理
论文：CT-Mamba:AHybridConvolutionalStateSpaceModelforLow-DoseCTDenoising代码：zy2219105/CT-Mamba，作者称将会在论文正式发表后提供。本文参考了该网站，其对CT-Mamba提供了更详细的描述：https://www.aimodels.fyi/papers/arxiv/ct-mamba-hybrid-convolutio
2025年软件工程/计算机科学与技术最新毕业设计专题精选推荐小五java毕设 java毕设选题推荐案例软件工程课程设计毕业设计 java
选题指导：近期开题的同学越来越多，很多同学不知道怎么选题，不知道老师分配的题目应该怎么做，指导老师分享的信息不多，无从下手？选题避坑：毕设选题实际上对很多同学来说一个大坑，每年挖坑给自己跳的人太多太多，选题选得好后面的答辩以及论文撰写会轻松很多，选的不好就是一个无穷无尽的折磨难度把控：其实这主要是由于大部分同学对某种具体场景所需要的技术不清晰而导致的，定题的时候想当然的觉得某种功能是很好实现的，但
第76期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.关于使用大语言模型
node.js毕设基于B_S架构的工艺品展示系统论文+程序凌菲学姐—毕设 node.js 课程设计架构
本系统（程序+源码+数据库+调试部署+开发环境）带文档lw万字以上，文末可获取源码系统程序文件列表开题报告内容一、选题背景关于工艺品展示系统的研究，现有研究主要以工艺品的实体展示、传统营销模式为主，专门针对基于B/S架构的工艺品展示系统的研究较少。在国内外，工艺品行业发展迅速，但传统的展示方式受地域、时间等限制，难以满足日益增长的市场需求。目前存在的争论焦点在于如何在网络环境下，既能全面展示工艺品
第84期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能 gpt AIGC
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.利用数据流路径对大
深入MapReduce——从MRv1到Yarn 黄雪超大数据基础 #深入MapReduce mapreduce 大数据 hadoop
引入我们前面篇章有提到，和MapReduce的论文不太一样。在Hadoop1.0实现里，每一个MapReduce的任务并没有一个独立的master进程，而是直接让调度系统承担了所有的worker的master的角色，这就是Hadoop1.0里的JobTracker。在Hadoop1.0里，MapReduce论文里面的worker就是TaskTracker，用来执行map和reduce的任务。而分配
【Matlab高端绘图SCI绘图模板】第006期对比绘柱状图（只需替换数据）小熊科研路（同名GZH）可视化 matlab 信息可视化开发语言
1.简介柱状图作为科研论文中常用的实验结果对比图，本文采用了3组实验对比的效果展示图，代码已调试好，只需替换数据即可生成相关柱状图，为科研加分。通过获得Nature配色的柱状图，让你的论文看起来档次更高，让你的科研更快地进行成果产出。用户能够生成既美观又精确的数据可视化图表。代码涵盖了从数据准备到最终图像输出的全过程，包括文件读取、颜色自定义、图形界面设置、数据可视化以及图像导出等关键步骤。适合数
手把手教你怎么用chatgpt写毕业论文和学术小论文洛白白 chatgpt chatgpt 学习方法经验分享笔记学习
以下是50个学术论文指令的目录，当然，用完了复制的时候.千万记得删除指令。一、学术角色预设指令(2个)二、论文撰写指令(8个)三、学术润色指令（20个)·四、中英翻译指令(5个)·五、论文查重指令（1个)·六、参考文献指令(2个)·七、投稿审稿指令(2个)·八、其他学术指令（11个)一、学术角色预设论文中无论是润色，语法检查还是降重，都要先进行角色预设，先给定一个身份。有些学术GPT是自带提示词的
机器学习&深度学习目录 UQI-LIUWJ 各专栏目录深度学习人工智能 1024程序员节
机器学习模型机器学习笔记：Transformer_刘文巾的博客-CSDN博客attention相关机器学习笔记：attention_UQI-LIUWJ的博客-CSDN博客机器学习笔记：ELMOBERT_UQI-LIUWJ的博客-CSDN博客机器学习笔记：ViT（论文AnImageIsWorth16X16Words:TransformersforImageRecognitionatScale）_UQ
【AI论文】FilmAgent: 一个用于虚拟3D空间中端到端电影制作自动化的多智能体框架东临碣石82 自动化运维
摘要：虚拟电影制作涉及复杂的决策过程，包括剧本编写、虚拟摄影以及演员的精确定位和动作设计。受近期基于语言智能体社会的自动化决策领域进展的启发，本文提出了FilmAgent，这是一个新颖的、基于大型语言模型（LLM）的多智能体协作框架，旨在实现我们构建的3D虚拟空间中的端到端电影制作自动化。FilmAgent模拟了各种剧组成员角色，包括导演、编剧、演员和摄影师，并涵盖了电影制作工作流程的关键阶段：（
基于Python的多元医疗知识图谱构建与应用研究（下） Allen_LVyingbo 医疗高效编程研发 python python 知识图谱健康医疗
五、基于医疗知识图谱的医疗知识图谱程序构建5.1数据层构建5.1.1数据源选择与获取在构建基于医疗知识图谱的医疗知识图谱数据层时，数据源的选择与获取至关重要。数据源的质量和丰富度直接决定了知识图谱的可靠性和实用性。医学文献是重要的数据源之一，包括学术期刊论文、医学研究报告等。这些文献包含了大量经过科学验证的医学知识，如疾病的发病机制、诊断标准、治疗方法等。可以通过专业的医学文献数据库，如PubMe
[论文笔记] Megatron: mistral sliding window（ImportError: /workspace/venv/lib/python3.10/site-packag报错解决）心心喵论文笔记论文阅读
pyTorch—TransformerEngine1.2.1documentation论文：https://arxiv.org/pdf/2310.06825.pdftransformerengine的slidingwindow是用了flashatttention（新版本2以上，这里用的最新版本2.5.2）里对sliding_window的实现。所以不需要用transformerengine。直接用
论文开题前的必备指南：如何做好充分准备学境思源AcademicIdeas ChatGPT 学境思源 AI写作人工智能
开题报告是撰写学术论文中关键的一步，它为整个研究过程奠定基础，是明确研究方向、构建研究框架的重要环节。为了确保开题报告的成功，提前做好充分的准备工作至关重要。今天的内容将详细说明撰写开题报告前需要准备的工作，包括选题、文献综述、研究设计、数据准备和写作计划等方面。一、确定研究选题1.选题的意义和原则选题是论文开题的第一步，也是最关键的一步。选题应具备科学性、创新性和可行性，既要有理论意义，也要有实
一款可以完整保留排版的PDF翻译，GitHub增长第一 java后端
最近看论文较多，顺手给大家推荐一个用下来觉得不错的开源PDF翻译工具：PDFMathTranslate目前这款开源项目在GitHub上已经收获了7.6KStar，而且由于一直处于增长趋势榜第一的位置，预计未来还会持续增长许多。PDFMathTranslate简介开源项目地址：https://github.com/Byaidu/PDFMathTranslate对于PDFMathTranslate这款
【Python・统计学】卡方检验（原理及代码） TUTO_TUTO python 统计学 python
前言自学笔记，分享给对统计学原理不太清楚但需要在论文中用到的小伙伴，欢迎大佬们补充或绕道。ps：本文不涉及公式讲解（文科生小白友好体质）～（部分定义等来源于知乎）本文重点：卡方检验（非参数检验的一种）【1.卡方检验的简单原理和前提条件】【2.卡方检验的数据实例】【3.卡方检验代码以及残差分析】关于“参数检验”和“非参数检验”的不同，请参考以下文章。【统计学】参数检验和非参数检验的区别和基本统计学1
ViT论文解读 freshfish丶文献阅读深度学习计算机视觉 transformer
ViT论文解读本文主要记录YiZhu大佬对于ICLR2021的一篇论文精读ANIMAGEISWORTH16x16WORDS:TRANSFORMERSFORIMAGERECOGNITIONATSCALE论文地址：https://arxiv.org/pdf/2010.11929.pdf源码地址：https://github.com/google-research/vision_transformer标
深圳杯数学建模挑战赛2024B题思路+论文+代码小驴数模数学建模
批量工件并行切割下料问题板材切割下料是工程机械领域重要的生产环节。热切割机由固定板材的底部轨道和发出激光（或火焰）的多刀具系统构成。在一块板材下料过程中，底部轨道（下面简称轨道）只能沿着板材的长边（纵向）做来回移动，移动速度可在区间[-80,80]mm/s上连续变化；多把切割刀排列在平行于板材短边的一条直线上，每一把切割刀具可以在保持至少100（mm）相互间距和横向次序下做独立（方向和速度都可不一
2024年华中杯数学建模B题思路与论文助攻小驴数模数学建模
B题使用行车轨迹估计交通信号灯周期问题某电子地图服务商希望获取城市路网中所有交通信号灯的红绿周期，以便为司机提供更好的导航服务。由于许多信号灯未接入网络，无法直接从交通管理部门获取所有信号灯的数据，也不可能在所有路口安排人工读取信号灯周期信息。所以，该公司计划使用大量客户的行车轨迹数据估计交通信号灯的周期。请帮助该公司解决这一问题，完成以下任务。已知所有信号灯只有红、绿两种状态1.若信号灯周期固定
论文翻译：ChatGPT for good? On opportunities and challenges of large language models for education Author CSPhD-winston-杨帆智慧教育论文翻译 chatgpt 语言模型人工智能
高引用论文：ChatGPTforgood?OnopportunitiesandchallengesoflargelanguagemodelsforeducationAuthorlinksopenoverlaypanelhttps://www.sciencedirect.com/science/article/pii/S1041608023000195ChatGPTforgood？大型语言模型在教育
YOLOv8改进策略【Backbone/主干网络】| CVPR 2024替换骨干网络为 UniRepLKNet，解决大核 ConvNets 难题 Limiiiing YOLOv8改进专栏 YOLO 网络目标检测深度学习计算机视觉
一、本文介绍本文记录的是基于UniRepLKNet的YOLOv8骨干网络改进方法研究。UniRepLKNet提出了独特的大核设计能有效捕捉图像特征，在多模态任务中展现出强大的通用感知能力。将UniRepLKNet应用到YOLOv8的骨干网络中，提升YOLOv8在目标检测任务中的精度和效率。本文在YOLOv8的基础上配置了原论文中unireplknet_a,unireplknet_f,unirepl
[论文精读]Understanding Diffusion Models: A Unified Perspective 0x211 论文精读数学建模
发布链接：http://arxiv.org/abs/2208.11970文章详细讨论了扩散模型（DiffusionModels）作为一种生成模型的工作原理，并从多个角度解释其背后的数学机制。阅读原因：实验需要理解SD的数学建模过程数学层面更好的解释：diffusionmodel(一)：DDPM技术小结(denoisingdiffusionprobabilistic)|莫叶何竹1.扩散模型简介扩散模
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla

Separate to Adapt: Open Set Domain Adaptation via Progressive Separation论文笔记