zxyhhjs2017

VideoMatch: Matching based Video Object Segmentation

Abstract:

1.视频目标分割是一个很重要的挑战，对于各种各样的视频分析任务。最近视频目标分割任务基于深度网络取得了state-of-the-art的结果。

2.由于作为预测任务的表述，这些方法中的大多数都需要在测试期间进行微调，以使深层网记忆给定视频中感兴趣对象的外观。

3.为了解决这个问题，我们开发了一种新颖的基于匹配的视频对象分割算法。与基于记忆的分类技术相比，所提出的方法学习将提取的特征与提供的模板进行匹配，而无需记忆对象的外观。我们在具有挑战性的DAVIS-16，DAVIS-17，Youtube-Objects和JumpCut数据集上验证了该方法的有效性和鲁棒性。大量结果表明，我们的方法无需进行微调即可达到可比的性能，并且在计算时间方面更为有利。

Introduction:

1. 视频分割在从对象识别，视频编辑到视频压缩的各种应用中起着至关重要的作用。尽管在许多情况下，对象的描绘和跟踪对于人类来说似乎微不足道，但是由于遮挡，快速运动，运动模糊以及随时间的显着变化，视频对象分割对于算法仍然具有挑战性。

2.我们的方法主要是关注于半监督的任务，即知道视频的第一帧。

3.基于深度学习的方法都需要对视频的第一帧进行微调，这样花费了大量的时间

4.所以我们提出了一种基于匹配的方法，即当前帧的前景和背景与第一帧的前景和背景的特征是可以匹配的，为了保证我们的方法可以处理外观和几何的变化，我们使用深度网络自适应提取特征。我们的方法mIoU达到了81.03%【masktrack为80.3，但是是不是都是DAVIS-16？因为这篇的结果是在DAVIS16上】，同时大大减少了运行时间，每帧只需要0.32秒,而之前的masktrack则需要12秒每帧，可以说是大大减少了时间

Related work:

与我们的工作同时，提出了几种最近的方法（都是独立开发的），它们通过基于Part的VideoMatch来提高视频对象分割的速度：基于匹配的视频对象分割跟踪[9]，逐像素度量学习[7]或网络调制[56，38]。我们请读者阅读这些作品，以获取更完整的图片。

semi-supervison:

在无监督的视频对象细分设置中，groundtruth和用户标注均不可用。因此，无监督设置需要算法自动发现视频中的显着对象。已经提出了不同的方法，例如运动分析[39]，轨迹聚类[37]和基于显着性的时空传播[12、20]来识别前景对象。最近，已经讨论了基于深网的方法[47,48，22]。

object tracking:

半监督视频对象分割和对象跟踪[58、28]与我们的方法有关，因为它们都可以跟踪整个视频中的对象。但是，这两个任务的输出格式不同。视频对象分割的输出是像素级分mask，而对象跟踪的输出是界定对象位置和比例的边界框。根据跟踪文献，Bertinetto等人的工作。 [3]在精神上类似于我们提出的方法，因为它们通过匹配来制定跟踪。然而，由于输出的差异，Bertinetto等人。 [3]通过将整个补丁与给定模板进行卷积来计算相关性，然而我们提出了针对像素分割的软匹配【什么是软匹配？】。

matching:

在过去的几十年中，对图像匹配[33，18]进行了广泛的研究。随着深度学习的成功，研究重点从使用手工特征的匹配[35]转移到了深度特征[57]。通常计算提取的特征图之间的相关性，以找到对应关系[45]，以估计光流场[10]和几何变换[46]。由于匹配的目的是找到点对点的对应关系，因此，如果将匹配算法直接应用于分割，则结果将很嘈杂【为什么会很嘈杂】。为了处理嘈杂的预测，我们提出了一种软匹配机制，该机制可以估算不同段之间的相似性得分，如下所述。

Matching based Video Object Segmentation:

overview:

一些预设变量：

假定一个视频有T帧，，第一帧的ground truth为，其中W，H分别代表图像的宽和高，为第一帧的Ground truth, N表示为第一帧里的目标数量，预测第一帧以后的帧的结构，我们表示为，和分别代表的是经过一个孪生网络后的第一帧的特在和第t帧的特征，h,w,c分别代表高，宽和通道数，代表了第t帧图像下采样过后的特征图上第i个像素点的c维特征，和分别代表前景特征和背景特征，g()代表一系列属于前景的像素，计算公式如下【和这里具体如何怎么计算的，还是不太明白？】

整体流程：

对于以前的一些工作，已经训练好的模型还要用视频的第一帧去微调网络，这个微调虽然可以提升网络结果但是它很耗费时间，
所以我们的工作不需要微调训练网络，如上图所示，而是首先通过孪生网络计算出第一帧和第t帧的特征，然后计算出第一帧的前景特征和背景特征，然后将t帧的特征分别与和做软匹配，得到两个相似性矩阵，最后将两个矩阵分别上采样concat之后再加softmax,最后2个通道的概率图，哪个得分高属于哪一类。

Soft matching layer:

,计算和的相似性，i是代表上第i个像素位置的c维向量，j代表m上第j个像素位置的c维向量，通过（余弦距离公式）来计算相似性，最后我们的相似性矩阵由如下公式获得，

，

相当于就是X上第i个像素位置（共有hxw个像素位置）的特征都与m上每个像素位置（共有hxw个特征）的特征进行计算，这时候对x特征每个像素位置上，都有1xhxw个相似度分数，取其中最高的K（这里K等于20）个相似度，然后平均得到上的一个像素位置的得分。

【为什么K取20？】直观地，我们使用前K个匹配项的平均相似度，因为我们假设一个像素要匹配区域中的多个像素，而不是一个像素（太吵杂）或所有像素（太严格）通常，前景或背景可能会非常多样化。【不是很理解这句话？那你怎么知道匹配的多了就太严格】因为他希望x上的每个像素位置上的像素与一部分前景或者背景像素相关，而不是只和某一个前景或者背景像素相关，或者匹配所有的前景或者背景像素，太少，那么容易出错，很多像素可能都容易被分为前景或者背景，毕竟1对1的匹配，条件很松，如果这个像素是前景但是又跟背景里的一个像素很像，那么他就被分为背景了，如果是20个的话，出错的概率就小狠多，如果对于所有的都匹配的话可能就太严格了,那么很多像素容易不被分为前景或者背景，背景的像素肯定比前景多，如果像素是背景那么背景像素太多了，你去每个背景像素都相关一下的话，那么因为背景里那么多像素，不相关的多了之后，分数可能就下来了，那么此时就容易被分成前景。

异常值的移除和在线更新：

异常值的移除：

就是在前一帧(t-1)的mask周围画一个区域（根据阈值d）,如果预测的当前帧(t)的像素值在该区域之外，则剔除。

在线更新：

1.将(t-1)帧的异常值，放入背景特征模板中，因为物体在视频中是运动的，物体移动，那么一些新的背景就会被露出来，这些新的背景在第一帧是没有的，所以可以加入一些新的背景特征进去，而这些前景的异常值就是新的背景（这些特在与第一帧匹配跟前景更像而跟背景不像，所以这些异常值才会被分为前景，所以我们可以认为它是新的背景）。

2.其中g（y̆t）是侵蚀的当前分段预测y t中的前景像素集合，c是恒定阈值。直观地，我们添加了像素的特征，这些特征不仅被预测为具有高置信度（大于c 1）的前景，而且还远离边界。另外，我们将b t中的那些像素排除在外，以避免前景和背景特征之间的冲突。【不理解这一段话】

视频中的多目标分割，

就是计算第一帧的每一个目标的特征，如果有k个目标，就计算k个前景特征，然后分别放入soft match 层去匹配，（此时不需要计算背景图了），最后得到k个相关性矩阵，然后concat，经过softmax,最大概率的就是属于哪个目标，最后，对于所有的k，其中的某个像素的概率值小于一定程度的时候，被分为背景。【对于所有的k......,这句话不是很理解，为什么要这么做？】

实验结果

实验细节，训练和评估

为了获得特征x，我们发现ResNet-101 [17]作为具有膨胀卷积[6]的backbone，表现良好。特征图分辨率比输入图像小8倍。在实验中，我们设置K = 20，d c = 100，c 1 = 0.95和c 2 = 0.4。我们使用在Pascal VOC [11，16]上预训练的模型对参数进行初始化，以进行语义图像分割。我们使用Adam优化器[27]端到端地训练了整个网络。我们将初始学习率设置为10 -5，并随着时间逐渐降低。权重衰减因子为0.0005。

为了训练我们的匹配网络，我们使用视频序列中任意两个随机选择的帧作为训练对。重要的是，这两个帧不需要在时间上连续，这样可以提供大量的训练数据。我们通过在0.5到1.5之间进行随机翻转，裁剪和缩放来扩充训练数据。我们使用Tensorflow来实现该算法。在Nvidia Titan X上进行1000次迭代需要大约4个小时的训练。在测试时，输入图像大小为480×854的正向传递大约需要0.17秒。

训练

训练：我们使用DAVIS-16训练集[40]中提供的30个视频序列对所提的网络进行了1000次迭代训练，并在DAVIS-16验证集中进行了评估。同样，在DAVIS-17验证集中进行测试时，我们使用了DAVIS-17训练集中的60个序列[42]进行训练。尽管该模型是在DAVIS上训练的，但我们发现它可以很好地推广到其他数据集。因此，我们使用在DAVIS-17训练集上训练的模型对JumpCut [13]和YouTube-Objects [43]数据集进行评估。

评估

我们在DAVIS-16 [40]验证，DAVIS-17 [42]验证，JumpCut [13]和YouTube-Objects [43]数据集上验证了我们方法的有效性。对于YouTube对象数据集，我们使用[21]提供的具ground truth 分割mask的子集，其中包含126个视频序列。所有数据集都提供像素级别的ground truth分割。更具体地说，在DAVIS-16，JumpCut和YouTube-Objects数据集中提供了二进制（背景）ground truth，而在DAVIS-17数据集中则提供了实例级别的分割的ground truth。四个数据集中都提出了诸如遮挡，快速运动和外观变化等挑战。因此，这四个数据集可作为评估不同视频对象分割技术的良好测试平台。

评价指标

mIoU

就是计算每一帧IoU的平均值

Contour accuracy(计算segmentation图和ground truth边界上两点之间的匹配)

当β=1时，称为F1-score，这时，精确率和召回率都很重要，权重相同。当有些情况下，我们认为精确率更重要些，那就调整β的值小于1，如果我们认为召回率更重要些，那就调整β的值大于1

Error rate:

按照[13]中的评估协议，我们在JumpCut数据集上计算错误率。我们在每个序列中选择关键帧i = {0，16，...，96}，对于第i个关键帧，在给定了groundtruth分割掩码的情况下，我们计算了第i + d个帧的预测分割中的误差第i帧。直观地，我们测量方法相对于特定传递距离d的传递（或匹配）误差。误差等于在第i + d帧的预测分割中，错误的正像素和错误的负像素（错误标记的像素）的数量除以所有正像素（所有前景像素）的数量。我们在实验中使用d = 16并计算误差的平均值以获得误差率。【不太理解为什么要用第i帧的ground truth计算第i+d帧的错误率？】

定量的评估：

我们仔细评估了所提出的方法，并将所提出的方法与多种视频对象分割方法进行了比较，例如，MSK [25]，SFL [8]，OS-VOS [5]，OnAVOS [53]，PLM [59]，MaskRNN [19]，Lucid [26]，SEA [1]，HVS [15]，JMP [13]，FCP [41]，BVS [34]，OFL [50]，CTN [24]，VPN [23]，SVC [54]，JFS [36]，LTV [37]，HBT [14]，AFS [51]，SCF [21]，RB [2]和DA [60]。请注意，MSK，OS-VOS，SFL，OnAVOS，PLM，MaskRNN，Lucid在测试期间会进行微调。

我们在四个数据集上展示了定量结果：DAVIS-16 [40]，YouTube对象[43]，JumpCut [13]和DAVIS-17 [42]。在Youtube-Objects和JumpCut数据集上，我们的方法在mIoU中的性能比最新方法高0.4％，在错误率方面的性能高0.71。在DAVIS-16和DAVIS-17数据集上，我们的方法在不使用微调的情况下可以与最新技术相媲美。定量结果总结在表1、2、3、4和图4中。最佳方法以粗体突出显示，次最佳方法下划线。细节在下面描述。

Evaluation on the DAVIS-16 dataset:在表1中，我们将我们的方法与不需要微调的深层网络基线进行了比较，例如VPN [23]和CTN [24]。我们还与OSVOS [5]，MSK [25]，OnAVOS [53]和SFL [8]进行了比较，从而禁用了它们的微调步骤【为什么不比微调之后的？】。我们使用上标“-”表示禁用了微调步骤的方法。在表1中，我们报告了在DAVIS-16数据集上测试的每种方法的平均IoU和每帧的平均运行时间。我们的方法实现了最佳的mIoU，在有效运行的情况下，比基准性能高出6％以上。我们的方法没有消除异常值（在表1中用OURS-NU表示），运行速度快了2倍，同时实现了竞争优势。

在图4中，我们将不需要微调的方法与可能需要或不需要微调的基线进行了比较。我们在图4（a）中报告mIoU与每帧的平均计算时间，在图4（b）中报告轮廓精度与每帧的运行时间。请注意，对于那些需要微调的方法，每帧的平均运行时间还包括微调步骤。由于我们的方法中使用的网络足够通用，可以学习如何进行匹配，因此我们可以在其他技术所需时间的一小部分时间内观察到竞争性能。注意，时间轴标度是对数的。

对YouTube对象数据集的评估：我们在表2中提供了对YouTube对象数据集的评估结果[43，21]。尽管我们的网络没有经过微调，但我们的方法仍优于一些baseline，但其他baseline例如 OnAVOS和MSK和OSVOS都需要微调。因此，我们的方法在计算时间和准确性上都更加有利。

对JumpCut数据集的评估：我们在表3中对Jump-Cut数据集[13]给出了评估结果。我们遵循[13]中的评估，并计算了不同方法的错误率。转移距离d等于16。在本实验中，我们不采用第3.3节中所述的异常值去除来限制非连续帧之间的mask转换。同样，我们的方法优于该数据集的baseline，其平均错误率比最佳竞争baseline，SVC低0.34 [54]。

在DAVIS-17数据集上的评估：我们显示了使用DAVIS-17验证集进行实例级视频对象分割的实验。结果示于表4。与没有微调的方法，即OSVOS-，OnAVOS-，MaskRNN-和OFL相比，我们的方法表现良好。我们进一步微调了我们的方法（称为OURS-FT），其性能在baseline之间具有竞争力，而计算时间则要快得多。请注意，表4中的OnAVOS + [52]是OnAVOS，顶部具有向上采样层，并且具有模型集成。

消融实验：

我们研究了所提的软匹配层中K的影响：其中我们计算了前K个匹配的平均相似度得分。我们在图5（a）中以不同的K设置显示了DAVIS-16的性能。我们将K设置为1到100之间。当K等于1（“硬匹配”）时，性能为0.753；而当K大于1（“软匹配”）时，性能提高，直到K等于20。 K大于20，性能持续下降，计算所有匹配项之间的平均相似性得分的性能为0.636。直观地，如果点的特征类似于该区域中合理数量的像素，则该点将很好地匹配该区域，这会激发所题的软匹配层。【这个K值相当于也是试出来的】

异常值移除和在线更新：在表5中，我们研究了异常值移除，在线背景特征更新和前景特征更新的影响。我们发现，既没有异常消除也没有在线更新的方法一样具有竞争优势，在DAVIS-16上达到0.792。消除异常值可以使性能提高0.013;如果我们合并了在线背景特征更新，则性能可以提高0.004，同时更新前景特征也可以进一步提高性能，在DAVIS-16数据集上，mIoU达到0.810。

匹配前景和背景：如图1所示，我们不仅将输入图像与模板中的前景区域匹配，而且还与背景区域匹配，因此我们有两个软匹配层用于计算前景相似度和背景相似度。我们发现同时拥有前景模型和背景模型对于获得良好性能至关重要。具体而言，在DAVIS-16上，仅匹配前景（即仅具有一个软匹配层来计算前景相似度）的性能仅为0.527（mIoU），而同时计算出前景和背景相似度均达到0.792。

在线微调：我们想指出的是，在观察第一帧的ground truth mask时，可以在测试过程中对我们方法中的网络进行微调。我们在DAVIS-16上显示了微调时间和性能之间的权衡图5（b)。具体而言，我们显示了考虑到微调步骤的每帧平均运行时间，并与OSVOS，OSVOS-BS（不带后处理步骤的OSVOS），OnAVOS和OnAVOS-NA（不带测试时间增加的OnAVOS）进行比较。我们报告不带CRF的OnAVOS和OnAVOS-NA的结果作为后处理。请注意，时间轴缩放比例也是对数的。每条曲线的左下角表示未经微调的性能。显然，如果禁止微调，我们的方法的性能将超过其他baseline。经过微调后，我们的方法可以得到进一步改进，并且仍然可以高效运行，每帧花费2.5秒，而其他基准需要超过10秒才能达到其峰值性能。请注意，我们没有任何后处理步骤可以优化我们的方法中的细分蒙版，同时仍能达到竞争效果。【这个方法是如何实现微调的？】

定性的结果：

在图6中，我们显示了在DAVIS-16（第1行），Youtube-Objects（第2行），JumpCut（第3行）和DAVIS-17数据集（第4行）上使用该方法的直观结果。我们观察到我们的方法可以准确地分割前景物体，例如快速运动，背景混乱和外观变化。我们还观察到该方法在DAVIS-17数据集上产生了准确的实例级别分割。我们在图7中显示了该方法的失败案例。该方法失败的可能原因包括微小的物体和不同实例的相似外观。

总结：

我们提出了一种基于新型软匹配层的有效视频对象分割算法。该方法泛化效果很好，不需要在线微调，同时保持了良好的准确性。我们的方法在Youtube-Objects和JumpCut数据集上达到了最先进的水平，并且在DAVIS-16和DAVIS-17上具有竞争力，而其计算时间比当前的状态至少快了一个数量级。致谢：本材料基于美国国家科学基金会在1718221、1755785，Samsung和3M授予的部分支持的工作。感谢NVIDIA提供了用于这项研究的GPU。

Articles in Newspapers，Magazines and Journals 2 梁梦婷
在你搜索到文章并阅读后，你一定要关注“给作者的信”这部分中，读者反应等后续问题。大多数报纸和杂志中，“给作者信”这部分，往往是提供“知识读者”支持或挑战文章观点的反应。在每周杂志中，文章后的回应中，通常出现两个问题；在双周刊或月刊中，后面会出现一个问题。
“闭门造车”之多模态思路浅谈：自回归学习与生成 PaperWeekly 回归学习数据挖掘人工智能机器学习
©PaperWeekly原创·作者|苏剑林单位|科学空间研究方向|NLP、神经网络这篇文章我们继续来闭门造车，分享一下笔者最近对多模态学习的一些新理解。在前文《“闭门造车”之多模态思路浅谈：无损》中，我们强调了无损输入对于理想的多模型模态的重要性。如果这个观点成立，那么当前基于VQ-VAE、VQ-GAN等将图像离散化的主流思路就存在能力瓶颈，因为只需要简单计算一下信息熵就可以表明离散化必然会有严重
AAAI—24—Main—paper（关于Multi—Modal的全部文章摘要）
我们生活在一个由多种模态（Multimodal）信息构成的世界，包括视觉信息、听觉信息、文本信息、嗅觉信息等等，当研究的问题或者数据集包含多种这样的模态信息时我们称之为多模态学习多模态机器学习旨在处理学习（视觉，听觉，语言等）不同模态融合交织的信息。下游任务（1）视觉问答1.视觉问答(visualquestionanswering,VQA).给予视觉输入(图像或视频),VQA代表了正确提供一个问题
VIT视觉妄想成为master opencv 目标检测机器学习数据挖掘语音识别人工智能计算机视觉
VisionTransformer视觉和语言(Vision-Language)NLPrompt:Noise-LabelPromptLearningforVision-LanguageModelsPaper:https://arxiv.org/abs/2412.01256Code:GitHub-qunovo/NLPromptPhysVLM:EnablingVisualLanguageModelsto
python 科研作图_Origin科研绘图 weixin_39525933 python 科研作图
前言入了生物学的坑，狗狗们需要时不时的画一些图，看着别人高大上的图片，大家有没有好奇这些图片是怎么做出来的呢?就本狗狗来看(狗狗可能来自农村-_-,)，现在铺天盖地的paper里的图，有些，当然本身就是照片啦，比如跑胶啊WB啊，有些是用R、python、或者matlab做的，那么对于不懂编程的狗狗来说，就需要利用一些趁手作图软件，也可以做出毫不逊色于前者的美图，常见的这类软件有origin，gra
语言大模型综述
Paper:ASurveyofLargelanguageModels目录Paper:ASurveyofLargelanguageModels综述概要LLM关键技术规模定律（ScalingLaws）预训练与微调对齐调优（AlignmentTuning）外部工具集成GPT系列模型的技术演进模型检查点和APIPre-Training数据准备和处理数据准备数据预处理数据调度架构EmergentArchit
Aurora中插入伪代码的字体设置
中文：宋体英文：TimesNewRoman公式：LatinModernMath，跟包newtxmath有关word里面插入对象-->选择AuroraEquation-->Properties-->Packages，复制以下代码：%!TEXprogram=xelatex%强制使用XeLaTeX引擎\documentclass[a4paper]{article}%\usepackage{mathptm
SurveyForge：AI自动撰写综述论文的革命性工具，助力科研效率跃升花生糖@ AIGC学习资料库人工智能 AI论文 AI助手
在学术研究领域，综述论文（SurveyPaper）的撰写是一项耗时且复杂的任务，通常需要数周甚至数月的文献调研与内容整合。如今，上海人工智能实验室、复旦大学与上海交通大学联合开源的SurveyForge，通过创新的AI技术，将这一过程压缩至10分钟内，且生成质量接近人工水平，成为科研人员的得力助手。项目简介SurveyForge是一款基于大语言模型（LLM）的自动综述论文生成工具，专为计算机科学领
2025年电子工程、计算机应用与信号处理国际会议（EECASP 2025）学术交流国际学术会议论文征稿 EI会议
2025年电子工程、计算机应用与信号处理国际会议（EECASP2025）2025InternationalConferenceonElectronicEngineering,ComputerApplications,andSignalProcessing一、大会信息会议简称：EECASP2025大会地点：中国·苏州审稿通知：投稿后2-3日内通知投稿邮箱：[email protected]二、
CHES2024 issue-1文章总结打工小熊猫密码学文献分类总结 arm开发同态加密零知识证明密码学网络攻击模型安全威胁分析计算机网络
来源：https://ches.iacr.org/2024/acceptedpapers.php简要分类：分类文章编号后量子密码软硬件加速相关无侧信道攻防相关1、10、11、12、14、15同态相关18、19、201.Gadget-basedMaskingofStreamlinedNTRUPrimeDecapsulationinHardwareGeorgLand,AdrianMarotzke,Ja
2025年数字信号、计算机通信与软件工程国际会议（DSCCSE 2025）学术交流国际学术会议论文征稿 EI会议
2025年数字信号、计算机通信与软件工程国际会议（DSCCSE2025）2025InternationalConferenceonDigitalSignal,ComputerCommunication,andSoftwareEngineering一、大会信息会议简称：DSCCSE2025大会地点：中国·北京审稿通知：投稿后2-3日内通知投稿邮箱：[email protected]二、会议简介
推荐文章：探索深度学习的不确定性边界 —— SDE-Net 开源项目解析史多苹Thomas
推荐文章：探索深度学习的不确定性边界——SDE-Net开源项目解析SDE-NetCodeforpaper:SDE-Net:EquippingDeepNeuralnetworkwithUncertaintyEstimates项目地址:https://gitcode.com/gh_mirrors/sd/SDE-Net在当今的人工智能领域，深度神经网络(DNN)已经成为推动技术创新的基石。然而，其预测的
长尾形分布论文速览三十篇【60-89】木木阳 Long-tailed 人工智能
长尾形分布速览（60-89）这些研究展示了LLMs在长尾数据分布、持续学习、异常检测、联邦学习、对比学习、知识图谱、推荐系统、多目标跟踪、标签修复、对象检测、医疗生物医学以及其他应用中的广泛应用。通过优化和创新，LLMs在这些领域展现了卓越的性能，并为解决长尾问题提供了有效的工具和方法。1.长尾持续学习与对抗学习长尾持续学习(Paper60):通过优化器状态重用来减少遗忘，提高在长尾任务中的持续学
长尾形分布论文速览【80-119】木木阳 Long-tailed 人工智能
为便于理解和应用，以下将30篇关于长尾分布的研究文献按主题进行分类整理。每一大类包含相应的工作，帮助我们从整体上把握各方向的研究进展。1.长尾半监督学习与伪标签优化Paper90:Uncertainty-awareSamplingforLong-tailedSemi-supervisedLearning提出了一种动态阈值选择方法（UDTS），能有效改善尾部分类性能，适用于不平衡类别的半监督学习。P
CVPR2024无监督Unsupervised论文17篇速览木木阳 CVPR 无监督 unsupervised
Paper1GuidedSlotAttentionforUnsupervisedVideoObjectSegmentation摘要小结:这段话的中文翻译如下：无监督视频对象分割旨在分割视频序列中最突出的对象。然而，复杂的背景和多个前景对象的存在使这项任务变得具有挑战性。为了解决这一问题，我们提出了一种引导式槽注意力网络，以加强空间结构信息并获得更好的前景-背景分离。初始化时带有查询引导的前景和背景
CVPR2024 分割Segmentation相关论文37篇速览木木阳 CVPR2024 Segmentation 分割论文
Paper1MFP:MakingFullUseofProbabilityMapsforInteractiveImageSegmentation摘要小结:最近的交互式分割算法中，将先前的概率图作为网络输入，以帮助当前分割轮次的预测。然而，尽管使用了先前的掩膜，概率图中包含的有用信息并没有很好地传播到当前预测中。在本文中，为了克服这一局限性，我们提出了一种新颖有效的基于点击的交互式图像分割算法MFP，
Paper Reading《SoK: Prudent Evaluation Practices for Fuzzing》小苑同学安全性测试网络安全
论文链接：https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10646824IEEESSP20241Introduction（背景意义）模糊测试是发现软件漏洞的高效方法，被Meta、Google等企业广泛应用，且大量学术研究持续改进其技术（如覆盖反馈、领域扩展）。过去六年（2018-2023）中，顶级安全与软件工程会议上发表了超280
如何在 Android 14系统中修改默认锁屏壁纸(非桌面壁纸) 熊熊饲养员 Android开发笔记 android
如何在Android14系统中修改默认锁屏壁纸本文介绍如何通过修改LockscreenWallpaper.java文件，实现针对默认锁屏壁纸定制化需求。以下是具体实现方法和代码逻辑分析。需求背景客户要求在X设备上更换默认锁屏壁纸，其他设备保持原有壁纸不变。修改涉及系统UI模块的LockscreenWallpaper.java文件，通过条件判断实现差异化配置。代码修改步骤在LockscreenWal
不是只有写稿能用AI！教你用AI“模拟审稿人”帮论文过关学境思源AcademicIdeas AI写作学境思源 ChatGPT 人工智能
在AI辅助写作火遍学术圈之后，学境思源，越来越多作者开始发现：AI的真正威力，并不只是帮你一键生成论文初稿！“写”，而是可以反过来“像审稿人一样看你的论文”。acaids.com。这种“反向应用”，正成为提高论文录用率的关键利器。今天这篇文章就告诉你：如何用AI模拟审稿人视角，检查论文的逻辑漏洞、结构混乱、语言问题，甚至帮助你发现数据论证不足，提前做出修改。我们会重点介绍Paperpal、Writ
FB-OCC: 3D Occupancy Prediction based on Forward-BackwardView Transformation justtoomuchforyou 智驾
NVidia，CVPR20233DOccupancyPredictionChallengeworkshoppaper：https://arxiv.org/pdf/2307.1492code：https://github.com/NVlabs/FB-BEV大参数量imagebackboneInternImage-H，1B外部数据集预训练：object365nuscenes：有点云label，强化网络
PillarNet: Real-Time and High-PerformancePillar-based 3D Object Detection justtoomuchforyou 目标检测人工智能计算机视觉智驾
ECCV2022paper：[2205.07403]PillarNet:Real-TimeandHigh-PerformancePillar-based3DObjectDetectioncode：https://github.com/VISION-SJTU/PillarNet-LTS纯点云基于pillar3D检测模型网络比较SECOND基于voxel，one-stage，基于sparse3Dc
CCF推荐会议计算机体系结构/并行与分布计算/存储系统领域3月份截稿资讯汇总! 会议之眼人工智能深度学习阿里云云计算计算机网络
会议之眼快讯会议之眼精心汇总了以下CCF推荐会议之计算机十大领域之一：计算机体系结构/并行与分布计算/存储系统领域，2024年度3月份会议截稿资讯！为你第一时间进行播报！让广大科研学者及时了解最新的学术进展，助力学者们在专业领域保持竞争优势！会议简称：ISLPED会议全称：InternationalSymposiumonLowPowerElectronicsandDesignFullPaperDe
python做生物信息学分析_Python从零开始第五章生物信息学①提取差异基因吴敬欣 python做生物信息学分析
目前来说，做生物信息学的人越来越多，但是我觉得目前而言做生信的主要有三类人：老本行是做实验的，做生信可能是为了辅助研究或者是为了发paper(有非常多的临床生选择趟生信这波水)主要是做生信的，主要涵盖高通量测序数据分析，组学数据分析等等，专门从事生物学数据分析的这群人，其大部分也是本科生物狗作为强大的生力军，以调包写R，python为主。那么这群人就要熟悉看各种包的tutorial以及如何进行常规
python 在线预览文件_OFFICE 文档转换为html在线预览苏橙橙 python 在线预览文件
OFFICE文档转换为html在线预览OFFICE文档在线预览方案很多：服务器先转换为PDF，再转换为SWF，最后通过网页加载Flash预览，比如flexpaperOffice文档直接转换为SWF，通过网页加载Flash预览微软的Office365在浏览器中直接打开转换为html今天，我们要用的方案是转换为html来预览。技术方案：office文档转换为pdf：使用libreofficepdf转h
Android 14.0 默认壁纸不好看，客户要换成他们喜欢的壁纸，Android 14.0 更换默认壁纸的方法 zzq1996 android
Android14.0默认壁纸不好看，客户要换成他们喜欢的壁纸，Android14.0更换默认壁纸的方法替换如下framework路径的壁纸图片。diff--gita/frameworks/base/core/res/res/drawable-nodpi/default_wallpaper.pngb//frameworks/base/core/res/res/drawable-nodpi/defa
转 Totally Data-Driven Automated Testing black_sam QTP测试框架 testing payment application subroutine spreadsheet function
TotallyData-DrivenAutomatedTestingAWhitePaperByKeithZambelichSr.SoftwareQualityAssuranceAnalystAutomatedTestingEvangelistProfessionalHistoryandCredentials:IhavebeeninvolvedinSoftwareTestingandSoftware
Cross-stitch Networks for Multi-task Learning 项目教程童香莺Wyman
Cross-stitchNetworksforMulti-taskLearning项目教程Cross-stitch-Networks-for-Multi-task-LearningATensorflowimplementationofthepaperarXiv:1604.03539项目地址:https://gitcode.com/gh_mirrors/cr/Cross-stitch-Network
探索多任务学习的新维度：Cross-stitch Networks 计蕴斯Lowell
探索多任务学习的新维度：Cross-stitchNetworksCross-stitch-Networks-for-Multi-task-LearningATensorflowimplementationofthepaperarXiv:1604.03539项目地址:https://gitcode.com/gh_mirrors/cr/Cross-stitch-Networks-for-Multi-t
资源分享 | 一、盘点高清壁纸网站雨中散步撒哈拉资源壁纸高清
资源分享|一、盘点高清壁纸网站1.wallroom2.极简壁纸3.高清壁纸库4.动漫图片和壁纸5.WallpaperAbyss资源分享|一、盘点无版权图片网站作者：1024导航网址：https://shanhaigo.cn备注：1024导航致力于收集高质量网站，内容持续更新中....本文内容，已收录至1024导航：https://shanhaigo.cn1.wallroom高分辨率高质量壁纸2.极
SAM2论文解读-既实现了视频的分割一切，又比图像的分割一切SAM更快更好 ↣life♚ 计算机视觉大模型通用模型人工智能计算机视觉深度学习通用分割视频分割算法
code：https://github.com/facebookresearch/sam2/tree/maindemo:https://sam2.metademolab.com/paper:https://ai.meta.com/research/publications/sam-2-segment-anything-in-images-and-videos/这是SAM这是SAM2Facebook
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts