Godswisdom

语义软分割：《Semantic Soft Segmentation》

《Semantic Soft Segmentation》
来源：MIT
主页：http://people.inf.ethz.ch/aksoyy/sss/
源码：https://github.com/yaksoy/SemanticSoftSegmentation

文章目录

0 ABSTRACT
1 INTRODUCTION
2 RELATED WORK
3 METHOD

3.1 Background
3.2 Nonlocal Color Affinity
3.3 High-Level Semantic Affinity
3.4 Creating the Layers
3.5 Semantic Feature Vectors
3.6 Implementation Details

4 EXPERIMENTAL ANALYSIS

4.1 Spectral Matting and Semantic Segmentation
4.2 Natural Image Matting
4.3 Soft Color Segmentation
4.4 Using Semantic Soft Segments for Image Editing

5 LIMITATIONS AND FUTURE WORK
6 RESULT

0 ABSTRACT

准确地表示图像区域之间的软过渡对于高质量的图像编辑和合成是必不可少的，而当前，这一工作是由技艺纯熟的视觉艺术者来完成，这是一个让人乏味的任务
本文提出语义软分割（Semantic Soft Segmentation，下面简称SSS）来解决这一问题，使用SSS可以轻松完成复杂的图像编辑任务
SSS从光谱分割（spectral segmentation）的角度来解决这个问题，提出了一种嵌入图像纹理和颜色特征（texture and color features）以及神经网络产生的高级语义信息（ higher-level semantic information）的图结构（graph structure）；然后通过拉普拉斯矩阵（ Laplacian matrix）全自动特征分解（ eigendecomposition）生成软分割（ soft segments）

1 INTRODUCTION

选择和组合是图像编辑的核心，比如，局部调整通常从选择开始，组合来自不同图像的元素是生成新内容的一种强大方法；但是，创建一个精确的选择是一项乏味的任务，尤其是在涉及模糊边界和透明度的情况下
当下，如magnetic lasso 和 magic等这类工具就是为了帮助用户，但它们依赖低端线索，还是严重依赖用户的技艺；此外它们只进行二值选择，需要使用者来细化如毛茸茸的狗狗轮廓这样的软边界。Matting工具可以完成这一边界任务，但还是很单调乏味
SSS就是来自动解决这一问题的方案，在演示中，可以看出利用SSS可以方便地完成语义分割，图像编辑中的换背景，局部换颜色等等任务

2 RELATED WORK

1）Soft segmentation
将图像分解为2个或多个分段，其中每个像素可能属于对个分段

2）Natural image matting
对用户定义的前景区域的每像素不透明度（opacity）的估计，matting算法的典型输入是trimap，它定义不透明的前景、透明的背景和不可知的不透明区域
目前Matting方法也有很多，有兴趣可以看看

3）Semantic segmentation
对图像中每个像素进行分类，一个像素只能属于一个类，同一类事物属于同一类，比如一张图像中有多个人，这些人都属于同一类
关于语义分割的论文就太多了，直接给个github链接，有兴趣可以看看

4）Instance segmentation
与语义分割相似，不同的是图像中每个个体是单独实例，比如一张图像中有多个人，这些人属于不同实例
实例分割，这方面研究也很多，COCO挑战赛有这项，有兴趣可以看看

5）Panoptic segmentation
全景分割是近年兴起的，可谓是语义分割和实例分割的结合体，COCO2018挑战赛项目，有兴趣可以看看

语义软分割：《Semantic Soft Segmentation》_第1张图片

3 METHOD

1）本文寻求自动生成输入图像的软分割，即分解成层（layers），表示场景中存在的对象，包括透明度和软过渡；每个像素都有一个透明值（opacity value） $\alpha\in[0,1]$
$\alpha=0$ 表示完全透明， $\alpha=1$ 表示完全不透明，中间值表示不透明程度。如在Matting论文中的模型：

RGB像素则表示为，每层i的像素值与 $\alpha$ 值的加权和，并且限制在单个像素上和为1

2）本文采用如《spectral matting》的形式，将制定软分割任务作为特征向量估计问题。这种方法的核心是创建一个拉普拉斯矩阵L，该矩阵表示图像中每对像素属于同一段的可能性。但是spectral matting在建立L矩阵时，采用的是低级的局部颜色分布来构建的，本文提出利用非局部线索和高级语义信息来弥补这块；spectral matting还描述了如何使用稀疏方法从L矩阵中创建特征向量层，本文将改进稀疏方法，已取得更好的结果。图像2展示SSS

语义软分割：《Semantic Soft Segmentation》_第2张图片

3.1 Background

1）Spectral matting
首先，引进matting Laplacian，它表现为由局部颜色分布定义的矩阵L；它表达的是局部patch中，像素对之间的关联（affinity），经典的为5x5的像素局部。
然后，根据用户提供的约束，利用L矩阵，最小化二次型 $\bm\alpha^TL\bm\alpha$ ，其中 $\bm\alpha$ 表示一个向量，是某层的所有 $\alpha$ 组成
再然后，在随后的工作中，利用特征向量建立了软分割。每段软分割都是L矩阵最小特征值对应的K维特征向量的线性组合
最后，这些分段是最小化一个能量函数得到的

语义软分割：《Semantic Soft Segmentation》_第3张图片

其中， $\alpha_{ip}$ 表示第 $i^{th}$ 分段第 $p^{th}$ 个像素位置的 $\alpha$ 值；E表示有L矩阵的最小特征值对应K维特征向量组成的矩阵； $y_i$ 表示定义软分割的特征向量对应的线性权值； $\gamma <1$ 表示稀疏性的控制因子

spectral matting在图像中包含一个具有不同颜色且识别良好的单一目标时，会产生令人满意的结果，但是在复杂目标或场景下，由于受到仅仅考虑局部低级特征构建L矩阵，识别效果当然较差；本文中将在构建L矩阵时，融入更多语义特征，捕获更高层次的概念，如场景对象，已获得更广阔的图像视野

2）Affinity and Laplacian matrices
像素对之间更具有关联，则表示两个像素更相似，0关联的像素是独立的，负关联的像素则可能拥有不同的值。本文中，使用归一化拉普拉斯矩阵来表达这一关联概念

其中，W表示包含所有像素对之间的关联方阵，D为对应的次数矩阵（degree matrix）

3.2 Nonlocal Color Affinity

上文中提到了低级关联项，需要改进。一个简单的方法是在matting Laplacian的定义中使用更大的patch，然而，这个选项很快变得不切实际，因为它使拉普拉斯矩阵变得更密集。另一种选择是从非局部邻域采样像素来插入连接，同时在矩阵中保留一些稀疏性，KNN matting和information-flow matting用这种采样做出了良好的结果。然而，这种策略面临着稀疏性和鲁棒性之间的权衡：较少的样本可能会遗漏重要的图像特征，而更多的样本会使计算变得不那么容易处理。

本文提出了一种基于图像过度分割（oversegmentation）的有指导的采样方法。我们使用SLIC生成2500个压像素，并估计每个压像素与所有半径内的压像素之间的关联，该半径相当于图像大小的20%（nonlocal color affinity）。这种方法的优点是，每一个足够大的特征都被表示为一个压像素，稀疏性仍然很高，因为我们对每个压像素使用一个单一的样本，并且它通过使用一个大半径来链接可能断开的区域，例如，当通过物体上的洞看到背景时候。

形式上，我们定义，在两个压像素s和t质心之间（距离至少在图像尺寸的20%）的颜色关联 $w_{s,t}^C$ ：

其中 $c_s$ 和 $c_t$ 为位于[0,1]的s和t压像素的平均颜色； $a_c$ 和 $b_c$ 为控制关联退化速度和阈值为0的参数；erf为高斯误差函数，取[-1,1]中值，在这里使用它的主要动机是它的sigmoidal shape。

这种关联本质上确保了颜色非常相似的区域在具有挑战性的场景结构中保持连接，其效果如图3所示

语义软分割：《Semantic Soft Segmentation》_第4张图片

3.3 High-Level Semantic Affinity

虽然nonlocal color affinity为分割增色不少，尤其在远距离相互作用上，但它毕竟采用还是低级特征，根据作者实验表明，在颜色相近的不同对象分割时，容易出现问题；
为了解决这一问题，本文增加了语义关联项（semantic affinity term），它激励属于同一场景对象的像素点分为组，抑制不同场景对象分组。即在已有对象识别区域基础上，计算与目标相关的每个像素的特征向量，这个向量是通过神经网络计算出的特征向量（见3.5）。如点p和q属于同一对象，则 $||f_p-f_q|| \equiv 0$ ；点r不在同一语义区域内，则 $||f_p-f_q||\ll ||f_p-f_r||$
本文还定义了亚像素（superpixels）级的语义关联，既可增加线性系统的稀疏性，也可减少了过渡区域中不可靠特征向量的负面影响，如图

语义软分割：《Semantic Soft Segmentation》_第5张图片

亚像素边界不会直接用到线性系统，但在图（ graph）中的链接，是用的亚像素中心；对于每个亚像素s，我们关联它的平均特征向量 $\overline f_x$ 和它的中心 $p_s$ ，则相邻亚像素s和t的语义关联表示为：

$a_s$ 和 $b_s$ 表示控制关联函数的倾斜度（steepness）因子，见3.5；负关联有利于graph断开不同对象，正关联有利益链接同一对象

与颜色关联（color affinity）不同，语义关联（semantic affinity）只与附近的压像素相关，有利于创建连接的对象。这种非局部颜色关联和局部语义关联的结合，允许创建具有相同语义区域，而空间不连续区域的层（layers）。例如背景中经常出现的绿色植物和天空等元素，使得它们很可能由于遮挡而被分割成几个互不相连的区域。
由于包含了局部语义关联，L的特征向量揭示了对象边界，如图4和图5所示

语义软分割：《Semantic Soft Segmentation》_第6张图片

3.4 Creating the Layers

使用前面描述的关联来创建层（Layers），从而形成一个拉普拉斯矩阵L。我们从这个矩阵中提取特征向量，并使用两步稀疏化过程从这些特征向量中创建层。

1）Forming the Laplacian matrix
根据式3，以及几种关联矩阵的融合，形成拉普拉斯矩阵L：

$W_l$ ， $W_s$ ， $W_c$ 分别表示Matting关联，局部语义关联，非局部颜色关联； $\sigma_s$ ， $\sigma_c$ 分别表示对应关联融合权重，都设为0.01

2）Constrained sparsification
提取 L 矩阵的 100 个最小特征值对应的特征向量，在式2的优化过程中令 γ = 0.8，与特征向量上使用k-均值聚类来初始化优化不同，我们在特征向量f所表示的像素上使用k-均值聚类。这种初始猜测更符合场景语义，得到了更好的软分割效果。

我们用这种方法生成了40个层，实际上，其中几个都是0，剩下15到25个非平凡层。通过在这些非平凡层上运行k = 5的k-means算法，我们进一步减少了层数，这些层由它们的平均特征向量表示。这种方法比直接将100个特征向量稀疏化为5层的方法更有效，因为这种大幅度的缩减使得问题过于受限，并且不能产生足够好的结果，尤其是在matting稀疏方面。分组前后初步估计的软段如图7所示

语义软分割：《Semantic Soft Segmentation》_第7张图片

3）Relaxed sparsification
为了改善层的稀疏性，选择放宽他们特征向量的线性组合的约束。并不通过调整系数 $y_i$ 来处理，而是通过调节式2中的 $\alpha$ 。
首先，放宽子空间约束，并且仅确保生成的层保持靠近使用稀疏化约束过程中创建的层 $\hat\alpha$ ：

同时放宽累加为1的要求，作为软约束集成到线性系统中：

然后，下面是L定义的能量函数：

最后，我们制定了一个适应图像内容的稀疏项（ sparsity term）。直观地，部分像素来自图像中的颜色过渡，因为在许多情况下，它对应于两个场景元素之间的过渡，例如，泰迪熊和背景之间的模糊过渡。我们使用这种观察来建立一个空间变化的稀疏能量：

语义软分割：《Semantic Soft Segmentation》_第8张图片

将这些项放在一起，可以得到：

我们的空间变化稀疏能量对保持精确的软转换的影响可以从图6中看到：

3.5 Semantic Feature Vectors

3.3中提到了用特征向量f来定义语义关联项（semantic affinity term），它可以由完成语义分割的神经网络生成。在本文中，将语义分割和度量学习（metric learning）相结合，具体见补充资料

本文基础特征提取网络采用DeepLab-Resnet-101《 DeepLab: Semantic Image Segmentation with Deep Convolutional Nets》结合度量学习《Deep metric learning using triplet network》，目的是最大化不同对象的L2距离

我们在训练时，不是使用图像的所有像素，而是为所有像素生成特征，只使用一组随机采样的特征来更新网络。该网络使具有相同ground-truth类的样本特征之间的距离最小化，反之则使距离最大化。由于我们只使用这个线索（cue），即两个像素是否属于同一个类别，所以在训练中不使用特定的对象类别信息。因此，我们的方法是一种与类无关的方法，这符合我们语义软分割的总体目标，因为我们的目标是创建覆盖语义对象的软段，而不是对图像中的对象进行分类。为了利用更多具有计算效率的数据，我们使用了一个稍微修改过的N-pair loss

语义软分割：《Semantic Soft Segmentation》_第10张图片

我们对该网络进行COCO-Stuff数据集的语义分割任务训练。我们使用引导过滤器对该网络生成的特征图进行细化，使其与图像边缘保持良好对齐，然后使用主成分分析(PCA)将维数降为3，图8显示了这些预处理步骤。

语义软分割：《Semantic Soft Segmentation》_第11张图片

虽然原始的128维向量可以很好地覆盖我们可能遇到的所有内容，但是每个图像只显示了其中的一小部分，因此降低维数可以提高每个维数的精度。最后，我们对向量进行标准化，使其取值于[0,1]。这使得设置参数更容易，特别是在改变特征向量定义的情况下。对于我们给出的所有结果，我们将Eq. 5中的as和bs分别设为20和0.2

3.6 Implementation Details

我们使用MATLAB中可用的稀疏特征分解和直接求解器对算法的约束稀疏化阶段进行概念验证，这一步大约需要3分钟的640*480图像。松弛稀疏化步骤采用MATLAB的预条件共轭梯度优化实现。每次迭代通常在50到80次迭代中收敛，整个过程大约需要30秒，算法的运行时间随像素的增加而线性增长

4 EXPERIMENTAL ANALYSIS

4.1 Spectral Matting and Semantic Segmentation

可以明显看出SSS在分割主体边缘过度区域，优于其他方法，如头发，猫耳朵等

4.2 Natural Image Matting

语义软分割：《Semantic Soft Segmentation》_第12张图片

近年来Matting方法其实取得很大进步，但是呢，它们很依赖trimap的精度

语义软分割：《Semantic Soft Segmentation》_第13张图片

4.3 Soft Color Segmentation

语义软分割：《Semantic Soft Segmentation》_第14张图片

4.4 Using Semantic Soft Segments for Image Editing

能准确分割对象，当然换个背景还不是小问题；这相当依赖边界过度区域的精度，若存在损失，融合背景时，会出现白边等

5 LIMITATIONS AND FUTURE WORK

虽然我们能够生成精确的图像软分段，但在我们的原型实现中，我们的求解器并没有针对速度进行优化。因此，640*480图像的运行时间在3到4分钟之间。我们的方法可以通过多种方法来优化效率，例如多尺度求解器，但是线性求解器和特征分解的有效实现超出了本文的范围

6 RESULT

语义软分割：《Semantic Soft Segmentation》_第15张图片

语义软分割：《Semantic Soft Segmentation》_第16张图片

语义软分割：《Semantic Soft Segmentation》_第17张图片

【三维感知目标检测论文阅读】《Point RCNN: An Angle-Free Framework for Rotated Object Detection》
今天给大家带来的论文是2019年的《PointRCNN:AnAngle-FreeFrameworkforRotatedObjectDetection》。尽管这是一篇较早的纯点云检测论文，但我把它放在了最后来讲。因为在了解了各类主流方法后，再回过头来阅读它会有更深的理解。PointRCNN采用自底向上的方式直接从点云生成高质量的3D候选框，其对于旋转框的无角度（Angle-Free）处理方式，对于理
[论文阅读] 人工智能 + 软件工程 | 单会话方法论：一种以人类为中心的人工智能辅助软件开发协议张较瘦_ 前沿技术论文阅读人工智能软件工程
单一对话法（SCM）：AI辅助软件开发的“全局对话”新思路SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSoftwareDevelopmentarXiv:2507.12665SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSo
论文阅读：LLaVA1.5：Improved Baselines with Visual Instruction Tuning 微风❤水墨 LLM &AIGC &VLP LLM
论文：https://arxiv.org/abs/2310.03744代码：https://github.com/haotian-liu/LLaVA#train微调：https://github.com/haotian-liu/LLaVA/blob/main/docs/Finetune_Custom_Data.md模型论文时间VisionEncoderVLAdapterProjectionLaye
Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring 论文阅读钟屿论文阅读计算机视觉人工智能
用于动态场景去模糊的深度多尺度卷积神经网络摘要针对一般动态场景的非均匀盲去模糊是一个具有挑战性的计算机视觉问题，因为模糊不仅来源于多个物体运动，还来源于相机抖动和场景深度变化。为了去除这些复杂的运动模糊，传统的基于能量优化的方法依赖于简单的假设，例如模糊核是部分均匀或局部线性的。此外，最近的基于机器学习的方法也依赖于在这些假设下生成的合成模糊数据集。这使得传统的去模糊方法在模糊核难以近似或参数化的
“显著性”（Saliency）是计算机视觉中的一个重要概念，主要指的是图像或视频中最吸引人注意力的区域或对象步步咏凉天计算机视觉人工智能
“显著性”（Saliency）是计算机视觉中的一个重要概念，主要指的是图像或视频中最吸引人注意力的区域或对象。它模拟的是人类视觉系统对视觉场景中“显著”区域的感知能力。显著性可以用于图像理解、目标检测、图像压缩、图像分割等多个任务。下面是对显著性在计算机视觉中的几个关键方面的解释：一、显著性检测（SaliencyDetection）显著性检测的目标是预测图像中最能吸引人注意的区域，通常输出一个与输
【图像分割】基于模糊聚类FCM和改进的模糊聚类算法实现CT图像分割matlab代码天天Matlab科研工作室图像处理 Matlab各类代码算法聚类 matlab
1简介医学影像分割的基本目标是将图像分割成不同的解剖组织，从而可以从背景中提取出感兴趣区域。因为图像的低分辨率和弱对比度，实现医学影像分割是一件具有挑战的任务。而且，这个任务由于噪声和伪阴影变得更加困难，这些干扰项可能是因器材限制、重建算法和患者移动等原因造成的。目前还没有通用的医学图像分割算法，算法的优点和缺点经常根据所研究的问题而变化。将分割概念具体到颅内出血CT图像上，就是将颅腔中的出血病灶
Unet源码实现（pytorch） wyn20001128 pytorch 人工智能 python
U-Net是一种用于生物医学图像分割的卷积神经网络架构。它通过引入一种新颖的网络结构和训练策略解决了传统方法在数据量不足时面临的挑战。U-Net的主要思想是利用数据增强技术来高效利用有限的标注样本，并通过独特的网络设计来提高分割精度。主要贡献U-Net的主要贡献包括：1、数据增强策略：使用随机弹性变形和其他形式的数据增强来增加训练数据的多样性，从而在有限的数据集上训练出更强大的模型。2、U形网络结
051-OpenCV GrabCut图像分割算法
话不多说，上代码，看结果。importcv2#导入库importnumpyasnp'''cv2.imread(filename,flags)#filename为文件名，图片与.py文件在一个文件夹时输入文件名即可#不在一个文件夹时输入图片的路径和名字#flags为图片的颜色类型，默认为1，灰度图像为0'''img=cv2.imread('89.jpg')mask=np.zeros(img.shap
数据科学简讯 2023-04-07 数科每日
image.png头条SegmentAnything图像分割的重大进步图像分割是提取图像中代表特定对象（例如人或桌子）的所有像素的过程。由于几个原因，这是一项艰巨的任务，通常它要么需要大量预定义对象的数据集，要么需要一些的初级监督数据。Meta的这个全新的、完全开源的模型感觉就像是功能上的飞跃。他们收集了大量数据集，简化了注释功能，并创建了一个可以在浏览器中实时运行的模型。并提供演示、代码和论文。
微算法科技研究量子视觉计算，利用量子力学原理提升传统计算机视觉任务的性能
计算机视觉，作为人工智能领域的一个重要分支，致力于模拟人类视觉系统对图像或视频等视觉数据的理解与分析能力。它涵盖了图像识别、目标检测、图像分割等一系列复杂任务，广泛应用于自动驾驶、医疗影像分析、安防监控等多个领域。然而，随着数据规模的不断膨胀和任务复杂度的日益提升，传统计算机视觉算法在处理大规模、高维度数据时遇到了性能瓶颈。微算法科技(NASDAQ：MLGO)研究量子视觉计算，探索量子计算与经典卷
[论文阅读]Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smal 0x211 论文阅读语言模型人工智能自然语言处理
中文译名：逐步蒸馏！以较少的训练数据和较小的模型规模超越较大的语言模型发布链接：http://arxiv.org/abs/2305.02301AcceptedtoFindingsofACL2023阅读原因：近期任务需要用到蒸馏操作，了解相关知识核心思想：改变视角。原来的视角：把LLMs视为噪声标签的来源。现在的视角：把LLMs视为能够推理的代理。方法好在哪？需要的数据量少，得到的结果好。文章的方法
目前主流图像分类模型的详细对比分析 @comefly 闲聊 linux 运维服务器
以下是目前主流图像分类模型的详细对比分析，结合性能、架构特点及应用场景进行整理：一、主流模型架构分类与定量对比模型名称架构类型核心特点ImageNetTop-1准确率参数量（百万）计算效率典型应用场景ResNetCNN残差连接解决梯度消失，支持超深网络（如ResNet-152）76.1%25.6中等通用分类、目标检测ViTTransformer将图像分割为patches，用标准Transforme
深度学习交互式图像分割技术演进与突破 wang1776866571 深度学习交互式分割深度学习人工智能交互式分割
说明本文为作者读研期间基于交互式图像分割领域公开文献的系统梳理与个人理解总结，所有内容均为原创撰写（ai辅助创作），未直接复制或抄袭他人成果。文中涉及的算法、模型及实验结论均参考自领域内公开发表的学术论文（具体文献见文末参考文献列表）。本文旨在为交互式图像分割领域的学习者提供一份结构化的综述参考，内容涵盖技术演进、核心方法、关键技术优化及应用前景，希望能为相关研究提供启发。摘要：本文系统综述了基于
【论文阅读】【IEEE TCYB 2023】Edge-Guided Recurrent Positioning Network forSalient Object Detection in Opt
引言任务：光学遥感图像中显著目标检测论文地址：Edge-GuidedRecurrentPositioningNetworkforSalientObjectDetectioninOpticalRemoteSensingImages|IEEEJournals&Magazine|IEEEXplore代码地址：前置知识一、摘要目前由于光学rsi中目标类型多样、目标尺度多样、目标方向众多以及背景杂乱，现有S
大模型服务的推理优化探索半吊子全栈工匠
【引】有的事情别人不问时我们明白，一旦要我们解释它我们就不明白了，而这正是我们必须留心思索的东西。于是，开启了一次又一次的论文阅读之旅。开发并部署大模型应用肯定要考虑它们的服务成本。然而，钱并不是唯一的考虑因素，如果不能解决模型性能方面的问题，即使有很大的预算，大模型服务仍会受到影响。本文尝试讨论将LLM推理服务更改为高吞吐量引擎的挑战与应对方法。1.大模型服务面临的挑战大模型的能力令人惊叹，但其
ER综述论文阅读-Emotion recognition in EEG signals using deep learning methods: A review 今天早睡了情绪识别Emotion Recognition 论文阅读深度学习人工智能
EmotionrecognitioninEEGsignalsusingdeeplearningmethods:AreviewQ1期刊，2023论文链接：https://d1wqtxts1xzle7.cloudfront.net/105887899/emotionreview-libre.pdf?1695460941=&response-content-disposition=inline%3B+f
【论文阅读】AdaCtrl: Towards Adaptive and Controllable Reasoning via Difficulty-Aware Budgeting quintus0505 LLM 论文阅读语言模型
AdaCtrl:TowardsAdaptiveandControllableReasoningviaDifficulty-AwareBudgeting3Method3.1长度触发标签作为控制接口（Length-TriggerTagsasControllingInterface）3.2冷启动微调（Cold-startfine-tuning）3.3难度感知的强化学习框架（Difficulty-awar
【论文阅读笔记】TimesURL: Self-supervised Contrastive Learning for Universal Time Series 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
TimesURL:Self-supervisedContrastiveLearningforUniversalTimeSeriesRepresentationLearning摘要学习适用于多种下游任务的通用时间序列表示，并指出这在实际应用中具有挑战性但也是有价值的。最近，研究人员尝试借鉴自监督对比学习（SSCL）在计算机视觉（CV）和自然语言处理（NLP）中的成功经验，以解决时间序列表示的问题。
【论文阅读】Decoupled Knowledge Distillation Bosenya12 论文阅读
摘要：最先进的蒸馏方法主要基于从中间层蒸馏出深层特征，而logit蒸馏的重要性则被大大忽视了。为了提供研究logit蒸馏的新观点，我们将经典的KD损失重新表述为两部分，即目标类知识蒸馏（TCKD）和非目标类知识蒸馏（NCKD）。我们实证调查并证明了两部分的效果：TCKD传递了有关训练样本“困难”的知识，而NCKD是logit蒸馏起作用的突出原因。更重要的是，我们揭示了经典的KD损失是一个耦合公式，
【论文阅读】Transfer Learning for Automatic Modulation Recognition Using a Few Modulated Signal Samples
摘要：这封信提出了一种用于自动调制识别（AMR）的迁移学习模型，该模型仅具有少量调制信号样本。传输模型以音频信号UrbanSound8K作为源域进行训练，然后以一些调制信号样本为目标域进行微调。为了提高分类性能，信噪比（SNR）被用作一个功能来促进信号的分类。仿真结果表明，迁移模型在分类精度方面具有显著优势。这篇文章的核心内容是提出了一种基于迁移学习（TransferLearning）的自动调制识
【论文阅读】Meta-SE: A Meta-Learning Framework for Few-Shot Speech Enhancement Bosenya12 论文阅读
这篇文章介绍了一个名为Meta-SE的元学习框架，专门用于少样本（few-shot）语音增强问题。文章的核心目标是解决在实际应用中，由于训练样本有限而导致传统深度神经网络（DNN）模型性能受限的问题。Meta-SE通过元学习的方法，利用先验的元知识快速适应新的任务和噪声类型，即使只有少量训练样本也能表现出色。背景知识与研究动机语音增强技术旨在从带噪语音信号中恢复目标语音，提升语音质量和可懂度。深度
【论文阅读】SASLN：小样本条件下机械故障诊断的信号增强自学习网络
SASLN:SignalsAugmentedSelf-TaughtLearningNetworksforMechanicalFaultDiagnosisUnderSmallSampleCondition本文介绍了一种名为SASLN（SignalsAugmentedSelf-TaughtLearningNetworks）的方法，专门用于在小样本条件下对风力发电机（WT）的发电机轴承故障进行诊断。该方
【论文阅读】SSCL-AMC：一种基于动态增强和集成学习的自监督自动调制分类方法
SSCL-AMC:ASelf-supervisedAutomaticModulationClassificationMethodviaDynamicAugmentationandEnsembleLearning摘要：与传统的手工自动调制分类（AMC）方法相比，深度学习已经显示出有希望的结果，AMC作为信号检测和调制之间的中间步骤发挥着关键作用。然而，获取大规模标记数据仍然具有挑战性，因为数据质量和
[论文阅读] 人工智能 + 软件工程 | 当 LLM 写代码时，它的 “思考过程” 靠谱吗？—— 揭秘 CoT 质量的那些事儿张较瘦_ 前沿技术论文阅读人工智能软件工程
当LLM写代码时，它的“思考过程”靠谱吗？——揭秘CoT质量的那些事儿论文标题：AreTheyAllGood?EvaluatingtheQualityofCoTsinLLM-basedCodeGenerationarXiv:2507.06980[pdf,html,other]AreTheyAllGood?EvaluatingtheQualityofCoTsinLLM-basedCodeGenera
[论文阅读] 人工智能 + 软件工程 | 需求获取访谈中LLM生成跟进问题研究：来龙去脉与创新突破
需求获取访谈中LLM生成跟进问题研究：来龙去脉与创新突破论文标题：RequirementsElicitationFollow-UpQuestionGenerationarXiv:2507.02858RequirementsElicitationFollow-UpQuestionGenerationYuchenShen,AnmolSinghal,TravisBreauxComments:13page
Prompt相关论文阅读(02)--Auto-CoT(2024-11-25) zhilanguifang 论文 prompt engineering 论文阅读笔记
论文阅读笔记2024-11-24~2024-11-25Auto-CoT:AutomaticChainofThoughtPromptinginLargeLanguageModels(ICLR2023)碎碎念：复现代码和笔记保存到gitee仓库上海交通大学的学生在亚马逊实习的时候的成果ICLR2023摘要：LLM能够通过生成中间推理步骤执行复杂的推理。提供这些步骤用于提示演示叫做思维链提示CoT。Co
Halcon学习之select_shape（）算子参数介绍
一、算子介绍select_shape()是HALCON中用于基于形状特征筛选区域的关键算子，广泛应用于图像分割、目标检测和工业质检等领域。它允许用户根据指定的几何特征从输入区域集合中选择符合条件的区域。至于为什么单独介绍这个算子呢，因为他筛选特征的方式有太多种了，如果可以熟练的掌握这些特征，那在后面的例程学习以及实际应用中，可谓是得心应手了。二、算子参数select_shape(Regions:S
【论文阅读】Dynamic Few-Shot Visual Learning without Forgetting Bosenya12 论文阅读
系统概述如下：(a)一个基于卷积神经网络（ConvNet）的识别模型，该模型包含特征提取器和分类器；(b)一个少样本分类权重生成器。这两个组件都是在一组基础类别上训练的，我们为这些类别准备了大量训练数据。在测试阶段，权重生成器会接收少量新类别的训练数据以及基础类别的分类权重向量（分类器框内的绿色矩形），并为新类别生成相应的分类权重向量（分类器框内的蓝色矩形）。这样，卷积神经网络就能同时识别基础类别
【论文阅读】Few-Shot PPG Signal Generation via Guided Diffusion Models Bosenya12 论文阅读
从少量样本数据选择到后处理的整体框架。首先，扩散模型在N样本数据集和指导下的训练。接着，模型生成一个增强的数据集，并进一步优化以提高保真度。最后，这些合成数据与少量样本训练数据集结合，用于基准模型的训练和评估。数据分布从最初的红色变为保真度增强的蓝色，这表明模型与真实数据更加吻合，如简化后的数据分布示意图所示。这篇文章的核心内容是介绍了一种名为BG-Diff（Bi-GuidedDiffusion）
[论文阅读] 人工智能 | 读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法张较瘦_ 前沿技术论文阅读人工智能
读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法论文标题：Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsarXiv:2507.02533Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsMiguelRomero-Arjona,JoséA.Parejo,Jua
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod