只星若晨

Background Matting-v2

一、要解决的问题

抠图问题： $I=\alpha*F+(1-\alpha)*B$
输出高质量alpha，保留发丝细节

二、创新点

两阶段抠图：base-matting与refine-matting，由粗到细
base阶段预测额外预测Error Map，用于表征需要refine的区域
两个数据集：图像数据集PhotoMatte85和视频数据集VideoMatte240K

三、具体细节

MattingBase网络：

Base网络是基于Deeplabv3+修改的Encoder-Decoder网络。Encoder部分的Backbone为Resnet50，同时作者的代码提供了Resnet101和Mobilenetv2作为可选backbone用于对精度和速度的不同要求。

Resnet50 backbone后接Deeplabv3的ASPP模块，空洞卷积的dilate_rate=[3,6,9]。

Decoder部分采用上采样+3*3conv+BN+ReLU套装。同时与Encoder的中间输出进行跳层链接。

Base网络共四个输出：

coarse-grained alpha matte $\alpha_c$
foreground residual $F_c^R$
error prediction map $E_c$
32-channel hidden features $H_c$

MattingRefine网络：

Refine网络的目的是减少过多的网络计算，同时回复高分辨率的抠图细节。Base网络基于全图进行抠图操作，Refine网络则是根据error prediction map $E_c$ 选取patches进行抠图refine操作。Refine包括 $\frac{1}{2}$ 原分辨率的操作和全分辨率refine两个过程。

patches的选择：resample $E_c$ 到原分辨率的 $\frac{1}{4}$ ，即 $E_4$ 。这样 $E_4$ 中的每个像素表示原分辨率上4*4的patches。选取 $E_4$ 中误差最大的top-k个元素作为refine网路的输入，这样在原分辨率上相当于对16k个像素进行refine.

2-stage Refine过程：首先，对 $\alpha_c$ 、 $F_c^R$ 、 $H_c$ 、input image $I$ 、 background $B$ 进行双线性插值，到原分辨率的 $\frac{1}{2}$ ，并Concatenate到一起。

然后在选曲的误差较大的区域截取8*8的patches，然后送入2个3*3卷积+BN+ReLU套装，并降低到4*4，得到中间特征（intermediate features）.

intermediate features再进行上采样到8*8，并和从原分辨率的 $I$ 和 $B$ 中截取的8*8patches concatenate到一起，送入2个3*3卷积+BN+ReLU套装，得到4*4的patches alpha prediction 和 foreground residuals。

最后，把 $\alpha_c$ 和 $F_c^R$ 上采样到原分辨率，并在选取的refine区域，将上采样的patches换成refine得到4*4的patches alpha prediction 和 foreground residuals。

四、代码

Base部分

RenNetEncoder定义在model/resnet.py中，继承自pytorch官方Renset。只是输入的channel从3变成6（ $I\_channel+B\_channel=6$ ）
并在forward的过程中保留中间block输出，用于skip connection。

def forward(self, x):
    x0 = x  # 1/1
    x = self.conv1(x)
    x = self.bn1(x)
    x = self.relu(x)
    x1 = x  # 1/2
    x = self.maxpool(x)
    x = self.layer1(x)
    x2 = x  # 1/4
    x = self.layer2(x)
    x3 = x  # 1/8
    x = self.layer3(x)
    x = self.layer4(x)
    x4 = x  # 1/16
    return x4, x3, x2, x1, x0

ASPP直接从官方Pytorch中引入，输入的dilate_rate=[3, 6, 9]
Decoder则是自定义的interpolate+3*3conv+BN+ReLU套装，共4次上采样，对应Encoder的4次2倍缩放。

self.conv1 = nn.Conv2d(feature_channels[0] + channels[0], channels[1], 3, padding=1, bias=False)
self.bn1 = nn.BatchNorm2d(channels[1])
self.conv2 = nn.Conv2d(feature_channels[1] + channels[1], channels[2], 3, padding=1, bias=False)
self.bn2 = nn.BatchNorm2d(channels[2])
self.conv3 = nn.Conv2d(feature_channels[2] + channels[2], channels[3], 3, padding=1, bias=False)
self.bn3 = nn.BatchNorm2d(channels[3])
self.conv4 = nn.Conv2d(feature_channels[3] + channels[3], channels[4], 3, padding=1)
self.relu = nn.ReLU(True)
...
#forward
x = F.interpolate(x4, size=x3.shape[2:], mode='bilinear', align_corners=False)
x = torch.cat([x, x3], dim=1)
x = self.conv1(x)
x = self.bn1(x)
x = self.relu(x)
...

整个Base的代码如下：

self.backbone = ResNetEncoder(in_channels, variant=backbone)
self.aspp = ASPP(2048, [3, 6, 9])
self.decoder = Decoder([256, 128, 64, 48, out_channels], [512, 256, 64, in_channels])
...
# 4个输出
def forward(self, src, bgr):
    x = torch.cat([src, bgr], dim=1)
    x, *shortcuts = self.backbone(x)
    x = self.aspp(x)
    x = self.decoder(x, *shortcuts)
    pha = x[:, 0:1].clamp_(0., 1.) # alpha_c
    fgr = x[:, 1:4].add(src).clamp_(0., 1.) # F_c
    err = x[:, 4:5].clamp_(0., 1.)  # E_c
    hid = x[:, 5: ].relu_()        # hidden_feature
    return pha, fgr, err, hid

Refine部分

Refine部分的代码在 model/refiner.py文件中。按照论文中的描述，首先在 $E_4$ 上选取前k个refine点。

def select_refinement_regions(self, err: torch.Tensor):
    """
    Select refinement regions.
    Input:
        err: error map (B, 1, H, W)
    Output:
        ref: refinement regions (B, 1, H, W). FloatTensor. 1 is selected, 0 is not.
    """
    
    if self.mode == 'sampling':
        # Sampling mode.
        b, _, h, w = err.shape
        err = err.view(b, -1)
        idx = err.topk(self.sample_pixels // 16, dim=1, sorted=False).indices #   选取topk个refine点
        ref = torch.zeros_like(err)  
        ref.scatter_(1, idx, 1.)  #  使用类似one-hot的方式，1表示需要优化的点，0表示不需要优化的点
        if self.prevent_oversampling:
            ref.mul_(err.gt(0).float())# 删除0点
        ref = ref.view(b, 1, h, w)
    else:
        # Thresholding mode.
        ref = err.gt(self.threshold).float()
    return ref


def crop_patch(self,
               x: torch.Tensor,
               idx: Tuple[torch.Tensor, torch.Tensor, torch.Tensor],
               size: int,
               padding: int):
    """
    Crops selected patches from image given indices.
    
    Inputs:
        x: image (B, C, H, W).
        idx: selection indices Tuple[(P,), (P,), (P),], where the 3 values are (B, H, W) index.
        size: center size of the patch, also stride of the crop.
        padding: expansion size of the patch.
    Output:
        patch: (P, C, h, w), where h = w = size + 2 * padding.
    """
    if padding != 0:
        x = F.pad(x, (padding,) * 4)
    
    if self.patch_crop_method == 'unfold':
        # Use unfold. Best performance for PyTorch and TorchScript.
        # 先按照H方向滑动窗口unfold出8*w的patch
        # 再按照W方向滑动窗口unfold出8*8的patch
        # 最后按照筛选出topk的refine点位置取出对应patch
        return x.permute(0, 2, 3, 1) \
                .unfold(1, size + 2 * padding, size) \
                .unfold(2, size + 2 * padding, size)[idx[0], idx[1], idx[2]]
    else:
        # Use roi_align. Best compatibility for ONNX.
        # roi_align更好地兼容ONNX，采用Mask-RCNN的roi_align,输出[K, C, output_size[0], output_size[1]]
        idx = idx[0].type_as(x), idx[1].type_as(x), idx[2].type_as(x)
        b = idx[0]
        x1 = idx[2] * size - 0.5
        y1 = idx[1] * size - 0.5
        x2 = idx[2] * size + size + 2 * padding - 0.5
        y2 = idx[1] * size + size + 2 * padding - 0.5
        boxes = torch.stack([b, x1, y1, x2, y2], dim=1)
        return torchvision.ops.roi_align(x, boxes, size + 2 * padding, sampling_ratio=1)    

def replace_patch(self,
                  x: torch.Tensor,
                  y: torch.Tensor,
                  idx: Tuple[torch.Tensor, torch.Tensor, torch.Tensor]):
    """
    Replaces patches back into image given index.
    
    Inputs:
        x: image (B, C, H, W)
        y: patches (P, C, h, w)
        idx: selection indices Tuple[(P,), (P,), (P,)] where the 3 values are (B, H, W) index.
    
    Output:
        image: (B, C, H, W), where patches at idx locations are replaced with y.
    """
    xB, xC, xH, xW = x.shape
    yB, yC, yH, yW = y.shape
    if self.patch_replace_method == 'scatter_nd':
        # Use scatter_nd. Best performance for PyTorch and TorchScript. Replacing patch by patch.
        x = x.view(xB, xC, xH // yH, yH, xW // yW, yW).permute(0, 2, 4, 1, 3, 5)
        x[idx[0], idx[1], idx[2]] = y
        x = x.permute(0, 3, 1, 4, 2, 5).view(xB, xC, xH, xW)
        return x
    else:
        # Use scatter_element. Best compatibility for ONNX. Replacing pixel by pixel.
        iH, iW = xH // yH, xW // yW
        i = self.crop_patch(torch.arange(0, xB * xC * xH * xW).view(xB, xC, xH, xW).type_as(x), idx, 4, 0)
        i, x, y = i.view(-1), x.view(-1), y.view(-1)
        x.scatter_(0, i.long(), y)
        x = x.view(xB, xC, xH, xW)
        return x

# refine开始
# 上采样E到1/4 E_4
err = F.interpolate(err, (H_quat, W_quat), mode='bilinear', align_corners=False)
ref = self.select_refinement_regions(err)
idx = torch.nonzero(ref.squeeze(1))
idx = idx[:, 0], idx[:, 1], idx[:, 2]  # 计算refine点位置，(B:list, H:list, W:list)

if idx[0].size(0) > 0:
       # 1. Hid, F_c, alpha_c concatenate
	   # 2. 把Hid, F_c, alpha_c上采样到1/2
	   # 3. crop_patches
       x = torch.cat([hid, pha, fgr], dim=1)
       x = F.interpolate(x, (H_half, W_half), mode='bilinear', align_corners=False) 
       x = self.crop_patch(x, idx, 2, 3 if self.kernel_size == 3 else 0)
		
	   # 1. .
	   # 2. src_bgr(F,B)上采样到1/2
	   # 3. crop_patches
       y = F.interpolate(src_bgr, (H_half, W_half), mode='bilinear', align_corners=False)
       y = self.crop_patch(y, idx, 2, 3 if self.kernel_size == 3 else 0)
       # 4. 3*3卷积+BN+ReLU套装
	   x = self.conv1(torch.cat([x, y], dim=1))
       x = self.bn1(x)
       x = self.relu(x)
       x = self.conv2(x)
       x = self.bn2(x)
       x = self.relu(x)
       # 5. 套装输出的结果再次上采样到8*8
       # 6. 对src_bgr 的refine点crop patches（center_size=4, padding=2）
       x = F.interpolate(x, 8 if self.kernel_size == 3 else 4, mode='nearest')
       y = self.crop_patch(src_bgr, idx, 4, 2 if self.kernel_size == 3 else 0)
       # 7. 套装
       x = self.conv3(torch.cat([x, y], dim=1))
       x = self.bn3(x)
       x = self.relu(x)
       x = self.conv4(x)
       # 8. 上采样alpha_c, FR_c到原分辨率
       out = torch.cat([pha, fgr], dim=1)
       out = F.interpolate(out, (H_full, W_full), mode='bilinear', align_corners=False)
       # 9. refine点替换
       out = self.replace_patch(out, x, idx)
       pha = out[:, :1]
       fgr = out[:, 1:]
else:
    pha = F.interpolate(pha, (H_full, W_full), mode='bilinear', align_corners=False)
    fgr = F.interpolate(fgr, (H_full, W_full), mode='bilinear', align_corners=False)

训练过程损失函数

同v1一样，alpha损失采用了L1 Loss和Gradient Loss（Sobel）。

网络输出前景残差 $F^R$ ，然后计算 $F=max(min(F^R+I,1),0)$ ，再将F与ground truth $F^*$ 计算L1 Loss，这里计算的时候只考虑alpha>0的区域。

Error map的Ground truth $E^*$ 由ground truth $\alpha^*$ 和预测的 $\alpha$ 计算得来， $E^*=|\alpha-\alpha^*|$ ，E主要为了表征预测的 $\alpha$ 与实际 $\alpha$ 的Error区域，不需要明确的边界，所以采用L2 Loss（MSE）。同时，差别越大的区域损失值也越大。

Base网络的整体损失函数：

Refine网络的整体损失函数：

五、参考

https://zhuanlan.zhihu.com/p/381917042

你可能感兴趣的:(抠图Matting,网络,卷积,深度学习,人工智能,计算机视觉)

【技术解密】本地部署 DeepSeek-V3：完整指南海棠AI实验室 “智元启示录“-AI发展的深度思考与未来展望人工智能深度学习 DeepSeek
目录引言运行环境需求下载与安装推理部署总结参考资源引言随着人工智能的快速发展，开源大模型正逐步改变着技术生态。DeepSeek-V3作为最新的开源大模型之一，不仅提供了强大的推理能力，同时也支持本地部署，使开发者可以灵活地进行自定义优化。本文将详细介绍如何在本地部署DeepSeek-V3，涵盖系统要求、安装步骤、模型转换及不同推理框架的应用。1.运行环境需求1.1硬件要求✅NVIDIAGPU（支持
人工智能伦理与可持续发展 CarlowZJ 人工智能
前言人工智能（AI）技术正在深刻地改变我们的生活和工作方式。从自动驾驶汽车到智能医疗系统，从个性化推荐到自动化决策，AI的应用无处不在。然而，随着技术的快速发展，其伦理和社会影响也引发了广泛的关注。人工智能伦理不仅涉及技术本身的公平性、透明性和安全性，还涉及到更广泛的社会、经济和环境影响。本文将探讨人工智能伦理的核心问题，并从可持续发展的角度提出应对策略。一、人工智能伦理的核心问题1.1数据隐私与
Matlab GPU加速技术算法工程师y matlab 开发语言
1.GPU加速简介（1）为什么使用GPU加速？CPU擅长处理逻辑复杂的串行任务，而GPU拥有数千个流处理器，专为并行计算设计。对于大规模矩阵运算、深度学习训练或科学计算等任务，GPU加速可将计算速度提升数十至数百倍。（2）Matlab的GPU支持功能依赖：需安装ParallelComputingToolbox（并行计算工具箱）。硬件要求：支持CUDA的NVIDIAGPU（如Tesla、GeForc
pytorch中的DataLoader 朋也透william pytorch 人工智能 python
在PyTorch中，DataLoader是一个工具类，用于高效地加载数据并准备数据输入到模型中。它支持数据的批量加载、随机打乱、并行加载和迭代操作，是训练深度学习模型的关键组件之一。1.基本功能DataLoader的主要职责是从数据集中提取样本，并根据设置返回一个批次的数据。它与Dataset类结合使用：Dataset：定义数据集的来源、结构以及如何获取单个数据样本。DataLoader：负责从D
机器学习中输入输出Tokens的概念详解爱吃土豆的程序员机器学习基础机器学习人工智能 Tokens
随着深度学习技术的快速发展，大语言模型（LargeLanguageModels,LLMs）已经成为自然语言处理（NLP）领域的一个热点研究方向。这些模型不仅能够生成高质量的文本，还能在多种任务中展现出卓越的表现，比如机器翻译、问答系统、文本摘要等。在大语言模型的工作流程中，Tokens的概念扮演着至关重要的角色。本文将详细介绍大语言模型如何使用Tokens，以及如何计算Tokens的数量。什么是T
【深度学习基础】第二十四课：softmax函数的导数 x-jeff 深度学习基础深度学习人工智能
【深度学习基础】系列博客为学习Coursera上吴恩达深度学习课程所做的课程笔记。1.softmax函数softmax函数详解。2.softmax函数的导数假设神经网络输出层的激活函数为softmax函数，用以解决多分类问题。在反向传播时，就需要计算softmax函数的导数，这也就是本文着重介绍的内容。我们只需关注输出层即可，其余层和之前介绍的二分类模型一样，不再赘述。我们先考虑只有一个样本的情况
AI如何创作音乐及其案例 alankuo 人工智能
AI创作音乐主要有以下几种方式：基于深度学习的生成模型深度神经网络：通过大量的音乐数据训练，让AI学习音乐的结构、旋律、和声、节奏等特征。如Transformer架构，其注意力机制可捕捉跨小节的旋律关联性，能生成具有长期依赖性的音乐序列。生成对抗网络（GAN）：包含生成器和判别器，生成器负责生成音乐样本，判别器判断生成的音乐是否真实。两者相互对抗、不断优化，使生成器生成更逼真的音乐。变分自编码器（
LLM-PowerHouse: 一站式大型语言模型定制训练与推理指南 Nifc666 语言模型人工智能自然语言处理 whisper langchain gpt 开源软件
LLM-PowerHouse:解锁大型语言模型的潜力在人工智能和自然语言处理领域,大型语言模型(LargeLanguageModels,LLMs)正在掀起一场革命。随着GPT、BERT等模型的出现,LLMs展现出了惊人的能力,可以执行各种复杂的语言任务。然而,如何有效地训练和使用这些强大的模型仍然是一个挑战。针对这一需求,GitHub上的LLM-PowerHouse项目应运而生,为开发者、研究人员
202年充电计划——自学手册网络安全（黑客技术）网安康sir web安全安全网络 python linux
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包前言什么是网络安全网络安全可以基于攻击和防御视角来分类，我们经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行，因为不知如何去学，在这里，我将这个整份答案分为黑客（网络安全）入门必备、黑客（网络安全）职业指南、黑客（网络安全）学习
【网络安全 | 漏洞挖掘】价值14981$的Google点击劫持漏洞秋说 web安全漏洞挖掘
未经许可，不得转载。文章目录点击劫持前言漏洞1攻击场景漏洞2攻击场景漏洞3攻击场景漏洞4攻击场景漏洞5攻击场景漏洞6攻击场景点击劫持点击劫持是一种恶意的用户界面攻击技术，也被称为“UI覆盖攻击”或“透明劫持”。攻击者通过创建一个看似正常的网页，并在其中嵌入一个隐藏的、透明的iframe框架，该框架指向目标网站的某个功能页面，如支付页面、订阅页面等。同时，攻击者会在iframe上方放置一些虚假的按钮
【sklearn 01】人工智能概述 @金色海岸人工智能 sklearn python
一、人工智能，机器学习，深度学习人工智能指由人类制造出的具有智能的机器。这是一个非常大的范围，长远目标是让机器实现人工智能，但目前我们仍处在非常初始的阶段，甚至不能称为智能机器学习是指通过数据训练出能完成一定功能的模型，是实现人工智能的手段之一，也是目前最主流的人工智能实现方法深度学习则是机器学习的分支，超过8层的神经网络模型就叫深度学习，深度即层数。深度学习目前在语音、图像等领域取得很好的效果
如何做好兼容性测试测试工具
要做好兼容性测试，需要关注环境搭建、设备多样性、测试工具选择、问题追溯等重要环节，其中对环境搭建尤为关键。本质上，兼容性测试就是在各种不同的操作系统、硬件设备与网络环境中进行应用或系统的功能验证，以确保最终产品无论在何种环境下都能稳定运行。尤其是在环境搭建方面，建议采用虚拟机、真实设备与云端环境相结合的方式进行多维度测试，为后续的深度测试奠定扎实基础。一、兼容性测试的基本概念在软件测试领域，兼容性
【人工智能】【Python】在Scikit-Learn中使用决策树算法（ID3和CART） SmallBambooCode 机器学习人工智能 python 算法 scikit-learn 决策树机器学习 ai
importnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.treeimportDecisionTreeClassifier,plot_tree#加载数据集iris=load_iri
差异中寻找共识：浅析中美欧AIGC服务商的标识义务人工智能
2025年1月7日，西藏日喀则地震中一张被广泛传播的图片“被压在废墟下的小男孩”被证明是AI合成图片，[1]这随即引发了社会对于人工智能生成物（ArtificialIntelligenceGeneratedContent，以下简称“AIGC”）的广泛讨论。随着AI大模型生成逼真图像、音频与视频的能力日益增强，人类作品与AIGC之间的界限愈发模糊。如不加以管控，则会产生“真相侵蚀”（TruthDec
迷雾渐开：美国AIGC可版权性剖析及案例梳理人工智能
当地时间2025年1月29日，美国版权局（U.S.CopyrightOffice,USCO）发布了版权和人工智能相关法律和政策报告的第二部分——《版权和人工智能：可版权性》（以下简称“《USCO可版权性报告》”）[1]，旨在探讨人工智能生成内容（AIGC）的可版权性问题。该报告明确指出，美国版权局认为现有的版权法足以解决AIGC问题，因此无需制定新的立法。具体而言，该报告在此前美国版权局于2023
智能体平台架构深度剖析：从底层到应用的全链路解析人工智能
在当今人工智能飞速发展的时代，智能体平台作为承载和驱动智能应用的关键基础设施，其架构设计至关重要。一个优秀的智能体平台架构，能够高效整合各类资源，实现智能体的灵活构建与稳定运行，为多样化的应用场景提供强大支持。稳固根基：基础资源层与并行平台层基础资源层是整个智能体平台的基石。其中，GPU和服务器构成了强大的计算硬件支撑，确保平台能够应对复杂的计算任务。而数据与OSS（对象存储服务）则如同智能体的“
美国首例AI训练数据版权案：从汤森路透诉罗斯案看AI训练数据的“合理使用” 人工智能
随着人工智能（AI）技术的快速发展和广泛应用，复杂的版权问题也随之而来。2025年2月11日，美国特拉华州联邦地区法院对汤森路透（ThomsonReuters）诉罗斯（Ross）案作出部分简易判决，认定被告罗斯公司未经授权使用受版权保护的作品训练AI法律检索工具的行为构成版权侵权，且不属于合理使用。[1]这是美国首个就AI训练数据作出实质性判决的案件。本文将重点分析其合理使用论述中对于“转换性目的
Centos离线安装perl 为什么要做囚徒 linux运维 linux centos perl linux 运维
文章目录Centos离线安装perl1.perl是什么？2.Perl下载地址3.perl的安装4.安装结果验证Centos离线安装perl1.perl是什么？Perl是一种高级脚本语言，诞生于1987年，以强大的文本处理能力和灵活性著称，常用于系统管理、Web开发、网络编程等领域2.Perl下载地址perl整体打包下载地址CentOS-7所有rpm包的仓库地址：perl-5.16.3-297.el
21-梯度累积原理与实现机器人图像处理深度学习算法与模型人工智能深度学习 YOLO
一、基本概念在深度学习训练的时候，数据的batchsize大小受到GPU内存限制，batchsize大小会影响模型最终的准确性和训练过程的性能。在GPU内存不变的情况下，模型越来越大，那么这就意味着数据的batchsize智能缩小，这个时候，梯度累积（GradientAccumulation）可以作为一种简单的解决方案来解决这个问题。二、Batchsize的作用训练数据的Batchsize大小对训
使用 Go 语言实现高性能网络服务: 包括TCP连接管理、内存池、epoll、缓存设计、序列化等 AI天才研究院 Golang实战一天一门编程语言自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介Go是一门开源的编程语言，由Google开发并于2009年正式发布。其拥有以下特征：静态强类型:在编译时已经把变量的数据类型确定下来，并进行严格类型检查；自动垃圾回收:不需要手动分配和释放内存，通过引用计数实现自动释放无用对象；接口:支持接口、多态特性，可以方便地实现依赖注入、适配器模式、代理模式等；goroutine:采用协程（Coroutine）机制，使得编
OpenStack Heat模板实战：快速创建用户、容器、网络与云主机类型冯·诺依曼的 openstack 网络 ssh 运维云计算
Heat是OpenStack中的编排服务，通过YAML模板自动化资源管理。本文通过4个实战案例，详解如何用Heat模板创建用户体系、Swift容器、网络资源及云主机类型。一、创建用户、Domain、租户及用户绑定目标：在chinaskillsDomain下创建beijing_group租户，并创建用户cloud。#user_create.ymlheat_template_version:2016-
利用pprof对golang进行性能分析忍界英雄 go学习笔记 golang
利用pprof进行性能分析pprof性能分析的5个方面一、性能分析的五个核心维度CPU分析-剖析程序的CPU使用情况，定位高耗时函数内存分析-追踪内存分配与泄露，优化内存使用模式IO分析-监控文件/网络IO操作，发现瓶颈资源Goroutine分析-检测协程泄露与异常堆栈并发问题分析-诊断死锁及通过racedetector检测数据竞争数据采集时间生产环境采集：选择业务低峰期进行采样（凌晨2-4点）测
【人工智能基础2】Tramsformer架构、自然语言处理基础、计算机视觉总结 roman_日积跬步-终至千里人工智能习题人工智能自然语言处理计算机视觉
文章目录七、Transformer架构1.替代LSTM的原因2.Transformer架构：编码器-解码器架构3.Transformer架构原理八、自然语言处理基础1.语言模型基本概念2.向量语义3.预训练语言模型的基本原理与方法4.DeepSeek基本原理九、计算机视觉七、Transformer架构1.替代LSTM的原因处理极长序列时，效率下降：虽然LSTM设计的初衷是解决长期依赖问题，即让模型
Linux----网络tcp编程 weixin_51790712 linux 网络 tcp/ip
网络编程编程linux操作系统[用户空间]应用层//程序员实现------------------------------------------------------[内核空间]传输层[网络协议栈]//内核已经实现好的属于网络功能网络层数据链路层物理层程序发送数据系统调用---通过系统调用来使用操作系统提供的网络功能函数接口---socketsocket:1.操作系统提供的函数接口//通过这个
java实现大文件传输 M_Snow java 开发语言
简介在现代互联网中，我们经常需要传输大文件，例如视频、音频或者大型数据文件。传输大文件需要考虑诸多因素，例如网络延迟、带宽限制和传输安全性。在本文中，我们将介绍如何使用Java实现大文件传输，并提供相应的代码示例。文件传输协议在进行大文件传输之前，我们需要选择合适的传输协议。目前常用的文件传输协议有FTP（FileTransferProtocol）、SFTP（SecureFileTransferP
怎么做一个AI产品经理？ AI筑梦师 AI产品经理人工智能产品经理
AI产品经理全面进化：在人工智能迅猛发展的时代，产品经理的角色正经历前所未有的转型。从传统的需求捕捉者到技术与商业紧密结合的创新推动者，AI产品经理肩负着将前沿AI技术转化为解决用户痛点的产品的重要任务。随着大数据、云计算和大模型技术的不断成熟，产品经理不仅需要具备敏锐的市场洞察，还必须深刻理解AI技术本质，跨界整合技术、数据与业务优势，从而推动产品的持续创新与落地。本文将全面解析AI产品经理的角
Redis的IO多路复用机制：高效的网络通信设计菜就多练少说 Redis redis 数据库缓存
在高并发、高性能的应用中，如何有效地管理和处理大量的客户端请求是一个至关重要的问题。Redis作为一个高性能的内存数据存储系统，面对大量并发客户端请求时，需要具备良好的网络通信能力。在Redis的设计中，IO多路复用机制是其核心技术之一。它能高效地处理多个客户端的请求，避免了多线程和多进程带来的复杂性和性能开销。本文将深入讲解Redis的IO多路复用机制，包括其原理、实现方式以及为什么它能使Red
MV-EB435i立体相机对垃圾分类开哥kg pytorch 深度学习卷积神经网络分类人工智能
最近在v社区发了一篇文章，懒得转移过来了链接：V社区-机器视觉技术交流社区-MV-EB435i立体相机对垃圾分类我觉得这篇文章对于刚入门深度学习想看点项目学点代码的刚刚好，因为我也是新手，嘻嘻嘻！希望这篇文章对大家有所帮助，如有错误请大家指正。
如何禁止电脑中某个应用联网办公小百知软件技术电脑文件管理技巧电脑
一、通过防火墙基础设置（快速操作）打开控制面板在任务栏搜索框输入“控制面板”并打开，将右上角“查看方式”切换为“大图标”。进入防火墙设置点击WindowsDefender防火墙→左侧选择允许应用或功能通过WindowsDefender防火墙。禁用目标应用的网络权限在列表中找到需禁用的应用，取消其勾选的专用网络和公用网络，点击确定保存。二、通过高级出站规则（彻底禁止）创建出站规则在防火墙设置界面，点
请编写一个Python程序，实现WOA-CNN-BiLSTM鲸鱼算法优化卷积双向长短期记忆神经网络多输入单输出回归预测功能。 2301_81121233 算法神经网络 python mongodb storm zookeeper spark
实现一个基于鲸鱼优化算法（WOA）优化的卷积双向长短期记忆神经网络（CNN-BiLSTM）的多输入单输出回归预测功能是一个复杂的任务，涉及到多个步骤和组件。由于完整的实现会非常冗长，我将提供一个简化的框架和关键部分的代码示例，帮助你理解如何实现这个功能。请注意，这个示例不会包含所有细节，比如数据集的准备、鲸鱼优化算法的具体实现（WOA是一个元启发式算法，需要单独实现或引用现有库），以及CNN-Bi
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他