00000cj

实时语义分割模型PIDNet（CVPR 2023）解析

paper：PIDNet: A Real-time Semantic Segmentation Network Inspired by PID Controllers

official implementation：GitHub - XuJiacong/PIDNet: This is the official repository for our recent work: PIDNet

third-party implementation： https://github.com/open-mmlab/mmsegmentation/tree/main/configs/pidnet

存在的问题

两分支结构在实时语义分割中展现出了其有效性，但高分辨率的细节信息和低分辨率的上下文信息的直接融合存在一个问题即细节特征很容易被周围的上下文特征给淹没。这种overshoot问题限制了现有two-branch分割模型精度的提升。

本文的创新点

本文将卷积神经网络CNN和PID (Proportional-Integral-Derivative)控制器联系起来，并表明一个两分支网络就相当于一个PI控制器，因此本质上存在类似的超调问题。为了解决这个问题，本文提出了一种新的三分支网络架构PIDNet，它包含三个分支分别用来解析细节信息、上下文信息和边缘信息，并采用边界注意力来指导detail branch和context branch的融合。截至发文时间，PIDNet是实时语义分割模型中的SOTA。

方法介绍

背景知识

一个PID控制器包含三个部分：比例proportional控制器、积分Integral控制器、微分Derivative控制器，如图3上所示。

PI控制器的实现如下所示

比例控制器关注当前信号，积分控制器累积过去所有的信号，由于累积的惯性效应，当信号变成相反的时候，简单PI控制器的输出会发生超调现象。然后引入了微分控制器，当信号变小的时候，微分变量会变成负的，起到一个阻尼器的作用来减少超调。类似的，两分支网络Two-Branch Network (TBN)分别通过多个降采样和不降采样的卷积层来解析上下文和细节信息。考虑一个简单的一维例子，其中细节分支和上下文分支都包含3层卷积且不包含BN和ReLU，输出映射计算如下

其中 $K_{i}^{D}=k_{31}k_{22}k_{13}+k_{31}k_{23}k_{12}+k_{32}k_{21}k_{13}+k_{32}k_{22}k_{12}+k_{32}k_{23}k{13}+k_{33}k_{21}k_{12}+k_{33}k_{22}k_{11}$， $K_{i}^{C}=k_{32}k_{22}k_{12}$。这里 $k_{mn}$ 表示第 $m$ 层中卷积核的第 $n$ 个值。由于 $\left | k_{mn} \right | $ 大都分布在(0, 0.01)内（92% for DDRNet-23）并且以1为界，每项的系数会随着层数的增加呈指数下降。因此对于每个输入向量，更多的项意味着对最终输出有贡献的可能性更高。对于detail branch，$I[i-1],I[i],I[i+1]$ 占所有项的70%还多，这意味这detail branch更关注局部信息。相反，在context branch中 $I[i-1],I[i],I[i+1]$ 只占了所有项的不到26%，这表明context branch更关注周围的信息。图3下表明context branch对局部信息变化的敏感度低于detail branch。空间域中细节分支和上下文分支的这种行为类似于时域中的P (current) I (all previous) 控制器。

在PID控制器的z变换中用 $e^{-j\omega}$ 替换 $z^{-1}$，如下

当输入频率 $\omega$ 增加时，I控制器增益变小，D控制器增益变大，因此P , I, D控制器分别起到全通、低通滤波器、高通滤波器的作用。由于PI控制器更关注于输入信号的低频部分，且不能对信号的快速变化立刻做出反应，因此它本身就存在超调的问题。D控制器通过使输出对输入信号的变化更加敏感来减少超调。图3下展示了detail branch解析各种各样的语义信息尽管不准确，而context branch聚合低频上下文信息并且在语义上起到类似大型均值过滤器的作用。细节和语义信息的直接融合会导致一些细节特征的丢失，作者认为TBN在傅里叶领域等价于一个PI控制器。

PIDNet: A novel Three-branch Network

为了缓解超调问题，本文在TBN上增加了一个辅助微分分支（auxiliary derivative branch, ADB）来在空间上模拟PID控制器，并突出高频语义信息。每个对象内部像素的语义是一致的，只有在相邻对象的边界上才会不一致，所以语义的差只在边界上不为零，ADB的目标就是边界检测。为此，本文提出了一个新的三分支实时语义分割模型结构，Proportional-Integral-Derivative Network (PIDNet)，如图4所示

PIDNet包含三个互补的分支，比例P分支在高分辨率特征图中解析和保存细节信息，积分I分支在局部和全局聚合上下文信息来解析long-range dependencies，微分D分支提取高频特征来预测边缘区域。同时还采用cascaded residual block来构建硬件友好的骨干网络。此外P, I, D分支的深度分别设置为适中、深、浅来保证高效实现。

作者在第一个Pag module的输出处接了一个head来得到额外的语义损失 $l_{0}$ 以便更好地优化整个网络。本文没有采用dice loss，而是采用加权交叉熵损失来处理边缘检测的不平衡问题。$l_{2}$ 和 $l_{3}$ 表示CE loss，具体 $l_{3}$ 用的是boundary-awareness CE loss，利用边界head的输出来对齐语义分割和边缘检测任务，并增强Bag module的作用。BAS-Loss的计算如下

其中 $t$ 是预先设定的阈值，$b_{i},s_{i,c},\hat s_{i,c}$ 分别表示边界head的输出、分割的ground-truth和类别c第i个像素的预测结果。完整的损失函数如下

其中 $\lambda_{0}=0.4,\lambda_{1}=20,\lambda_{2}=1,\lambda_{3}=1,t=0.8$。

Pag: Learning High-level Semantics Selectively

在PIDNet中，I分支提供丰富准确的语义信息对细节解析和边缘检测至关重要，这两个分支的层数和通道数都相对较少。因此我们将I分支当做其它两个分支的后备，可以向其它两个分支提供需要的信息。和D分支直接相加的方式不同，本文提出了一个Pixel-attention-guided fusion module (Pag)如图5所示，让P分支有选择的从I分支学习有用的语义特征而不被淹没。

将P和I分支的特征图中对应像素的向量分别定义为 $\vec v_{p}$ 和 $\vec v_{i}$，Sigmoid函数的输出可以表示为

其中 $\sigma$ 表示这两个像素属于同一个对象的概率，如果 $\sigma$ 的值大，我们更相信 $\vec v_{i}$ 因为I分支在语义上是丰富而准确的，反之亦然。Pag的输出如下

PAPPM: Fast Aggregation of Contexts

为了更好的构建全局场景先验，PSPNet（PSPNet: Pyramid Scene Parsing Network）提出了pyramid pooling module (PPM)，它在卷积层之前拼接多尺度的pooling maps得到局部和全局的上下文表示。DDRNet（Deep Dual-resolution Network 原理与代码解析）中提出的Deep Aggregation PPM (DAPPM)进一步提高了上下文的embedding能力展现了优异的性能。但是DAPPM的计算过程就深度而言无法并行，这比较耗时。同时DAPPM的每个尺度都包含了太多的通道，可能超过了轻量模型的表示能力。因此，本文修改了DAPPM中的连接使其可以并行，如图6所示，并将每个尺度的通道数由128减少到96。

这个新的模块称为Parallel Aggregation PPM (PAPPM) 并且应用于PIDNet-M和PIDNet-S中以保证速度。在PIDNet-L中考虑到深度还是使用DAPPM，但减少了通道数来获得更快的速度。

Bag: Balancing the Details and Contexts

根据ADB提取的边缘特征，本文使用边界注意力机制来指导细节表示P和上下文表示I的融合。具体提出了一个Boundary-attention-guided fusion module (Bag) 如图7所示，分别用detail特征和context特征填充高频和低频区域。

context分支在语义上是准确，但丢失了太多的空间和几何细节，尤其是对于边界区域和小目标。由于detail分支保留了更多的空间细节，我们强迫模型在边界区域更信任detail分支，而在其它区域用context特征来填充。定义P, I, D特征图对应像素的向量分别为 $\vec v_{p}, \vec v_{i}, \vec v_{d}$，则Sigmoid、Bag、Light-Bag的输出分别如下

其中 $f$ 表示卷积、BN、ReLU的组合。尽管把Bag中的3x3卷积替换为两个1x1卷积得到Light-Bag，两者的作用是相似的，即当 $\sigma > 0.5$ 时模型更信任细节特征，否则更相信语义特征。

代码解析

这里以MMSegmentation中的实现为例，讲一下具体实现。输入shape为(16, 3, 480, 480)，网络结构是PIDNet-S。S、M、L的区别主要是backbone、ppm、head中的channel数量，num_stem_blocks和num_branch_blocks的个数，和ppm的类型。

backbone的实现在mmseg/models/backbones/pidnet.py中，forward实现如下

def forward(self, x: Tensor) -> Union[Tensor, Tuple[Tensor]]:
    """Forward function.

    Args:
        x (Tensor): Input tensor with shape (B, C, H, W).

    Returns:
        Tensor or tuple[Tensor]: If self.training is True, return
            tuple[Tensor], else return Tensor.
    """
    w_out = x.shape[-1] // 8
    h_out = x.shape[-2] // 8

    # stage 0-2
    x = self.stem(x)  # (16,64,60,60)

    x_i = self.relu(self.i_branch_layers[0](x))  # (16,128,30,30)
    x_p = self.p_branch_layers[0](x)  # (16,64,60,60)
    x_d = self.d_branch_layers[0](x)  # (16,32,60,60)

    comp_i = self.compression_1(x_i)  # (16,64,30,30)
    x_p = self.pag_1(x_p, comp_i)  # (16,64,60,60)
    diff_i = self.diff_1(x_i)  # (16,32,30,30)
    x_d += F.interpolate(
        diff_i,
        size=[h_out, w_out],
        mode='bilinear',
        align_corners=self.align_corners)
    if self.training:
        temp_p = x_p.clone()

    # stage 4
    x_i = self.relu(self.i_branch_layers[1](x_i))  # (16,256,15,15)
    x_p = self.p_branch_layers[1](self.relu(x_p))  # (16,64,60,60)
    x_d = self.d_branch_layers[1](self.relu(x_d))  # (16,64,60,60)

    comp_i = self.compression_2(x_i)  # (16,64,15,15)
    x_p = self.pag_2(x_p, comp_i)  # (16,64,60,60)
    diff_i = self.diff_2(x_i)  # (16,64,15,15)
    x_d += F.interpolate(
        diff_i,
        size=[h_out, w_out],
        mode='bilinear',
        align_corners=self.align_corners)
    if self.training:
        temp_d = x_d.clone()

    # stage 5
    x_i = self.i_branch_layers[2](x_i)  # (16,512,8,8)
    x_p = self.p_branch_layers[2](self.relu(x_p))  # (16,128,60,60)
    x_d = self.d_branch_layers[2](self.relu(x_d))  # (16,128,60,60)

    x_i = self.spp(x_i)  # (16,128,8,8)
    x_i = F.interpolate(
        x_i,
        size=[h_out, w_out],
        mode='bilinear',
        align_corners=self.align_corners)
    out = self.dfm(x_p, x_i, x_d)  # (16,128,60,60)
    return (temp_p, out, temp_d) if self.training else out

self.stem首先是两个3x3-s2的conv+BN+ReLU，然后是两个nn.Sequential层，每层包含2个BasicBlock，在第二层的第一个BasicBlock的第一个卷积层中进行下采样，通道数x2。最终self.stem的输出shape为(16, 64, 60, 60)。

如图4所示，三分支从上到下分别为P, I, D，分别对应细节分支、语义分支、边缘分支。

首先是I分支，代码如下，其中channels=32，num_branch_blocks=3，BasicBlock和Bottleneck都来源于ResNet，具体介绍见ResNet。可以看出一共有3层，前两层的block是BasicBlock，最后一层是Bottleneck。stride=2，每一层都进行下采样，这样是为了增大感受野，提取更丰富的语义特征。

self.i_branch_layers = nn.ModuleList()
for i in range(3):
    self.i_branch_layers.append(
        self._make_layer(
            block=BasicBlock if i < 2 else Bottleneck,
            in_channels=channels * 2**(i + 1),
            channels=channels * 8 if i > 0 else channels * 4,
            num_blocks=num_branch_blocks if i < 2 else 2,
            stride=2))

然后是P分支，代码如下，其中num_stem_blocks=2。和I分支相比，这里默认stride=1不进行下采样，是为了保留更多的细节信息。同时I分支三层的block数分别为3、3、2，而这里为2、2、1，这是因为不下采样图像分辨率更大，减少block数从而减少计算量，和I分支的计算量保持平衡。

self.p_branch_layers = nn.ModuleList()
for i in range(3):
    self.p_branch_layers.append(
        self._make_layer(
            block=BasicBlock if i < 2 else Bottleneck,
            in_channels=channels * 2,
            channels=channels * 2,
            num_blocks=num_stem_blocks if i < 2 else 1))

最后是D分支，代码如下，边缘分支和细节分支一样不进行下采样，同时相比于其它两个分支，边缘分支的层数更少，可能是因为边缘信息作为辅助分支不需要太强的学习能力，还能减少计算量。

self.d_branch_layers = nn.ModuleList([
    self._make_single_layer(BasicBlock, channels * 2, channels),
    self._make_layer(Bottleneck, channels, channels, 1)
])
self.d_branch_layers.append(
    self._make_layer(Bottleneck, channels * 2, channels * 2, 1))

Pag的实现如下，其中self.f_i和self.f_p是两个1x1-s1的卷积

def forward(self, x_p: Tensor, x_i: Tensor) -> Tensor:  # (16,64,60,60),(16,64,30,30)
    """Forward function.

    Args:
        x_p (Tensor): The featrue map from P branch.
        x_i (Tensor): The featrue map from I branch.

    Returns:
        Tensor: The feature map with pixel-attention-guided fusion.
    """
    if self.after_relu:  # False
        x_p = self.relu(x_p)
        x_i = self.relu(x_i)

    f_i = self.f_i(x_i)  # (16,32,30,30)
    f_i = F.interpolate(
        f_i,
        size=x_p.shape[2:],
        mode=self.upsample_mode,
        align_corners=False)  # (16,32,60,60)

    f_p = self.f_p(x_p)  # (16,32,60,60)

    if self.with_channel:  # False
        sigma = torch.sigmoid(self.up(f_p * f_i))
    else:
        sigma = torch.sigmoid(torch.sum(f_p * f_i, dim=1).unsqueeze(1))  # (16,32,60,60)->(16,60,60)->(16,1,60,60)->(16,1,60,60)

    x_i = F.interpolate(
        x_i,
        size=x_p.shape[2:],
        mode=self.upsample_mode,
        align_corners=False)

    out = sigma * x_i + (1 - sigma) * x_p
    return out

PAPPM的实现如下

def forward(self, inputs: Tensor):
    x_ = self.scales[0](inputs)
    feats = []
    for i in range(1, self.num_scales):
        feat_up = F.interpolate(
            self.scales[i](inputs),
            size=inputs.shape[2:],
            mode=self.unsample_mode,
            align_corners=False)
        feats.append(feat_up + x_)
    # [(16,96,8,8),(16,96,8,8),(16,96,8,8),(16,96,8,8)]
    scale_out = self.processes(torch.cat(feats, dim=1))  # (16,384,8,8)
    return self.compression(torch.cat([x_, scale_out],
                                      dim=1)) + self.shortcut(inputs)

下面是DAPPM的实现，可以看出区别主要在于DAPPM遍历每个尺度池化的输出，上采样后与前一个输出feats[i-1]相加后在经过一个卷积处理后再添加进列表feats中，因此当前尺度的结果依赖于上一步的输出，没法并行计算。而在PAPPM中，每个尺度的上采样输出feat_up都与第一个尺度池化的输出相加即x_，因此后面每个尺度的输出可以并行计算。

def forward(self, inputs: Tensor):  # (16,1024,8,8)
    feats = []
    feats.append(self.scales[0](inputs))

    for i in range(1, self.num_scales):
        feat_up = F.interpolate(
            self.scales[i](inputs),
            size=inputs.shape[2:],
            mode=self.unsample_mode)
        feats.append(self.processes[i - 1](feat_up + feats[i - 1]))
    # [(16,128,8,8),(16,128,8,8),(16,128,8,8),(16,128,8,8),(16,128,8,8)]

    return self.compression(torch.cat(feats,
                                      dim=1)) + self.shortcut(inputs)  # (16,256,8,8)

Bag和Light-Bag的实现非常简单，如下

# Bag
def forward(self, x_p: Tensor, x_i: Tensor, x_d: Tensor) -> Tensor:
    """Forward function.

    Args:
        x_p (Tensor): The featrue map from P branch.
        x_i (Tensor): The featrue map from I branch.
        x_d (Tensor): The featrue map from D branch.

    Returns:
        Tensor: The feature map with boundary-attention-guided fusion.
    """
    sigma = torch.sigmoid(x_d)
    return self.conv(sigma * x_p + (1 - sigma) * x_i)

# LightBag
def forward(self, x_p: Tensor, x_i: Tensor, x_d: Tensor) -> Tensor:
    """Forward function.
    Args:
        x_p (Tensor): The featrue map from P branch.
        x_i (Tensor): The featrue map from I branch.
        x_d (Tensor): The featrue map from D branch.

    Returns:
        Tensor: The feature map with light boundary-attention-guided
            fusion.
    """
    sigma = torch.sigmoid(x_d)

    f_p = self.f_p((1 - sigma) * x_i + x_p)
    f_i = self.f_i(x_i + sigma * x_p)

    return f_p + f_i

Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
✨【Blender/Houdini 渲染必看】CPUⓥⓢGPU？3 分钟选对算力不踩坑！渲染101专业云渲染 blender houdini 分布式服务器 maya
核心问题速答Q：渲染该选CPU还是GPU？✅CPU：复杂场景/批量渲染/预算可控首选✅GPU：单帧速度/实时预览/急单交付必选维度1：硬件硬刚——CPU凭啥赢麻了？▫️多线程王者：16核/32核服务器矩阵，支持50-300台并行渲染▫️场景兼容性：粒子特效/全局光照/超复杂模型稳定输出秘密武器：CPU批量渲染100帧耗时=GPU单帧耗时，整体效率持平！⚙️维度2：动态计费逻辑——成本由什么决定？计
PillarNet: Real-Time and High-PerformancePillar-based 3D Object Detection justtoomuchforyou 目标检测人工智能计算机视觉智驾
ECCV2022paper：[2205.07403]PillarNet:Real-TimeandHigh-PerformancePillar-based3DObjectDetectioncode：https://github.com/VISION-SJTU/PillarNet-LTS纯点云基于pillar3D检测模型网络比较SECOND基于voxel，one-stage，基于sparse3Dc
[Python]-基础篇1- 从零开始的Python入门指南踏雪无痕老爷子 Python python 开发语言
无论你是尚未接触编程的新手，还是想从其他语言转向Python的开发者，这篇文章都是你的入门课。一、Python是什么？Python是一种解释型、高级、通用型编程语言，以简洁明了、简单易用着称。它可以应用于网站开发、自动化脚本、数据分析、人工智能、系统操作等多种场景。二、如何安装Python步骤：访问Python官方网站选择目前最新的Python3.x版本下载Windows用户请务必勾选“AddPy
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
Memfault 简介及在Nordic nRF91 系列 DK的应用
1：Memfault是一个云平台，它允许您和您的团队持续监控设备、调试固件问题，并将OTA更新部署到您的设备群，从而以软件的速度交付硬件产品。Memfault以嵌入式优先：支持运行在任何实时操作系统（RTOS）或Android、Linux等操作系统上的嵌入式系统和设备它适用于任何设备：从功能强大的SoC一直到功能受限的MCU，Memfault都能适配您设备的可用闪存、RAM和带宽我们的SDK是专为
OPC/MQTT工业通信软件OPLink 牛宝柱
OPLink是上海泗博自主研发的基于OPC数据采集及转发，OPC数据到MQTT通信的产品。它是基于上海泗博多年的OPC应用经验和工业通信产品的开发背景，推出的OPC/MQTT工业通信软件。软件设计简洁、实用、稳定。同时，OPLink还具备与KepwareLinkMaster相似的数据转发功能，可实现PLC设备间的自主数据通信。功能升级实时性增强：针对复杂的工业自动化环境，OPLink优化了数据传输
AIRIOT物联网低代码平台如何配置MQTT驱动？ AIRIOT 网络服务器物联网
MQTT驱动配置简介MQTT全称为消息队列遥测传输（英语：MessageQueuingTelemetryTransport），是ISO标准（ISO/IECPRF20922）下基于发布(Publish)/订阅(Subscribe)范式的消息协议，工作在TCP/IP协议族上。MQTT最大优点在于，可以用极少的数据和有限的带宽，为连接远程设备提供实时可靠的消息服务。作为一种低开销、低带宽占用的即时通讯协
RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用 ApacheDubbo spring 人工智能架构 Spring AI RAG
>夏冬,SpringAIAlibabaContributorRAG简介什么是RAG（检索增强生成）RAG（RetrievalAugmentedGeneration，检索增强生成）是一种结合信息检索和文本生成的技术范式。核心设计理念RAG技术就像给AI装上了「实时百科大脑」，通过先查资料后回答的机制，让AI摆脱传统模型的"知识遗忘"困境。️四大核心步骤1.文档切割→建立智能档案库核心任务:将海量文档
潜入思维的海洋：SoftCoT++如何让语言模型更聪明步子哥智能涌现语言模型人工智能自然语言处理
在人工智能的浩瀚星空下，大型语言模型（LLMs）如同一颗颗璀璨的恒星，照亮了从文本生成到复杂推理的广阔领域。然而，这些模型在推理任务中往往像是在迷雾中航行——尽管它们能抵达目的地，却常常因为固定的思维路径而错过更优的航线。2025年5月，一篇题为《SoftCoT++:Test-TimeScalingwithSoftChain-of-ThoughtReasoning》的论文如同一盏明灯，照亮了如何让
BI+AI实战：我们如何用3秒完成车企供应链推演 qq_43696218 人工智能
一、BI+AI引领财务分析新纪元在财务数据分析领域，奥威BI+AI正以革命性的姿态颠覆传统。当金蝶、用友等工具仍深陷报表泥潭时，奥威BI+AI通过深度融合商业智能（BI）与人工智能（AI），实现了从滞后报表到实时洞察的飞跃。这不仅极大地提升了财务分析的效率，更为企业的战略决策提供了前所未有的精准支持。二、BI+AI的核心技术优势‌实时动态分析‌o奥威BI+AI摒弃了静态数据集，依托原始科目余额表实
DeepSeek-V3 通俗详解：从诞生到优势，以及与 GPT-4o 的对比码事漫谈 AI ai
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站1.DeepSeek的前世今生1.1什么是DeepSeek？DeepSeek是一家专注于人工智能技术研发的公司，致力于打造高性能、低成本的AI模型。它的目标是让AI技术更加普惠，让更多人能够用上强大的AI工具。1.2DeepSeek-V3的诞生DeepSeek-V3是DeepSeek公司推出的最新一代A
企业级AI开发利器：Spring AI框架深度解析与实战_spring ai实战 AI大模型-海文人工智能 spring python 算法开发语言 java 机器学习
企业级AI开发利器：SpringAI框架深度解析与实战一、前言：Java生态的AI新纪元在人工智能技术爆发式发展的今天，Java开发者面临着一个新的挑战：如何将大语言模型（LLMs）和生成式AI（GenAI）无缝融入企业级应用。传统的Java生态缺乏统一的AI集成方案，开发者往往需要为不同AI供应商（如OpenAI、阿里云、HuggingFace）编写大量重复的接口适配代码，这不仅增加了开发成本，
Linux tcp_info：监控TCP连接的秘密武器 CodeWithMe 网络 linux tcp/ip
深入解析Linuxtcp_info：TCP状态的实时监控利器在开发和运维网络服务时，我们常常遇到这些问题：我的TCP连接为什么速度慢？是发生了重传，还是窗口太小？拥塞控制到底有没有生效？这些问题的答案，其实隐藏在内核的tcp_info结构中。本文将详细介绍：tcp_info是什么，怎么用？各字段含义和实际用途在调优TCP服务中的应用实践一、什么是tcp_info？tcp_info是Linux内核中
Python编程：使用Opencv进行图像处理
【参考】https://github.com/opencv/opencv/tree/4.x/samples/pythonPython使用OpenCV进行图像处理OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。下面将从基础到高阶介绍如何使用Python中的OpenCV进行图像处理。一、安装首先需要安装OpenCV库：pipinst
图扑软件智慧云展厅，开启数字化展馆新模式智慧园区可视化 5g 人工智能大数据安全云计算
随着疫情的影响以及新兴技术的不断发展，展会的发展形式也逐渐从线下转向线上。通过“云”上启动、云端互动、双线共频的形式开展。通过应用大数据、人工智能、沉浸式交互等多重技术手段，构建数据共享、信息互通、精准匹配的高精度“云展厅”，突破时空壁垒限制。图扑软件运用HT强大的渲染功能，数字孪生“云展位”，1:1复现实际展厅内部独特的结构造型和建筑特色。也可以第一人称视角漫游，模拟用户在展厅内的参观场景，在保
webpack和vite对比解析（AI）秉承初心 AI创造 webpack 前端 node.js
以下是Webpack和Vite的对比解析，从核心机制、性能、配置扩展性、适用场景等维度进行详细说明：⚙️一、核心机制差异构建模式Webpack：采用打包器模式，启动时需遍历整个模块依赖图，将所有资源打包成Bundle，再启动开发服务器。Vite：基于ESModules原生支持，开发环境跳过打包，按需编译（浏览器请求时实时编译）。生产环境才用Rollup打包。依赖处理Webpack：冷启动时需全量打
转行要趁早！网络安全行业人才缺口大，企业招聘需求正旺！
网络安全行业具有人才缺口大、岗位选择多、薪资待遇好、学历要求不高等优势，对于想要转行的人员来说，是一个非常不错的选择。人才缺口大网络安全攻防技术手段日新月异，特别是现在人工智能技术飞速发展，网络安全形势复杂严峻，人才重要性凸显。教育部《网络安全人才实战能力白皮书》数据显示，到2027年，我国网络安全人员缺口将达327万。近期发布的《2024年网络安全产业人才发展报告》中提到，沿用ISC2的人才缺口
go关闭linux进程,Golang信号处理和优雅退出守护进程凯然 go关闭linux进程
Golang中的信号处理信号类型个平台的信号定义或许有些不同。下面列出了POSIX中定义的信号。Linux使用34-64信号用作实时系统中。命令mansignal提供了官方的信号介绍。在POSIX.1-1990标准中定义的信号列表信号值动作说明SIGHUP1Term终端控制进程结束(终端连接断开)SIGINT2Term用户发送INTR字符(Ctrl+C)触发SIGQUIT3Core用户发送QUIT
【策划所需编程知识】叫我六胖子笔记游戏
1、TCP与UDP名称TCPUDP方式先奏后斩先斩后奏优点防外挂，慢但不出错用户体验好常用游戏MMORPGFPS、MOBA、IO类2、弱联网与实时联网名称弱联网实时联网方式只在必要时链接频率很高特点频率低频率高特点对宽带要求不高对宽带要求高常用游戏卡牌、放置挂机、轻度休闲、SLGFPS、MOBA、IO类
【机器学习与数据挖掘实战 | 医疗】案例18：基于Apriori算法的中医证型关联规则分析 Francek Chen 机器学习与数据挖掘实战机器学习数据挖掘 Apriori python 关联规则人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈机器学习与数据挖掘实战⌋⌋⌋机器学习是人工智能的一个分支，专注于让计算机系统通过数据学习和改进。它利用统计和计算方法，使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联和异常的过程，旨在提取有价值的信息和知识。机器学习为数据挖掘提供了强大的分析工具，而数据挖掘则是机器学习应用的重要领域，两者相辅相成，共同推动
【Python深度学习】零基础掌握Pytorch Pooling layers nn.MaxPool方法 Mr数据杨 Python 深度学习 python 深度学习 pytorch
在深度学习的世界中，MaxPooling是一种关键的操作，用于降低数据的维度并保留重要特征。这就像是从一堆照片中挑选出最能代表某个场景的那张。PyTorch提供了多种MaxPooling层，包括nn.MaxPool1d、nn.MaxPool2d和nn.MaxPool3d，它们分别适用于不同维度的数据处理。如果处理的是声音信号（一维数据），就会用到nn.MaxPool1d。而处理图像（二维数据）时，
误差的回响：反向传播算法与神经网络的惊天逆转田园Coder 人工智能科普人工智能科普
当专家系统在20世纪80年代初期大放异彩，成为人工智能实用化的耀眼明星时，另一股曾经被宣判“死刑”的力量——连接主义（神经网络）——正在寒冬的冻土下悄然涌动，孕育着一场惊天动地的复苏。马文·明斯基和西摩·帕尔特在1969年《感知机》专著中那精准而冷酷的理论批判，如同沉重的封印，将多层神经网络的研究禁锢了近二十年。他们指出的核心死结——缺乏有效算法来训练具有隐藏层的网络——仿佛一道无法逾越的天堑。单
LabVIEW液压系统远程监控 LabVIEW开发 LabVIEW开发案例 LabVIEW开发案例
利用LabVIEW开发构建注塑机合模液压系统远程监控平台，实现设备状态实时监测、数据交互与远程控制。应用场景工业自动化产线监控：在大型注塑生产车间，实时监测多台注塑机合模液压系统的压力、流量、位移等关键参数，支持产线集中管理。设备远程维护：工程师可通过VPN网络远程访问现场设备，实现故障诊断、参数调整，减少现场维护成本与停机时间。无人值守生产场景：配合自动化上下料系统，实现24小时连续生产监控，异
Linux journal 日志大小限制与管理详解 XMYX-0 linux 运维服务器
文章目录Linuxjournal日志大小限制与管理详解journal日志的默认存储位置journal日志大小限制配置查看当前日志占用情况手动清理日志文件按大小清理日志按时间清理日志按文件数清理日志journald日志机制原理简析（适当加点原理）日志筛选与导出技巧（实用提升）按服务名筛选按时间范围查看日志导出日志为纯文本文件实时查看日志（类似`tail-f`）常见问题与踩坑提醒（经验+防踩坑）问题1
【Html实现“心形日出”（附效果+源代码）】| JavaScript面试题：解释一下异步编程中的回调函数、Promise和Async/Await的概念。它们有什么区别？追光者♂ html5 css3 心形日出前端特效 JS面试题 Promise Async/Await
风会带走你曾经存在过的证明。——虞姬作者主页：追光者♂个人简介：[1]计算机专业硕士研究生[2]2023年城市之星领跑者TOP1(哈尔滨)[3]2022年度博客之星人工智能领域TOP4[4]阿里云社区特邀专家博主[5]CSDN-人工智能领域优质创作者无限进步，一起追光！！！
阅读笔记(2) 单层网络:回归 a2507283885 笔记
阅读笔记(2)单层网络:回归该笔记是DataWhale组队学习计划（共度AI新圣经：深度学习基础与概念）的Task02以下内容为个人理解，可能存在不准确或疏漏之处，请以教材为主。1.从泛函视角来看线性回归还记得线性代数里学过的“基”这个概念吗？一组基向量是一组线性无关的向量，它们通过线性组合可以张成一个向量空间。也就是说，这个空间里的任意一个向量，都可以表示成这组基的线性组合。函数其实也可以看作是
深入了解SIP架构与多媒体通信协议亜恵恵阿由 SIP架构 SDP协议 RTP协议 MGCP协议 RTSP协议
深入了解SIP架构与多媒体通信协议背景简介在现代网络通信中，会话发起协议（SIP）已成为关键的组件，特别是在VoIP和多媒体通信领域。SIP不仅支持音频和视频通信，还通过各种协议和架构实现复杂的通信场景。本文将对SIP相关的关键技术进行分析，探讨它们在实时通信中的作用和意义。会话描述协议（SDP）SDP是一种文本协议，用于在SIP会话初始化时发送必要的多媒体信息。它提供了关于会话名称、活动时间、交
青少年编程与数学 01-012 通用应用软件简介 15 人工智能助手明月看潮生编程与数学第01阶段青少年编程人工智能应用软件编程与数学
青少年编程与数学01-012通用应用软件简介15人工智能助手一、什么是人工智能助手二、人工智能助手的产生和发展（一）早期探索阶段（二）技术突破阶段（三）广泛应用阶段三、人工智能助手的主要功能（一）信息查询（二）日程管理（三）设备控制（四）知识问答四、人工智能助手的商业模式（一）广告收入（二）增值服务（三）数据服务（四）硬件销售五、DeepSeek（一）基本情况（二）技术水平（三）产品功能（四）市场
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_