fadedtj

单目3D多人姿态估计网络（整合自上而下和自下而上网络）

Monocular 3D Multi-Person Pose Estimation by Intergrating Top-Down and Bottom-Up Networks 论文解读

贡献
实验结果
整体框架
3D多人姿态估计相关工作
Network Structure
- GCN Structure
- TCN Structure
- Illustration of the heatmaps estimated from the bottom-up network
- Details of Semi-Supervised Learning
Top-Down Network
Bottom-Up Network
Integration with Interaction-Aware Discriminator
Inter-Person Discriminator
实验细节
消融术研究

这篇文章发表在CVPR2021，目前官方还没有开源，作者提供的github网站为 https://github.com/3dpose/3D-Multi-Person-Pose

贡献

1、本文引入了一种新的双分支框架，其中自上而下的分支检测多个人，而自下而上的分支在其过程中包含了标准化的图像补丁。其框架从这两个分支中获益，同时也克服了它们的缺点。
2、本文的下扑网络采用多人姿态估计，可以有效地处理检测误差引起的人间遮挡和相互作用。
3、本文将人类检测信息纳入自下而上的分支，以便更好地处理尺度变化，从而解决了现有的自下而上方法中的问题。
4、与现有的关注单人姿态的鉴别器不同，本文引入了一种新的鉴别器，它增强了在相机中心坐标中紧密成两交互的人类姿态的有效性。

实验结果

先来看一下本文提出的双分支整合方法的表现：

为了评估室内和室外场景中三维多人摄像机姿态估计的性能，本文对MupoTS-3D进行了评估，如表3所示。结果表明，本文以相机为中心的多人三维姿态估计比SOTA[1]上的性能好2.3%。本文还使用PCK进行以人为中心的三维姿态估计评估，其中本文比SOTA方法[2]高出了2.1%。对MupotS-3D的评估表明，本文的方法在以相机为中心和以人为中心的三维多人姿态估计方面都优于最先进的方法，因为本文提出的框架克服了自下自上和自上而下分支的弱点，同时受益于它们的优势。
[1] Jiefeng Li, Can Wang, Wentao Liu, Chen Qian, and Cewu Lu. Hmor: Hierarchical multi-person ordinal relations for monocular multi-person 3d pose estimation. In Proceedings of the European Conference on Computer Vision (ECCV), 2020.
[2] Jiahao Lin and Gim Hee Lee. Hdnet: Human depth estimation for multi-person camera-space localization. In Proceedings of the European Conference on Computer Vision (ECCV), 2020.

Human3.6M被广泛用于评估三维单人姿态估计。由于本文的方法侧重于处理人间遮挡和尺度变化，不期望本文的方法的性能明显好于SOTA方法。表5总结了对Human3.6M的定量评估，其中本文的方法与SOTA方法[1, 3]对以人为中心的三维人体姿态评估指标（即MPJPE和PA-MPJPE）相当。
[3] Nikos Kolotouros, Georgios Pavlakos, Michael J Black, and Kostas Daniilidis. Learning to reconstruct 3d human pose and shape via model-fitting in the loop. In Proceedings of the
IEEE International Conference on Computer Vision, pages 2252–2261, 2019.

整体框架

上图描述：如图中所示，本文提出的框架由三个主要部分来完成以多人摄像机为中心的三维人体姿态估计：自上而下的精细实例姿态估计网络，自下自上的全局感知姿态估计网络，以及将自上自下和自下而上分支的姿态估计与人机间姿态识别器集成的集成网络。此外，还提出了一种半监督训练过程来增强基于重投影一致性的三维位姿估计。
本文提出的方法包括三个组成部分：1) 一个自上而下的分支来估计细粒度的实例式三维姿态。2) 自下而上的分支，可生成全球感知以相机为中心的三维姿势。3) 一种集成网络，基于自上而下和自下而上的配对姿势生成最终估计，从而从两个分支中获益。
请注意，半监督学习部分是一种训练策略，因此它不包含在本图中。
后面将详细讲述Top-Down、Bottom-Up、Integration with Interaction-Aware Discriminator这三个部分。

3D多人姿态估计相关工作

Top-Down Network
自上而下的单目三维人体姿态估计 (Top-Down Monocular 3D Human Pose Estimation)
现有的自上而下的三维人体姿态估计方法通常将人体检测作为估计以人为中心的三维人体姿态的方法的重要组成部分。它们在单人评估数据集上展示了良好的性能，不幸的是，由于人间封闭或密切交互，多人场景中的性能会下降。此外，所产生的以人为中心的三维姿态不能用于多人场景，其中需要以相机为中心的三维姿态估计。自上而下的方法独立处理每个人，导致人们对附近其他人存在的认识不足。因此，他们在通常存在人间遮挡和密切互动的多人视频中表现不佳。Rogez等人，开发了一个姿态建议网络来生成边界框，然后为每个人单独进行姿态估计。最近，与以前以人为中心进行姿态估计的方法不同，Moon等人，提出了一种自上而下的三维多人姿态估计方法，该方法可以在相机中心坐标下估计图像中所有人的姿势。然而，该方法仍然依赖于检测和独立处理每个人；因此，它很可能遭受人间的闭塞和密切的相互作用。
Bottom-Up Network
自下而上的单目三维人体姿态估计(Bottom-Up Monocular 3D Human Pose Estimation)
现有一些自下而向上的方法被提出。Fabbri等人，引入了一个编码器-解码器框架，首先压缩热图，然后在测试时间将其解压缩回原始表示以快速高清图像处理。Mehta等人，建议识别单个关节，组成全身关节，并在三个阶段执行时间和运动学约束，以实现实时三维运动捕捉。Li等人，开发了一种计算复杂度较低的综合方法，用于人体检测、以人为中心的姿态估计和来自输入图像的人体深度估计。Lin等人，将人的深度回归表示为照相机坐标系中多人定位的垃圾桶指数估计问题。Zhen等人，首先估计身体部位的2.5维表示，然后重建以相机为中心的多人三维姿势。这些方法受益于自下而上的方法的性质，它可以同时处理多个人，而不依赖于人类的检测。然而，由于所有的人都以相同的规模进行处理，这些方法不可避免地对人类的规模的变化很敏感，这限制了它们在野生视频上的适用性。
Integration with Interaction-Aware Discriminator
自上而向下和自下而向上的组合(Top-Down and Bottom-Up Combination)
早期探索自下扑和自下而上的人姿态估计方法的非深度学习方法的形式是数据驱动的信念传播、联合位置和骨架的不同分类器，或概率高斯混合建模。最近基于深度学习的方法试图利用自上向下和自下而上的信息，主要是关于估计二维姿态。Hu and Ramanan提出了一种分层修正的高斯模型，将自上自下的反馈与自下而上的cnn相结合。Tang等人，开发了一个具有自下而上推理的框架，然后基于人体的组合模型进行自上而向下的细化。Cai等人，引入了一种同时使用自下而积和自上而下特征的时空图卷积网络(GCN)。对这些方法进行探索，以受益于自上而下和自下而上的信息。然而，它们不适合三维多人姿态估计，因为自下向下和自下而上方法的基本弱点都没有完全解决，包括人间遮挡引起的检测和关节组合错误，以及尺度变化问题。Li等人，采用LSTM，将自下而上的热图与人体检测相结合，进行二维多人姿态估计。它们解决了被遮挡和检测移位的问题。不幸的是，他们使用一个自下而上的网络，并且只添加检测边界框作为自上而向下的信息来分组关节。因此，他们的方法基本上仍然是自下而上的，因此仍然容易受到人类规模变化的影响。

Network Structure

GCN Structure

与现有的使用无向图的GCN方法不同，本文使用有向图。使用有向图的优点是，具有较高可信度的更可靠的节点能够影响具有非对称邻接矩阵的低可信度的不可靠节点。我们采用如下的GCN方法。
这些特征根据GCNs中的相邻矩阵进行传播，这意味着传播图中的边缘值。给定二维姿态估计器的热图H，我们选择图中最高值的位置作为每个关节图中的顶点，邻接矩阵由以下方程式组成：

其中，Ai,j 是从顶点i到顶点j的向外的权重。max(Hi) 代表 i-th 关节的置信度。阶 (i, j) 是从顶点 i 到达顶点 j 所需的最小跳数。这种邻接的形成使对近顶点的权重更大，而对远顶点的权重更小。

TCN Structure

本文的GCN可以在遮挡或缺失信息下完成姿势，但由于缺乏时间平滑性而产生令人不安的结果。以往对时间卷积网络(TCN)的研究表明，TCN在限制预测的三维姿态的时间平滑性方面的有效性。我们采用了TCN结构。如下图所示，本文分别利用两个TCNs来估计以人为中心的三维姿态（即关节）和以相机为中心的根关节的深度。本文将这两个TCN命名为：Joint-TCN 和 Root-TCN。

上图描述：本文的TCN包括一个用于相对姿态估计的联合TCN和一个用于以相机为中心的根深度估计的根TCN。
- Joint-TCN 以GCN生成的三维姿势序列作为输入，并通过考虑时间信息来输出精确的以人为中心的三维姿势。估计姿态PTCN与其地面真相P˜之间的损失为L2，公式为：
  
  其中，K是关节的数量
- Root-TCN 以GCN生成的三维姿态序列和姿态估计器生成的二维姿态序列作为输入，并输出估计的以相机为中心的根深度。本文没有直接估计凸轮中心的深度Z，而是估计了归一化的根深度，即基于焦距f的RTCN=Zf，以避免照相机固有参数的影响。损失函数介于估计RTCN与其地面真实值R˜之间：
  
  其中，K是关节的数量；基于等式提供的以个人为中心的三维姿势和来自等式的根缝深度，得到了以相机为中心的三维姿态。

Illustration of the heatmaps estimated from the bottom-up network

如下图所示，说明了由本文使用的自下而上的网络估计的四个热图输出的一个示例。左上角是一个输入图像。顶部中间是一个关节图，它显示了关节的热图，其中所有通道合并在一起，以便更好地可视化所有关节。右上角是估计的三维姿势。左下角显示了ID标签分布。中间是根深度图，红色代表一个人比其他人更远。右下角是相对于骨盆关节的相对深度映射的一个例子，其中以左臂深度为例。与他的骨盆相比，左人的手臂距离相机更远（红色），而右人的骨盆更靠近相机（蓝色）。

从自下而上分支估计热图的可视化

Details of Semi-Supervised Learning

本文的半监督学习(SSL)管道如图所示。首先，使用训练好的模型来生成无标签数据的伪标签，这是本文12个实验中的COCO数据集。注意，本文只使用了图像，而不是关节的二维地面来模拟未标记的数据场景。不幸的是，伪标签不能直接使用，因为其中一些标签是不正确的。因此，本文使用了两个一致性项来测量所有伪标签的质量：本文中提到的重投影误差和多透视误差。
由于二维数据集的姿态变化比三维数据集的姿态变化更丰富，例如。与H36M相比，COCO在不同的环境和姿态方面，估计的2D姿态比估计的三维姿态更健壮。现有的重投影误差测量生成的三维姿态与检测到的二维姿态之间的偏差。与此不同的是，本文利用二维姿态热图中关节的置信度作为权重，自适应地调整重新投影的三维姿态，以匹配基于关节的置信度的估计的二维姿态。

上图描述：SSL旨在保持两种一致性：重新投影和多视角。

Top-Down Network

给定一个人体检测边界框，现有的下扑方法估计一个人的全身关节。因此，如果盒子内或有多个人的部分边界外的身体部位，全身关节估计很可能是错误的。下图显示了现有方法的故障示例。相比之下，本文的方法可以为边界框内部的所有关节生成热图（即，放大以适应不准确的检测）并估计每个关节的标识，以将其分成相应的人员。

上图描述：估计的人类关节热图的例子。左图显示的输入帧上覆盖有不准确的检测边界框（即仅检测到一个人）。中间的图显示了现有的自上而下方法的估计热图。右边的图像显示了本文自上而下的分支的热图。
给定一个输入视频，对于每一帧，我们都应用一个人类检测器，并根据检测到的边界框裁剪图像补丁。对每个贴片应用二维姿态检测器，为所有人体关节，如肩膀、骨盆、踝关节等生成热图。具体地说，我们的二维姿态热图的下顶损失是预测热和地真热图之间的L2损失，公式为：

其中H和H˜分别是预测的和地面真值热图。
获得二维姿态热图后，定向GCN网络用于细化由遮挡或部分边界框体部分引起的潜在不完整姿态，并使用两个TCN基于给定的二维姿态序列类似于估计以个人为中心的三维姿态和以相机为中心的根深度。由于TCN需要同一实例的输入序列，因此将使用姿态跟踪器来跟踪输入视频中的每个实例。本文还在训练中应用数据增强训练TCN，以便它可以处理闭塞。

Bottom-Up Network

自上而下的方法在边界框内进行估计，因此缺乏对他人的全局认识，导致难以估计以相机为中心的坐标中的姿势。为了解决这个问题，本文进一步提出了一个自下而向上的网络，同时处理多个人。由于自下向上的姿态估计存在人类尺度的变化，本文将自上而下网络的热图与原始输入框架作为自下而上网络的输入。在自上而下的热图是目标探测器的结果和基于归一化盒的姿态估计的指导下，自下而上的网络的估计对尺度变化具有更强的鲁棒性。本文的自下而上的网络输出四个热图：一个二维姿态热图、ID标签图、相对深度图和根深度图。二维姿态热图和ID标签图的定义方式与上一节中的定义方式相同。相对深度图是指每个关节相对于其根（骨盆）关节的深度图。根深度图表示根关节的深度图。
特别是，本文将深度损失应用于相对深度图h根和根深度h根的估计。请参见补充材料，例如来自自下而上网络的四个估计热图。对于N个人和K个接头，损失可表述为：

其中h是深度图，d是地面真值的深度值。请注意，对于骨盆（即根关节），深度是以相机为中心的深度。对于其他接头，深度相对于对应的根接头是相对的。
本文将热图分组为实例（即人员），并使用与在自上而下的网络中相同的程序来检索联合位置。此外，通过检索关节（即根或其他关节）所在的相应深度图，可以获得根关节z根的凸轮心深度和其他关节的相对深度。具体是：

其中，i，k 分别指ith实例和 k-th 关节。

Integration with Interaction-Aware Discriminator

在得到自上而下和自下而上网络的结果后，首先需要找到两个网络结果之间的对应姿势，即自上而下姿势和自下而上姿势属于同一个人。请注意，在本文中，P代表以相机为中心的三维姿势。
给定来自自下而上分支PBU和自上而下分支PTD的两个姿态集，我们匹配来自这两个集合的姿势，以形成姿势对。两种姿势的相似性定义为：

其中，

OKS表示对象关键点相似度，它度量给定联合对的联合相似度。d(x，y) 是两个接头之间的欧几里得距离。s和σ是两个控制参数。Sim i,j 测量了自下而上网络的ith3D姿态PiBU与自上而下网络的 j-th 三维姿态PjTD之间的相似性。请注意，来自自上而下的 PTD 和自下而上的 PBU 的姿势都是以相机为中心的；因此，相似度是基于相机坐标系来测量的。cBUi、k和cTDj、k分别是三维姿态PiBU和PjTD的联合k的置信值。根据Sim i,j 的定义计算了两组姿态PTD和PBU之间的相似性矩阵，利用匈牙利算法得到了匹配结果。
一旦得到了匹配的对，就将每对三维姿势和每个关节的置信度提供给我们的积分网络。本文的集成网络由3个全连通的层组成，它们输出了最终的估计。

Inter-Person Discriminator

为了训练集成网络，本文提出了一种新的人间鉴别器。不像大多数现有的关于人体姿态估计的鉴别器。当他们只能区分一个人的三维姿态时，本文提出了一个交互感知鉴别器来强制姿态对的交互是自然和合理的，它不仅包括现有的单人鉴别器，而且还推广到相互作用的人。具体地说，本文提出的鉴别器包含两个子网络：D1，专门用于一个以人为中心的3D姿势；还有，D2，专门用于两个人的一对以相机为中心的3D姿势。

实验细节

Multi-Person Pose Estimator
- 我们的多人姿态估计器使用HRNet-w32作为骨干，并在MuCO和COCO数据集的组合上进行训练。我们复制了两次COCO数据集，以平衡两个数据集之间的训练数据。网络由 Adam 优化器训练，学习率从0.001开始，在epoch 30和40时减少至1/10。该网络被训练了50个epochs，使用8x RTX Quadro 8000 GPUs进行训练需要35个小时。
GCN and TCNs
- 本文的GCN和TCNs是基于从多人姿态估计器中预先提取的热图来训练的。本文用 Adam 优化器来训练网络，学习率从0.001开始，并每40个epochs减少至1/10。这些网络经过了100个epochs的训练，使用单个RTX 2080Ti GPU进行训练需要25个小时。本文使用增强功能来训练网络以更好地处理遮挡。
Bottom-Up Network
- 本文的自下而上的网络是基于MuCO和COCO数据集的结合来训练的。为了平衡训练样本的数量，本文复制了两次COCO数据集，并与MuCO数据集结合。自下向上的网络由 Adam 优化器训练，学习率从0.001开始，在第30和第40个epoch降到1/10。该网络被训练了50个epochs，使用8个 8x RTX Quadro 8000 GPUs.进行训练需要65个小时。
Integration Network
- 本文的集成网络包含5层完全连接，层大小为512。网络一开始用 Adam 优化器训练，学习率为0.001，并每50个epochs减少到1/10。网络经过150次训练，单个RTX 2080Ti GPU进行训练需要3.5小时。本文主要讨论了数据增强的过程。为了清楚起见，在这里简要地解释：1) 本文使用随机掩蔽来模拟遮挡，其中被遮挡的关节被掩盖到（0,0）。2) 本文应用基于高斯随机的关节随机位移方法来模拟不准确的位姿估计。3) 本文随机将配对中的一个姿势设为零，以模拟未配对的姿势。

消融术研究

消融研究旨在验证本文的框架中的每个子模块的有效性。本文使用现有的自上而下的姿态估计器（即检测一个全身关节）作为基线来验证本文提出的自上而下的网络，缩写为TD(w/oMP)，以与本文称为TD(wMP)的自上而下网络进行比较。本文还使用现有的自下而上的热图估计来验证自下而上的网络作为baseline，成为BU(w/o CH)，以与本文自下而上的网络BU(wCH)进行比较。为了评估本文的集成网络，本文使用了三个基线。第一个是通过结合现有的TD和BU网络的直接集成。第二种是硬集成，缩写为TDBU（hard），其中总是使用自上而下的以人为中心的姿势，再加上来自自下而上的网络的根深度。第三种是线性积分，缩写为TDBU（linear），根据估计热图的置信值，将自上向下的三维姿态与相应的自下置上姿态相结合。
如下表所示，可以观察到本文的自上而下的网络、自下而上的网络和集成网络明显优于它们相应的基线。与自下而上的网络相比，本文的自上而下的网络往往有更好的以人为中心的三维姿态估计，因为自上而下的网络不仅受益于多人姿态估计器，还有助于处理遮挡姿势的GCN和TCN姿势。相反，本文的自下而上网络在根关节估计方面取得了更好的性能，因为它基于一个完整的图像来估计根深度；而自上而下网络的根深度是基于单个骨架来估计的。最后，与自上而下和自下而上网络的姿态组合相比，本文的集成网络显示了优越的性能，验证了其有效性。

上图描述：对 MuPoTS-3D 数据集的消融研究。TD、BU、MP、CH、IN 和 PM 分别代表自上而下、自下而上、多人姿态估计器、组合热图、集成网络和姿态匹配。
除了验证本文的自上而下和自下而上的网络外，本文还对提出的半监督学习进行了消融分析。本文在下表中展示了使用鉴别器使用重投影损失、多透视损失、重投影损失，以及使用鉴别器使用重投影和多透视损失的结果。可以看到，重新投影损失比多透视损失更有用，因为它利用了来自二维姿态估计器的信息，这是用具有大量姿态和环境变化的二维数据集来训练的。更重要的是，可以观察到，与其他模块相比，本文提出的交互感知鉴别器进行了最大的性能改进，证明了加强人员之间交互的有效性的重要性。

上图描述：对 MuPoTS-3D 数据集的消融研究。Rep, MP和 dis 代表重新投影、多视角和鉴别器。

=====================================================================
最后还有一些定量定性分析就不阐述了，详细可以看论文。后面等作者代码开源后，再复现进行讨论。

CIANNA由天体物理学家提供/为天体物理学家提供的卷积交互式人工神经网络 struggle2025 神经网络
一、软件介绍文末提供程序和源码下载CIANNA是一个通用的深度学习框架，主要用于天文数据分析。根据天体物理问题解决的相关性添加功能和优化。CIANNA可用于为各种任务构建和训练大型神经网络模型，并提供高级Python接口（类似于keras、pytorch等）。CIANNA的特点之一是它定制实施了受YOLO启发的对象探测器，用于2D或3D射电天文数据产品中的星系探测。该框架通过低级CUDA编程完全实
【docker】离线部署docker-compose
简介记录一下安装docker-compose的步骤，首先表示安装的系统是centos，docker已经安装好了，本文采用的是离线安装的方式。网上使用的在线安装由于github网络时好时坏，所以只能采用离线安装的方式。参考文档。步骤1.进入到官网官网的链接是https://github.com/docker/compose/releases/tag/v2.18.1。注意这里的是2.18.1版本，可以
PAT A1052 Linked List Sorting C++ 主要的坑 sisi-mia PAT 甲级算法 c++学习 pat考试
Alinkedlistconsistsofaseriesofstructures,whicharenotnecessarilyadjacentinmemory.WeassumethateachstructurecontainsanintegerkeyandaNextpointertothenextstructure.Nowgivenalinkedlist,youaresupposedtosortt
和李沐老师学深度学习--2.数据操作部分代码实现（学习笔记）
大家对代码有不懂地方都可以上网去查找，最好是有一定的数据分析基础比较容易理解，李沐老师课程视频链接我放在这里了大家有不懂都可以观看课程进行学习04数据操作+数据预处理【动手学深度学习v2】_哔哩哔哩_bilibili深度学习课程电子书：大家可以使用翻译插件观看书的内容Preface—DiveintoDeepLearning1.0.3documentation深度学习github项目：https:/
基于opencv的鱼群检测和数量统计识别鱼群密度带界面
完整项目点文末名片查看获取一、项目简介本项目旨在通过计算机视觉技术，实现对视频中鱼类数量的自动检测与计数。利用OpenCV库进行图像处理，包括背景减除、形态学操作、轮廓检测等步骤，最终在视频帧中标记出鱼类并统计其数量。该系统可广泛应用于水产养殖、生态监测等领域，有助于提高工作效率和数据准确性。二、环境准备在开始项目之前，需要确保以下环境和工具已安装：Python：推荐使用Python3.6及以上版
目标跟踪领域经典论文解析 ♢.＊目标跟踪人工智能计算机视觉
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、JAVA、PYTHON与SAP的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！目标跟踪是计算机视觉领域的一个
基于均值偏移算法的动态目标跟踪研究 Zoiny_楠算法均值算法目标跟踪
摘要：目标跟踪技术是计算机视觉领域中重要研究课题之一,在人类生活、军事侦察、工业生产、医疗诊断、交通管理等多方面,都有广泛的应用,研究目标跟踪对人类生活、工程应用等具有现实的指导意义。在基于视觉的目标跟踪算法中,经典的Mean-Shift算法以其理论科学有效、操作简单易实现,跟踪性能较好等优势,一直是众多学者研究的热点。可算法也存在着许多缺陷。例如目标模型中混有背景信息的干扰,给目标定位带来了偏差
day39 心落薄荷糖 Python训练营 python
#先继续之前的代码importtorchimporttorch.nnasnnimporttorch.optimasoptimfromtorch.utils.dataimportDataLoader,Dataset#DataLoader是PyTorch中用于加载数据的工具fromtorchvisionimportdatasets,transforms#torchvision是一个用于计算机视觉的库，
【图像处理入门】12. 综合项目与进阶：超分辨率、医学分割与工业检测小米玄戒Andrew 图像处理：从入门到专家图像处理人工智能深度学习算法 python 计算机视觉 CV
摘要本周将聚焦三个高价值的综合项目，打通传统算法与深度学习的技术壁垒。通过图像超分辨率重建对比传统方法与深度学习方案，掌握医学图像分割的U-Net实现，设计工业缺陷检测的完整流水线。每个项目均包含原理解析、代码实现与性能优化，帮助读者从“技术应用”迈向“系统设计”。一、项目1：图像超分辨率重建（从模糊到清晰的跨越）1.技术背景与核心指标超分辨率（SR）是通过算法将低分辨率（LR）图像恢复为高分辨率
Densenet模型花卉图像分类深度学习乐园分类数据挖掘人工智能
项目源码获取方式见文章末尾！600多个深度学习项目资料，快来加入社群一起学习吧。《------往期经典推荐------》项目名称1.【基于CNN-RNN的影像报告生成】2.【卫星图像道路检测DeepLabV3Plus模型】3.【GAN模型实现二次元头像生成】4.【CNN模型实现mnist手写数字识别】5.【fasterRCNN模型实现飞机类目标检测】6.【CNN-LSTM住宅用电量预测】7.【VG
基于AFM注意因子分解机的推荐算法深度学习乐园深度学习实战项目深度学习科研项目推荐算法算法机器学习
关于深度实战社区我们是一个深度学习领域的独立工作室。团队成员有：中科大硕士、纽约大学硕士、浙江大学硕士、华东理工博士等，曾在腾讯、百度、德勤等担任算法工程师/产品经理。全网20多万+粉丝，拥有2篇国家级人工智能发明专利。社区特色：深度实战算法创新获取全部完整项目数据集、代码、视频教程，请进入官网：zzgcz.com。竞赛/论文/毕设项目辅导答疑，v：zzgcz_com1.项目简介项目A033基于A
docker-compose配置文件解析疯狂吧小飞牛 docker 容器运维
原文地址：docker-compose配置文件解析–无敌牛欢迎参观我的个人博客：无敌牛–技术/著作/典籍/分享等我们在把服务docker化的时候，不仅需要把各个服务做成docker镜像，还需要编辑各个服务之间的启动方式。对于不需要暴露的端口，还需要通过虚拟网桥的方式，保证各个服务之间的正常通讯。这就需要用到docker-compose工具，并且需要编辑对应的DockerCompose配置文件来控制
深度学习实战：基于嵌入模型的AI应用开发 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能深度学习 ai
深度学习实战：基于嵌入模型的AI应用开发关键词：嵌入模型（EmbeddingModel）、深度学习、向量空间、语义表示、AI应用开发、相似性搜索、迁移学习摘要：本文将带你从0到1掌握基于嵌入模型的AI应用开发全流程。我们会用“翻译机”“数字身份证”等生活比喻拆解嵌入模型的核心原理，结合Python代码实战（BERT/CLIP模型）演示如何将文本、图像转化为可计算的语义向量，并通过“智能客服问答”“
基于OpenCv的图片倾斜校正系统详细设计与具体代码实现 AI大模型应用之禅人工智能数学基础计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
基于OpenCv的图片倾斜校正系统详细设计与具体代码实现1.背景介绍1.1图像处理的重要性在当今数字时代,图像处理技术在各个领域都扮演着重要角色。无论是在计算机视觉、模式识别、医学影像、遥感探测还是多媒体处理等领域,图像处理都是不可或缺的核心技术。通过对图像进行预处理、增强、分割、特征提取等操作,可以从图像中获取有价值的信息,为后续的分析和决策提供支持。1.2图像倾斜问题及其影响在实际应用中,由于
SQl中多使用EXISTS导致多查出了一条不符合条件的数据 yangchanghua111 sql 数据库
原本的部分条件如下andi.is_complement='20'andi.yxbz='1'AND(i.nameLIKEconcat('%','红','%')OREXISTS(SELECT*FROMcommodity_suit_composecscWHEREcsc.suit_id=i.IDANDcsc.compose_nameLIKEconcat('%','红','%')))查寻i表的name和cs
Script to save all images from a docker-compose.yml file 唧唧歪歪的 docker docker docker-compose
通过docker-compose.yml导出镜像到单个文件Scripttosaveallimagesfromadocker-compose.ymlfile1st#!/bin/bashmkdir-poutforimgin`grepimage$1|sed-e's/^.*image\://g'`;docleanname=${img/\//-}tag=`dockerimages|grep$img|awk'
卷积神经网络（Convolutional Neural Network, CNN）不想秃头的程序神经网络语音识别人工智能深度学习网络卷积神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专门用于处理图像、视频等网格数据的深度学习模型。它通过卷积层自动提取数据的特征，并利用空间共享权重和池化层减少参数量和计算复杂度，成为计算机视觉领域的核心技术。以下是CNN的详细介绍：一、核心思想CNN的核心目标是从图像中自动学习层次化特征，并通过空间共享权重和平移不变性减少参数量和计算成本。其关键组件包括：卷积层（
ResNet（Residual Network）不想秃头的程序神经网络语音识别人工智能深度学习网络残差网络神经网络
ResNet（ResidualNetwork）是深度学习中一种经典的卷积神经网络（CNN）架构，由微软研究院的KaimingHe等人在2015年提出。它通过引入残差连接（SkipConnection）解决了深度神经网络中的梯度消失问题，使得网络可以训练极深的模型（如上百层），并在图像分类、目标检测、语义分割等任务中取得了突破性成果。以下是ResNet的详细介绍：一、核心思想ResNet的核心创新是
P25：LSTM实现糖尿病探索与预测 ?Agony lstm 人工智能 rnn
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、相关技术1.LSTM基本概念LSTM（长短期记忆网络）是RNN（循环神经网络）的一种变体，它通过引入特殊的结构来解决传统RNN中的梯度消失和梯度爆炸问题，特别适合处理序列数据。结构组成：遗忘门：决定丢弃哪些信息，通过sigmoid函数输出0-1之间的值，表示保留或遗忘的程度。输入门：决定更新哪些信息，同样通过sigmoid函数控制更新
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
导出docker-compse.yml中docker镜像成tar文件青春不流名 eureka 云原生
#!/bin/bash#确保脚本在正确的目录下运行SCRIPT_DIR=$(dirname"$(realpath"$0")")cd"$SCRIPT_DIR"||exit1#定义docker-compose文件路径COMPOSE_FILE="${SCRIPT_DIR}/docker-compose.yml"#创建导出目录EXPORT_DIR="${SCRIPT_DIR}/docker_images"
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
Python编程：使用Opencv进行图像处理
【参考】https://github.com/opencv/opencv/tree/4.x/samples/pythonPython使用OpenCV进行图像处理OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。下面将从基础到高阶介绍如何使用Python中的OpenCV进行图像处理。一、安装首先需要安装OpenCV库：pipinst
运行两个不同项目（`ragflow` 和 `dify`）时，出现了 Redis 容器互相替换 z日火人工智能类项目 redis 数据库 docker
问题描述在同时运行两个不同项目（ragflow和dify）时，出现了Redis容器互相替换的问题。具体表现为，当启动一个项目的Redis容器时，另一个项目的Redis容器会被停止或替换，导致两个项目的Redis容器无法同时存在。问题经过最初发现：在运行dify项目时，发现ragflow项目的Redis容器被替换为dify项目的Redis容器。尝试解决：通过修改docker-compose.yml文
【Python深度学习】零基础掌握Pytorch Pooling layers nn.MaxPool方法 Mr数据杨 Python 深度学习 python 深度学习 pytorch
在深度学习的世界中，MaxPooling是一种关键的操作，用于降低数据的维度并保留重要特征。这就像是从一堆照片中挑选出最能代表某个场景的那张。PyTorch提供了多种MaxPooling层，包括nn.MaxPool1d、nn.MaxPool2d和nn.MaxPool3d，它们分别适用于不同维度的数据处理。如果处理的是声音信号（一维数据），就会用到nn.MaxPool1d。而处理图像（二维数据）时，
阅读笔记(2) 单层网络:回归 a2507283885 笔记
阅读笔记(2)单层网络:回归该笔记是DataWhale组队学习计划（共度AI新圣经：深度学习基础与概念）的Task02以下内容为个人理解，可能存在不准确或疏漏之处，请以教材为主。1.从泛函视角来看线性回归还记得线性代数里学过的“基”这个概念吗？一组基向量是一组线性无关的向量，它们通过线性组合可以张成一个向量空间。也就是说，这个空间里的任意一个向量，都可以表示成这组基的线性组合。函数其实也可以看作是
使用docker搭建redis主从架构，一主2从黑皮爱学习 redis自学笔记 docker redis 架构
使用Docker搭建Redis主从架构（一主两从）Redis主从架构是提高系统可用性和读取性能的重要方案，通过Docker可以快速搭建该架构。下面将详细介绍搭建步骤。架构设计我们将搭建包含以下组件的架构：1个主节点（Master）：负责写入操作，端口63792个从节点（Slave）：负责读取操作，端口分别为6380和6381所有节点通过DockerCompose管理，共享一个自定义网络搭建步骤1.
Excel处理控件Aspose.Cells教程：Java 在 Excel 中插入和删除行和列
Aspose.Cells是Excel电子表格编程API，可加快电子表格的管理和处理任务，支持构建能够生成，修改，转换，呈现和打印电子表格的跨平台应用程序。同时不依赖于MicrosoftExcel或任何MicrosoftOfficeInterop组件，AsposeAPI支持旗下产品覆盖文档、图表、PDF、条码、OCR、CAD、HTML、电子邮件等各个文档管理领域，为全球.NET、Java、C++等1
【深度学习解惑】如果用RNN实现情感分析或文本分类，你会如何设计数据输入？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 分类人工智能机器学习神经网络
以下是用RNN实现情感分析/文本分类时数据输入设计的完整技术方案：1.引言与背景介绍情感分析/文本分类是NLP的核心任务，目标是将文本映射到预定义类别（如正面/负面情感）。RNN因其处理序列数据的天然优势成为主流方案。核心挑战在于如何将非结构化的文本数据转换为适合RNN处理的数值化序列输入。2.原理解释文本到向量的转换流程：原始文本分词建立词汇表词索引映射词嵌入层序列向量关键数学表示：词嵌入表示：
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen