顾道长生'

（CVPR-2023）用于步态识别的动态聚合网络

用于步态识别的动态聚合网络

paper题目：Dynamic Aggregated Network for Gait Recognition

paper是BIT发表在CVPR 2023的工作

paper地址：链接

Abstract

步态识别有利于多种应用，包括视频监控、犯罪现场调查和社会安全等。然而，步态识别在实际场景中常常受到多种外部因素的影响，例如携带条件、穿着大衣、不同的视角等。近年来，各种基于深度学习的步态识别方法取得了可喜的成果，但它们往往使用固定权重的卷积网络来提取显着特征之一，没有很好地考虑关键区域步态特征之间的关系，并且忽略忽略了完整运动模式的聚合。在本文中，我们提出了一个新的观点，即实际步态特征包括多个关键区域的全局运动模式，并且每个全局运动模式由一系列局部运动模式组成。为此，我们提出了动态聚合网络（DANet）来学习更多有区别的步态特征。具体来说，我们在相邻像素的特征之间创建了一种动态注意机制，该机制不仅自适应地关注关键区域，而且还生成更具表现力的局部运动模式。此外，我们开发了一种自注意力机制来选择代表性的局部运动模式并进一步学习鲁棒的全局运动模式。对三个流行的公共步态数据集（即 CASIAB、OUMVLP 和 Gait3D）的广泛实验表明，所提出的方法可以对当前最先进的方法提供实质性改进。

1. Introduction

步态识别旨在远距离检索相同的身份，已广泛应用于社会治安[28]、视频监控[4、15、49]、犯罪侦查[25]等领域。与动作识别[17，53，54]和行人重识别[2，55，60，61]相比，步态识别是最具挑战性的细粒度标签分类问题之一。一方面，轮廓数据是受分割算法[26，62，63]的限制的人的二值图像，偶尔会有孔洞和破碎的边缘。另一方面，在真实场景中，步态识别也会受到各种外部因素的影响，如携带条件、穿着外套、不同的视角等。不同的角度和服装条件会极大地改变同一个人的剪影外观，导致类内差异远远大于类间差异。我们问：如何在各种外部因素的影响下，为每个人自适应地学习更稳健的特征？我们试图从以下几个角度回答这个问题：

(I)局部运动模式。步态，或行走的行为，本质上是身体各部分的协调运动。在步态序列中，我们观察到每个部分都有唯一的代表性运动模式，并且每个运动模式都由一组局部化子运动组成。因此，在各种外界因素的干扰下，准确定位判别部分，获得具有代表性的局部运动模式至关重要。然而，以前的基于步态的方法[7，8，13，14，20，24，33]简单地使用具有非线性激活的卷积网络来模拟动态运动。一旦网络被训练好，参数和非线性函数就只能集中在固定的模式上。为此，我们提出将每个像素的特征编码为具有幅度和相位的向量，如图1所示，这允许学习聚焦相邻像素之间的动态注意映射函数。通过对这种关系进行建模，网络可以进一步关注关键区域的局部运动模式。

图1.每个像素的特征被映射为同时具有幅值和相位分量的矢量。幅值代表上下文信息，而相位分量用于构建关键区域的动态注意模型。卷积运算用∗表示，图中的蓝色圆圈表示动态注意力学习到的关键区域。

(Ii)全局运动模式。步态是一种周期性的运动。我们假设实际的运动模式是一维信号，如图2所示，其中局部运动模式是信号上的点。因此，有必要使用一系列局部运动模式来进一步拟合实际运动模式，以获得可区分的步态特征。然而，最近的基于步态的方法[8，20，33]只使用基于最大或平均的方法来提取其中一个重要的局部特征。这些方法容易受到干扰，不能适应实际的运动模式。根据信号处理理论中的Nyquist-Shannon采样定理[37，39]，当以大于信号频率的两倍的频率对连续信号进行采样时，原始信号的信息保持不变。在这方面，我们提出构建一个全局注意模型，并使用它来动态地选择预设数量的可区分局部运动模式(绿色箭头)，同时排除噪声(红色箭头)的影响。通过选择足够的区分局部运动模式，网络可以进一步获得稳健的全局运动模式。

图2.实际运动模式与基于最大值的方法、基于均值的方法和全局运动模式聚合器(GMPA)模块的比较。黑色曲线表示受干扰影响的单个周期动作，而绿色曲线表示由GMPA选择的不同局部运动模式组成的合成周期动作。

在此基础上，提出了一种新颖有效的步态识别动态聚集网络(DANet)。如图3所示。DANet由两个设计良好的组件组成，即局部卷积混合块(LCMB)和全局运动模式聚合器(GMPA)。首先将每个像素的特征编码到包括幅度和相位的复数域中，其中幅度项代表上下文信息，而相位项用于建立每个向量之间的关系。通过聚集邻近焦点区域中的矢量的大小和相位来生成局部运动模式。其次，我们利用GMPA模型中的自注意机制动态地选择足够的可区分的局部运动模式，并进一步学习对实际步态模式的拟合。最后，使用我们提出的模型，我们获得了每个人最具代表性的稳定步态特征，并且性能优于最新的SOTA方法，特别是在最具挑战性的变装条件下。

图 3.提出的 DANet 概述。每个阶段都包含局部卷积混合块（LCMB），它利用动态注意力模型来建立感兴趣的相邻像素之间的关系。 HP表示水平池化，GMPA表示全局运动模式聚合器， $l$ 表示最后阶段的数量。特别地， $\mathrm{GMPA}_j$ 模块负责聚合第 $j$ 个部分的局部运动模式并产生最终的全局运动模式 ${v}_{\bar{i}}$ 以供识别。

本文的主要贡献如下：

提出了一种新的局部运动模式提取算法，该算法能够动态地对相邻像素的特征之间的关系进行建模，进而准确定位关键区域。
设计了一种有效的全局运动模式匹配算法，用于选择具有区分性的局部运动模式，并对其进行聚合以获得稳健的全局表示。据我们所知，在这项任务中探索自我注意模式的潜力是第一次尝试。
实验结果表明，该方法在CASIA-B[56]、OUMVLP[41]和Gait3D[59]数据集上的性能优于SOTA方法。此外，在CASIA-B[56]上的许多严格的消融实验进一步验证了DANet中每种成分的有效性。

2. Related Works

在这一部分中，我们简要概述了步态识别、局部动作建模和全局动作建模领域的相关研究。

步态架构。步态识别方法主要分为两个典型类别，即基于模型的方法和基于外观的方法。基于模型的方法 [1, 3, 27, 29–31, 44] 尝试将人体姿势结构 [10] 明确地拟合到图像。然而，预定义点是凭经验设计的，并受到低质量图像估计结果不准确的限制。因此，基于模型的方法在性能上通常不如基于外观的方法。基于外观的方法[7,8,13,18,20,21,24,32,33,43,47,51,52,58]是步态的主流框架，并受益于深度学习的快速发展。它大致可以分为三类，即基于模板的方法、基于集合的方法和基于序列的方法。基于模板的方法[18,36,43,47,52,57]通过压缩一系列步态轮廓（例如步态能量图像（GEI））来提取步态时空特征，这不可避免地破坏了判别性局部运动的表示步态序列中的模式。基于集合的方法[8,20,21,23]假设轮廓的外观包含其位置信息，这无法使用连续帧构建局部运动模式。最近一些先进的基于序列的方法[7,24,32,33,51]使用3D卷积（C3D）神经网络从步态序列中提取步态特征并实现SOTA结果。我们的方法属于基于序列的方法，与其他方法相比，我们提出使用可变长度帧作为输入。

局部动作建模。局部动作建模[14,24,32,33]旨在构建短程时空特征，这些特征已在各种文献中被证明有利于步态识别。 GaitPart [14]提出了一种微运动捕捉模块来建模短程时空特征。 MT3D [32]提出了多个时间尺度的 3D 卷积层来提取小和大时间尺度的运动特征。 GaitGL [33]利用局部时间聚合模块来提取局部时间信息。 3DLocal [24]提出了一个定位模块来自适应采样局部动作特征。与这些策略相反，我们提出将步态序列的每个像素映射到复值域，使用相位项来编码步态特征之间的关系。通过充分利用相位项，我们在特征的每个像素之间构建动态注意力模型，以提取关键区域的局部运动模式。

全局动作建模。旨在捕获远程依赖性的全局动作建模已被证明有利于广泛的识别任务，例如动作识别[6,45,48,54]和行人重识别[9,16,19, 35,40,61]。许多基于注意力的方法 [12,34,46] 在空间维度 [5, 50] 或通道维度 [22] 中建立了全局关系，并取得了显着的结果。然而，当前步态识别中最先进的工作[7,8,32,33]仍然直接使用基于Max或Mean的方法来提取全局时间特征，仅关注最显着的特征。与这些方法不同，我们设计了一个有效的全局自注意力模型来获得每个人的鲁棒表示，该模型可以选择有区别的局部运动模式，并进一步将它们映射到全局运动模式。

3. Methodology

在本节中，我们首先在第 3.1 节中描述我们方法的总体架构，然后介绍所提出的两个新颖的精心设计的模块，即第 3.2 节中的局部卷积混合块（LCMB）和第 3.3 节的全局运动模式聚合器（GMPA）。最后，我们将在 3.4 节中讨论联合损失函数。

3.1. Formulation and Motivation

步态识别旨在在各种外部因素的影响下识别同一个人。令 $\mathbf{X} \in \mathbb{R}^{T \times H \times W}$ 表示包含连续 $T$ 帧的轮廓数据，其中 $T 、 H$ 和 $W$ 表示时间，输入帧的高度和宽度尺寸。在我们的实现中，我们从连续序列中采样可变长度帧 $\in[20,40]$ 作为输入。步态特征的提取可表示为

$f=\mathcal{G}(\mathcal{L}(\mathbf{X})),$

其中 $\in \mathbb{R}^{P \times C}$ 是输出特征， $P$ 是水平切片部分的数量， $C$ 是特征通道， $\mathcal{L}$ 表示局部运动模式提取， $\mathcal{G}$ 表示全局运动模式聚合。

为了学习每个人的独特表征，之前基于 C2D 的方法 [8, 20] 和基于 C3D 的方法 [32, 33] 仅使用卷积层和非线性函数来学习步态特征。然而，经过训练的网络只能识别某些容易受到噪声影响的运动模式。在这项工作中，我们在 DANet 的主干中提出了一种新颖的 LCMB，它使网络能够专注于关键区域并通过动态构建像素之间的关系来提取局部运动模式。此外，受奈奎斯特香农采样定理[37, 39]的启发，我们提出了一个新的观点，即完整的步态模式应包含许多可区分的局部运动模式。为此，我们开发了一种有效的GMPA来选择足够可区分的局部运动模式，同时有效地排除噪声的干扰。然后聚合所选择的局部运动模式以生成鲁棒的全局运动模式。

3.2. Local Conv-Mixing Block

在本节中，我们详细描述了本地卷积混合块（LCMB）模块中的向量表示和向量聚合。

矢量表示。在 LCMB 模块中，输入特征表示为 $\mathbf{V}=\left[v_1, v_2, \ldots, v_N\right] \in \mathbb{R}^{N \times C_i}$ ，其中 $N$ 是步态序列中的像素数， $C_i$ 是输入特征的维度。如图4所示，我们得到幅度 $\left|v_j\right|$ 和每个向量的相位 $\theta_j$ 分别乘以可学习参数 $W^m \in \mathbb{R}^{C_i \times C_l}$ 和 $W^t \in \mathbb{R}^{C_i \times C_l}$ ，即

$\begin{gathered} \left|v_j\right|=W^m v_j, j=1,2, \cdots, N, \\ \theta_j=\max \left(0, W^t v_j\right), j=1,2, \cdots, N, \end{gathered}$

其中下标 $j$ 是第 $j$ 个像素的特征。每个向量的内容是由幅度项 $\left|v_j\right|$ 建模的实值特征，而每个向量的关系由相位项 $\theta_j$ 进行调制，使用具有修正线性的分组卷积层激活 ReLU。复向量 $\tilde{v}_j \in \mathbb{C}^{C_l}$ 使用欧拉公式通过幅度和相位项进行调制，即：

$\tilde{v}_j=\overbrace{\left|v_j\right| \odot \cos \theta_j}^{\text {real part }}+\overbrace{i\left|v_j\right| \odot \sin \theta_j}^{\text {imaginary part }}, j=1,2, \cdots, N,$

其中 $i$ 是满足 $i^2=-1$ 的虚数单位， $\odot$ 是逐元素乘法。

向量聚合。将每个像素的特征表示为向量后，我们进一步聚合每个向量的局部时空域，如图4所示。特别是，由可学习的卷积核 $\mathcal{K} \in \mathbb{R}^{C_i \times C_l \times K_t \times K_s \times K_s}$ 聚合的输出 $\tilde{o}_j \in \mathbb{C}^{C_i}$ 的复值表示，即

$\tilde{o}_j=\sum_{m \in \mathcal{N}(j)} \mathcal{K}[j-m] \tilde{v}_m+v_j, j=1,2, \cdots, N,$

其中 $\mathcal{N}(j)$ 表示 $j$ 的相邻像素集， $\tilde{v}_m$ 表示属于 $\tilde{v}_j$ 的相邻像素的向量。按照[42]，为了方便计算，我们通过将 $\tilde{v}_j$ 的实部和虚部相加来获得实值输出特征 $o_j \in \mathbb{R}^{C_i}$ ，即：

$\begin{aligned} & o_j=\sum_{m \in \mathcal{N}(j)}\left(\mathcal{K}[j-m]\left|v_m\right| \odot \cos \theta_m+\right. \\ & \left.\mathcal{K}[j-m]\left|v_m\right| \odot \sin \theta_m\right)+v_j, j=1,2, \cdots, N, \end{aligned}$

其中 $\left(\cos\theta_m+\sin\theta_m\right)$ 表示 $j$ 的相邻像素之间的动态注意力。为了进一步理解动态聚合模型，显示相位值的热图如图 6 所示。

图 4. LCMB 的架构，其中“⊙”表示 Hadamard 乘积，“⊕”表示逐元素求和运算，Mix 表示向量聚合运算。

图 6. 同一人剪影中相位值和相应位置（实心点）的注意力图（虚线框）可视化，其中“J”代表脸部，“H”代表手，“L”代表腿，“F”代表脚。

3.3. Global Motion Patterns Aggregator

在这一部分中，我们提出了一种用于步态识别的全局动作建模框架的新实例，称为全局运动模式聚合器（GMPA），它选择预设数量的区分局部运动模式，然后利用注意机制来聚合查询特定的全局运动模式每个查询位置。 GMPA 对每个部分采用单独的参数，并对相应部分的全局运动模式进行建模。

低阶全局运动模式。步态数据受到许多可变因素的影响，例如分段孔或破损边缘，进一步损害实际的运动模式。为此，我们首先提出将可变的局部运动模式压缩到预设数量的通道描述符中。然后，我们利用softmax在时间维度上构建注意力图，并将压缩的注意力图与重塑的局部运动模式特征相乘以获得全局低阶运动模式。形式上，全局低阶运动模式 $\tilde{\mathbf{G}} \in \mathbb{R}^{P \times C \times M}$ 由局部运动模式 $\mathbf{L} \in \mathbb{R}^{P \times T \times C}$ 和注意力图 $\mathbf{M} \in \mathbb{R}^{P \times T \times M}$ 生成，并且可以表示为
$\begin{gathered} \mathbf{M}=\frac{\exp \left(W_1 \mathbf{L}_i\right)}{\sum_{i=1}^T \exp \left(W_1 \mathbf{L}_i\right)}, \\ \tilde{\mathbf{G}}=\mathbf{M} \otimes \mathbf{L}, \end{gathered}$
其中 $W_1 \in \mathbb{R}^{P \times C \times M}$ 是Separate $F C_1的权重，i$ 是帧的索引， $\otimes$ 表示矩阵乘法。

高阶全局运动模式。为了利用低阶全局运动模式中聚合的信息，我们进行了进一步的映射，旨在完全捕获高阶全局运动模式。此外，我们还将残差学习引入到 GMPA 中以简化训练。具体来说，我们进一步将预设数量的低阶全局运动模式 $\tilde{\mathbf{G}}$ 映射为高阶全局特征 $\mathbf{G}$ ，即

$\mathbf{G}=\delta\left(W_2 \tilde{\mathbf{G}}\right) \oplus \mathbf{L},$

其中 $W_2 \in \mathbb{R}^{P \times M \times 1}$ 是Separate $C_2的权重，\delta$ 表示LeakyReLU激活函数， $\oplus$ 表示逐元素广播添加。

图 5.GMPA 的架构和特征图按维度显示，其中“⊗”是矩阵乘法。

（五)PS识别：压缩痕迹挖掘-压缩量化表与 DCT 系数分析超龄超能程序猿机器学习 python 图像处理人工智能计算机视觉
（一)PS识别：Python图像分析PS识别之道（二）PS识别：特征识别-直方图分析的从原理到实现（三)PS识别：基于噪声分析PS识别的技术实现（四)PS识别：基于边缘纹理检测分析PS识别的技术实现一介绍本文将介绍一种基于量化表分析和DCT系数分析的图片PS检测方法，帮助你判断图片是否经过处理。二实现原理量化表分析在JPEG图片的压缩过程中，量化表起着关键作用。不同的软件或处理操作可能会改变量化表
MavenHelper插件：解决IntelliJ IDEA中Maven依赖冲突的利器
本文还有配套的精品资源，点击获取简介：MavenHelper是一款专门针对IntelliJIDEA设计的Maven插件，旨在帮助开发者快速识别和解决Maven项目中的依赖冲突问题。该插件能生成项目的依赖树，标记版本冲突的依赖项，并提供建议解决方案和可视化界面来管理依赖。此外，它还包括一键升级或降级依赖、清理Maven缓存和自定义配置功能，以确保与团队规范的一致性。通过使用MavenHelper，开
IDEA依赖冲突分析神器—Maven Helper
IDEA依赖冲突分析神器—MavenHelperMavenHelper是一款专为IntelliJIDEA设计的插件，它极大地简化了Maven项目中依赖冲突的分析和解决过程。以下是对MavenHelper的详细介绍及其使用方法：一、MavenHelper简介MavenHelper插件提供了一个直观的图形界面，帮助开发者查看和管理Maven项目的依赖关系。它特别擅长于展示和识别依赖冲突，使开发者能够迅
2025年渗透测试面试题总结-2025年HW(护网面试) 31（题目+回答）独行soc 2025年护网面试职场和发展安全 linux 护网渗透测试
安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录2025年HW(护网面试)311.自我介绍2.渗透测试流程（五阶段模型）3.技术栈与开发经历4.自动化挖洞实践5.信息搜集方法论6.深度漏洞挖掘案例8.SQL注入实战技巧9.AWVS扫描与防御10.CSRFvsSSRF核心差异11.SSRF正则绕过技术12.虚拟主机识别原
超轻量级中文OCR项目使用教程甄墨疆
超轻量级中文OCR项目使用教程chineseocr_lite超轻量级中文ocr，支持竖排文字识别,支持ncnn、mnn、tnn推理(dbnet(1.8M)+crnn(2.5M)+anglenet(378KB))总模型仅4.7M项目地址:https://gitcode.com/gh_mirrors/ch/chineseocr_lite1.项目介绍本项目是一个超轻量级的中文OCR（OpticalCha
【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
说话人识别python_基于各种分类算法的说话人识别（年龄段识别） weixin_39673184 说话人识别python
基于各种分类算法的语音分类(年龄段识别)概述实习期间作为帮手打杂进行了一段时间的语音识别研究，内容是基于各种分类算法的语音的年龄段识别，总结一下大致框架，基本思想是：获取语料库TIMIT提取数据特征，进行处理MFCC/i-vectorLDA/PLDA/PCA语料提取，基于分类算法进行分类SVM/SVR/GMM/GBDT...用到的工具有HTK(C,shell)/Kaldi(C++,shell)/L
使用 C++ 实现 MFCC 特征提取与说话人识别系统 whoarethenext c++开发语言 mfcc 语音识别
使用C++实现MFCC特征提取与说话人识别系统在音频处理和人工智能领域，C++凭借其卓越的性能和对硬件的底层控制能力，在实时音频分析、嵌入式设备和高性能计算场景中占据着不可或缺的地位。本文将引导你了解如何使用C++库计算核心的音频特征——梅尔频率倒谱系数(MFCCs)，并进一步利用这些特征构建一个说话人识别（声纹识别）系统。Part1:在C/C++中计算MFCCs直接从零开始实现MFCC的所有计算
【机器学习&深度学习】多分类评估策略一叶千舟深度学习【理论】深度学习【应用必备常识】大数据人工智能
目录前言一、多分类3大策略✅宏平均（MacroAverage）✅加权平均（WeightedAverage）✅微平均（MicroAverage）二、类比理解2.1宏平均（MacroAverage）2.1.1计算方式2.1.2适合场景2.1.3宏平均不适用的场景2.1.4宏平均一般用在哪些指标上？2.1.5怎么看macroavg指标？2.1.6宏平均值低说明了什么？2.1.7从宏平均指标中定位模型短板
OpenCV 图像操作：颜色识别、替换与水印添加
目录引言代码实现1.导入必要的库2.图像加法3.图像直接相加4.颜色加权加法5.HSV颜色空间转换概念作用6.查找颜色范围对应的像素点7.与运算-生成掩膜8.添加水印9.主函数总结引言在计算机视觉领域，OpenCV是一个强大的库，提供了丰富的图像操作功能。本文将详细介绍如何使用OpenCV进行图像加法、颜色加权加法、HSV颜色空间转换、颜色范围查找、与运算生成掩膜以及添加水印等操作，并给出相应的P
大语言模型应用指南：ReAct 框架 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
大语言模型应用指南：ReAct框架关键词：大语言模型,ReAct框架,自然语言处理(NLP),模型融合,多模态学习,深度学习,深度学习框架1.背景介绍1.1问题由来近年来，深度学习技术在自然语言处理(NLP)领域取得了显著进展。尤其是大语言模型(LargeLanguageModels,LLMs)，如BERT、GPT系列等，通过在大规模无标签数据上进行预训练，获得了强大的语言理解和生成能力。然而，预
Pillow 安装使用教程小奇JAVA面试安装使用教程 pillow microsoft 深度学习
一、Pillow简介Pillow是Python图像处理库PIL（PythonImagingLibrary）的友好分支，是图像处理的事实标准。它支持打开、编辑、转换、保存多种图像格式，常用于图像批量处理、验证码识别、缩略图生成等应用场景。二、安装Pillow2.1使用pip安装（推荐）pipinstallPillow2.2验证安装importPILprint(PIL.__version__)若无报错
【网络安全基础】第八章---电子邮件安全薄荷椰果抹茶信息安全与网络安全安全 web安全网络
仅供参考文章目录一、电子邮件协议二、邮件格式2.1RFC53222.2MIME2.3S/MIME（重点）三、域名系统（DNS）四、域名密钥识别邮件（DKIM）一、电子邮件协议传输邮件时使用两种协议：1）简单的邮件传输协议SMTP——把消息通过互联网从源移动到目的地2）邮件访问协议——用于在邮件服务器之间传输信息，两个最常使用：POP3（邮局协议）：允许客户端从邮件服务器上下载邮件IMAP（网络邮件
大语言模型原理基础与前沿基于语言反馈进行微调 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿基于语言反馈进行微调作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，自然语言处理（NLP）领域取得了显著的进展。大语言模型（LargeLanguageModels，LLMs）如GPT-3、BERT等在各项NLP任务上取得了令人瞩目的成绩。然而，如何进一步提高大语言模型的理
搜索领域SEO进阶：内容优化与用户体验提升搜索引擎技术 ux ai
搜索领域SEO进阶：从关键词堆砌到用户价值——内容优化与体验升级的实战指南关键词SEO进阶、内容质量、用户体验、E-E-A-T、用户行为信号、结构化数据、页面速度优化摘要当“SEO=关键词堆砌”的时代成为历史，当搜索引擎算法从“识别文字”进化到“理解意图”，SEO从业者正面临一场从“技术投机”到“用户价值”的范式转移。本文将深度拆解搜索领域的进阶策略：从内容优化的核心逻辑（E-E-A-T框架、主题
搜索架构中的NLP技术：提升搜索准确性的关键搜索引擎技术架构自然语言处理人工智能 ai
搜索架构中的NLP技术：提升搜索准确性的关键关键词：搜索架构、NLP技术、查询理解、语义搜索、相关性排序、意图识别、BERT模型摘要：本文将深入探讨现代搜索架构中NLP技术的核心应用，从查询理解到结果排序的全流程，揭示NLP如何提升搜索准确性。我们将通过生动的比喻解释复杂概念，分析关键技术原理，并提供实际代码示例，帮助读者全面理解搜索系统背后的NLP魔法。背景介绍目的和范围本文旨在解析NLP技术在
探索AI人工智能医疗NLP实体识别系统的架构设计 AI学长带你学AI 人工智能自然语言处理 easyui ai
探索AI人工智能医疗NLP实体识别系统的架构设计关键词：人工智能、医疗NLP、实体识别、系统架构、深度学习、自然语言处理、医疗信息化摘要：本文将深入探讨医疗领域NLP实体识别系统的架构设计。我们将从基础概念出发，逐步解析医疗文本处理的特殊性，详细介绍实体识别技术的核心原理，并通过实际案例展示如何构建一个高效可靠的医疗实体识别系统。文章还将探讨当前技术面临的挑战和未来发展方向，为医疗AI领域的从业者
用PyTorch实现MNIST手写数字识别
MNIST包含70,000张手写数字图像:60,000张用于培训，10,000张用于测试。图像是灰度的，28x28像素的，并且居中的，以减少预处理和加快运行。1、导入相关库importtorchimporttorchvisionfromtorch.utils.dataimportDataLoaderimporttorch.nnasnnimporttorch.nn.functionalasFimpo
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
免费棱光 PDF：免安装加水印去水印批量格式转换小瑞软件库开源软件电脑软件构建
各位办公小能手们，今天给大家介绍一款超棒的PDF处理工具——棱光PDF！它完全免费，专门解决咱对PDF文件的常见操作需求。绿色免安装，体积小得跟颗花生米似的，打开就能用。它有三大核心功能，分别是水印管理、格式转换和批量处理。软件下载地址安装包先说说水印处理，你可以给PDF文件加上自定义的文字或者图片水印，还能随便调整水印的位置、大小和透明度。要是文档里已经有水印，它也能精准识别，然后一键清除。，把
【雕爷学编程】MicroPython手册之 ESP32-CAM 图像识别驴友花雕 1024程序员节单片机嵌入式硬件 MicroPython python ESP32-CAM 图像识别
MicroPython是为了在嵌入式系统中运行Python3编程语言而设计的轻量级版本解释器。与常规Python相比，MicroPython解释器体积小(仅100KB左右)，通过编译成二进制Executable文件运行，执行效率较高。它使用了轻量级的垃圾回收机制并移除了大部分Python标准库，以适应资源限制的微控制器。MicroPython主要特点包括:1、语法和功能与标准Python兼容,易学
深度学习篇---简单果实分类网络
下面我将提供一个使用Python从零实现果实分类模型的完整流程，包括数据准备、模型构建、训练和部署，不依赖任何深度学习框架，仅使用NumPy进行数值计算。1.数据准备与预处理首先需要准备果实图像数据集，将其分为好果和坏果两类，并进行预处理：importosimportnumpyasnpfromPILimportImagefromsklearn.model_selectionimporttrain_
Python深度学习：3步实现AI人脸识别，效果堪比专业软件！小筱在线 python 人工智能 python 深度学习
引言：AI人脸识别的时代已经到来在当今数字化时代，人脸识别技术已经从科幻电影走进了我们的日常生活。从手机解锁到机场安检，从银行身份验证到智能门禁系统，这项技术正以前所未有的速度改变着我们的生活方式。而令人振奋的是，借助Python和深度学习技术，普通人也能构建出专业级的人脸识别系统。本文将带领您通过三个关键步骤，使用Python深度学习技术实现一个准确率高达99%的人脸识别系统。这个系统不仅原理简
利用 SoC 架构信息 (SAI) 创建自动网表的解析 weixin_45371279 innovus
基于SAI（SoCArchitectureInformation）创建网表是在无完整电路网表时启动物理设计的关键技术，通过解析架构描述并生成等效网表，使Innovus能够执行布局规划与分析。以下是核心功能与实现逻辑的详细说明：一、SAI自动网表生成的技术背景与目标当设计早期缺乏RTL或门级网表时，SAI自动网表生成通过抽象模型具体化的方式，将架构描述转换为物理设计工具可识别的网表结构，实现：提前启
Python实例题：简单的聊天机器人狐凄实例 python 开发语言
目录Python实例题题目要求：解题思路：代码实现：Python实例题题目简单的聊天机器人要求：实现一个基于规则的聊天机器人，支持简单问答和对话。支持以下功能：问候语识别与回应天气查询（模拟）时间/日期查询简单数学计算随机笑话生成添加对话历史记录功能，可随时查看。支持退出对话的指令。解题思路：使用关键词匹配实现简单的问答逻辑。利用Python内置模块处理时间、数学计算等功能。维护对话历史列表存储交
【推荐算法课程二】推荐算法介绍-深度学习算法盒子6910 运维视角下的广告业务算法推荐算法深度学习运维开发运维人工智能
三、深度学习在推荐系统中的应用3.1深度学习推荐模型的演化关系图3.2AutoRec——单隐层神经网络推荐模型3.2.1AutoRec模型的基本原理AutoRec模型是一个标准的自编码器，它的基本原理是利用协同过滤中的共现矩阵，完成物品向量或者用户向量的自编码。再利用自编码的结果得到用户对物品的预估评分，进而进行推荐排序。什么是自编码器？自编码器是指能够完成数据“自编码”的模型。无论是图像、音频，
【AI智能推荐系统】第二篇：深度学习在推荐系统中的架构设计与优化实践 DeepFaye 人工智能深度学习
第二篇：深度学习在推荐系统中的架构设计与优化实践提示语：“从Wide&Deep到Transformer，深度推荐模型如何突破性能瓶颈？本文将揭秘Netflix、淘宝都在用的深度学习推荐架构，手把手教你设计高精度推荐系统！”目录深度学习推荐系统的核心优势主流深度学习推荐架构解析2.1Wide&Deep模型2.2DeepFM与xDeepFM2.3神经协同过滤(NCF)2.4基于Transformer的
简述：link与@import区别
区别：link属于html标签。@import在css中使用表示导入外部样式表；页面被加载的时，link会同时被加载，而@import引用的CSS会等到页面被加载完再加载;import只在IE5以上才能识别，而link是HTML标签，无兼容问题;link方式的样式的权重高于@import的权重；link支持使用javascript改变样式（document.styleSheets），后者不可使用场
Maven Array_06 eclipse jdk maven
Maven Maven是基于项目对象模型(POM)，信息来管理项目的构建，报告和文档的软件项目管理工具。 Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法，许多 Apache Jakarta 项目发文时使用 Maven，而且公司
ibatis的queyrForList和queryForMap区别 bijian1013 java ibatis
一.说明 iBatis的返回值参数类型也有种：resultMap与resultClass，这两种类型的选择可以用两句话说明之： 1.当结果集列名和类的属性名完全相对应的时候，则可直接用resultClass直接指定查询结果类
LeetCode[位运算] - #191 计算汉明权重 Cwind java 位运算 LeetCode Algorithm 题解
原题链接：#191 Number of 1 Bits 要求：写一个函数，以一个无符号整数为参数，返回其汉明权重。例如，‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。汉明权重：指一个字符串中非零字符的个数；对于二进制串，即其中‘1’的个数。难度：简单分析：将十进制参数转换为二进制，然后计算其中1的个数即可。 “
浅谈java类与对象 15700786134 java
java是一门面向对象的编程语言，类与对象是其最基本的概念。所谓对象，就是一个个具体的物体，一个人，一台电脑，都是对象。而类，就是对象的一种抽象，是多个对象具有的共性的一种集合，其中包含了属性与方法，就是属于该类的对象所具有的共性。当一个类创建了对象，这个对象就拥有了该类全部的属性，方法。相比于结构化的编程思路，面向对象更适用于人的思维
linux下双网卡同一个IP 被触发 linux
转自： http://q2482696735.blog.163.com/blog/static/250606077201569029441/ 由于需要一台机器有两个网卡，开始时设置在同一个网段的IP，发现数据总是从一个网卡发出，而另一个网卡上没有数据流动。网上找了下，发现相同的问题不少：一、关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
安卓按主页键隐藏程序之后无法再次打开肆无忌惮_ 安卓
遇到一个奇怪的问题，当SplashActivity跳转到MainActivity之后，按主页键，再去打开程序，程序没法再打开（闪一下），结束任务再开也是这样，只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity 本来代码： // 销毁这个Activity fin
通过cookie保存并读取用户登录信息实例知了ing JavaScript html
通过cookie的getCookies()方法可获取所有cookie对象的集合；通过getName()方法可以获取指定的名称的cookie；通过getValue()方法获取到cookie对象的值。另外，将一个cookie对象发送到客户端，使用response对象的addCookie()方法。下面通过cookie保存并读取用户登录信息的例子加深一下理解。（1）创建index.jsp文件。在改
JAVA 对象池矮蛋蛋 java ObjectPool
原文地址： http://www.blogjava.net/baoyaer/articles/218460.html Jakarta对象池 ☆为什么使用对象池恰当地使用对象池化技术，可以有效地减少对象生成和初始化时的消耗，提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
ArrayList根据条件+for循环批量删除的方法 alleni123 java
场景如下： ArrayList<Obj> list Obj-> createTime, sid. 现在要根据obj的createTime来进行定期清理。（释放内存） ------------------------- 首先想到的方法就是 for(Obj o:list){ if(o.createTime-currentT>xxx){
阿里巴巴“耕地宝”大战各种宝百合不是茶平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”，“耕地宝”由阿里巴巴投入一亿，主要是用来进行农业方面，将农民手中的散地集中起来不仅加大农民集体在土地上面的话语权，还增加了土地的流通与利用率，提高了土地的产量，有利于大规模的产业化的高科技农业的发展，阿里在农业上的探索将会引起新一轮的产业调整，但是集体化之后农民的个体的话语权将更少，国家应出台相应的法律法规保护
Spring注入有继承关系的类（1） bijian1013 java spring
一个类一个类的注入 1.AClass类 package com.bijian.spring.test2; public class AClass { String a; String b; public String getA() { return a; } public void setA(Strin
30岁转型期你能否成为成功人士 bijian1013 成功
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
[Velocity三]基于Servlet+Velocity的web应用 bit1129 velocity
什么是VelocityViewServlet 使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中，以Servlet+Velocity的方式实现web应用 Servlet + Velocity的一般步骤 1.自定义Servlet，实现VelocityViewServl
【Kafka十二】关于Kafka是一个Commit Log Service bit1129 service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解？ A message is considered "committed" when all in sync replicas for that partition have applied i
NGINX + LUA实现复杂的控制 ronin47 lua nginx 控制
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-14.输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字 bylijinnan java
public class TwoElementEqualSum { /** * 第 14 题：题目：输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字。要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字，输出任意一对即可。例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder bylijinnan java netty
今天看Netty如何实现一个Http Server org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory： pipeline.addLast("decoder", new HttpRequestDecoder()); pipeline.addLast(&quo
java敏感词过虑-基于多叉树原理 cngolon 违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包，用于java中的敏感词过滤 1、工具包自带敏感词词库，第一次调用时读入词库，故第一次调用时间可能较长，在类加载后普通pc机上html过滤5000字在80毫秒左右，纯文本35毫秒左右。 2、如需自定义词库，将jar包考入WEB-INF工程的lib目录，在WEB-INF/classes目录下建一个 utf-8的words.dict文本文件，
多线程知识 cuishikuan 多线程
T1，T2，T3三个线程工作顺序，按照T1，T2，T3依次进行 public class T1 implements Runnable{ @Override
spring整合activemq dalan_123 java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分： a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
MySQL时间字段究竟使用INT还是DateTime？ dcj3sjt126com mysql
环境：Windows XPPHP Version 5.2.9MySQL Server 5.1 第一步、创建一个表date_test（非定长、int时间） CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
Parcel: unable to marshal value dcj3sjt126com marshal
在两个activity直接传递List<xxInfo>时，出现Parcel: unable to marshal value异常。在MainActivity页面（MainActivity页面向NextActivity页面传递一个List<xxInfo>）： Intent intent = new Intent(this, Next
linux进程的查看上（ps） eksliang linux ps linux ps -l linux ps aux
ps:将某个时间点的进程运行情况选取下来转载请出自出处：http://eksliang.iteye.com/admin/blogs/2119469 http://eksliang.iteye.com ps 这个命令的man page 不是很好查阅，因为很多不同的Unix都使用这儿ps来查阅进程的状态，为了要符合不同版本的需求，所以这个
为什么第三方应用能早于System的app启动 gqdy365 System
Android应用的启动顺序网上有一大堆资料可以查阅了，这里就不细述了，这里不阐述ROM启动还有bootloader，软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来（包括wifi, power, rild, surfaceflinger, mediaserver等等）-> 启动Dalivk中的第一个进程Zygot
App Framework发送JSONP请求(3) hw1287789687 jsonp 跨域请求发送jsonp ajax请求越狱请求
App Framework 中如何发送JSONP请求呢? 使用jsonp,详情请参考:http://json-p.org/ 如何发送Ajax请求呢? (1)登录 /*** * 会员登录 * @param username * @param password */ var user_login=function(username,password){ // aler
发福利，整理了一份关于“资源汇总”的汇总 justjavac 资源
觉得有用的话，可以去github关注：https://github.com/justjavac/awesome-awesomeness-zh_CN 通用 free-programming-books-zh_CN 免费的计算机编程类中文书籍精彩博客集合 hacke2/hacke2.github.io#2 ResumeSample 程序员简历
用 Java 技术创建 RESTful Web 服务 macroli java 编程 Web REST
转载：http://www.ibm.com/developerworks/cn/web/wa-jaxrs/ JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API，可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项超声波 oracle linux
前言：这两天项目要上线了，由我负责往服务器部署整个项目，因此首先要往服务器安装oracle，服务器本身是CentOS6.5的64位系统，安装的数据库版本是11g，在整个的安装过程中碰到很多的坑，不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。安装过程中可能遇到的问题（注
HttpClient 4.3 设置keeplive 和 timeout 的方法 supben httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() { @Override public long getKeepAliveDuration(HttpResponse response, HttpContext context) { long keepAlive
Spring 4.2新特性-@Import注解的升级 wiselyman spring 4
3.1 @Import @Import注解在4.2之前只支持导入配置类在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean 3.2 示例演示java类 package com.wisely.spring4_2.imp; public class DemoService { public void doSomethin