diligent_321

论文解读-Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

文章目录

1 “top-down” vs “bottom-up”
2 动机

2.1 已有"bottom-up"方法缺点
2.2 改进点

3 方案

3.1 Detection 和 Association
3.2 detection confidence map
3.3 Part Affinity Fields
3.4 Multi-Person Parsing using PAFs

3.4.1 动机
3.4.2 论文中方案
3.4.3 关节点对

4 实验结果
5 总结
6 参考资料

最近需要做视频分类相关的工作，在做技术调研过程中，了解到视频分类包含了两种形式，（1）通用的多标签视频分类，它的特点是标签为静态的，也即做分类时不需要考虑图像帧之间的关联性，因此跟基于图片的分类没什么差异了。（2）行为识别，因为是“行为”，所以这类任务需要考虑图像帧之间的关联性，比如“芭蕾舞”、“绘画”等，包含了3D卷积和Two-stream两种方法，在看了这方面的综述文章后发现是全新的方向。因为笔者之前一直做的2D目标检测方向，为了能更好地王行为识别方向过渡，选择先从2D的行为识别啃起，也即人体关键点检测，因此后面的几篇博文都是围绕关键点检测展开的。

说起人体关键点检测，就不得不提OpenPose算法了，它因为速度和精度的权衡在实际中得到了广泛的应用，它包含了人体骨骼关键点检测和脸部关键点检测。笔者在阅读它所使用的人体骨骼关键点检测算法后，有了对这个方向新的理解，故这里记录下来。

1 “top-down” vs “bottom-up”

人体姿态估计可以分为两种思路，（1）“top-down”，它指先检测人体区域，再检测区域内的人体关键点。（2）“bottom-up”，它指先检测图片中所有的人体关键点，然后将这些关键点对应到不同的人物个体。这里需要提及一下，第一种方案因为需要对检测出的每个人体区域，分别做前向关键点检测，所以速度较慢，而OpenPose采用的则为第二种方案。

2 动机

2.1 已有"bottom-up"方法缺点

（1）未利用全局上下文先验信息，也即图片中其他人的身体关键点信息；

（2）将关键点对应到不同的人物个体，算法复杂度太高。

2.2 改进点

论文中提出了新的概念“Part Affinity Fields (PAFs)”，笔者将其翻译成关节联通区域。每个像素是2D的向量，用于表征位置和方向信息。基于检测出的关节点和关节联通区域，使用greedy inference算法，可以将这些关节点对应到不同人物个体。

3 方案

整个的技术方案为“two-branch multi-stage CNN”，如下图，其中一个分支用于预测打分图 $S$ ，另外一个分支用于预测关节联通区域 $L$ 。

符号说明：

$S=(S_{1}, S_{2}, ..., S_{J})$ ：score maps，其中 $J$ 表示关节点个数， $S_{i}\in R^{w\times h}$ 用于表征第 $i$ 个关节点的score map；

$L=(L_{1}, L_{2}, ..., L_{C})$ ：part affinities，其中 $C$ 表示关节连通域（关节点对）的个数， $L_{c}\in R^{w\times h\times 2}$ 用于表征第c个关节联通域的联通情况，2D表征像素点的位置和方向，图像化表示如下，

其中，左图为"right elbow"和“right wrist”对应的关节联通域。右图为局部图像块放大后的表示；

3.1 Detection 和 Association

论文中所提的多任务网络架构，能够同时预测detection confidence maps和affinity fields，前者用于表征每个像素点是否为关节点的置信度，后者用于表征关节点之间的关联性。

输入图像经过VGG-19的backbone网络，输出特征图 $F$ ，然后 $F$ 经过Branch 1和Branch 2，分别得到Stage 1对应的confidence map和affinity field。其中， $\rho^{t}、\phi^{t}$ 表示Stage t不同分支的推理CNN，公式表示如下，

然后，将Stage 1的输出 $S^{1}、L^{1}$ 和 $F $ 做concate操作，作为Stage 2的输入，Stage 2负责对confidence map和affinity field做refinement操作，图像化表示如下，

关于两个分支的损失函数，作者均采用了 $L_{2}$ loss函数。而且，在每个Stage均进行监督，解决了“消失梯度”问题。另外，考虑到有些训练数据集只标注了图片中部分人物的关节点，因此对损失函数采用了空域加权操作，公式表示如下，

其中， $S^{*}_{j}$ 表示groundtruth关节点置信度图， $L^{*}_{c}$ 表示groundtruth关节连通域图， $W$ 表示二值化mask矩阵，当位置 $p$ 的标签缺失时其值为0，否则值为1。显然，对于未被标记的人物关节点， $W (p) = 0$ ，而被标记的人物关节点和非关节点， $W(p)\not=0$ ，所以未被标记的人物关节点不会影响模型的学习过程，整个CNN网络架构的优化目标函数如下，

也即，综合考虑了所有Stage的关节点和联通区域检测。

3.2 detection confidence map

论文中，使用2D高斯分布建模groundtruth关节点置信度图。记第 $k$ 个人的第 $j$ 个关节点的置信度图为 $S^{*}_{j, k}$ ，第 $k$ 个人的第 $j$ 个关节点的groundtruth位置为 $x_{j, k} \in R^{2}$ ，那么 $S^{*}_{j, k}$ 中位置 $p\in R^{2}$ 的像素值定义如下，

然后在channel维度做max pooling操作，得到Branch1网络的输出，公式如下，

所以，输出channels个数等于关节点个数，每一个feature map表示某一类关节点的confidence map。

在inference阶段，考虑到一张图片中不同人的相同关节点距离较大，作者对网络输出结果使用了non-maximum suppression操作，过滤掉距离较近的关节点。

3.3 Part Affinity Fields

上面3.2的内容给出了每类关节点的confidence map，那么问题来了，怎么把这些检测出来的关节点进行重组，得到不同的人体骨骼结构呢？

设想一下，如果我们知道了每一对关节点的相关性，也即每一对关节点是否属于同一个人，那么问题就解决了。

怎么知道每一对关节点是否属于同一个人呢？比较直接的方法是，检测人体所有骨骼的midpoint，比如手腕和肘部之间的midpoint，然后校验其它关节点，若某一对关节点位于midpoint两侧，则它们是一对，也即对应了同一个人。这种思路是有问题的，比如下图(b)，红色和蓝色分别表示人体骨骼点，黄色表示midpoint，对于每一条黑线，满足这里的约束，然而对于绿线，是因为中间的黄点带来的歧义，所以这种方案不可行。

不可行的原因：（1）只对骨骼(limb)的位置编码，而忽略了方向信息；（2）只用了一个点表征骨骼区域，信息量不充分。

第二种解决办法，也即原论文中的最大创新，使用part affinity fields（PAF）建模骨骼区域，对于骨骼区域内的每一个像素，使用2D向量同时表征位置和方向信息，这里的方向指代当前骨骼对应的关节点对的连接方向。
以下图的骨骼区域为例，

其中， $x_{j_{1}, k}$ 和 $x_{j_{2}, k}$ 分别表示关节点 $j_{1}, j_{2}$ 的groundtruth位置。 $k, c$ 分别表示原始大图中的人物索引和关节点对索引，位置 $p$ 处的groundtruth关节联通域向量定义如下，

其中，

也即 $v$ 表示位置 $j_{1}$ 指向位置 $j_{2}$ 的单位向量。

点集 $p$ 定义成上图中绿色虚线内的区域，数学公式表示如下，

其中， $l_{c, k}=||x_{j_{2}, k} - x_{j_{1}, k}||_{2}$ 表示骨骼长度， $\sigma_{l}$ 衡量了骨骼的粗细。这里大家可以对照本文的第一张图来理解，就比较容易懂了。

然后，在channels维度做average pooling操作，得到Branch2网络的输出，用于表征不同关节点对的特征图，公式表达如下，

其中， $n_{c}(p)$ 表示所有人中位置 $p$ 处非0向量的个数。

（ps：为什么关节点定位使用max pooling操作，而骨骼定位却使用average pooling操作呢？欢迎大家留言讨论）。

在推理的时候，对于任意两个关节点位置 $d_{j_{1}}$ 和 $d_{j_{2}}$ ，通过计算PAF联通区域的线性积分来表征骨骼点对的相关性，也即表征了骨骼点对的置信度，公式表示如下，

其中， $p (u)$ 是对两个关节点位置 $d_{j_{1}}$ 和 $d_{j_{2}}$ 做插值操作得到的，公式如下，

因为计算机不支持积分运算，所以在实际运算过程中，将公式（10）分解成对 $u$ 的均匀采样，近似计算出这两个关节点之间的相关性。

3.4 Multi-Person Parsing using PAFs

3.4.1 动机

由于图片中可能有多个人，或者算法预测的false positive点，导致每个关节点feature map中可能存在多个预测点的位置，使用公式（1）计算点对的置信度，只能保证局部最优，那么如何保证全局最优呢？这里的全局指人体整个骨骼结构。

3.4.2 论文中方案

在原论文中，作者采用了greedy relaxation的思想生成全局较优的搭配。

具体来说，引入如下数学符号，

（1） $D_{J}=\{d_{j}^{m}: for j \in {1... J}, m \in \{1, ..., N_{j}\}\}$ ，其中， $N_{j}$ 表示关节点j对应的预测位置个数， $d_{j}^{m}\in R^{2}$ 表示第j类关节点对应的第m个预测candidate， $D_{J}$ 表示所有类关节点对应的所有预测candidate；

（2） $z_{j_{1}j_{2}}^{mn}\in\{0, 1\}$ 表示两个预测candidate $d_{j_{1}}^{m}和d_{j_{2}}^{n}$ 的连通状态；

因此，优化目标为：针对所有可能的连接， $\{z_{j_{1}j_{2}}^{mn}: for j_{1}, j_{2} \in \{1...,J\}, m\in \{1...,N_{j_{1}}\}, n\in \{1...,N_{j_{2}}\}\}$ ，寻找全局最优解。

3.4.3 关节点对

比较简单的情况，先考虑一对关节点类型 $j_{1}$ 和 $j_{2}$ ，对应了第c个骨骼，那么寻找最优连接等价于求解加权二分图匹配最大化问题。

让笔者来更加形象地解释待优化的问题，网络结构中的Branch 1会输出多个feature map图，每一个feature map表示某一个关节点的所有预测candidates，因此包含了图片上所有人的该关节点预测结果。以肘部和手腕这两个feature map为例，这里要解决的问题就是，将同一个人的肘部和手腕位置构成一个match，如果这样的match越多，那么匹配成功的人数就越多，也就意味这对肘部和手腕连接情况的预测效果越好。

为了求解Graph匹配问题，这里以论文中插图5b为例，图中的node表示预测关节点 $D_{j_{1}}$ 和 $D_{j_{2}}$ ，edge表示预测关节点对的连通性，这里的连通性用公式(10)中的骨骼点对置信度来衡量，在公式(12)中用 $E_{mn}$ 表示。匹配最优化问题就转换成新的问题，即寻找edge子集合，且满足子集合中任意两条edge无共享node，公式表示如下，

其中， $E_{c}$ 表征了关节点对（骨骼） $c$ 总的匹配置信度，这个优化问题可以使用Hungarian算法来求解。

4 实验结果

5 总结

（1）采用了coarse-to-fine的逐阶段思路；
（2）采用了“bottom-up”的思想，算法耗时跟图片中人物数量基本无关，速度快；
（3）开源软件OpenPose采用该方法定位人体，可以在服务器端做到实时，在工业场景中得到广泛应用。

6 参考资料

https://arxiv.org/abs/1611.08050
https://github.com/CMU-Perceptual-Computing-Lab/openpose

你可能感兴趣的:(深度学习算法)

院级医疗AI管理流程—基于数据共享、算法开发与工具链治理的系统化框架 Allen_Lyb 医疗高效编程研发人工智能算法时序数据库经验分享健康医疗
医疗AI：从“单打独斗”到“协同共进”在科技飞速发展的今天，医疗人工智能（AI）正以前所未有的速度改变着传统医疗模式。从最初在影像诊断、临床决策支持、药物发现等单一领域的“单点突破”，医疗AI如今已迈向“系统级协同”的新阶段。曾经，医疗AI的应用多集中在某一特定环节，比如利用深度学习算法分析医学影像，辅助医生进行疾病诊断。这种单点突破式的应用虽然在一定程度上提高了医疗效率，但随着医疗行业对AI技术
专题：2025云计算与AI技术研究趋势报告|附200+份报告PDF、原数据表汇总下载
原文链接：https://tecdat.cn/?p=42935关键词：2025,云计算，AI技术，市场趋势，深度学习，公有云，研究报告云计算和AI技术正以肉眼可见的速度重塑商业世界。过去十年，全球云服务收入激增8倍，中国云计算市场规模突破6000亿元，而深度学习算法的应用量更是暴涨400倍。这些数字背后，是企业从“自建机房”到“云原生开发”的转型，是AI从“实验室”走向“产业级应用”的跨越。本报告
【推荐算法课程二】推荐算法介绍-深度学习算法盒子6910 运维视角下的广告业务算法推荐算法深度学习运维开发运维人工智能
三、深度学习在推荐系统中的应用3.1深度学习推荐模型的演化关系图3.2AutoRec——单隐层神经网络推荐模型3.2.1AutoRec模型的基本原理AutoRec模型是一个标准的自编码器，它的基本原理是利用协同过滤中的共现矩阵，完成物品向量或者用户向量的自编码。再利用自编码的结果得到用户对物品的预估评分，进而进行推荐排序。什么是自编码器？自编码器是指能够完成数据“自编码”的模型。无论是图像、音频，
浅析基于深度学习算法的日语OCR技术原理及其应用场景 AI人工智能+ TEL18600524535 ocr 文字识别人工智能
在全球数字化进程加速的今天，日语作为世界第九大使用语言，其文字处理的自动化需求日益凸显，日语OCR技术应运而生。中科逸视日文OCR技术是一款基于先进人工智能技术的专业光学字符识别(OCR)解决方案，专门针对日语文本的数字化需求设计开发。能够将纸质文档、图片中的日文内容快速准确地转换为可编辑、可搜索的电子文本，大幅提升日文资料的处理效率，为企业国际化运营和个人日语学习提供强有力的技术支持。技术原理中
当AI邂逅新能源：Java如何重构能源未来
当AI邂逅新能源：Java如何重构能源未来在阿联酋阿布扎比的沙漠深处，一座由AI驱动的“全景式数字指挥中心”正实时监控着2000公里外的海上油田。通过深度学习算法预测设备故障、优化钻井路径，这座由阿布扎比国家石油公司打造的智能中枢，每年减少100万吨碳排放，创造价值5亿美元。而在中国南方，全球首个大规模抽水蓄能AI数据分析平台，正让百年历史的电站群焕发新生——7座电站、34台机组实现90%人工巡检
人脸识别接口&sdk，两张人脸相似度比对
人工智能时代，人脸识别技术正在被广泛应用于金融支付、安防监控、身份验证等多个领域，基于深度学习算法于海量样本训练，人脸识别接口以高精度、低延迟的特性出现在大众视野，成为开发者和企业用户集成人脸识别功能的首要选择之一。人脸识别接口技术服务原理：格式转换：支持BMP、JPG、PNG、TIF等多种常见图像格式；尺寸调整与压缩：建议图像大小控制在200KB左右，确保传输效率与识别质量；图像增强：自动旋转、
2025年中总结 Just Jump 人生经历思考反思认知方法 2025年中总结
2025年中总结。一如往年惯例，总结近半年工作中的体悟和经验。一、把大而难的事拆解成小而具体的小目标。专注解决小目标，每周迭代交付，先完成再完善。1.1把大任务拆解成具体可执行的小目标2025年5月起我开始做大模型相关的技术调研、技术升级和开发工作。传统的机器学习、深度学习算法和大模型的算法在技术知识上还是有很大的差异的。想要快速转型使用大模型做开发、训练，是需要些时间和精力投入的，这并不是一个简
基于级联深度学习算法在双参数MRI中检测前列腺病变的评估| 文献速递-AI辅助的放射影像疾病诊断有Li 人工智能深度学习算法
Title题目EvaluationofaCascadedDeepLearning–basedAlgorithmforProstateLesionDetectionatBiparametricMRI基于级联深度学习算法在双参数MRI中检测前列腺病变的评估Background背景MultiparametricMRI(mpMRI)improvesprostatecancer(PCa)detectionc
合规视角下银行智能客服风险防控 AI 智能服务智能客服人工智能 AIGC 数据库 chatgpt
1.AI驱动金融变革的政策与技术背景政策导向：我国《新一代人工智能发展规划》明确提出发展智能金融，要求：构建金融大数据平台，提升多媒体数据处理能力；创新智能金融产品与服务形态；推广智能客服、监控等技术应用；建立智能风控预警体系。技术支撑：云计算、大数据技术成熟为AI发展奠定了基础。深度学习算法的突破则引爆了本轮AI浪潮，显著提升了复杂任务处理精度，进而推动了计算机视觉、机器学习、自然语言处理（NL
【安卓】AI漫画推文v1.1.8 小说生成民间故事快速变现已解锁会员【110M】
【应用版本】：1.1.8【应用大小】：110MB【适用平台】：安卓【版本说明】：最新版【官方介绍】：AI漫画推文是一款基于人工智能技术的漫画推文生成工具，可以帮助用户快速、准确地创作出各种作品。该App利用深度学习算法分析用户的绘画动作，自动进行线条纠正、色彩填充等操作，从而提高小说推文漫画生成效率和画面质量。下载链接：https://pan.quark.cn/s/1585110a8d74
基于深度学习的IMU解算 SEU-WYL 深度学习dnn 深度学习人工智能 dnn
基于深度学习的惯性测量单元（IMU）解算是一种利用深度学习算法处理和分析IMU数据，以提升姿态估计、运动轨迹跟踪和定位精度的方法。IMU通常由加速度计、陀螺仪和磁力计组成，广泛应用于智能手机、无人机、机器人、虚拟现实（VR）和增强现实（AR）等领域。以下是关于这一领域的系统介绍：1.任务和目标IMU解算的主要任务是从IMU传感器数据中准确估计物体的姿态（姿态角、姿态矩阵或四元数）、速度和位置。具体
人脸识别技术成为时代需求，视频智能分析网关视频监控系统中AI算法的应用 Oliverro 视频分析网关人工智能网络
一、应用背景：时代需求与技术革新的双重驱动1）传统安防系统的困境：传统监控系统依赖人工逐帧筛查海量视频，在人流密集场所极易漏检，且缺乏实时锁定和主动预警能力，面对突发安全事件响应迟缓。2）技术发展的强大推力：深度学习算法推动人脸识别准确率大幅提升，跨角度识别率达91.3%，误识率低至0.002%。结合高性能摄像头、红外传感器与3D建模技术，可在复杂环境下精准识别。3）公共安全需求的升级：在交通枢纽
Java 人工智能应用：使用 DL4J 实现深度学习算法向哆哆 Java入门到精通人工智能 java 深度学习
Java人工智能应用：使用DL4J实现深度学习算法在当今数字化时代，人工智能技术正以前所未有的速度改变着各个行业的发展格局。而Java作为一种广泛应用于企业级开发的编程语言，在人工智能领域也发挥着越来越重要的作用。其中，深度学习作为人工智能的核心技术之一，为解决复杂问题提供了强大的能力。本篇文章将深入探讨如何使用Java深度学习库DL4J（Deeplearning4j）实现深度学习算法，助力开发者
植被监测新范式！Python驱动机器学习反演NDVI/LAI关键技术解析梦想的初衷~ 生态环境遥感植被 python 机器学习生态环境监测
在全球气候变化与生态环境监测的重要需求下，植被参数遥感反演作为定量评估植被生理状态、结构特征及生态功能的核心技术，正面临数据复杂度提升、模型精度要求高、多源异构数据融合等挑战。人工智能（AI）技术的快速发展，尤其是机器学习与深度学习算法的突破，为解决这些难题提供了全新路径。AI凭借强大的非线性拟合能力、数据特征自动提取优势及跨模态信息融合潜力，能够高效处理遥感数据中的噪声与不确定性，显著提升植被参
【Python深度学习（第二版）（2）】深度学习之前：机器学习简史 roman_日积跬步-终至千里 #python深度学习（第二版）深度学习机器学习人工智能
文章目录一.深度学习的起源1.概率建模--机器学习分类器2.早期神经网络--反向传播算法的转折3.核方法--忽略神经网络4.决策树、随机森林和梯度提升机5.神经网络替代svm与决策树二.深度学习与机器学习有何不同可以这样说，当前工业界所使用的大部分机器学习算法不是深度学习算法。深度学习不一定总是解决问题的正确工具：有时没有足够的数据，深度学习不适用；有时用其他算法可以更好地解决问题。如果第一次接触
智能光学计算成像技术与应用前沿会议通知 m0_75133639 光电光学成像全息成像光学光电光子学光电工程师生物医学工程
会议背景智能光学计算成像是人工智能与光学成像深度融合的前沿领域，通过深度学习、光学神经网络、超表面光学及量子光学等技术，显著推动成像技术的革新。当前研究热点包括：-深度学习赋能的成像技术：如高速多模光纤成像、神经渲染全息三维重建、超分辨率成像-先进光谱与计算成像：基于超表面和衍射光栅的高光谱信息获取、压缩感知成像、无透镜成像-端到端联合设计：融合可微光学模型与深度学习算法，实现硬件-软件协同优化会
AI人工智能深度学习算法：在高精地图构建中的应用 AI天才研究院 AI Agent 应用开发 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1高精地图的重要性随着自动驾驶、无人机等技术的快速发展，高精地图变得越来越重要。高精地图不仅提供了传统地图所具有的道路、建筑等基础地理信息，还能提供道路的详细信息，如车道数、车道宽度、限速标志、交通信号灯等，对于实现精准的自动驾驶至关重要。1.2AI在高精地图构建中的应用AI人工智能，特别是深度学习算法，在高精地图构建中发挥着重要作用。传统的地图构建方法通常需要大量的人工参与，而且
深入详解人工智能入门数学基础：理解向量、矩阵及导数的概念猿享天开人工智能数学基础专讲人工智能矩阵线性代数数学
人工智能入门数学基础详解数学是人工智能的基石，理解数学基础对于掌握机器学习和深度学习算法至关重要。本篇文章将详细探讨线性代数和微积分中的基础概念，涵盖向量、矩阵及其运算，以及导数的基本概念。第一部分：线性代数中的向量1.向量的定义与表示向量是线性代数的核心概念之一。它不仅仅是一个数值的集合，而是一个具有大小和方向的数学对象。在多维空间中，向量可以用于表示点的位置、速度、力等物理量。1.1向量的表示
基于RGB与多光谱图像的农田语义分割技术研究及应用中达瑞和-高光谱·多光谱相机
随着智慧农业的发展，精准监测农田环境与作物生长状态成为关键需求。传统遥感技术受限于光谱分辨率与成像条件，难以满足精细化管理要求。本文以无人机搭载中达瑞和S810多光谱相机为技术载体，结合深度学习算法，提出单模态与多模态融合的农田语义分割方法。通过构建专用数据集与创新网络架构，显著提升了复杂场景下的分割精度与环境适应性，为精准农业提供了高效解决方案。一、研究背景与技术挑战农业生产的数字化监测依赖高精
ZED X系列双目3D相机的耐用性与创新设计解析欣佰特cnbestec ZED 人工智能数码相机机器人
在工业自动化和学术研究领域，高精度的视觉设备正成为提升效率和质量的关键。ZEDX系列AI立体相机，凭借其先进的技术和耐用的设计，为这一领域带来了新的可能。核心技术：深度感知与精准追踪ZEDX系列的核心技术之一是NeuralDepthEngine2，这项技术通过深度学习算法，提供了高精度的深度感知能力。设备支持高达4K的分辨率，能够捕捉到细腻的画面细节，同时帧率可达120帧每秒，确保动态场景的流畅捕
Python与自动驾驶数据集处理：构建智能驾驶的基石 Echo_Wish Python！实战！python 自动驾驶开发语言
Python与自动驾驶数据集处理：构建智能驾驶的基石在自动驾驶技术的快速发展中，数据始终是最核心的驱动力。自动驾驶系统依赖于大量的传感器数据（激光雷达、摄像头、GPS等），通过深度学习算法不断优化决策，使车辆能够自主感知、理解道路环境并做出合理决策。而Python作为AI和数据科学的核心工具，在自动驾驶数据集的处理上扮演着不可或缺的角色。今天，我们就深入探索如何使用Python处理自动驾驶数据集，
使用 C# 入门深度学习：线性代数详细讲解江沉晚呤时算法 C#c#深度学习线性代数 .netcore 后端人工智能
在深度学习的领域中，线性代数是基础数学工具之一。无论是神经网络的训练过程，还是数据的预处理和特征提取，线性代数的知识都无处不在。掌握线性代数的核心概念，对于理解和实现深度学习算法至关重要。在本篇文章中，我们将通过C#语言来详细讲解线性代数在深度学习中的应用。一、线性代数基础1.向量和矩阵在深度学习中，数据、权重和偏置通常都以向量和矩阵的形式存储和操作。让我们从这两个概念开始：向量（Vector）是
生成式人工智能：创意产业的变革力量 Blossom.118 分布式系统与高性能计算领域人工智能去中心化区块链交互 web3 机器学习目标检测
引言随着人工智能技术的飞速发展，生成式人工智能（GenerativeAI）逐渐成为科技领域的热门话题。生成式人工智能通过深度学习算法，能够生成文本、图像、音乐、视频等多种内容，为创意产业带来了前所未有的机遇。本文将探讨生成式人工智能在创意产业中的应用、技术原理以及未来的发展趋势。一、生成式人工智能简介（一）定义与原理生成式人工智能是一种利用深度学习算法（如生成对抗网络GAN、变分自编码器VAE和T
AI模型部署初认识山语山人工智能 ai 架构数据结构
AI部署这个词儿大家肯定不陌生，可能有些小伙伴还不是很清楚这个是干嘛的，但总归是耳熟能详了。近些年来，在深度学习算法已经足够卷卷卷之后，深度学习的另一个偏向于工程的方向–部署工业落地，才开始被谈论的多了起来。当然这也是大势所趋，毕竟AI算法那么多，如果用不着，只在学术圈搞研究的话没有意义。因此很多AI部署相关行业和AI芯片相关行业也在迅速发展，现在虽然已经2021年了，但我认为AI部署相关的行业还
AI人工智能深度学习算法：在流体动力学中的应用 AI天才研究院计算 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
欢迎您的阅读，接下来我将为您一步步分析：AI人工智能深度学习算法在流体动力学中的应用。让我们通过多个角度来探讨这个问题。文章目录AI人工智能深度学习算法：在流体动力学中的应用AIDeepLearningAlgorithms:ApplicationsinFluidDynamics1.理解深度学习和流体动力学的基本概念1.UnderstandingtheBasicConceptsofDeepLearn
【深度学习新浪潮】智能追焦技术全解析：从算法到设备应用 AndrewHZ 深度学习新浪潮深度学习算法人工智能图像处理手机影像 ISP算法目标追踪
一、智能追焦技术概述智能追焦是基于人工智能和自动化技术的对焦功能，通过深度学习算法识别并持续跟踪移动物体（如人、动物、运动器械等），实时调整焦距以保持主体清晰，显著提升动态场景拍摄成功率。其核心优势包括：精准性：AI算法优化复杂运动轨迹追踪（如不规则移动、突发变速）。智能化：支持语义识别（如优先追踪人脸、眼睛、特定物体），适配“人像”"运动"“宠物”等模式。易用性：自动化对焦，降低动态拍摄门槛，适
智能视频分析系统 ARM2NCWU 音视频
智能视频分析系统是基于人工智能、机器视觉和大数据技术的综合型监控解决方案，其核心功能与应用场景如下：一、核心功能实时视频流处理‌系统可对实时视频流进行毫秒级响应分析，识别并跟踪目标对象（如人脸、车辆、特定物体），支持多分屏显示和全屏浏览模式。目标检测与跟踪‌通过运动检测技术分离动态目标与背景，并利用深度学习算法持续跟踪目标轨迹，确保复杂场景下的精准定位。智能事件分析与预警‌基于行为识别模型，系统可
Python爬虫与语音识别技术的完美结合：从抓取音频到文本提取的完整实践 Python爬虫项目 2025年爬虫实战项目 python 爬虫语音识别 tcp/ip 数据挖掘开发语言音视频
第一部分：介绍1.1什么是爬虫技术？爬虫技术，也称为网络抓取，是从网站、社交平台、API接口等地方获取数据的过程。通过爬虫技术，开发者能够抓取大量的信息，为后续的数据分析、机器学习训练、自然语言处理等应用提供数据支持。1.2语音识别技术简介语音识别是将语音信号转化为文字的技术。现代语音识别系统使用深度学习算法，并且在自然语言处理领域发挥着重要作用。在本篇博客中，我们将探索如何通过爬虫抓取包含语音文
开源近红外光谱数据集 Echo_Code 近红外光谱学习人工智能 python
系列文章目录近红外光谱分析技术属于交叉领域，需要化学、计算机科学、生物科学等多领域的合作。为此，在（北京邮电大学杨辉华老师团队）指导下，近期准备开源传统的PLS，SVM，ANN，RF等经典算和SG，MSC，一阶导，二阶导等预处理以及GA等波长选择算法以及CNN、AE等最新深度学习算法，以帮助其他专业的更容易建立具有良好预测能力和鲁棒性的近红外光谱模型。文章目录系列文章目录前言一、总体预览二、下载地
Baklib构建AI就绪知识管理新范式数字体验运营官其他
Baklib驱动知识管理智能化升级Baklib通过构建企业级知识中台，推动知识管理进入智能化跃迁阶段。平台基于自然语言处理与深度学习算法，实现多源异构数据的自动化清洗与智能分类，并建立动态更新的知识图谱。在数据预处理环节，系统可自动识别文档的语义关联性，生成多维标签体系，使知识检索效率提升50%以上。通过上下文感知推荐机制，员工在具体业务场景中能实时获取关联案例模板与解决方案参考，有效缩短决策链路
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：[email protected]）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他