weixin_50862344

【论文翻译】Jointformer ：一种基于误差预测和改进的三维人体姿态估计的单帧提升变压器

摘要

单目三维人体姿态估计技术有望极大地提高人体运动数据的可用性。表现最好的单幅图像2D3D提升模型使用图卷积网络(GCNs)，通常需要一些手动输入来定义不同身体关节之间的关系。我们提出了一种新的基于变压器的方法，该方法使用更广泛的自我注意机制来学习表示关节的符号序列中的这些关系。我们发现使用中间监督，以及堆叠编码器之间的剩余连接有利于性能。我们还建议使用错误预测作为多任务学习框架的一部分，通过允许网络补偿其置信度来提高性能。我们进行了广泛的消融研究，以证明我们的每一项贡献都能提高性能。此外，我们表明，我们的方法在单帧3D人体姿势估计方面的表现优于最近的技术水平。我们的代码和训练过的模型在Github上公开提供。

1.介绍

运动分析对于混合现实、人机交互、运动生物力学和物理治疗等应用至关重要。然而，人体运动是高度复杂和主观的，高维度和受试者之间的差异意味着仍然有很多不了解的地方。虽然自20世纪80年代以来，运动捕捉系统就被用于量化运动，但设备昂贵，数据集在很大程度上受到实验室设置的限制，而且可供公开使用的数据相对较少。与此同时，互联网收集了大量野外(无标签和不受限制)的移动人类图像和视频。单目3D人体姿态估计(HPE)技术的成熟有可能使可用数据和可评估场景逐步增加，最终可用于提高我们对人体运动的理解

单眼三维人体姿态估计是指从单个视点预测三维关节位置。虽然视频技术可以利用时间信息来提高*表示等贡献精度，但单幅图像估计器仍有其自身的用处。例如，关于人体运动的有用信息可以从低帧率的在线图像数据集或视频数据集中学习。此外，一些视频方法选择使用单帧空间模型和多帧时间模型[2]的组合。因此，强单幅图像的3D姿态提升器也可以提高视频数据的性能。

直接估计技术旨在从图像[3]中直接估计三维人体姿态。然而，具有3D姿态标签的不同图像数据集是稀疏的，并且可以方便地利用现成的2D姿态估计器[4]，[5]的高精度，这非常适合于像素处理任务。姿态提升方法从这些估计器提供的2D关节预测中预测3D姿态。用于学习这种映射的神经网络架构的类型已经逐步发展。最初用于姿态提升的简单基线[6]使用多层感知器来实现惊人的精度，即使没有来自图像特征的信息。最近的研究强调，将姿态视为向量忽略了关节之间的空间关系，而图形结构可能更适合[7]。然而，现有的关于图卷积的工作需要手工制作的邻接矩阵来定义节点之间的关系。此外，标准图卷积用共享权矩阵对相邻关节之间的关系进行建模，这对于铰接体的建模是次优的，因为不同身体关节之间的关系可能是不同的[8]。此外，叠加GCN层可能会导致[9]过平滑。相比之下，变压器模型的自注意算子将前馈层推广为对输入是动态的，并且关节之间的关系可以通过学习而不是手动编码。

transformer首先取代了循环神经网络作为自然语言处理(NLP)[10]中的主要模型，最近在图像分类[11]、物体检测[12]和动作识别[13]等视觉任务中成功取代了卷积神经网络。然而，迄今为止，很少有研究将transformer应用于三维人体姿态估计任务。现有的工作要么采用直接估计方法[14]，要么集中研究基于视频的2D-3D提升[2]，[15]。据我们所知，我们的方法是第一个采用变压器进行单幅图像2D-3D姿态提升的方法。序列的输入和输出标记表示关节，因此我们将我们的方法称为Jointformer。

因此，我们的贡献如下:

•我们提出了一种用于人体姿态估计的新型单帧2D-3D姿态提升的关节transformers。

•我们建议通过使网络能够补偿自身的不确定性，预测与每个关节相关的错误来提高准确性。

•我们提出了一种改进transformers结构，根据3D预测本身、输入2D关节和每个关节的预测误差，改进关节变压器的3D姿势预测。

•我们在transformers编码器堆栈中引入了对3D关节和误差预测的中间监督，由线性层促进。

•我们表明，这种架构在Human3.6M和MPI-INF-3DHP数据集上实现了最先进的结果，用于单帧3D人体姿势估计

2.相关工作

人体姿态估计:由于其在动作识别、增强现实和混合现实等多个领域的适用性，HPE已经成为计算机视觉中一个非常活跃的问题。我们介绍了与直接估计和2D-3D提升方法相关的文献。直接估计是指直接从原始图像中估计三维姿态。Pavlakos等[16]利用人体关节的序数深度来提供一个较弱的监督信号。Sun等人[17]利用关节连接结构，并定义了一个组合损失函数，对姿态的远程相互作用进行编码。马丁内斯等人探索了将问题解耦为2D人体姿势估计和2D- 3D提升，并使用vanilla神经网络来学习映射。Zhao等[7]利用语义图卷积网络(SemGCN)中节点的空间关系(包括局部和全局)来提高性能。Ci等[18]引入了局部连接网络来克服GCNs在估计3D姿态时的有限表示能力。Xu等人[19]使用图堆叠沙漏网络来处理三种不同尺度的人类骨骼表征的图结构特征。Tekin等[20]设计了一个网络，结合了直接估计和提升的优缺点。Yang等[21]提出了一种使用几何感知鉴别器辅助对抗学习的野外HPE方法。Fang等[22]提出了一种基于双向循环网络的提升框架，该框架明确地对诸如运动学、对称性和运动协调等辅助信息建模。Sharma等[23]使用变分自动编码器来预测一组候选3D姿势，并使用序数得分或信息对它们进行排名。Liu等[8]-在对HPE的综合综述中，研究了基于图卷积的提升方法的不同权值分担策略。Zhou等人[24]提出了一种两阶段方法，其中2D点被映射到中间潜在空间，然后对3D空间进行体积回归。

在视觉领域的Transformers:30年来，卷积神经网络(cnn)[25]一直是计算机视觉领域的主导模型。由于卷积在小的局部邻域内运行，深度堆叠卷积对于形成大的接受域和捕获长距离依赖关系变得必要。非局部神经网络[26]受到NLP[10]中的自我注意机制的启发，在CNN的各个阶段之间使用少量的非局部块，以更好地捕获长距离关系，进行动作识别。Ramachandran等人[27]探索了在小窗口内使用独立的自我注意作为图像分类和目标检测的基本构建块(而不是在卷积之上的增强)。同样，Zhao等[28]使用了一种具有成对和patchwise自注意的自注意网络进行图像识别。

视觉转换器(ViT)[11]并没有将构建块的结构建立在resnet风格的体系结构上，而是直接应用了一个标准Transformers(尽可能少的修改)来对图像进行分类。图像输入为扁平的patches序列，patches处理类似于NLP应用程序中的tokens标记(单词)。类似的方法已经应用于视频分类[29]和动作识别[13]。

尽管在其他视觉任务中有很大的前景，但很少有研究将Transformers应用于三维人体姿态估计任务。Liu等人首次使用注意力机制自适应地识别人类运动视频的时间窗口中的重要帧。Lin等[14]使用变压器直接估计单个输入帧的3D人体姿势和形状。输入标记由CNN提取的特征向量组成，该特征向量与随机初始化的3D关节或网格顶点连接。在每个编码器之后，输入输入令牌的尺寸逐渐减小。Zheng等人[2]解决了基于视频的3D人体姿态估计任务，并将空间Transformers作为一个更大的时间变压器中的组件，其中输出标记是编码的特征，而不是3D关节位置。因此，它不能应用于单帧2D-3D提升，其性能没有在图像上进行评估。Li等人[15]使用了一个提升Transformers，用跨步时间卷积取代编码器中的前馈层。它对时间序列进行操作，其中每个输入标记都是一个完整的骨架。这意味着有用的信息不能在骨骼的关节之间传递。

误差预测、改进和中间监督:人体姿态估计模型的预测不可避免地存在误差。Ronchi等人[30]在COCO数据集[31]上对2D HPE估计器的预测误差进行了严格的分析。研究了不同类型的误差(抖动、反转、交换和未命中)的相对频率和对性能的影响，发现误差显示出与所使用的2D位姿估计器类型无关的相似分布。Moon等[32]使用这些误差统计数据来生成合成姿势，并将其输入到细化网络。类似地，Chang等人[33]使用特定的误差分布来合成用于2D- 3D姿态提升的2D姿态。Fieraru等人[34]引入了一种姿态优化网络，该网络将图像和给定的姿态估计同时作为输入。Zhang等[35]构造了一个姿态图来考虑细化过程中不同关键点之间的关系。Wang等[36]使用图形姿态细化(GPR)模块根据关键点之间的关系来细化视觉特征。

中间监督是在深度神经网络的各个阶段使用额外的损失项来提高性能的实践。在二维人体姿态估计中，Newell等[37]使用了重复的自底向上/自顶向下处理，中间监督他们的堆叠沙漏网络DETR[12]在堆叠的Transformers译码块之间使用中间监督来进行目标检测

3.方法

在本节中，我们将描述我们提出的用于3D人体姿态估计的网络架构。遵循之前的2D-3D姿态提升方法[6]，我们使用一个现成的模型从图像中生成2D姿态，并使用这些预测来估计相应的3D姿态。三维姿态估计在相机坐标和骨盆关节为中心。虽然以前的大多数技术都使用多层感知器(mlp)[6]或GCNs[7]，但我们使用Transformer分两部分预测和细化3D姿态。首先，我们的Joint Transformer估计单个帧的2D姿态的3D姿态和预测误差。然后，利用中间预测和预测误差，进一步改进了该预测。这种新颖的网络组合使我们能够在单帧3D姿态估计中实现最先进的性能。

A.Joint Transformer

我们的Joint Transformer的设计，以提升输入的2D姿态到3D的单帧。给定一组J二维关节坐标x，我们将每个关节视为一个令牌，并首先将其嵌入到尺寸为c的更高维度: $f_{embed}(x):\mathbb{R}^{J \times 2}\rightarrow \mathbb{R}^{J \times c}$

传统上，在Transformer中，嵌入之后是位置编码。然而，在我们的例子中，关节的顺序在训练和测试过程中都没有改变，隐式地编码了输入本身的位置(即输入中的第一个关节总是髋关节)。这使得显式位置编码的添加是多余的，并且实际上会损害我们的预测性能，正如我们在第IV-C节中所展示的那样。

在嵌入之后，我们将关节点tokens馈送到Transformer编码器的堆栈中，其中应用自注意来跨每个关节共享信息。我们使用变压器编码器[10]的原始实现，并且没有进一步修改隐藏维数。给定L个变压器编码器，每个编码器的输出为 $z_L\in \mathbb{R}^{J \times c}$ 。最后，我们回归最后一个编码器z的输出，使用由层归一化、dropout和单个线性层fpred(z)组成的MLP块来预测3D姿态: $f_{pred}(z): \mathbb{R}^{J \times c}\rightarrow \mathbb{R}^{J \times 3}$ 。

1)中间监督 : 通过设计，Transformer编码器层在tokens之间共享信息，并学习哪些tokens对于预测是重要的。这甚至给了我们堆栈中的第一个Transformer编码器学习联合标记如何相互作用和预测3D姿势的能力(尽管不一定是容量)。我们利用中间监督来训练我们的网络。与以前的方法相比，我们不单独计算网络末端的损耗，而是在堆栈中每个单独的Transformer编码器之后引入一个损耗项。这允许网络学习初始估计，并由堆栈中的每个Transformer编码器进一步细化。后续的变压器编码器从以前的编码器中传递高度鉴别的特征，并可以专注于越来越细粒度的特征，以细化以前的估计。为了进一步帮助解决这个问题，我们在每个编码器周围添加残差连接。在我们的实现中，每个编码器后面都有一个预测3D姿态的MLP，可以对其应用损失。我们在预测的3D姿态中添加一个额外的线性层，将预测嵌入到变压器的隐藏维度中，并将嵌入添加到原始变压器输出中，如图1的右上角所示。

2)姿态嵌入:二维输入姿态坐标需要扩展到我们网络的隐藏维度。以前的方法使用线性层或图卷积来完成这项任务。然而，在我们的方法中，我们在所有关节上使用核大小为1的1D卷积。这相当于一个线性层，将每个关节的二维坐标分别扩展到隐藏维度，并在每个关节之间共享权重。由于每个关节的嵌入权重是共享的，因此该层可以专注于寻找扩展二维坐标的最佳方法，而不考虑关节的位置。传统上，Transformer还需要嵌入标记的位置编码。由于关节的输入顺序从未改变，位置已经隐式编码，额外的编码是多余的。我们在表III中显示，我们的方法在没有任何显式位置编码的情况下工作得更好，我们的卷积嵌入优于线性层。

3)错误预测:对其预测的置信度进行估计，使网络具有补偿能力。由于分类头在softmax层之前每个类生成一个预测，因此可以直接推断其预测置信度。相比之下，回归头缺乏这种开箱即用的能力。我们在变压器编码器的输出中添加第二个反映3D姿势预测的MLP，并迫使网络隐式地学习自己的不确定性。因此，误差预测将预测自己每个关节和每个坐标 $f_{error}(z)=\mathbb{R}^{J \times c}\rightarrow \mathbb{R}^{J \times 3}$ 。我们观察到，误差预测的加入使训练稳定，并导致更好的整体结果(第IV -C节)。它还可以作为可视化姿势或技术实际应用的重要附加信息。

4)损失函数:我们用来训练我们的网络的损失函数由两项组成:3D预测损失L3D和误差损失 $L_{error}$ 。对于3D预测损失，我们使用预测的3D位姿y和真实位姿y之间的均方误差。对于误差损失，我们首先将真实误差 $\widehat{e}$ 定义为预测位姿和真实位姿之间的绝对差 $\widehat{e}=\left | y-\widehat{y} \right |$ 。这允许我们使用预测误差e和真实误差 $\widehat{e}$ 之间的均方误差作为误差损失。由于我们的中间监督，我们在堆栈中的每个变压器编码器后应用这两个损失项。这导致了综合损失:

其中L是堆栈中Transformer编码器的数量

B. Refinement Transformer

为了进一步利用误差预测，提高姿态预测的精度，我们设计了一个额外的Refinement Transformer。该网络类似于我们的joint Transformer，但有以下区别:输入是原始的2D位姿连接到预测的3D位姿和误差预测。我们只堆叠两个隐藏维度为256的Transformer编码器，并且我们不使用中间监督。与joint Transformer一样，Refinement Transformer对每个关节进行标记，并使用1D卷积将8通道输入嵌入到隐藏维度。在堆叠的Transformer编码器之后，我们使用一个线性层来预测最终的3D姿态。

C.实现细节

我们在PyTorch[38]中实现我们的方法，并使用单个NVIDIA GeForce RTX 2080 TI进行训练。我们使用AdamW[39]优化器训练联合变压器30个周期，批大小为256，初始学习率为0.001，余弦退火学习率衰减为[40]。我们所有的预测层在训练期间也包括0.2的dropout。

然后，我们确定联合变压器的权重，并使用3D预测损失和相同的超参数训练细化变压器。在评估期间，我们通过水平翻转使用测试时数据增强，遵循[41]。

4.实验

实验部分就不写了

对json数据进行去重的Python实战代码爱编程的喵喵 Python基础课程 python json 数据去重实战代码
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了对json数据进行去重的Python
【高中生讲机器学习】30. 理解条件随机场最清晰的思路！（上篇） Geeker · LStar 机器学习人工智能算法机器学习人工智能条件随机场算法监督学习标注问题
创建时间：2024-12-22首发时间：2025-01-24最后编辑时间：2024-01-24作者：Geeker_LStar你好呀~这里是Geeker_LStar的人工智能学习专栏，很高兴遇见你~我是Geeker_LStar，一名高一学生，热爱计算机和数学，我们一起加油~！⭐(●’◡’●)⭐上一篇我们讲完了马尔可夫随机场MRF，那篇的最后我简单介绍了条件随机场CRF但没有展开讲。这不，这篇就来填坑
【高中生讲机器学习】17. 讲人话的主成分分析，它来了！（上篇） Geeker · LStar 人工智能机器学习算法机器学习人工智能主成分分析算法无监督学习
创建时间：2024-08-13首发时间：2024-09-05最后编辑时间：2024-09-05作者：Geeker_LStar你好呀~这里是Geeker_LStar的人工智能学习专栏，很高兴遇见你~我是Geeker_LStar，一名准高一学生，热爱计算机和数学，我们一起加油~！⭐(●’◡’●)⭐那就让我们开始吧！诶嘿！这一篇想写很久啦，现在终于来了！（什么玩意都拖到开学了还没写完如果想比较好的理解这
【初中生讲机器学习】14. 手撕公式，一篇带你理解逻辑回归！ Geeker · LStar 人工智能机器学习算法机器学习逻辑回归人工智能算法分类算法监督学习
创建时间：2024-03-03最后编辑时间：2024-03-10作者：Geeker_LStar你好呀~这里是Geeker_LStar的人工智能学习专栏，很高兴遇见你~我是Geeker_LStar，一名初三学生，热爱计算机和数学，我们一起加油~！⭐(●’◡’●)⭐那就让我们开始吧！嘿嘿，好几篇前，好像是在线性回归那篇吧，我就说要讲逻辑回归，but当时被数学卡了一下（好吧不只一下）and正好遇上开学，
OpenAI Sora 入门教程第二章：Sora 的文本到视频转换原理山海青风人工智能人工智能 prompt python
一、目标对象本章面向对视频制作或人工智能技术感兴趣的技术爱好者、视频编辑人员以及希望理解视频生成模型原理的从业人员。二、Sora模型的基础原理Sora模型的核心功能是将文本转换为视频内容，这一过程包括三个主要步骤：1.文本解析Sora首先会解析输入的文本脚本，分析出其中的关键词、意图和语法结构。解析过程包括：关键词提取：识别描述场景、角色、时间和动作的词汇。语法分析：分析句子的语法结构，理解逻辑关
基于python使用OpenCV和MediaPipe通过人体姿态检测实现对标准的仰卧起坐数量的计量(一） Komorebi_777 视觉学习 python opencv 开发语言
项目中主要运用到的库1.OpenCV2.MediaPipe3.math4.Numpy项目总流程用户准备仰卧起坐的时候，可以打开摄像头对准自己（本报告为方便呈现，将导入外部有关仰卧起坐的视频体现监测过程，并截图体现效果）并运行程序，则可以实现实时监测仰卧起坐的状态，通过获取人体一侧（本项目中指定为左侧）的肩膀、腰部和脚的点位，得到三个坐标值，而后利用数学公式讲指定两点（即肩膀与腰部、脚与腰部）的连线
AI人工智能代理工作流 AI Agent WorkFlow：在音乐创作中的应用 AGI大模型与大数据研究院大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：在音乐创作中的应用1.背景介绍1.1问题的由来在音乐创作领域，艺术家们一直在寻找创新的方式来提升作品的独特性、丰富性以及创作效率。随着人工智能技术的快速发展，特别是深度学习和生成模型的广泛应用，音乐创作过程正逐渐被赋予新的生命力。AI代理工作流的概念应运而生，旨在通过自动化的流程和智能辅助手段，帮助音乐人探索新的音乐风格、创作灵感，甚至生成完整
如何使用Agent框架来模拟群体智能？ concisedistinct 人工智能 python 开发语言 Agent 人工智能 ai AI编程
Agent框架作为人工智能领域的重要工具，可以模拟复杂的群体智能行为，广泛应用于社会科学、经济学和行为学等领域。想象一个由数百万人组成的虚拟社会，每个人都有独立的行为决策规则和不同的目标。通过这样的模拟，我们能否发现隐含的社会规律？能否揭示复杂群体行为背后的动力机制？Agent框架为这一设想提供了可能，它不仅能够构建多样化的个体模型，还能实现复杂的交互、学习和协作过程，开启探索群体智能的无限可能。
在量子计算与AI结合的未来，是否能够实现更高效、更复杂的模式识别和数据处理？ concisedistinct 编程开发技术栈人工智能
随着量子计算和人工智能（AI）的发展，二者的结合正在成为前沿科技领域的一个重要研究方向。量子计算通过利用量子叠加和纠缠等特性，能够在某些问题上提供比经典计算机更强大的计算能力。人工智能，特别是深度学习，已经在许多领域取得了突破性的进展。本文将探讨量子计算与AI结合的创新机会，重点分析其在模式识别和数据处理中的优势与挑战。通过量子计算的并行处理能力和AI模型的智能学习能力，未来有望实现比传统计算更高
DeepSeek-R1全面超越OpenAI o1：开源大模型训练范式革新前端javascript
CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读人工智能在过去十年中的发展令人惊叹。其中，2017年Google发布的“AttentionIsAllYouNeed”论文奠定了神经网络架构的重要基础，推动了大规模语言模型（LLM）的突破。OpenAI早期专注于强化学习（RL），但在Transformer结构问世后，迅速调整方向，借助Google的开源研究开发出强大的LLM。然而，尽
python 量化回测框架生成器 2401_85969422 大数据
各位朋友们，小编在这里要分享，量化回归测试平台设计python量化交易策略回测，一起体验不同地域的风土人情，拓宽视野！虽然#python#的安装非常简单，但是总有一些神经网络CSDN真的非常白，雪白雪白的……以至于我常看见这种帖子：所以，我还是写一个安装指南吧，专供给神经网络CSDN学习PHP从入门到精通：我的个人时间线。首先要知道，安装Python其实就是安装一个Python编程环境，而且这和安
Python未来的发展前景到底如何？附python学习路线大模型官方资料 python 学习开发语言
对于程序员而言，了解编程语言的发展趋势，有助于个人职业成长；而对于想要入行IT的新人而言，最大的疑惑大多来自于不知道该选择哪门编程语言发展前景更好！✔有人让你学Java，因为使用的人最多；✔有人让你学Python，因为简单易学，是人工智能时代的首选语言；✔还有人让你学PHP，因为是“世界上最好的语言”；今天小编将主要介绍一下Python的发展前景！薪资待遇上海python就业形势分析：·招聘待遇，
python必读书单 Vin0sen python 开发语言
文章目录{编程入门}{编程进阶}{算法基础}{Web开发}{网络编程}{爬虫}{安全}{数据分析}{数据科学}{数据挖掘}{机器学习}{深度学习}{其他方向}{编程入门}父与子的编程之旅：与小卡特一起学Python[HOT]Python2.7和孩子一起玩编程Python2.7零压力学PythonPython3.0，但也指出了如何修改示例，以支持Python2.0Python编程：从入门到实践[HO
心法利器[127] | 24年算法思考-特征工程和经典深度学习机智的叉烧算法深度学习人工智能
心法利器本栏目主要和大家一起讨论近期自己学习的心得和体会。具体介绍：仓颉专项：飞机大炮我都会，利器心法我还有。2023年新的文章合集已经发布，获取方式看这里：又添十万字-CS的陋室2023年文章合集来袭，更有历史文章合集，欢迎下载。往期回顾心法利器[122]|效果提升的根本来源讨论心法利器[123]|算法面试的八股和非八股讨论心法利器[124]|24年算法思考-大模型的应用与训练篇心法利器[125
Pytorch深度学习实战2-1：详细推导Xavier参数初始化(附Python实现) 2401_84140080 程序员深度学习 python pytorch
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
TensorFlow 示例项目实战与源码解析.zip ELSON麦香包
本文还有配套的精品资源，点击获取简介：TensorFlow是谷歌大脑团队开发的开源机器学习库，广泛应用于深度学习、人工智能等领域。该压缩包提供了一个TensorFlow示例项目的源代码，涵盖了从基础操作到复杂模型的各种主题。文章将详细介绍TensorFlow的核心概念，如张量、图计算、会话、变量、梯度下降与优化器、损失函数、数据集、模型评估、模型保存与恢复以及KerasAPI。读者可通过实践这些示
大模型带你学pytorch课程立杰说 Python deep-learning Pytorch pytorch 人工智能 python
时间有限，大家有想看的部分，可以私信或者评论区联系，我及时补充。或者大家有想帮忙补充的也可以联系。注：大部分内容均为大模型生成，若有疏漏，欢迎指出。看起来你想要开始学习PyTorch，这是一个非常棒的选择！PyTorch是一个强大的开源机器学习框架，由Facebook的人工智能研究实验室开发，被广泛用于深度学习模型的构建和训练。让我们开始你的PyTorch旅程吧！1.预备课程大纲1.1引入Pyth
【2024年国内一些知名的免费AI对话工具的对比】龙少9543 后端人工智能
2024年国内一些知名的免费AI对话工具的对比免费体验以下是2024年国内一些知名的免费AI对话工具的对比以及它们的体验地址。这些工具基于各自公司的深度学习和自然语言处理技术，为用户提供智能对话服务。百度文心一言特点:基于ERNIE模型，拥有知识增强、检索增强和对话增强的技术特色，支持跨模态生成。体验地址:https://yiyan.baidu.com/讯飞星火认知大模型特点:支持多风格长文本生成
用于深度学习的硬件配置列表 Mr.Q 项目记录环境搭建工具深度学习
自己2021年配制的一台深度学习机子，体验是水冷没必要（主要是安装费劲）。注意电源功率一定要够，不然带不动显卡，最好是1000w左右。1处理器：英特尔（Intel）i9-10900K10核20线程盒装CPU处理器【英特尔i9-10900K】英特尔（Intel）10代酷睿i9-10900KCPU处理器10核20线程睿频至高可达5Ghz【行情报价价格评测】-京东35992主板：玩家国度（ROG）ROG
无人机飞行惯导系统技术详解无人机技术圈无人机技术无人机
无人机飞行惯导系统技术是一种关键的导航技术，它利用惯性导航系统（INS）来测定和维持无人机的方向、位置和速度。以下是对无人机飞行惯导系统技术的详细解析：一、工作原理惯性导航系统主要依赖于测量设备的加速度和旋转率，从而不需要外部参考点就能进行导航。具体来说，它通过加速度计和陀螺仪这两种惯性元件，分别测出飞行器的线运动信息和角运动信息，再与初始姿态、初始航向、初始位置一起交给计算模块，由计算模块推算出
计算范式的变革：从图灵机到神经网络 AI架构设计之禅 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
图灵机，神经网络，计算范式，深度学习，机器学习，人工智能，算法，模型1.背景介绍自20世纪中叶以来，计算机科学经历了飞速发展，计算范式也经历了深刻的变革。从最初的图灵机模型到如今的深度学习，我们不断探索更强大、更灵活的计算方式。图灵机作为计算机科学的基石，奠定了通用计算的理论基础。它以有限的符号和规则，模拟了人类的逻辑思维过程，为现代计算机的诞生提供了理论支撑。然而，图灵机的计算能力受限于其固定的
【Python】已解决：Python读取字典查询键报错“KeyError: ‘d‘” 屿小夏 python 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
GRU是门控循环单元是什么？无限进步呀万能科普 gru 深度学习人工智能机器学习数据挖掘学习方法
GRU是门控循环单元（GatedRecurrentUnit）的简称，它是循环神经网络（RNN）的一种变体。GRU旨在解决传统RNN中存在的长期依赖问题和反向传播中的梯度消失或梯度爆炸问题。与另一种流行的RNN变体LSTM（长短期记忆网络）相比，GRU具有更简单的结构，但同样能够有效地捕捉序列数据中的长期依赖关系。GRU的主要特点包括：门控机制：GRU通过引入门控机制来控制信息的流动。具体来说，它包
DeepSeek 微调变得简单：使用 Python 创建自定义 AI 模型学习针对所有用例微调 DeepSeek R1 模型知识大胖 NVIDIA GPU和大语言模型开发教程 python 人工智能学习
简介当每个人都竞相在ChatGPT上构建应用程序时，精明的开发人员正在悄悄发现DeepSeek-R1的微调功能，这是一颗隐藏的宝石，可以将通用人工智能转变为专业的数字专家。通过本文，您将了解如何将通用的DeepSeekR1模型转变为专门的、特定领域的LLM。推荐文章《使用DeepseekZeroCodingExperience创建类似飞扬的小鸟游戏》权重1，DeepSeek《如何在本地电脑上安装和
AI Native概念解析：人工智能的原生创新勤劳兔码农人工智能百度
AINative概念解析：人工智能的原生创新目录引言AINative概念的提出背景定义AINative的特点数据驱动自主学习实时决策可解释性AINative的应用领域医疗健康智能制造金融服务智慧城市教育科技AINative的技术架构数据层算法层应用层AINative的挑战与机遇技术挑战伦理和法律问题商业机遇AINative的未来发展趋势预测研究方向总结参考文献1.引言人工智能（AI）技术正在快速发
揭秘DeepSeek R1大模型：它如何像人类一样“思考”？大模型扬叔学习自然语言处理 prompt 人工智能 hugging face怎么用
在人工智能领域，大模型正在掀起一场认知革命。从聊天对话到代码生成，从数据分析到创意写作，大模型的能力边界不断被突破。而近期备受关注的DeepSeekR1，凭借更高效的推理能力和更低能耗，成为行业焦点。今天，我们将深入它的“大脑”，看看它是如何工作的！DeepSeek官网：https://www.deepseek.com1.DeepSeekR1的“大脑结构”：Transformer进化版所有大模型的
人工智能：技术革新与未来展望哎你看人工智能
人工智能（ArtificialIntelligence，简称AI）作为当今世界最具变革性的技术之一，正以迅猛的速度改变着各行各业以及我们的日常生活。从智能语音助手、推荐算法到自动驾驶、医疗诊断，AI的身影无处不在。本文将探讨人工智能的发展历程、核心技术、应用领域以及未来的发展趋势和挑战。一、人工智能的发展历程1.初期探索阶段（20世纪40年代-70年代）1943年：沃伦·麦卡洛克和约翰·皮茨提出了
DeepSeek R1重塑行业标准：BIM智能审查效率提升300%的实战解密 Coderabo DeepSeek R1模型企业级应用人工智能
DeepSeekR1驱动的BIM模型智能审查技术深度解析与实践指南第一章BIM智能审查技术概述建筑信息模型（BIM）的智能化审查是建筑行业数字化转型的核心环节。传统人工审查方式存在效率低、标准不统一、易遗漏等问题，DeepSeekR1框架支持的智能审查系统通过以下技术突破实现革新：多源异构数据融合：支持IFC/RVT/DWG等格式的自动转换语义特征解析引擎：基于深度学习的构件特征识别准确率达98.
DeepSeek R1赋能智能建造：施工安全风险预判系统全栈开发实战与创新解析 Coderabo DeepSeek R1模型企业级应用安全
基于DeepSeekR1的智能施工安全风险预判系统构建与实战一、施工安全风险预判技术概述在建筑工程领域，安全风险预判是保障施工人员和财产安全的关键环节。传统的人工巡检方式存在效率低、覆盖面窄、响应滞后等问题。DeepSeekR1智能分析系统通过融合计算机视觉、物联网传感技术和深度学习算法，构建了多维度的风险预警体系。本系统具备以下核心功能：实时视频监控分析（安全装备检测、危险区域入侵识别）设备状态
什么叫DeepSeek-V3,以及与GPT-4o的区别 AI_1988 chatgpt ai 人工智能
1.DeepSeek的故事1.1DeepSeek是什么？DeepSeek是一家专注于人工智能技术研发的公司，致力于打造高性能、低成本的AI模型。它的目标是让AI技术更加普惠，让更多人能够用上强大的AI工具。1.2DeepSeek-V3的问世DeepSeek-V3是DeepSeek公司推出的最新AI模型，基于DeepSeek-V2.5发展而来。它在性能、速度和成本上均有显著提升，标志着国产AI模型在
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方