小红书技术REDtech

小红书论文刷新 SOTA：人体动作预测再升级，能精准到指尖

想象一下，你在玩一款 VR 游戏，准备伸手拿起一个虚拟杯子喝水。‍‌‌‎‎

在传统的交互系统中，这通常需要你按下控制器上的特定按钮。但如果游戏集成了 EAI 框架，这一过程将变得无比自然。当你的手缓缓接近虚拟杯子时，系统会敏锐地预测出你的未来手部动作，无需任何操作，游戏中的“你”便会流畅地模拟出精细的手部抓取动作，游戏引擎也会提前对你的动作行为做出响应。

这种无缝的交互体验，将会提升游戏中人-人、人- NPC 交互的实时性和准确性，极大地提升游戏沉浸感。

‍‌‌‎

什么是 EAI 框架？全称是编码-对齐-交互（Encoding-Alignment-Interaction）框架，由小红书创作发布团队在 AAAI 2024 上创新提出。该框架用于预测未来全身人体动作，尤其擅长手部细微动作的预测。‍‌‌‎‎

EAI 框架的应用远不止于此。它能够理解并预测用户的动作意图，无论是在艺术表演中同步舞者的动作，创造出与音乐和视觉效果和谐融合的动态艺术，还是在智能家居中自动响应你的需求，或是在医疗康复领域指导患者正确执行运动，避免潜在伤害。它甚至能够预测潜在的安全威胁，如在拥挤场所避免踩踏事件。

实验结果表明：EAI 框架在多个大规模基准数据集上取得了最先进的预测性能（SOTA）。它有效地处理了身体和手部动作之间的异质性和交互性，实现了全身动作预测的高质量输出。这一突破性的技术，预示着未来在人机交互、虚拟现实以及更广泛的智能系统中，将有无限的可能性等待着被探索。

‍‌‌‎‎

人体动作预测（Human Motion Forecasting）‍‌‌‎‎，即预估未来一段时间内的人类行为，正成为连接人类行为与智能系统的关键桥梁。在人机交互（HRI）、虚拟现实（VR）和游戏动画（GA）等领域，这一任务至关重要。然而，现有研究通常集中在预测人体主要关节的运动，却忽略了手部精细动作，而这些动作在沟通和交互中至关重要。

在人机交互场景中，机器人需要准确预测人类未来动作以实现有效协作，但现有模型未能充分捕捉手部精细动作，这直接影响了对人类意图和行为的理解。此外，人体各部分间的协作和交付，如喝水、鼓掌等复杂交互模式，也未被现有预测模型充分捕捉，这限制了预测的准确性和表达性。

‍‌‌‎‎

为解决上述挑战，我们首先提出了一种全新范式：全身人体动作预测任务，即同时预测身体和手部所有关节的未来活动。通过这种联合预测，可以更准确地捕捉人类行为的全貌，从而在人机交互等应用中提供更自然的交互体验。这种全身运动预测不仅包括身体的主要动作，还细致地考虑了手部的精细运动，以理解人类行为的意图和情感表达。

进一步地，为实现面向全身人体关节的细粒度动作预测的目标，‍‌‌‎‎我们重点提出了编码-对齐-交互（Encoding-Alignment-Interaction，EAI）框架‍‌‌‎‎。EAI 框架主要包括以下两个核心组成部分：

跨上下文对齐（cross-context-alignment，XCA）：用于对齐不同人体组件的潜在特征，消除异质性‍‌‌‎‎
跨上下文交互（cross-context-interaction，XCI）：专注于捕捉人体组件间的上下文交互，提高动作预测的准确性‍‌‌‎‎

通过在新引入的大型数据集上的广泛实验，EAI 框架在 3D 全身人体动作预测方面取得了最先进的性能，证明了其在捕捉人类动作细微差别方面的有效性。这些实验结果不仅展示了 EAI 框架在预测复杂人类动作方面的优越性，还为未来的人机交互和虚拟现实等领域的应用提供了新的视角和可能性。

‍‌‌‎

EAI 算法流程图‍‌‌‎‎

如图所示，EAI 框架主要涉及以下三个核心步骤：

‍‌‌‎‎Encoding ‍‌‌‎‎：通过离散余弦变换（DCT）和动态图卷积神经网络（GCNs）提取运动序列的时空相关性，并将其编码为高维隐藏特征；‍‌‌‎‎
Alignment‍‌‌‎‎：通过提出的跨上下文对齐（XCA）来调整不同身体部分的潜在特征，使其更加一致；‍‌‌‎‎
Interaction‍‌‌‎‎：利用提出的跨上下文交互（XCI）来捕捉身体各部分之间的语义和物理互动。‍‌‌‎‎

这种方法通过联合预测身体和手部动作，能够提高预测运动的准确性和表达性，特别是在捕捉不同人体部分动作的细微差别方面具有较强的性能。

‍‌‌‎‎2.1内部上下文编码（Intra-context Encoding）‍‌‌‎‎

a. ‍‌‌‎‎DCT 编码‍‌‌‎‎：在时间域，使用离散余弦变换（Discrete Cosine Transform，DCT）来捕捉动作序列的时序平滑性，将观察到的动作序列转换到轨迹空间:

b.‍‌‌‎‎ GCN 表示学习‍‌‌‎‎：在空间域，利用图卷积网络（Graph Convolutional Networks，GCNs）将骨骼表示为一个全连接图，通过邻接矩阵来捕捉空间关系：

‍‌‌‎‎

‍‌‌‎‎2.2 跨上下文对齐（Cross-context Alignment）‍‌‌‎‎

跨上下文对齐（Cross-context Alignment，XCA）目的是对齐不同身体部分（如身体、左手和右手）的潜在特征，以消除它们之间的异质性，从而方便后续的跨上下文特征交互。该模块通过以下步骤实现特征对齐：

‍‌‌‎‎a. 特征中立化‍‌‌‎‎：引入可学习的因子来中和不同特征分布之间的差异，通过最小化最大均值差异（Maximum Mean Discrepancy，MMD）来调整特征分布，使其更加接近一致：

‍‌‌‎‎

b. 环形中立化‍‌‌‎‎：为了进一步实现 part-to-part 的对齐，我们将中立化扩展到环形版本，通过身体到手腕的链路来实现身体和手部之间的对齐，确保每个部分的特征对齐都会考虑到其他两个部分的特征属性。

‍‌‌‎‎

c. 不一致性约束‍‌‌‎‎：接着，我们应用差异约束来减少部分到部分的差异，通过计算特征的平均值和方差，然后应用中立化和差异约束来调整特征，使其分布更加一致。

‍‌‌‎‎

通过 XCA，EAI 框架能够有效地处理身体各部分之间的异质性，为后续的 XCI 提供了更加一致和协调的特征表示，从而有助于提高全身动作预测的准确性和表达性。

‍‌‌‎‎2.3 跨上下文交互（Cross-context Interaction）‍‌‌‎‎

跨上下文交互（Cross-context Interaction，XCI）是 EAI 框架中的另一个核心模块，它专注于捕捉全身不同部分之间的交互性，包括语义和物理层面的互动。这个模块通过以下步骤实现交互：

a. ‍‌‌‎‎语义交互‍‌‌‎‎：通过交叉注意力机制，模型学习不同身体部分之间的语义依赖性。例如，对于吃饭这个动作，手指和头部关节之间存在强相关性。XCI 通过计算注意力图来融合这些语义交互信息。

‍‌‌‎‎

b.‍‌‌‎‎ 物理交互‍‌‌‎‎：作为身体和手部之间的桥梁，手腕提供了直接的链式相关性。XCI 采用“分割和融合”策略，首先独立地复制手腕关节以包含它，然后进行动态特征融合，以更好地模拟身体部分之间的物理连接。

‍‌‌‎‎

通过最小化分布差异误差，XCI 将不同身体部分的特征融合在一起，生成表达性特征。这些特征随后用于预测器，以回归到预测的序列。通过 XCI，EAI 框架能够捕捉到全身动作中微妙的交互细节，这对于理解和预测复杂的人类行为至关重要。这种交互性的理解有助于提高预测的准确性，特别是在涉及精细手部动作的场景中。

‍‌‌‎‎2.4 损失函数（Training Loss）‍‌‌‎‎

损失函数（Training Loss）主要包含四个部分：关节损失、物理损失、骨头长度损失和对齐损失，具体如下：

‍‌‌‎‎

最终损失是所有损失函数的加权和，综合了预测损失、物理损失和对齐损失。通过调整权重参数（λ1、λ2、λ3）来平衡这些损失，以确保模型在训练过程中能够同时优化预测准确性和特征的一致性。

‍‌‌‎‎

3.1 实验设置‍‌‌‎‎

‍‌‌‎‎评估指标‍‌‌‎‎：为了评估模型的性能，我们使用了平均每个关节位置误差 MPJPE、手腕对齐后的 MPJPE-AW。MPJPE 用于衡量预测的 3D 坐标的准确性，而MPJPE-AW 则用于评估手部动作的精细预测，通过将手势与手腕对齐来减少手腕运动对预测的影响。

‍‌‌‎‎实验设置‍‌‌‎‎：我们采用了两种训练策略来评估不同方法的性能：

（1）分隔（D）训练策略，分别针对每个人体组件的训练基线方法，这种独立策略缺乏组件之间的交互，可以用来说明 XCI 的有效性。

‍‌‌‎‎

‍‌‌‎‎3.2 指标对比结果‍‌‌‎‎

我们首先统计了 GRAB 数据集上的平均预测性能（表 1），针对每种动作类型统计了预测性能（表 2）。我们分别展示了使用分割策略（标注为 D）和联合策略（标注为 U）的预测结果。另外，每个表格中分别展示了身体关节的预测结果（major body）、左手关节的预测结果（left hand）、右手关节的预测结果（right hand），以及使用腕关节对齐后的左手对齐误差（left hand AW）、右手对齐误差（right hand AW），以及全身所有关节的预测结果（whole body）。

‍‌‌‎

表1：GRAB 数据集上采用分隔（D）和联合（U）训练的平均预测结果‍‌‌‎‎

表2：采用统一训练策略，GRAB 数据集上每一个动作类别下的预测结果‍‌‌‎‎

3.3 可视化对比结果‍‌‌‎‎

可视化对比结果部分提供了一种直观的方式来评估和理解模型在预测全身动作方面的性能。通过展示「play」动作的全身骨骼形式，我们可以分析模型的预测性能。这些可视化结果可以帮助我们直观地理解模型在预测精细动作和粗略动作方面的表现。可以清晰地看出，提出的 EAI 方法不仅在预测躯干姿态方面取得了最优的性能，而且对于细粒度的手部动作具有更好的预测结果。

‍‌‌‎‎

「play」动作下的全身关节预测结果对比‍‌‌‎‎

3.4 消融实验‍‌‌‎‎

消融实验（Ablation Study）旨在评估 EAI 框架中不同组件对最终性能的贡献程度。这些实验通过单独移除或修改框架中的某些部分来观察模型性能的变化。具体来说，消融实验包括以下几个方面：

‍‌‌‎‎移除 XCA 和 XCI ‍‌‌‎‎：首先，实验移除了跨上下文对齐（XCA）和跨上下文交互（XCI）模块，以观察这些核心组件对模型性能的影响。通过比较移除这些组件前后的平均预测误差，可以评估它们在提高预测准确性方面的重要性。‍‌‌‎‎
移除 XCA 的子模块‍‌‌‎‎：进一步地，实验移除了 XCA 中的交叉中性化（CN）和差异约束（DC）子模块，以单独评估这些技术在对齐不同身体部分特征分布中的作用。‍‌‌‎‎
移除 XCI 的子模块‍‌‌‎‎：类似地，实验移除了 XCI 中的语义交互（SI）和物理交互（PI）子模块，以分析这些交互在捕捉身体部分之间相互作用中的效果。‍‌‌‎‎
‍‌‌‎‎全模型与消融模型比较‍‌‌‎‎：通过比较包含所有组件的全模型与经过消融的模型，可以直观地看到每个组件对整体性能的具体贡献。‍‌‌‎‎

移除不同组件时对于算法性能影响的分析‍‌‌‎‎

在本研究中，小红书创作发布团队提出了一种创新的全身人体动作预测框架——编码-对齐-交互（EAI），该框架旨在同时预测身体主要关节和手部的精细动作。我们通过引入跨上下文对齐（XCA）和跨上下文交互（XCI）机制，有效地处理了全身动作预测中的异质性和交互性问题。在新引入的 GRAB 数据集上的广泛实验表明，EAI 框架在 3D 全身人体动作预测方面取得了最先进的性能（SOTA），显著提升了预测的准确性和表达性。

我们的工作不仅在理论上提出了新的预测框架，而且在实际应用中也展示了其潜力，尤其是在需要精细手部动作预测的场景中。这些技术能够支撑小红书媒体技术中面向细粒度人体动作生成、分析、建模的需求。不过这项工作仍有待进一步探索，例如，如何将与物体的交互纳入模型，以提供更准确的运动预测。随着未来研究的深入，我们期待 EAI 框架将为人体运动预测领域带来更多的创新和突破。

‍‌‌‎‎论文地址‍‌‌‎‎：‍‌‌‎‎https://arxiv.org/pdf/2312.11972.pdf‍‌‌‎‎

代码地址‍‌‌‎‎：‍‌‌‎‎https://github.com/Dingpx/EAI‍‌‌‎‎

‍‌‌‎‎

@丁鹏翔（实习） ‍‌‌‎‎

硕士毕业于北京邮电大学，目前为西湖大学博士生，该工作完成于在小红书实习期间。发表多篇期刊和会议论文，主要研究方向为人体动作分析，3D 计算机视觉。

‍‌‌‎‎@崔琼杰（实习） ‍‌‌‎‎

博士毕业于南京理工大学，该工作完成于在小红书实习期间。在 CVPR、ICCV、ECCV、IJCAI、AAAI 等国际会议上发表多篇论文，担任多个国际顶级计算机视觉，人工智能会议的审稿人。目前主要研究方向为人体运动分析与合成。

‍‌‌‎‎@炎真(王浩帆) ‍‌‌‎‎

小红书创作发布组- AIGC 方向算法工程师，硕士毕业于卡内基梅隆大学，在 CVPR、ICCV、NeurIPS、3DV、AAAI、TPAMI 等国际会议和学术期刊上发表多篇论文。目前主要研究方向为图像、视频、3D 生成。

创作发布团队-算法实习生（AIGC方向）

岗位职责：

1. 负责 AIGC 生成业务在小红书平台的落地和上线。

2. 负责调研前沿技术，参与创新性算法的研究以及开发工作；如有较好成果，可支持论文发表。

任职资格：

1. 熟悉目前 AIGC 常用技术链并有实际项目或论文经验，如 LoRA、ControlNet 的训练，了解近期图像、视频生成领域的最新进展。

2. 具有良好的沟通、编程、合作能力。在知名赛事有获奖名次或在顶级会议上已发表过至少一篇论文的优先。

3. 现场入职，北京、上海均可，实习至少三个月以上；如有科研意向，至少半年以上。

欢迎感兴趣的同学发送简历至[email protected]，并抄送至[email protected]。

众多主播都在用的超有趣桌面小宠物！开开心心_Every 宠物 virtualenv eclipse python django pygame java
BongocatMver是一款主播直播必备萌系插件，是一款开源软件。软件由国外一个高中生kuroni开发出来，让手鼓猫中的手臂可以跟随鼠标，按键的操作而发生动作。萌系的猫咪造型以及键盘映射的交互动画，十分适合游戏主播、绘画主播、音游主播在直播时使用的虚拟造型插件，可以给你的直播间或视频带来无限的元气。软件采用Live2d模型来实现自定义形状，用户可以根据自己的设定来更换不同形状的猫。精准的面部捕捉
人民日报报道，华为云赋能智能制造助力图扑软件构造数字孪生场景智慧园区华为人工智能物联网
2021年12月22日，《人民日报》头版头条刊登了《华为云赋能智能制造，助力图扑软件构造数字孪生场景》一文，聚焦数据可视化建设发展。报道指出，数字经济发展的背后，是大数据时趋势下各地区积极贯彻国家数字经济发展战略的时代精神;高效便捷管控的背后，是云端平台各大企业的互助共赢;高质精准2D、3D数据可视图的背后，是专注于数据可视化Web组态开发的厦门图扑软件科技有限公司。并对厦门图扑软件科技有限公司进
【Matlab光伏功率预测】基于RF随机森林算法的多变量光伏功率预测（附MATLAB代码）天天科研工作室光伏功率预测算法 matlab 随机森林机器学习
【Matlab光伏功率预测】基于RF随机森林算法的多变量光伏功率预测（附MATLAB代码）文章目录【Matlab光伏功率预测】基于RF随机森林算法的多变量光伏功率预测（附MATLAB代码）文章介绍基本步骤代码分享运行结果参考资料文章介绍随机森林可以应用于光伏功率预测，这是一项重要的任务，旨在估计光伏发电系统的输出功率。光伏功率预测在可再生能源管理、电网调度和能源计划等领域具有广泛的应用。随机森林回
使用Python构建去中心化预测市场：从概念到实现 Echo_Wish Python！实战！python 去中心化开发语言
使用Python构建去中心化预测市场：从概念到实现大家好，我是Echo_Wish。今天，我们将深入探讨一个前沿的区块链应用——去中心化预测市场，并学习如何使用Python来构建一个简易的预测市场平台。预测市场是基于市场参与者对未来事件的预测来产生结果的地方，通常被用来预测政治事件、金融市场走向、体育比赛结果等。传统的预测市场如Augur、Polymarket等，基于去中心化平台，利用区块链技术确保
Stability AI 发布 Stable Virtual Camera：从 2D 图像生成 3D 视频三花AI 三花AI 人工智能 3d 音视频
StabilityAI发布StableVirtualCamera：从2D图像生成3D视频StableVirtualCamera[4]是由StabilityAI最新发布的一款能够从一张或多张2D图像（最多支持32张）生成具有真实深度和透视感的3D视频的技术。用户可以自由定义相机轨迹，或者选择预设的动态相机路径，例如360°旋转、螺旋、变焦（DollyZoom）等，效果极其丝滑。不过，当输入图像包含人
stability ai推出的 AI模型2D图像转3D视频微丽宝 AI工具人工智能 3d 音视频
StableVirtualCamera是StabilityAl推出的A|模型，能将2D图像转换为具有真实深度和透视感的3D视频。用户可以通过指定相机轨迹和多种动态路径(如螺旋、推拉变焦、平移等)来生成视频。模型支持从1到32张输入图像生成不同宽高比(如1:1、9:16、16:9)的视频，最长可达1000帧。无需复杂的重建或优化，可生成高质量的3D视频，同时保持3D一致性和时间平滑性。StableV
unity3D获取游戏物体的四种方式 qq_35430208 unity3d 游戏 uinity3d 图形渲染 3d渲染游戏引擎 unity3D获取游戏物体
一、第一种：二、第二种：voidStart(){print(transform.Find("GameObject(1)/GameObject"));print(transform.Find("GameObject(2)"));}三、第三种：比较耗性能，不推荐使用voidStart(){GameObjectmainCameraGo=GameObject.Find("MainCamera");//查找
论文阅读笔记——MAGICDRIVE: STREET VIEW GENERATION WITH DIVERSE 3D GEOMETRY CONTROL 寻丶幽风论文阅读笔记论文阅读笔记 3d 人工智能自动驾驶
MagicDrive论文MagicDrive通过对3D数据和文本数据的多模态条件融合和隐式视角转换，实现了高质量、多视角一致的3D场景生成。几何条件编码Cross-attention：针对顺序数据，适合处理文本标记和边界框等可变长度输入。Additiveencoderbranch：对于地图等网络状规则数据，能够有效保留空间结构。对于文本按照模版构建：“Adrivingsceneat{locatio
AIOps：解决企业IT挑战的智能利器雅菲奥朗认证培训 AIOps SRE 可观测性
前言：在当今数字化的时代，企业IT基础设施和应用程序规模不断扩大，面临着日益复杂的挑战。在这种情况下，AIOps人工智能运维成为解决企业IT运维困境的智能利器。AIOps与可观测性密切相关，可观测性是实现AIOps的基础。通过收集、监视和理解系统数据，AIOps能够自动化运维任务、实时监控系统状态、预测潜在问题，从而提高效率和稳定性。AIOps尤其适用于IT运维部门，这是一个迫切需要此类技术的群体
回归模型评价指标——衡量预测能力 Tang–t 回归数据挖掘人工智能机器学习 python
目录一、指标说明1.均方误差（MeanSquaredError，MSE）2.均方根误差（RootMeanSquaredError，RMSE）3.平均绝对误差（MeanAbsoluteError，MAE）4.决定系数（CoefficientofDetermination，R²）5.解释方差（ExplainedVariance，EV）6.最大误差（MaximumError）二、代码一、指标说明回归模型
回归任务中的评价指标MAE，MSE，RMSE，R-Squared 旺旺棒棒冰统计学习方法机器学习回归评价指标 r2 mse
转自博客。仅供自己学习使用，如有侵权，请联系删除分类任务的评价指标有准确率，P值，R值，F1值，而回归任务的评价指标就是MSE，RMSE，MAE、R-SquaredMSE均方误差MSE是真实值与预测值的差值的平方和然后求平均。通过平方的形式便于求导，所以常被用作线性回归的损失函数。MSE=1m∑i=1m(yi−y^i)2MSE=\frac{1}{m}\sum_{i=1}^{m}\left(y_{i
转 C# .NET4.0 混合模式程序集异常 weixin_30516243
1.引用Microsoft.DirectX.dll和Microsoft.DirectX.Directsound.dll这2个文件。2.项目属性里边，把目标平台改成X86。3.App.Config修改下：123456在.NET4.0下使用Dirext3D托管库，出现“混合模式程序集是针对“v1.1.4322”版的运行时生成的，在没有配置其他信息的情况下，无法在4.0运行时中加载该程序集。”异常信息，
先验地图--slam学习笔记超级璐璐人工智能机器学习
先验信息(PriorInformation)先验信息指的是在收集新数据之前已有的知识或假设。这种信息可以来自之前的实验、历史数据、理论模型或专家意见。地图信息：在无人驾驶中，车辆通常会预先加载高精度地图数据，这些地图数据提供了道路布局、车道线位置、交叉口结构等信息。这些信息就是先验信息。车辆动力学模型：车辆的动力学模型，包括车辆的物理特性（如质量、轮胎摩擦系数等），这些模型可以帮助预测车辆的行为。
【机器学习】机器学习工程实战-第3章数据收集和准备腊肉芥末果机器学习工程实战机器学习人工智能
上一章：第2章项目开始前文章目录3.1关于数据的问题3.1.1数据是否可获得3.1.2数据是否相当大3.1.3数据是否可用3.1.4数据是否可理解3.1.5数据是否可靠3.2数据的常见问题3.2.1高成本3.2.2质量差3.2.3噪声（noise）3.2.4偏差（bias）3.2.5预测能力低（lowpredictivepower）3.2.6过时的样本3.2.7离群值3.2.8数据泄露/目标泄漏3
HTML+CSS案例展示(CSS3D效果旋转相册) hacalili html css 前端 css3
参考来源：黑马程序员pink老师前端入门教程，零基础必看的h5(html5)+css3+移动端前端视频教程_哔哩哔哩_bilibili效果展示：总结：transform：translate(x,y)rotate(180deg)scale()...顺序对最后的效果有影响，需要根据需求安排位移和其他属性的顺序；实现暂停动画效果：animation-play-state:paused;经常和鼠标经过等其
html5 相册翻转效果,HTML5 css3：3D旋转木马效果相册岑依惜 html5 相册翻转效果
这篇博客的目的是因为上篇HTML5CSS3专题诱人的实例CSS3打造百度贴吧的3D翻牌效果中有个关于CSS3D效果的比较重要的知识点没讲到，就是perspective和tranlateY效果图：嘿嘿，我把大学毕业时的一些照片，做成旋转木马，绕着我大文理旋转，不忘母校的培育之恩~1、perspectiveperspective属性包括两个属性：none和具有单位的长度值。其中perspective属
HTML5+CSS实现图片3D旋转效果，附音乐宁醉小白 html5 前端 html
利用程序呈现图片，可以俘获一众女生的心，增加音乐可以实现图片变化的同时也带上了想要得到效果，如此一程序实乃众人之喜。先看看程序呈现的效果，还是特别吸引人的。先在网上爬取想要呈现的美女照片，存放在文件夹img-one，与程序路径一致。图片像素需进行调整，同一面图片可以使用同一个图片，保持图片像素一致的同时也增加了立体感。第二张02.jpg和2.jpg可以倒着放，这样在程序实现的时候，可以和其他方向的
集成学习（随机森林） herry57 数学建模大数据随机森林集成学习
目录一、集成学习概念二、Bagging集成原理三、随机森林四、例子（商品分类）一、集成学习概念集成学习通过建⽴⼏个模型来解决单⼀预测问题。它的⼯作原理是⽣成多个分类器/模型，各⾃独⽴地学习和作出预测。这些预测最后结合成组合预测，因此优于任何⼀个单分类的做出预测。只要单分类器的表现不太差，集成学习的结果总是要好于单分类器的二、Bagging集成原理分类圆形和长方形三、随机森林在机器学习中，随机森林是
HTML实现酷炫3D相册算法与编程之美编程之美 css html js css3 javascript
欢迎点击「算法与编程之美」↑关注我们！本文首发于微信公众号："算法与编程之美"，欢迎关注，及时了解更多此系列文章。欢迎加入团队圈子！与作者面对面！直接点击！目录1、创建文件目录2、调背景色3、制作3D相册4、将图片散开，围成一圈。5、绘制透明底盘6、最终效果1、创建文件目录在Hbuilder在新建一个目录，创建css和js文件。图12、调背景色在style块里面给整个页面渲染成黑色调。*{padd
【Html+CSS】3D旋转相册小木荣 web前端 css html 3d
3D旋转木马相册&3D盒子相册因为代码大部分相同，就放一起了注释一下就是另一个相册3D旋转木马相册body{background-color:#000;/*视距，使子元素获得视距效果*/perspective:900px;}section{margin:20vhauto;position:relative;width:200px;height:200px;/*开启3D空间*/transform-s
机器学习怎么做特征工程全栈你个大西瓜人工智能机器学习人工智能特征工程数据预处理特征变换特征降维特征构造
一、特征工程通俗解释特征工程就像厨师做菜前的食材处理：原始数据是“生肉和蔬菜”，特征工程是“切块、腌制、调料搭配”，目的是让机器学习模型（食客）更容易消化吸收，做出更好预测（品尝美味）。二、为什么要做特征工程？数据质量差：原始数据常有缺失、噪声、不一致问题（如年龄列混入“未知”）。模型限制：算法无法直接理解原始数据（如文本、日期需要数值化）。提升效果：好特征能显著提升模型性能（准确率提升10%~5
ARPG 游戏战斗系统设计详解小宝哥Code Unity引擎游戏
ARPG游戏战斗系统设计详解ARPG（ActionRole-PlayingGame，动作角色扮演游戏）的战斗系统需要兼顾操作性、打击感、技能组合、AI交互等多个方面。本指南将详细解析ARPG战斗系统的核心要素、设计思路与优化方案，适用于Unity、UE4及自研引擎开发。1.ARPG战斗系统的核心要素1.1战斗核心机制即时战斗（Real-TimeCombat）：无回合制，玩家实时控制角色进行攻击、闪
模型优化驱动产业应用创新智能计算研究中心其他
内容概要当前模型优化技术的迭代正沿着多维路径快速演进，其核心驱动力在于突破算法性能与产业需求间的适配瓶颈。以自适应学习机制与迁移学习框架为基础的优化策略，显著提升了模型在跨场景应用中的泛化能力，而超参数自动调优技术则通过PyTorch、TensorFlow等主流框架的接口标准化，降低了复杂模型的开发门槛。在部署层面，边缘计算与联邦学习的协同应用不仅缩短了金融预测、医疗影像分析等场景的响应延迟，更通
关于pytorch3d的安装诚威_lol_中大努力中人工智能 pytorch 人工智能 python
更新1：2025_2_04今天发现，原来的pytorch3d不见了，在我的aaa1环境中。重新安装，我发现最好用的还是去github下载最新的pytorch3d的zip，unzip之后，进去pipinstall-e.然后安装成功！1、参考文章1：windows安装PyTorch3D详细指南-哔哩哔哩(bilibili.com)这篇文章巨好2、参考文章2：pytorch3d/INSTALL.mdat
Echarts map3D 禁止鼠标滚轮缩放程序媛小白白 javascript 前端 vue echarts
Echartstype为map3D在使用时发现会存在鼠标滚轮缩放的情况zoomSensitivity属性本质上是是否开启map3D的缩放和平移所以也可以禁止鼠标滚轮缩放的情况zoomSensitivity:false,//是否开启缩放和平移/鼠标滑动缩放禁止禁用这个属性就可以实现map3D禁止鼠标滚轮缩放的需求了
一文读懂Python之random模块（31）跟着杰哥学Python python
random模块是Python的内置标准库，用于生成各类随机数，可以用作生成网站初始登录密码和随机验证码。一、random模块简介random模块可以生成随机数，包括随机整数、浮点数、随机元素等。二、random模块相关概念随机数：是指在一定范围内随机产生的数，每个数被选中的概率相等。随机数最重要的特性是其后产生的数与前面的数毫无关系，即随机性、不可预测性和不可重现性。三、random模块常用方法
echarts map3D区域颜色单独设置浪漫不敌风月 echarts echarts 前端 3d
效果图：实现：用的是map3D，之前试了下geo3d因为版本问题不好控制（地图上字体颜色都没法设置）只需要在series的data中加上你要标色的区域名称和颜色即可。此效果实现的是无图例着色。series:[{type:"map3D",//系列类型name:"map3D",//系列名称map:"yuhang",//地图类型。data:[{name:"鸬鸟镇",itemStyle:{color:"#
【地图 Map3d】——2 花花 Show Python pyecharts—从0到精通信息可视化数据分析 python
解锁数据可视化的魔法钥匙——pyecharts实战指南在这个数据为王的时代，每一次点击、每一次交易、每一份报告背后都隐藏着无尽的故事与洞察。但你是否曾苦恼于如何将这些冰冷的数据转化为直观、吸引人的视觉盛宴？欢迎来到《pyecharts图形绘制大师班》在这里，你将不再受限于单调的表格和图表，而是学会如何运用pyecharts这一强大的Python数据可视化库，将复杂的数据转化为令人惊叹的交互式图形。
Matlab实现SSA-HKELM麻雀算法（SSA）优化混合核极限学习机多变量回归预测的详细项目实例 nantangyuxi MATLAB 算法 matlab 回归人工智能数据挖掘开发语言深度学习
目录Mstlsb实她TTS-HKFLM麻雀算法（TTS）优化混合核极限学习机多变量回归预测她详细项目实例1项目背景介绍...1项目目标她意义...1目标...1意义...2项目挑战及解决方案...2挑战...2解决方案...3项目特点她创新...3创新点...3特点...4项目应用领域...4应用领域...4项目效果预测图程序设计及代码示例...5项目模型架构...6数据预处理...6混合核极限学
C#入门学习记录（五）轻松掌握条件分支与循环语句 FAREWELL00075 c#学习前端
前言编程就像给计算机写一份"烹饪指南"，而条件分支和循环就是这份指南中的关键指令。想象你要教机器人做蛋糕：条件分支："如果没有鸡蛋了，就去超市买"（做决定）循环："重复搅拌面糊100次"（重复动作）本文会用简单易懂的语言和比喻，带你掌握C#中这两个核心概念。新手友好，放心食用！一、条件分支：让程序学会"做选择"1.if-else语句（基础版选择器）if(今天下雨){Console.WriteLin
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio

小红书论文刷新 SOTA：人体动作预测再升级，能精准到指尖

‍​​‌​‌​‎‎2.1内部上下文编码（Intra-context Encoding）‍​​‌​‌​‎‎

‍​​‌​‌​‎‎2.2 跨上下文对齐（Cross-context Alignment）‍​​‌​‌​‎‎

‍​​‌​‌​‎‎2.3 跨上下文交互（Cross-context Interaction）‍​​‌​‌​‎‎

‍​​‌​‌​‎‎2.4 损失函数（Training Loss）‍​​‌​‌​‎‎

3.1 实验设置‍​​‌​‌​‎‎

‍​​‌​‌​‎‎3.2 指标对比结果‍​​‌​‌​‎‎

3.3 可视化对比结果‍​​‌​‌​‎‎

3.4 消融实验‍​​‌​‌​‎‎

你可能感兴趣的:(AAAI,虚拟现实,人机交互,人体动作预测,3D)

‍‌‌‎‎2.1内部上下文编码（Intra-context Encoding）‍‌‌‎‎

‍‌‌‎‎2.2 跨上下文对齐（Cross-context Alignment）‍‌‌‎‎

‍‌‌‎‎2.3 跨上下文交互（Cross-context Interaction）‍‌‌‎‎

‍‌‌‎‎2.4 损失函数（Training Loss）‍‌‌‎‎

3.1 实验设置‍‌‌‎‎

‍‌‌‎‎3.2 指标对比结果‍‌‌‎‎

3.3 可视化对比结果‍‌‌‎‎

3.4 消融实验‍‌‌‎‎