菜鸟本尊

Self-supervised Learning of Motion Capture阅读笔记

备注：

1.作者

Hsiao-Yu Fish Tung，Katerina Fragkiadaki 卡耐基梅隆大学

一、概述

1. abstract

（1）跟直接优化mesh and skeleton 的参数不一样的是，我们通过优化网络的权重来预测一个 monocular RGB video中的3D shape and skeleton 的配置；

（2）模型采用end-to-end framework；

（3）模型训练联合使用 strong supervision from synthetic(合成的) data 和 self supervision from differentiable rendering of skeleton keypoints, dense 3D mesh motion , human-background segmentation;

（4）联合使用supervised learning 和 test-time optimization，监督学习在合适的时间对模型参数进行初始化，确保测试时候 good pose and surface initialization;

（5）优点：self-supervision by BP through differentiable rendering allows(unsupervised) adaptation of model to the test data,and offer much tighter fit than a pretrained fixed model.

2 .应用方向

对于非设定实验场中单视觉的人体以及其运动理解是很重要的，可有以下应用场景：

automated gym, dancing teacher , rehabilitation guidance, patient monitoringand safer human-robot interactions;

对于影视行业的 character motion capture（MOCAP）and retargeting (that still require tedious labor effort of artists to achieve the disired accuracy ,or the use espensive multi-camera setups and green-scerrn backgrounds.)

二、网络架构

1. 主旨描述

（1）提出一个基于monocular video的运动捕捉的网络模型，学习将图片序列映射到相应的3D 网格序列；

（2）使用合成的渲染模型进行strong supervision；以及从3D 到2D的渲染模型并对应于2D监测点的真实单目视频进行 self-supervision；

（3）self-supervision利用 2D body joint detection ，2D figure-ground segmentation， 2D optical flow；除此之外，2D身体关节标注更易获取，以及optical flow 能容易的从合成数据泛化到真实数据；

（4）跟以往的基于motion capture work进行优化的不同点，我们使用 differentiable warping and differentiable camera project for optical flow and segmantation losses ;这些方法的综合运用有利于进行end-to-end with BP的学习；

（5）使用SMPL 作为 dense human 3D mesh model;我们的任务是对渲染过程进行逆向工程操作，并且预测SMPL的参数；

（6）给出了连续两帧的三维网格预测，可微投影网格顶点的三维运动矢量，并将其与估计的二维光流矢量进行匹配；可微运动渲染和匹配需要顶点可见性估计，我们使用光线投射和我们的代码加速神经模型来完成；（如下图）相似的，in each frame，3D keypoint are projected and their distances to corresponding detected 2D keypoints are penalized.Differentiable segmentation matching using Chamfer distances penalizes under and over fitting of the projected vertices against 2D segmentation of the human foreground.Note that thess re-projection errors are only on the shape rather than the texture by design, since our predicted 3D meshes are textureless.

（7）文中成果总结

对比了相应版本的优化策略，网格参数可以直接通过减小 self-supervision loss 进行优化，与supervised model不同的是，测试时不需要使用self-supervision；optimization baseline 很容易陷入 local minima,对初始化也很敏感。与之相反的是，基于supervised pretraining (on synthetic data)的MOCAP model在测试时，采用reasonable pose initialization； self-supervision adaptation取得相比于non-adapted model 的预训练更低的 3D reconstruction error 。最后还特别强调了三个 self-supervision losses.

（8）数据集

Surral and H3.6M dataset.

2. 相关工作

2.1 3D motion capture

（1）现有的工作很多取得了很好的成果，都是基于multiple cameras（four or more）；

(Motion capture using joint skeleton tracking and surface estimation. CVPR 2009)

（2）基于single monocular camera,对于 skeleton-only capture/tracking 还有待研究；

（3）单目运动捕捉中的 ambiguity and occlusion是比较严重的问题，而且多数方法都是基于pose and motion的模型；之前的工作主要是采用 linear motion capture (Robust on-line appearance models for vision tracking; People tracking using hybrid monte carlo fifiltering,ICCV2001)；

non-linear prior 有 Guassian process dynamical model and twin Guassian processes，这些比线性模型表现更好；

（Gaussian process dynamical models for 3d people tracking，CVPR2006;Twin gaussian processes for structured prediction.）

（4） Bogo提出 a static image pose and 3d dense shape prediction model，此模型分为两个步骤：a.先从图片中预测3D human skeleton ；b.用一个parametric 3D shape 去拟合这个prediction skeleton，在此期间skeleton 保持不变。

(Keep it SMPL: automatic estimation of 3d human pose and shape from a single image. ECCV, 2016)

（5）本文工作，用end-to-end differentiable framework 通过 test-time adaptation 对3D skeleton and 3D mesh进行估计。

2.2 3D human pose estimation

（1）之前的工作基于优化或者是 hard-coded anthropomorphic constraints(比如关节是对称的) 来解决 2D-3D 的 ambiguity 问题；

(Reconstructing 3d Human Pose from 2d Image Landmarks,ECCV2012)

（2）使用大量的监督训练集，通过神经网络，直接从RGB 图片中回归3D pose ；

(Coarse-to-fifine volumetric prediction for single-image 3d human pose. 2016)

（3）把2D pose 作为一个 intermediate representation(A.B) 或者是多任务中的一个辅助性(CD)的任务设置；主要原因是有标签的2D 数据集较多，而3D 较少

(A.3d human pose estimation = 2d pose estimation + matching,2016;

B. Single image 3D interpreter network. In ECCV, 2016;

C. Lifting from the deep: Convolutional 3d pose estimation from a single image. , 2017.

D . Perspective transformer nets: Learning single-view 3d object reconstruction without 3d supervision,2016)

（4）本工作中：

Rogez and Schmid 通过合成3D渲染技术获取了大量的RGB 到3D 标注数据，其中一个数据集也在本工作中使用

(Mocap-guided data augmentation for 3d pose estimation in the wild. In NIPS,2016)

2.3 Deep geometry learning

（1）本工作结合 deep learning 和 geometric inferences;

(Adversarial inverse graphics networks: Learning 2d-to-3d lifting and image-to-image translation from unpaired supervision. ICCV, 2017)

（2）differentiable warping(A.B) and backpropable camera projection(C.D)使用去学习3D camera motion(E) and joint 3D camera and 3D object motion(F) in an end-to-end self-supervision fashion ，minimizing a photometric loss.

(A. Spatial transformer networks. In NIPS, 2015; B. Spatio-temporal video autoencoder with differentiable memory. 2015; C . Single image 3D interpreter network. In ECCV, 2016; D.Perspective transformer nets: Learning single-view 3d object reconstruction without 3d supervision.2016; E. Unsupervised learning of depth and ego-motion from video. In arxiv, 2017; F. Learning of structure and motion from video. In arxiv, 2017)

（3）(A)学习一个 monocular depth predictor， supervised by photometric error, given a stereo image pair with knoen baseline as input;

(A. Unsupervised cnn for single view depth estimation:Geometry to the rescue. Springer, 2016;)

（4）此工作使用了很多深度学习知识，以及geometric operation including a backpropable camera projection layer ,跟Yan(A) and Wu(B) 以及G (C)相似。

(A.Perspective transformer nets: Learning single-view 3d object reconstruction without 3d supervision,2016; B.Single image 3D interpreter network. In ECCV, 2016; C. Unsupervised cnn for single view depth estimation: Geometry to the rescue.Springer, 2016)

3. 网络详解

3.1 learning motion capture

1. 网络结构如上图所示：使用SMPL作为3D的参数化模型（SMPL参数化模型中最重要的两个值是 theta 和 beta）

2. paired supervision from synthetic data: 使用synthetic Surreal dataset（包含了人类角色在二维图像背景下进行活动的单眼视频），这些合成数据使用SMPL 进行参数化，使用Human H3.6M dataset。（见文中细节）

3.1.1 self-supervision through differentiable rendering

模型中的自监督是基于3D-TO-2D 渲染，并对2D关键点估计分割和光流进行一致估计；训练和测试时都可以进行自监督，是的我们的模型能够在测试中的权重适合统计量。

1. keypoint re-projection error

一般情况下，给一个静态图片，3D body joint应该与2D keypoint detection能够一致；类似的关键点重构错误在之前的工作已经有所使用；

本文中的模型预测密集的3D 网格；利用3D mesh vertices 和 3D body joints之间的线性关系

为了估计3D 到 2D的投影，我们的模型进一步的预测focal length ，rotation of the camera，并且将三维网格从图像的中心平移，以便于三维网状的根节点能够准确的位于图像的中间；我们不预测Z方向的平移，因为the predicted focal length accounts for scaling of the person figure.

最终的error 是：

2. motion re-projection error

3. segmentation re-projection error

三、实验

1. 数据集处理

Surreal 是最大的人体运动的合成数据集，其包含单目视觉的描述人体日常活动特征的视频判断；GT 3D 网格也是可以使用的。把数据集分为训练和测试视频序列。

Human3.6M 是最大的真实视频数据（包含标注的3D skeletons），包含人体活动以及每一帧中2D 3D 关节位置标注数据，但是没有密集3D ground-truth。

2. 训练

2.1 训练说明

（1）首先，在Surreal 的训练集上，使用有监督的skeleton and surface parameters进行训练；

（2）self-supervision 使用differentiable rendering，在两个数据集上使用re-projection error进行优化；使用2D keypoint and segmentations 作为GT.

注： Surreal上的segmentation mask是非常精确的，而在H3.6M,采用背景相减的方法得到，可能不是很精确；我们的模型也改进了这种不精确的分割

（3）密集运动的2D 光流使用FlowNet2.0 获得，在两个数据集上。

（4）没有使用H3.6M 中的3D GT，这样才能能够说明能够从SURREAL 到 H3.6M 成功的 domain transfer。

（5）在两个数据集上测试3D skeleton，但是仅在SURREAL数据集上测试dense 3D meshes.

2.2 evaluation metrics

1. 对于pre-joint error ， reconstruction error 和surface error的度量方法，可以参见文章第七页

2. 基于两个方面与其他的两个标准模型进行比较：

（1） pretrained: 一个模型是仅仅使用合成数据进行监督训练，没有self-supervision adaptation

（2）direct optimization：

一个模型使用跟文中模型一致的 self-supervision losses，不同的是它优化网络中的权重，直接优化每个body mesh的参数，rotation，translation， and focal length

3. 我们使用梯度下降法进行优化：

在初始化优化方面，使用了不同程度的监督优化策略： random initialization ， ground-truth 3D translation， ground-truth rotation ，ground-truth theta angles( to estimaiton the surface parameters)

2.3 补充说明

网络结构使用 5 convolution blocks，每一个block包含两个卷积层（filter size 5*5， stride2； filter size 3*3，stride1），后接 batch normalization and leakly relu activation.

第一个block包含64 channels，随后的每一个block 使用双倍的channels；

在每一个block的开始，添加3 个全连层，然后最后一层resize成我们想要的输出；

input image size 128*128；梯度下降打进行优化，learning rate = 0.0001， TensorFlow version ==1.1.0

文中还使用 Chamfer distance 和 Ray casting,对网络训练速度和精度进行优化，详细细节看文中第九页。

四、讨论

1. 文章工作

（1）提出一种基于合成数据的密集3D 网格跟踪监督模型；通过网格运动，关键点，分割的可渲染的自监督模型；并且能够与2D 统计量匹配

（2）使用无标签的数据

（3）联合使用supervised learning 和unsupervised adaptation对于3D mesh预测准确率是有帮助的；基于自监督的学习模式联合最好的监督学习和测试优化，监督学习初始化学习参数；

（4）自监督模型通过可微渲染方法能够使得模型具备域适应的能力

（5）希望我们的3D mesh模型能够尽可能地去fit test data，在最少的人为操作情况下提升追踪精确度。

2. 展望

（1）使用iterative additive feedback on the mesk,可以去的更高的3D reconstruction accuracy；允许在参数SMPL 模型上面学习 a residual free form deformation,而不是 in a self-supervised manner.

（ Human pose estimation with iterative error feedback. 2015）

强化学习之 DQN、Double DQN、PPO JNU freshman 强化学习强化学习
文章目录通俗理解DQNDoubleDQNPPO结合公式理解通俗理解DQN一个简单的比喻和分步解释来理解DQN（DeepQ-Network，深度Q网络），就像教小朋友学打游戏一样：先理解基础概念：Q学习（Q-Learning）想象你在教一只小狗玩电子游戏（比如打砖块）。小狗每做一个动作（比如“向左移动”或“发射球”），游戏会给出一个奖励（比如得分增加）或惩罚（比如球掉了）。小狗的目标是通过不断尝试，
使用Python进行机器学习入门指南软考和人工智能学堂 Python开发经验 python 机器学习开发语言
使用Python进行机器学习入门指南机器学习（MachineLearning）是人工智能（ArtificialIntelligence,AI）的一个重要分支，旨在通过算法和统计模型，使计算机系统能够自动从数据中学习和改进。Python作为机器学习领域的主流编程语言，提供了丰富的库和工具来实现各种机器学习任务。本文将介绍如何使用Python进行机器学习，包括基本概念、常用库以及一个实战项目示例。目录
少样本图学习（few-shot learning on graph）知识背景 so.far_away 网络空间安全学习机器学习人工智能
Few-ShotLearningonGraph少样本学习简介少样本图学习简介1.SupportSet和QuerySet（针对单个任务）（1）SupportSet（支持集）（2）QuerySet（查询集）2.BaseData和NovelData（针对整个数据集）（1）BaseData/Classes（基类数据）（2）NovelData/Classes（新类数据）少样本学习简介少样本学习（FSL）旨在
Building Apps with AI Tools: ChatGPT, Semantic Kernel, and Langchain 项目推荐滕娴殉
BuildingAppswithAITools:ChatGPT,SemanticKernel,andLangchain项目推荐building-apps-with-ai-tools-chatgpt-semantic-kernel-langchain-4469616ThisisacoderepositoryfortheLinkedInLearningcourseBuildingAppswithAIT
量子机器学习入门：从理论到实践
量子机器学习入门：从理论基石到实践路径元数据框架标题量子机器学习入门：从理论基石到实践路径——连接量子计算与人工智能的未来桥梁关键词量子计算；机器学习；量子算法；量子神经网络；Qiskit；PennyLane；量子变分算法摘要量子机器学习（QuantumMachineLearning,QML）是量子计算与机器学习的交叉领域，通过量子计算的叠加态、纠缠和并行性解决传统机器学习的计算瓶颈（如高维数据处
量子计算突破：8比特扩散模型实现指数级加速晨曦543210 人工智能
目录一、量子扩散模型（QuantumDiffusion）二、DNA存储生成（Biological-GAN）三、光子计算加速四、神经形态生成五、引力场渲染六、分子级生成七、星际生成网络八、元生成系统极限挑战方向一、量子扩散模型（QuantumDiffusion）量子线路模拟经典扩散过程fromqiskitimportQuantumCircuitfromqiskit_machine_learning.
大模型的“涌现能力“：现象、表现与成因解析北辰alk AI 深度学习人工智能
文章目录一、涌现能力的本质与特征1.1基本定义1.2识别标准二、三种典型涌现能力表现2.1少样本上下文学习（Few-shotIn-contextLearning）表现特征实证数据可能成因2.2思维链推理（Chain-of-ThoughtReasoning）表现特征典型案例可能成因2.3指令跟随（InstructionFollowing）表现特征能力对比可能成因三、涌现能力的理论解释3.1相变理论视
ER综述论文阅读-Emotion recognition in EEG signals using deep learning methods: A review 今天早睡了情绪识别Emotion Recognition 论文阅读深度学习人工智能
EmotionrecognitioninEEGsignalsusingdeeplearningmethods:AreviewQ1期刊，2023论文链接：https://d1wqtxts1xzle7.cloudfront.net/105887899/emotionreview-libre.pdf?1695460941=&response-content-disposition=inline%3B+f
【论文阅读笔记】TimesURL: Self-supervised Contrastive Learning for Universal Time Series 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
TimesURL:Self-supervisedContrastiveLearningforUniversalTimeSeriesRepresentationLearning摘要学习适用于多种下游任务的通用时间序列表示，并指出这在实际应用中具有挑战性但也是有价值的。最近，研究人员尝试借鉴自监督对比学习（SSCL）在计算机视觉（CV）和自然语言处理（NLP）中的成功经验，以解决时间序列表示的问题。
【论文阅读】Transfer Learning for Automatic Modulation Recognition Using a Few Modulated Signal Samples
摘要：这封信提出了一种用于自动调制识别（AMR）的迁移学习模型，该模型仅具有少量调制信号样本。传输模型以音频信号UrbanSound8K作为源域进行训练，然后以一些调制信号样本为目标域进行微调。为了提高分类性能，信噪比（SNR）被用作一个功能来促进信号的分类。仿真结果表明，迁移模型在分类精度方面具有显著优势。这篇文章的核心内容是提出了一种基于迁移学习（TransferLearning）的自动调制识
【论文阅读】Meta-SE: A Meta-Learning Framework for Few-Shot Speech Enhancement Bosenya12 论文阅读
这篇文章介绍了一个名为Meta-SE的元学习框架，专门用于少样本（few-shot）语音增强问题。文章的核心目标是解决在实际应用中，由于训练样本有限而导致传统深度神经网络（DNN）模型性能受限的问题。Meta-SE通过元学习的方法，利用先验的元知识快速适应新的任务和噪声类型，即使只有少量训练样本也能表现出色。背景知识与研究动机语音增强技术旨在从带噪语音信号中恢复目标语音，提升语音质量和可懂度。深度
【论文阅读】SASLN：小样本条件下机械故障诊断的信号增强自学习网络
SASLN:SignalsAugmentedSelf-TaughtLearningNetworksforMechanicalFaultDiagnosisUnderSmallSampleCondition本文介绍了一种名为SASLN（SignalsAugmentedSelf-TaughtLearningNetworks）的方法，专门用于在小样本条件下对风力发电机（WT）的发电机轴承故障进行诊断。该方
【论文阅读】SSCL-AMC：一种基于动态增强和集成学习的自监督自动调制分类方法
SSCL-AMC:ASelf-supervisedAutomaticModulationClassificationMethodviaDynamicAugmentationandEnsembleLearning摘要：与传统的手工自动调制分类（AMC）方法相比，深度学习已经显示出有希望的结果，AMC作为信号检测和调制之间的中间步骤发挥着关键作用。然而，获取大规模标记数据仍然具有挑战性，因为数据质量和
EgoAlpha/prompt-in-context-learning项目解析：Prompt Engineering核心技术指南霍日江Eagle-Eyed
EgoAlpha/prompt-in-context-learning项目解析：PromptEngineering核心技术指南prompt-in-context-learningAwesomeresourcesforin-contextlearningandpromptengineering:MasteryoftheLLMssuchasChatGPT,GPT-3,andFlanT5,withup-
VIT视觉妄想成为master opencv 目标检测机器学习数据挖掘语音识别人工智能计算机视觉
VisionTransformer视觉和语言(Vision-Language)NLPrompt:Noise-LabelPromptLearningforVision-LanguageModelsPaper:https://arxiv.org/abs/2412.01256Code:GitHub-qunovo/NLPromptPhysVLM:EnablingVisualLanguageModelsto
C#实现SVM支持向量机（附完整源码）源代码大师 C#实战教程 c#支持向量机开发语言
C#实现SVM支持向量机下面是使用C#实现支持向量机（SVM）的示例代码：usingSystem;usingAccord.MachineLearning.VectorMachines;usingAccord.MachineLearning.VectorMachines.Learning;usingAccord
MATLAB随机模拟技术在气候模型中的应用
本文还有配套的精品资源，点击获取简介：MATLAB是科学研究和工程领域中广泛使用的一款数学计算与编程软件，尤其在气象学和气候模拟方面有着重要的应用。’Fletcher_2019_Learning_Climate’项目通过MATLAB实现的随机模拟方法帮助理解气候变化。本文将详细探讨该项目的关键内容，包括气候模型的构成、随机过程与统计方法的运用、MATLAB编程技能、气候数据处理与分析、结果可视化以
深度学习基础与应用：从理论到实战创新工场
本文还有配套的精品资源，点击获取简介：深度学习是人工智能的核心分支，通过模拟人脑神经网络处理大量数据以执行复杂任务。Python因其简洁性和强大的库支持成为深度学习研究的首选语言。本文概述了深度学习基础概念、核心算法、Python框架，并假设了一个包含教程、示例代码、数据集、交互式学习环境、性能评估指标和进阶主题的“deep-learning-study-main”压缩包内容，旨在帮助学习者深入理
深度学习之迁移学习路溪非溪人工智能迁移学习机器学习
认识迁移学习迁移学习（TransferLearning）是机器学习中的一种重要技术，其核心思想是将在一个任务上学习到的知识（模型参数、特征表示等），迁移应用到另一个相关但不同的任务中，从而提升新任务的学习效率和性能，尤其是在新任务数据有限的情况下。一、迁移学习的核心动机传统机器学习通常要求为每个新任务收集大量标注数据并从头训练模型，但现实中面临以下挑战：数据稀缺：例如医疗影像分析（罕见疾病样本少）
四六级，雅思必备连接词（持续更新~） dulu~dulu 自用笔记雅思英语雅思雅思词汇总结笔记雅思阅读雅思写作四六级写作
目录（一）观点对立（二）递进（三）因果（四）假设（五）总结（六）举例（七）优缺点承接说明（八）其他简单连接词1.并列关系2.顺序关系3.强调关系4.条件关系5.时间关系6.总结关系（一）观点对立1.Conversely：相反地Someviewtechnologyasadistraction.Conversely,othersseeitasapowerfullearningtool.有人视科技为干扰
用Python实现数据可视化的实用指南庞队千Virginia
用Python实现数据可视化的实用指南practical-python-data-viz-guideResourcesforteaching&learningpracticaldatavisualizationwithpython.项目地址:https://gitcode.com/gh_mirrors/pr/practical-python-data-viz-guide项目介绍在数据驱动的时代，数
【零基础学AI】第33讲：强化学习基础 - 游戏AI智能体 1989 0基础学AI 人工智能游戏 transformer 分类深度学习神经网络
本节课你将学到理解强化学习的基本概念和框架掌握Q-learning算法原理使用Python实现贪吃蛇游戏AI训练能够自主玩游戏的智能体开始之前环境要求Python3.8+PyTorch2.0+Gymnasium(原OpenAIGym)NumPyMatplotlib推荐使用JupyterNotebook进行实验前置知识Python基础编程（第1-8讲）基本数学概念（函数、导数）神经网络基础（第23讲
【AI论文】Skywork-Reward-V2：通过人机协同实现偏好数据整理的规模化扩展
摘要：尽管奖励模型（RewardModels，RMs）在基于人类反馈的强化学习（ReinforcementLearningfromHumanFeedback，RLHF）中发挥着关键作用，但当前最先进的开源奖励模型在大多数现有评估基准上表现欠佳，无法捕捉人类复杂且微妙的偏好谱系。即便采用先进训练技术的方法也未能显著提升性能。我们推测，这种脆弱性主要源于偏好数据集的局限性——这些数据集往往范围狭窄、标
03 数据可视化的世界非常广阔，除了已提到的类型，还有许多更细分或前沿的可视化形式。晨曦543210 信息可视化人工智能
十五、机器学习与数据科学专用图表特征重要性图（FeatureImportancePlot）用途：展示机器学习模型中各特征对预测结果的贡献度。示例：随机森林模型中影响房价预测的关键因素。混淆矩阵热力图（ConfusionMatrixHeatmap）用途：分类模型性能评估，显示预测结果与真实标签的对比。示例：疾病诊断模型的真阳性/假阳性分布。学习曲线（LearningCurve）用途：分析模型训练过程
解密鸿蒙系统的隐私护城河：从权限动态管控到生物数据加密的全链路防护
摘要本文以健康管理应用为例，展示鸿蒙系统如何通过细粒度权限控制、动态权限授予、数据隔离和加密存储四大核心机制，实现复杂场景下的用户隐私保护。我们将通过完整的权限请求流程和敏感数据处理代码，演示鸿蒙系统如何平衡功能需求与隐私安全。场景描述想象一个健康管理应用需要实现以下功能：读取步数传感器数据（ohos.permission.ACTIVITY_MOTION）获取位置信息绘制运动轨迹（ohos.per
Prompt相关论文阅读(02)--Auto-CoT(2024-11-25) zhilanguifang 论文 prompt engineering 论文阅读笔记
论文阅读笔记2024-11-24~2024-11-25Auto-CoT:AutomaticChainofThoughtPromptinginLargeLanguageModels(ICLR2023)碎碎念：复现代码和笔记保存到gitee仓库上海交通大学的学生在亚马逊实习的时候的成果ICLR2023摘要：LLM能够通过生成中间推理步骤执行复杂的推理。提供这些步骤用于提示演示叫做思维链提示CoT。Co
多智能体深度强化学习：一项综述 Multi-agent deep reinforcement learning: a survey 资源存储库笔记
Abstract抽象Theadvancesinreinforcementlearninghaverecordedsublimesuccessinvariousdomains.Althoughthemulti-agentdomainhasbeenovershadowedbyitssingle-agentcounterpartduringthisprogress,multi-agentreinforc
ReAct (Reason and Act) OR 强化学习（Reinforcement Learning, RL） SugarPPig 人工智能人工智能
这个问题触及了现代AI智能体（Agent）构建的两种核心思想。简单来说，ReAct是一种“调用专家”的模式，而强化学习(RL)是一种“从零试错”的模式。为了让你更清晰地理解，我们从一个生动的比喻开始，然后进行详细的对比。一个生动的比喻想象一下你要完成一项复杂的任务，比如“策划一场完美的生日派对”。ReAct的方式（像一位经验丰富的活动策划师）你是一位知识渊博的专家（大语言模型LLM）。你首先会思考
Python机器学习入门必看！从原理到实战，手把手教你线性回归模型小张在编程 python 机器学习线性回归
引言在人工智能浪潮席卷全球的今天，机器学习（MachineLearning）早已不再是实验室的“黑科技”——打开购物APP的“猜你喜欢”、输入搜索词后的“相关推荐”、甚至天气预报中的温度预测，背后都有机器学习模型的身影。而在线性回归（LinearRegression）作为机器学习中最基础、最经典的监督学习模型，堪称机器学习的“敲门砖”。本文将从原理到实战，带你彻底掌握这一核心算法。一、机器学习的“
AI人工智能助力联邦学习通信效率优化的解决方案 AI智能应用人工智能 ai
AI驱动的联邦学习通信效率优化：从理论到实践的全面解决方案元数据框架标题AI驱动的联邦学习通信效率优化：从理论到实践的全面解决方案关键词联邦学习（FederatedLearning）、通信优化（CommunicationEfficiency）、AI赋能（AI-Enabled）、参数压缩（ParameterCompression）、客户端选择（ClientSelection）、联邦蒸馏（Federa
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后