YuhsiHu

【论文精读】HumanNeRF

Abstract
1.Introduction
2.Related work
- Human specific rendering
- Neural radiance fields
- Human-specific neural rendering
- Concurrent work
3.Representing a Human as a Neural Field
- Canonical volume
- Skeletal motion
- Non-rigid motion
- Pose correction
4.Optimizing a HumanNeRF
- 4.1 Volume rendering
- 4.2 Delayed optimization of non-rigid motion field
- 4.3 Loss and ray sampling
5.Results
- 5.1 Evaluation dataset
- 5.2 Optimization details
- 5.3 Evaluation method
- 5.4 Comparisons
- 5.5 Ablation studies
6.Discussion
- Limitations
- Conclusion

今天读的是CVPR 2022 oral的一篇文章，文章由UW和Google合作，旨在使用NeRF基于单目视频渲染合成运动的人体。

项目地址：https://grail.cs.washington.edu/projects/humannerf/

Abstract

引入了一种自由视点渲染方法——HumanNeRF。它适用于人类进行复杂身体运动的单目视频。该方法可以在任何帧暂停视频，并从任意新的摄像机视点甚至是该特定帧和身体姿势的完整 360 度摄像机路径渲染主体。这项任务特别具有挑战性，因为它需要合成身体的细节，从输入视频中可能不存在的各种角度看，以及合成精细的细节，如布料褶皱和脸部细节。我们的方法优化了人在规范 T 姿势中的体积表示，与运动场相一致，该运动场通过向后扭曲将估计的规范表示映射到视频的每一帧。运动场被分解为由深度网络产生的骨骼刚性和非刚性运动。文章展示了性能改进和在随意的场景中移动人类的单目视频的渲染示例。

1.Introduction

给定一个人类运动的视频，我们想要在任何帧暂停并能够360度旋转在任何角度观察这个视频里的表演者。这个问题长期以来都是一个挑战，因为它需要合成一些摄像机完全没有涉及到的角度，并且还需要合成诸如衣服折叠、头发摆动、复杂肢体运动等等细节。
先前的工作可以在拥有小心拍摄的多个视图的情况下合成新视角，但在人类的合成上表现不好，因为人类的动作包含非刚体运动。针对人类的合成会把SMPL模板当作先验条件，这虽然有助于限制运动空间，但也会在服装和复杂运动中引入 SMPL 模型未捕获的伪影。最近，可变形的 NeRF 方法对于小的变形表现良好，但不适用于像跳舞这样的大的全身运动。
我们创造了一种名为 HumanNeRF 的方法，该方法将运动的人的视频作为输入，并在使用现成的估计器提取每帧 3D 姿势后，优化人体的典型体积 T-pose和通过backward warping将估计的规范体积映射到每个视频帧的motion field。运动场结合了骨骼刚性运动和非刚性运动，每一个都以体积表示。标准体积和运动场源自视频本身，并针对大的身体变形进行了优化，端到端训练，包括 3D 姿势细化，无需模板模型。在测试时，我们可以在视频中的任何帧暂停，并根据该帧中的姿势，渲染生成从任何角度来看的体积表示。
我们展示了各种示例的结果：现有的实验室数据集、我们在实验室外捕获的视频以及从 YouTube 下载的内容。我们的方法在数值上优于最先进的方法，并产生显着更高的视觉质量。

2.Related work

自由视点渲染的物理特性涉及对几何和表面属性进行建模，然后从新的相机视图进行渲染。但是，仍然很难重新创建复杂的几何形状和微妙的照明效果。另外，基于图像的渲染提供了基于图像域中给定视图集的新视图，并在过去几十年中进行了大量研究。

Human specific rendering

Kanade 等人的工作是对人类自由视点渲染的最早研究之一。，它引入了一个配备相机的圆顶来恢复深度图和网格，通过重投影和混合不同的视图来渲染新的视图，以解决由于遮挡引起的网格空洞。后来，Matusik 等人从对象的轮廓中重建了一个visual hull，并通过仔细选择没有辅助几何表示的像素来渲染它。 Carranza等人使用参数化的身体模型作为先验并组合无标记运动捕捉和依赖于视图的纹理。紧接着的工作带来了非刚性变形、纹理扭曲以及基于体积或球体的各种表示。Collet等人和Guo等人建立了一个系统和pipeline来生成高质量的视频中的移动人物。这些基本都依赖多个视角的视频和昂贵的采集装置，但我们想用简单的单目相机来达到这个效果。

Neural radiance fields

神经辐射场使得高质量渲染成为可能。文章将会把提出的方法与一些动态和可变形NeRF进行了对比。

Human-specific neural rendering

Lingjie 等人的工作从预先捕获的身体模型开始，学习对时间相关的动态纹理进行建模并强制执行时间连贯性。Martin-Brualla等人训练了一个 UNet 来改善体积捕获引入的artifacts。 Pandey 等人的后续工作通过半参数学习将所需输入帧的数量减少到单个 RGBD 图像。Wu和Peng等人探索了使用嵌入点云（来自 MVS）或 reposed mesh vertices（来自SMPL），并学习了一个随附的基于 UNet 或 NeRF 的神经渲染器。Zhang等人将场景分解为背景和表演者，并用分离的 NeRF 表示它们，从而实现场景编辑。除了自由视点渲染，还有另一个相关的活跃研究领域，专注于 2D或 3D 中的人类移动重定位。我们的方法与那些的主要区别在于，我们将包含复杂人体运动的单目视频作为输入，并可以进行高质量 3D 渲染。

Concurrent work

Xu等人的工作能够同时学习隐式几何以及图像的外观，他们主要关注多视图设置，其中有一些简单的人体运动（A-pose）单目视频示例。 Su等人使用过度参数化的 NeRF 来严格转换 NeRF 特征，以优化身体姿势，从而进行最终渲染。非刚性运动没有显式建模，所以渲染质量不高。 Noguchi等人发现了类似的方法但效果也不够理想。

3.Representing a Human as a Neural Field

我们将一个移动的人物表达为 $F_{c}$ ，转换为观察的姿势下能看到的样子 $F_{o}$ ：

其中 $F_{c}：x->(c,\sigma)$ 表示位置 $x$ 和颜色 $c$ 体积密度 $s i g m a$ ， $T:(x_{0},p)->x_{c}$ 定义了一个motion field，把点从观察空间映射回canonical space，由观察姿态 $p=(J,\Omega)$ 引导，其中 $J$ 包含 $K$ 个标准3D联合位置， $\Omega=\{w_{i}\}$ 是表示为轴角向量的local joint rotations。
我们通过将运动场分解为两部分来处理具有复杂变形的复杂人体运动：

其中 $T_{skel}$ 表示skeleton驱动的变形，基本上就是逆linear-blend skinning， $T_{NR}$ 从骨架驱动的变形开始，并对其产生偏移 $Δ x$ 。实际上， $T_{skel}$ 提供由标准skinning驱动的粗略变形，而 $T_{NR}$ 提供更多非刚性效果，比如由于服装的变形。
对于野外图像，我们使用现成的 3D 身体+相机姿势估计器。由于姿势估计的不准确，我们还求解了一个姿势校正函数 $P_{pose} (p)$ ，它可以更好地解释观察结果，并将这种改进应用于骨架驱动的变形，即，我们将 $T_{skel} (x, p)$ 替换为 $T_{skel}(x, P_{pose} (p))$ 。整体架构如下图所示：

Canonical volume

我们把canonical volume $F_{c}$ 表示为具有MLP的连续场，在给定点 $x$ 的情况下输出颜色 $c$ 和密度 $\sigma$ ：

其中y是和NeRF当中一模一样的位置编码方式。

Skeletal motion

我们计算了骨骼形变 $T_{skel}$ 作为一种逆向linear blend skinning，将观察空间中的点映射到规范空间：

其中 $w^{i}_{0}$ 是第 $i$ 个骨骼的混合权重， $R_{i}$ 和 $t_{i}$ 是旋转和平移，将骨骼的坐标从观察映射到规范空间。 $R_{i}$ 和 $t_{i}$ 可以从 $p$ 显式计算，我们的目标是针对 $w^{o}_{i}$ 进行优化。
在实践中，我们通过将 K 个混合权重存储为一组体积 ${w_{c}^{i} (x)}$ 来求解在规范空间中定义的 $w_{c}^{i}$ ，从中导出观察权重为：

求解规范空间中的一组权重体积 ${w_{c}^{i} (x)}$ ，而不是观察空间中的 $N$ 组 ${w_{o}^{i} (x)}$ （对应于 $N$ 个输入图像），可以导致更好的泛化，因为它避免了过拟合。
我们将 ${w_{c}^{i} (x)}$ 的集合打包成具有 K 个通道的单个volume $W_{c} (x)$ 。我们没有使用 MLP 对 $W_{c}$ 进行编码，而是出于两个原因选择显式体积表示：(1) 等式 5 表明需要 $K$ 个 MLP 评估来计算每个 $w_{o}^{i} (x)$ ，这对于优化是不可行的（在我们的工作中 $K = 24$ ）； (2) 通过三线性插值重新采样的具有有限分辨率的显式体积提供了平滑度，有助于以后对优化进行正则化。在实践中，在优化过程中，我们不是直接求解 $W_{c}$ ，而是求解从随机（恒定）潜在代码 z 生成体积的 CNN 的参数 $θ_{skel}$ ：

我们还添加了一个通道，一个背景类，并将 $W_{c}$ 表示为具有 $K + 1$ 个通道的volume。然后，我们将channel-wise的 softmax 应用于 CNN 的输出，在通道之间执行统一分区。然后可以使用等式5的分母来近似相似度 $f (x)$ （作为主体的一部分），其中 $f (x) =$

当 $f (x)$ 接近于零时，我们很可能在远离主体的自由空间中，我们将在体绘制期间使用它。
优化混合权重的主意其实并不新颖，相似的方法在human modeling上也有被使用过。

Non-rigid motion

我们使用非刚体运动 $T_{NR}$ 作为骨骼驱动的运动的一个偏移量 $\Delta x$ ，比如： $x(x, p) = T_{NR} (T_{skel} (x, p), p))$ 。为了获取细节，我们使用MLP来表示 $T_{NR}$ ：

其中，我们再一次使用了位置编码，并将 MLP 设置在 $Ω$ 上，身体姿势 $p$ 的joint angles。

Pose correction

身体的姿态 $\Omega)$ 如果通过图片估算的话经常是不准的。为了解决这个问题，我们使用这个方法对pose进行更新：

我们将关节 $J$ 固定并优化关节角度的相对更新， $ΔΩ = (Δω_{0} , ..., Δω_{K} )$ ，然后将其应用于 $Ω$ 以获得更新的旋转向量。
根据经验，我们发现，不直接针对 $∆ Ω$ 进行优化，而是求解 MLP 的参数 $θ_{pose}$ ，该 MLP 生成以 $Ω$ 为条件的 $∆ Ω$ 会导致更快的收敛：

通过这种姿势校正，我们可以将从观察空间扭曲到规范空间的方程重写为：

4.Optimizing a HumanNeRF

在本节中，我们描述了我们最小化的总体目标函数、我们的体积渲染过程、我们如何规范优化过程、具体的损失函数细节和光线采样方法。
HumanNeRF objective
给定一些视频帧 ${I_{1},I_{2},...,I_{N}\}$ ，身体姿态 ${p_{1},p_{2},...,p_{N}\}$ 和相机 ${e_{1},e_{2},...,e_{N}\}$ ，我们要解决的问题是：

其中L是loss函数， $\Gamma$ 是体积渲染器，我们最小化所有网络参数 $Θ = \{θ_{c} , θ_{skel} , θ_{NR} , θ_{pose} \}$ 的loss。 $F_{c}$ 由参数 $θ_{c}$ 确定，而从观察空间到规范空间的变换 $T$ 依赖于参数 $θ_{skel}$ 、 $θ_{NR}$ 和 $θ_{pose}$ 。

4.1 Volume rendering

我们使用的渲染神经场的方式如下，对于一条射线 $r$ ，采样 $D$ 个样本，那么期望颜色 $C (r)$ 可以被表示为：

其中 $\Delta t_{i}$ 是第 $i$ 和 $i + 1$ 个采样点之间的间距。
当近似前景概率 $f (x)$ 较低时，我们进一步扩大 $α_{i}$ 的定义：

我们应用了NeRF提出的stratified sampling。我们不使用hierarchical sampling，因为可以从他们的 3D 身体姿势估计对象的bounding box。然后我们只对box内的点进行采样。

4.2 Delayed optimization of non-rigid motion field

当一次求解等式11中的所有网络参数时，我们发现优化的骨架驱动和非刚性运动没有解耦，对象的一部分骨骼运动由非刚性运动场建模，这是由于将非刚性运动过拟合到了输入图像。于是，在渲染看不见的视角时就会质量下降。
我们通过管理优化过程来解决问题。具体来说，我们在优化开始时禁用非刚体运动，然后以coarse to fine的方式将它们恢复。为了实现这一点，对于非刚性运动 MLP，我们将截断的 Hann window应用于其位置编码的频带，以防止过度拟合数据，随着优化的进行增加窗口大小。继 Park 等人之后，我们定义了位置编码的每个frequency band j 的权重：

其中 $α \in [0, L)$ 定义了窗口的宽度， $L$ 是位置编码中频带的总个数。接着，我们定义了 $α$ 作为优化迭代的函数：

其中 $t$ 是当前的迭代， $T_{s}$ 和 $T_{e}$ 是超参，定义了何时启用非刚体运动优化，何时使用位置编码的full frequency bands。我们从位置编码中删除了位置标识，但并不影响性能。通过这种方式，我们可以设置 $\alpha=0$ ，来完全地禁用非刚体运动优化。

4.3 Loss and ray sampling

我们使用 MSE 损失来匹配像素级外观和感知损失 LPIPS，以提供对轻微错位和阴影变化的鲁棒性，并改善重建中的细节。我们的最终loss函数是这两个loss之和。我们使用 $\lambda=2$ 并选择VGG作为LPIPS的backbone。
Patch-based ray sampling
如果像在NeRF中所做的那样，对随机射线样本进行训练，并不能最大限度地减少我们的损失，因为 LPIPS 使用卷积来提取特征。因此，我们在图片上取 $G$ 个 $H \times H$ 大小的patch，然后在每个patch中渲染总共 $G \times H \times H$ 个光线。将渲染的patch与输入图像上相同位置的patch进行比较。我们在实验中使用 $G = 6$ ， $H = 32$ 。

5.Results

5.1 Evaluation dataset

在ZJU-MoCap，自己拍的视频和YouTube下载的视频上进行了测试。对ZJU-Mocap，选择了6个物体，采用由相机1拍摄的照片训练，用另外22个相机来测试。数据集直接提供了相机参数、人体姿态和语义分割结果，所以可以直接使用。对于自己采集的视频和网上下载的视频，使用SPIN得到近似的相机参数和人体姿态，自动分割前景物体，然后手动调整分割结果。并且我们把视频帧resize了以保证物体高度大概在500像素。

5.2 Optimization details

一些参数的设置。

5.3 Evaluation method

我们的方法适用于静态或移动的单个摄像机；我们专注于使用静态相机和移动主体的结果，这是最自然的捕捉人表现的方法。

5.4 Comparisons

我们发现HyperNeRF在我们的实验当中不能产生有意义的新视角合成，这有可能是因为它依赖于多个视角（移动的相机）来构建三维模型。对于静态相机和移动的物体，它无法恢复有意义的深度图所以看起来是在记忆输入图片而非从输入图片泛化合成新图片。我们发现人物运动剧烈的时候HyperNeRF也无法正常工作了。

定量地来说，如表1所示，HumanNeRF 在所有主题和所有指标下都优于Neural body，除了 PSNR指标在主题 393上的数值（已知有利于平滑结果的指标）。感知度量 LPIPS 的增益尤其显着，平均提高了近 40%。对于ZJU-MoCap这个数据集，HumanNeRF 的视觉质量明显优于 Neural Body。即使在完全未观察到的视图上，我们的方法也能够产生类似于基本事实的高保真细节，而Neural body往往会产生更模糊的结果。自拍视频和 YouTube 视频的结果也显示了使用 HumanNeRF 进行的始终如一的高质量重建。

5.5 Ablation studies

做了一些消融实验。
表 3 说明，对于 ZJU-MoCap 数据，仅skeletal deformation就足以显着改善Neural body。添加非刚性变形可提供更多收益。（为此数据集提供了准确的姿势，因此我们没有在此处对姿势优化器执行消融。）

图 6 直观地显示了对于野外数据，考虑非刚性运动以及对看不见的视图进行姿势校正的重要性。

图 7 显示了delayed optimization对于解耦骨骼变形和非刚性变形的重要性。当解耦得不好时，对新视图的泛化要差得多，如图 8 所示。

6.Discussion

Limitations

当视频中未显示身体的一部分时，方法会出现artifacts。姿势校正改善了图像对齐，但如果初始姿势估计较差或图像包含运动模糊等强伪影，则可能会失败。我们假设非刚性运动是姿势相关的，但这并不总是正确的（例如，由于风或动态主体运动后的跟进导致衣服移动）。我们还假设了漫射的照明，因此当对象上的点旋转时，外观不会发生显着变化。最后，对于随意采集的视频，我们依靠人工干预来纠正分割错误。这些限制为未来的工作指明了一系列有趣的途径。

Conclusion

HumanNeRF为单目视频中的移动人物的自由视角渲染生成了最先进的结果。我们通过仔细建模身体姿势和运动以及规范优化过程来展示这种具有挑战性的场景的高保真结果。我们对运动中的人类进行建模，并最终从随意的捕捉中实现完全逼真的、自由视角的人物渲染。

仓库货物检测：基于YOLOv5的深度学习应用与UI界面开发 YOLO实战营 YOLO 深度学习 ui 目标跟踪目标检测人工智能
一、引言随着电商和物流行业的快速发展，仓库货物管理已经成为企业运营中至关重要的环节。为了提高仓库管理的效率和准确性，越来越多的企业开始应用自动化技术来完成货物的盘点、分类、分拣等任务。传统的货物管理方式通常依赖人工检查，不仅效率低下，而且容易出现误差。为了克服这些问题，利用计算机视觉和深度学习技术来实现仓库货物的自动化检测成为了一种有效的解决方案。本博客将介绍如何使用YOLOv5进行仓库货物检测，
【云原生】Helm来管理Kubernetes集群的详细使用方法与综合应用实战景天科技苑云原生K8S 零基础到进阶实战云原生 kubernetes 容器 Helm k8s k8s集群
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，云原生k8s，linux，she
Python面向对象编程(OOP)详解：通俗易懂的全面指南盛夏绽放 python 开发语言有问必答
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。文章目录Python面向对象编程(OOP)详解：通俗易懂的全面指南一、OOP基本概念1.什么是面向对象编程？2.OOP的四大支柱3.核心概念对比表二、类和对象1.类(Class)vs对象(Object)2.类结构详解三、OOP三大特性详解1.封装(Encapsulation)2.继承(Inherita
马斯克整出的半仙儿，Chat GPT会让多少白领失业？可能会带来哪些变化？良辰美景5566
这几天，ChatGPT火了，是美国一家叫OpenAI的高科技公司研发的，背后的投资人是谁？——埃隆马斯克！这哥们儿只要一出手，注定就和新奇呀伟大呀啥的绑在一起了，他搞的项目，比如特斯拉、星链、脑机接口，光听名字就透着不俗。很多人纳闷儿，他这次搞得ChatGPT是个啥玩意儿？简单说就是一个人工智能聊天软件，这个软件比以往的智能聊天软件强在哪儿？这么说吧，这简直就是个半仙儿啊。如果您是一位老人，这个C
量子计算与AI融合的技术突破与实践路径
量子计算与人工智能的融合正开启一个全新的技术纪元，这种"量智融合"不是简单的技术叠加，而是多领域、多学科的横向连接，通过协同创新实现非线性增长。本文将深入探讨这一领域的最新进展、技术实现路径以及行业应用案例。电子-光子-量子一体化芯片：硬件基础突破2025年7月，美国波士顿大学、加州大学伯克利分校和西北大学团队联合开发出全球首个电子-光子-量子一体化芯片系统。这一突破性成果发表在《自然·电子学》杂
117、Python机器学习：数据预处理与特征工程技巧多多的编程笔记 python 机器学习开发语言
Python开发之机器学习准备：数据预处理与特征工程机器学习是当前人工智能领域的热门方向之一。而作为机器学习的核心组成部分，数据预处理与特征工程对于模型的性能有着至关重要的影响。本文将带领大家了解数据预处理与特征工程的基本概念，以及它们在实际应用场景中的重要性。数据预处理数据预处理是机器学习中的第一步，它的主要目的是将原始数据转换成适合进行机器学习模型训练的形式。就像我们在做饭之前需要清洗和准备食
2025年各细分产业链企业数据(汽车、数字经济、食品、制造业) 经管数据库汽车智能手机数据分析
本数据包含2025年及之前的所有上中下游企业信息，67个细分产业。汽车专区、数字经济专区、数字创意专区、未来产业专区、高端装备专区、新能源专区、食品农业专区、传统制造业专区等71个文件。汽车专区：充电桩制造动力电池汽车材料制造汽车制造汽车制造设备汽车座椅制造驱动电机制造燃料电池汽车制造燃料电池系统制造新能源汽车制造智能驾驶智能视觉数字经济专区：5g边缘计算大数据类服务器光通信集成电路区块链人工智能
2024年，想要靠做软件测试获得高薪，还有机会吗？朱公子的Note 软件测试
2024年，科技行业风云变幻，随着自动化技术和人工智能的发展，软件测试领域的竞争愈发激烈。很多人会问，现在还投身软件测试，真的能拿到高薪吗？尤其是当越来越多的自动化工具涌现，手动测试员会不会被淘汰？时间过得真快，一眨眼，2024年已经过去了一大半。最近正值金九银十招聘季，后台不免又出现了这几个同学们关心的问题：2024年还能转行软件测试吗？零基础转行可行吗？那么，2024年，软件测试行业的高薪岗位
2023-09-15 五角大楼探索生成式人工智能解决方案泰格
佳文砺道智库2023-09-1409:58发表于北京据“防务头条”网9月12日报道，美国研究机构“特殊竞争力研究项目”（SCSP）的一份报称告，如果美国想在制定生成式人工智能的开发和使用规范方面引领全球，就必须增加联邦研发支出，建立新的政府机构，或者改变现有的政府机构。生成式人工智能可以加速新药和网络安全解决方案的发现，从根本上实现更好的计算机网络，并提高公众的理解。但在对手手中，它可能会导致更多
光纤HDMI vs 普通HDMI线：区别对比及适用场景全解析
1.引言：HDMI线的重要性HDMI（HighDefinitionMultimediaInterface）作为目前最主流的高清音视频传输接口，广泛应用于显示器、电视、投影仪、游戏主机、PC等设备。然而，市面上的HDMI线种类繁多，尤其是光纤HDMI和普通铜芯HDMI，它们的性能差异大，适用场景也不同。本文将从传输原理、带宽、距离、抗干扰、价格等多个维度对比两者的区别，并给出选购建议，帮助你在不同场
HDMI、DisplayPort、USB-C 不同版本对比：带宽、刷新率、协议版本详解 TESmart碲视 KVM切换器领域相关技术电脑计算机外设智能硬件物联网
一、接口概览：HDMI、DP接口、USB-C到底是干嘛的？接口名称主要功能常见设备支持传输内容HDMI（High-DefinitionMultimediaInterface高清多媒体接口）专为高清音视频传输设计电视、显示器、显卡、游戏主机视频+音频DP（DisplayPort显示端口）高性能视频输出接口显卡、显示器、扩展坞视频+音频USB-C（带DPAlt模式支持DP替代模式）多功能数据传输接口笔
探索OpenCV 3.2源码：计算机视觉的架构与实现轩辕姐姐
本文还有配套的精品资源，点击获取简介：OpenCV是一个全面的计算机视觉库，提供广泛的功能如图像处理、对象检测和深度学习支持。OpenCV3.2版本包含了改进的深度学习和GPU加速特性，以及丰富的示例程序。本压缩包文件提供了完整的OpenCV3.2源代码，对于深入学习计算机视觉算法和库实现机制十分宝贵。源码的模块化设计、C++接口、算法实现、多平台支持和性能优化等方面的深入理解，都将有助于开发者的
人工智能服务器处理器的全新定义两大头部品牌旗舰款的王者之争！云储存cpu_云服务器处理器_企业服务器处理器
一、旗舰处理器架构解析IntelXeon6900系列代表着英特尔在服务器处理器领域的最新成果，采用增强版Intel7制程工艺打造。该系列最高配置56个物理核心，通过超线程技术支持112个逻辑线程，在处理多线程任务时展现出卓越的性能表现。内存子系统方面，支持8通道DDR5-4800内存配置，最高可扩展至4TB容量，为内存密集型应用提供了充足带宽。特别值得一提的是其集成的AMX高级矩阵扩展指令集，这项
院级医疗AI管理流程—基于数据共享、算法开发与工具链治理的系统化框架 Allen_Lyb 医疗高效编程研发人工智能算法时序数据库经验分享健康医疗
医疗AI：从“单打独斗”到“协同共进”在科技飞速发展的今天，医疗人工智能（AI）正以前所未有的速度改变着传统医疗模式。从最初在影像诊断、临床决策支持、药物发现等单一领域的“单点突破”，医疗AI如今已迈向“系统级协同”的新阶段。曾经，医疗AI的应用多集中在某一特定环节，比如利用深度学习算法分析医学影像，辅助医生进行疾病诊断。这种单点突破式的应用虽然在一定程度上提高了医疗效率，但随着医疗行业对AI技术
python--自动化的机器学习（AutoML） Q_ytsup5681 python 自动化机器学习
自动化机器学习（AutoML）是一种将自动化技术应用于机器学习模型开发流程的方法，旨在简化或去除需要专业知识的复杂步骤，让非专家用户也能轻松创建和部署机器学习模型**[^3^]。具体介绍如下：1.自动化的概念：自动化是指使设备在无人或少量人参与的情况下完成一系列任务的过程。这一概念随着电子计算机的发明和发展而不断进化，从最初的物理机械到后来的数字程序控制，再到现在的人工智能和机器学习，自动化已经渗
电信星卡定向流量可以使用哪些app(电信星卡定向流量app有哪些) 全网优惠分享
电信星卡定向流量可以使用哪些app(电信星卡定向流量app有哪些)关注微•信•公•众•号"卡泡泡"就知道啦！电信的定向流量包括哪些app?1、电信定向流量app如下：头条系应用今日头条、今日头条lite版本、西瓜视频、抖音火山版、抖音视频、多闪、图虫、懂车帝、皮皮虾APP、海豚股票、海豚财富、gogokid、轻颜、好好学习、飞聊、时光相册、半次元。电信星卡大流量版合集：电信星卡定向流量app有哪些
【Python】人脸识别宅男很神经 python 开发语言
第一章：计算机视觉与图像处理的基石在深入人脸识别之前，我们必须首先牢固掌握计算机视觉和图像处理的基本概念。人脸，本质上就是一张复杂的图像，对图像的理解是所有高级视觉任务的起点。1.1图像的本质：像素与数字化表示图像，在我们看来是连续的画面，但在计算机内部，它却是离散的数值矩阵。1.1.1什么是像素？图像的最小单元像素（Pixel），是构成数字图像的最小单位。可以将其想象成一个微小的彩色点。一张数字
人人皆有神功：AI如何改变程序员的江湖地位？ nbsaas-boot 人工智能大数据
在人类的历史中，每一次技术革命都重新洗牌了社会的力量结构：工业革命带来机器力量的爆发，信息时代成就了程序员的黄金时代。而如今，随着通用人工智能（AGI）和大模型技术的突飞猛进，我们正在步入一个**“人人皆有神功”的AI江湖时代**。当AI成为每个人的智能助手，编程是否还重要？程序员将何去何从？本文将以“武林江湖”的隐喻，探索AI时代的技术平权与社会重构。一、技术平权真的来了吗？过去，程序员之所以被
二维码在教学中的应用小尘老师
7月7日，阅读《现代极简教育技术》P174-180模块二主要是将二维码在教学中的灵活应用。二维码在生活中非常常见，大部分人看到都知道那是二维码。但真要问什么是二维码，应该有很多人跟我一样是有点懵的。没想到二维码背后还有这么多的知识。真的是长见识了。关于教师如何设计二维码，黎教授也分成5个小点教大家。主要是网页，PPT，word文件，图片音视频，其他二维码。黎教授介绍的方法中，草料二维码我用的是最多
计算机视觉算法实战——关键点检测
✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨1.引言关键点检测（KeypointDetection）是计算机视觉领域中的一个重要研究方向，旨在从图像或视频中检测出具有特定语义信息的关键点。这些关键点通常代表了物体的特定部位或特征，例如人体的关节、面部特征点、车辆的轮子等。关键点检测在姿态估计、动作识别、目标跟踪、三维重建等任务中
复杂场景检测老翻车？陌讯算法实测提升 40% 2501_92453489 算法视觉计算机视觉视觉检测
在工业质检、安防监控等计算机视觉落地场景中，工程师常面临棘手问题：传统算法在光照突变、目标遮挡等复杂环境下，漏检率高达20%以上，泛化能力不足成为项目落地的最大阻碍。而陌讯AI视觉算法通过架构创新，正在重新定义复杂场景下的检测精度标准。技术解析：从单模态到多模态的跨越传统目标检测模型多依赖单一RGB图像输入，在特征提取阶段容易受环境干扰。以经典的FasterR-CNN为例，其区域提议网络（RPN）
工业大模型应用报告：新机遇、挑战与未来展望花生糖@ AIGC学习资料库大模型人工智能应用扩展屏应用开发 AI 机器学习
大模型在工业智能化发展中的新机遇、挑战与展望。以下是报告的核心内容概述：大模型为工业智能化发展带来新机遇大模型开启人工智能应用新时代，推动技术创新和应用。大模型有望成为驱动工业智能化的引擎，提高研发效率、拓展生产制造智能化应用边界、提升经营管理水平。大模型应用落地需要深度适配工业场景，解决行业知识和企业特定环境的理解问题。大模型和小模型在工业领域将长期并存小模型应用呈现倒U型分布，主要集中在生产制
AI时代的弯道超车之第十七章：黄仁勋：坚持一件事，哪怕坐足冷板凳 Hebron_Deb AI时代-弯道超车-逆袭人生人工智能
在这个AI重塑世界的时代，你还在原地观望吗？是时候弯道超车，抢占先机了！李尚龙倾力打造——《AI时代的弯道超车：用人工智能逆袭人生》专栏，带你系统掌握AI知识，从入门到实战，全方位提升认知与竞争力！内容亮点：AI基础+核心技术讲解职场赋能+创业路径揭秘打破信息差+预测行业未来第十七章：黄仁勋：坚持一件事，哪怕坐足冷板凳我们终于来到了第十七章，也是这本人物传记中该领域的最后一章。前面我们讲到了李飞飞
AI+Python赋能！长时序植被遥感动态分析全攻略：从物候提取到生态评估梦想的初衷~ 土壤植被遥感人工智能遥感植被土壤
在遥感技术与人工智能深度融合的2025年，AI大模型正重塑长时序植被遥感数据分析范式。从Landsat/Sentinel卫星数据的智能化去云处理，到MODIS植被产品的AI辅助质量控制，以ChatGPT、DeepSeeK为代表的大模型技术已成为提升遥感数据处理效率与精度的核心工具——尤其在长时序植被动态监测、物候期精准提取、时空变异归因分析及生态环境质量评估等领域，展现出传统方法难以企及的技术优势
认知革命牧羊少年的时间之旅
看完人类简史后产生了一个想法，人类经过几万年的演化从采集时代，农业社会，再到工业革命和最近的科技革命，每一次的演变升级都是对传统认知的一次革新。但是我们现在的科技发展是如此的迅速，但是认知的进步却非常缓慢。克隆人，基因设计，人工智能，生化科技，量子计算等很多领域都是传统文化所无法理解和接受的，但是这些却依然有条不紊在进行中。所以人类目前急需一次认知的革命才能追上科技的脚步，不然一定会造成认知和现实
AI 人工智能与 Copilot 的融合发展策略 AI天才研究院 AI人工智能与大数据人工智能 copilot ai
AI人工智能与Copilot的融合发展策略关键词：人工智能、Copilot、代码生成、人机协作、机器学习、自然语言处理、软件开发摘要：本文探讨了人工智能与Copilot技术的融合发展策略。我们将从技术原理、实现方法、应用场景等多个维度深入分析，提出一套完整的融合框架和发展路径。文章首先介绍背景和核心概念，然后详细讲解关键技术，包括自然语言处理、代码生成算法等，接着通过实际案例展示应用效果，最后讨论
AI 人工智能与 Copilot 碰撞出的火花 AI天才研究院 AI大模型企业级应用开发实战人工智能 copilot ai
AI人工智能与Copilot碰撞出的火花关键词：AI人工智能、Copilot、代码辅助、智能编程、人机协作、软件开发、技术创新摘要：本文深入探讨了AI人工智能与Copilot碰撞所产生的一系列效应。首先介绍了相关背景，包括目的、预期读者、文档结构和术语表。接着阐述了核心概念与联系，展示了其原理和架构的示意图及流程图。详细讲解了核心算法原理和具体操作步骤，并通过Python代码进行说明。同时给出了数
Qt/C++音视频开发22-通用GPU显示 feiyangqingyun Qt/C++音视频开发 Qt视频监控 Qt音视频 Qt硬解码
一、前言采用GPU来绘制实时视频一直以来都是个难点，如果是安防行业的做视频监控开发这块的人员，这个坎必须迈过去，本人一直从事的是安防行业的电子围栏这个相当小众的细分市场的开发，视频监控这块仅仅是周边技术玩一玩探讨一下，关于GPU绘制这块着实走了不少的弯路。之前用ffmpeg解码的时候，已经做了硬解码的处理，比如支持qsv、dxva2、d3d11va等方式进行硬解码处理，但是当时解码出来以后，还是重
微算法科技研究量子视觉计算，利用量子力学原理提升传统计算机视觉任务的性能
计算机视觉，作为人工智能领域的一个重要分支，致力于模拟人类视觉系统对图像或视频等视觉数据的理解与分析能力。它涵盖了图像识别、目标检测、图像分割等一系列复杂任务，广泛应用于自动驾驶、医疗影像分析、安防监控等多个领域。然而，随着数据规模的不断膨胀和任务复杂度的日益提升，传统计算机视觉算法在处理大规模、高维度数据时遇到了性能瓶颈。微算法科技(NASDAQ：MLGO)研究量子视觉计算，探索量子计算与经典卷
vLLM快速入门：开启高效推理与部署之旅
在如今这个人工智能飞速发展的时代，语言模型的应用已经深入到我们生活的方方面面，从智能聊天机器人到文本生成工具，都离不开强大的语言模型技术支持。而vLLM作为一个专注于高效推理和部署的开源项目，正在为研究人员和开发人员提供一种全新的解决方案，让语言模型的使用变得更加便捷、高效。初识vLLM：背景与意义vLLM（VeryLargeLanguageModelInference）是一个专注于大型语言模型推
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep