packdge_black

《 Acquiring High-Fidelity 3D Avatar from a Single Image》笔记

摘要

本文提出一种，从单个图像生成，具有高分辨率UV纹理贴图的，高保真的，3D面部头像的方法。为了评估人脸的几何形状，我们使用深度神经网络直接根据给定的图像，预测3D人脸模型的顶点坐标。通过非刚性变形过程进一步完善了3D面部几何形状，以便在纹理投影之前更准确地捕获面部标志。文章方法的关键新颖之处在于，在使用高质量渲染引擎综合生成的面部图像上训练形状回归网络。此外，作者形状估算器，充分利用了，从数百万张面部图像中学到的，深度面部识别功能的辨别力。作者进行了广泛的实验，以证明优化2D到3D渲染方法的优越性，尤其是其在现实世界中自拍图像上的出色泛化特性。作者提出的从2D图像渲染3D化身的系统具有广泛的应用范围，从虚拟/增强现实（VR / AR）和望远镜技术到人机交互和社交网络。

--------------------------------------这是注释-------------------------------------------

关于UV纹理贴图：

1、SketchUV（UV贴图工具）是SketchUp里面一个贴图插件。

2、UVW贴图一般都是贴图坐标丢失时使用，也可以用在自己想把贴图位置详细设置的时候使用。因为贴图一般是平面的，所以贴图坐标一般只用到UV两项，W项很少用到。大家常说的要调整UV坐标，实际就是调整贴图在模型上的位置。

投影贴图，球形贴图，柱形贴图，Box贴图，四边面贴图，路径贴图；

非刚性变形（non-rigid deformation）

只有物体的位置(平移变换)和朝向(旋转变换)发生改变，而形状不变，得到的变换称为刚性变换。非刚性变换就是比这更复杂的变换，如伸缩，仿射，透射，多项式等一些比较复杂的变换。

例如：ps中自由变换命令里面的斜切、扭曲、透视这些功能就属于非刚性变换

-------------------------------------------------------------------------------------------------------------------------------------

1. Introduction

在许多视觉应用程序中，包括VR / AR，电话会议，虚拟试戴，计算机游戏，特效等，获取高质量3D化身是一项基本任务。大多数专业制作工作室采用的一种常见做法是，由熟练的艺术家根据3D扫描或照片参考手动创建化身。由于每个模型都需要数天的人工处理和润色，因此此过程通常很耗时且人工密集。期望通过利用计算机视觉/图形和图像/几何处理中的快速发展来自动化3D化身生成的过程。

开发用于从单个图像生成3D化身的全自动系统很具有挑战性，因为面部形状和纹理贴图的估计都涉及光，形状和表面材料的本质上模糊的组成。传统的智慧试图通过逆向渲染来解决这个问题，逆向渲染将图像分解位置公式化为优化问题，并估计最适合观察图像的参数。但是，这些现有方法通常会假设将照明，阴影和皮肤表面模型过度简化（over-simplifified），这些模型并没有考虑到现实世界中的复杂性（例如，表面下的散射，自闭（未理解，低头？）引起的阴影以及复杂的皮肤反射场）。因此，恢复的3D化身通常不会如实反映图像中呈现的实际面孔。

为了面临这些困难，作者提出了一种新颖的半监督方法。在使用医疗级3D面部扫描仪收集和处理482次中性面部扫描后，作者使用形状增强并利用了高保真渲染引擎，从而创建大量逼真的面部图像。据作者所知，这项工作是首次利用照片级逼真的面部图像合成进行准确的面部形状的尝试。对于面部几何形状估计，作者建议首先提取在数百万个图像上训练的深层面部身份特征，该特征将每个面部编码为唯一的潜在表示，并对一般三维头部模型的顶点坐标进行回归。为了更好地捕获纹理投影的面部特征，通过联合优化相机固有的、头部姿态、面部表情和每个顶点的校正场，以非刚性的方式进一步重新细化顶点坐标。作者最终生成的模型包括一个具有低多边形数的形状模型，但具有清晰细节的高分辨率纹理贴图，即使在移动设备上也可以有效地渲染（如图1所示）。

接下来对比了一些其他方法的3D AVATARS，优缺点。

文章的主要贡献可以总结如下：

•一种用于从单个图像生成高保真UV纹理3D化身的系统，即使在移动设备上，也可以实时有效地对其进行渲染。
•通过使用预先训练的深度面部识别功能，在合成照片逼真的图像上训练形状估计器。训练完成的网络在真实世界的图像上展现出出色的图像生成特性。
•相对于其他最新的面部造型技术，对所提方法进行了广泛的定性和定量评估，证明了其优越性（即更高的形状相似性和纹理分辨率）。

2. Related Works

3D Face Representation.3D人脸表示

Fitting via Inverse Rendering.通过逆向渲染进行拟合

Supervised Shape Regression.监督形状回归

值得一提的是，许多基于CNN的方法在训练过程中都使用通过反向渲染估算的面部形状作为基本事实。

Unsupervised Learning.无监督学习。

Deep Facial Identity Feature.。深度面部识别功能

3. Proposed Method

3.1. Overview

为了人脸图像的合成(3.2节)，为了训练形状回归神经网络(3.3节)，我们收集并处理了一个优先级的3D人脸数据集，我们可以从该数据集中提取带有UV纹理的增强3D人脸形状样本，以呈现大量逼真的人脸图像。在测试过程中，首先使用输入图像直接回归具有给定拓扑的3D面部模型的3D顶点坐标，然后进一步对其进行精炼以使其适合每个顶点非刚性变形方法的输入图像（3.4）。精确拟合后，自拍纹理将投射到UV空间以推断出完整的纹理图（第3.5节）。

3.2. Photo-Realistic Facial Synthesis（逼真的面部合成）

3D Scan Database

使用最广泛的 Basel Face Model 巴塞尔面部模型（BFM）有两个主要缺点。首先，它由200名受试者组成，但主要是白人，这可能导致面部形状估计有偏差。其次，每个面都由具有高多边形数，每个顶点纹理外观和仅正面的密集模型表示，这限制了其在生产级实时渲染中的使用。

使用包含2925个顶点的头部模型和大小为2048×2048的漫反射贴图的面部表示。我们采用非刚性对齐方法[8]来变形通用头部模型以匹配捕获的面部扫描。然后，将纹理转移到通用模型的UV空间中。通过进一步的手动艺术修饰，我们获得了最终的高保真扩散贴图。

Shape Augmentation（形状增强）

482位受试者远远不足以涵盖所有可能的面部形状变化。虽然收集数千个高质量的面部扫描非常昂贵，但我们采用了另一种形状增强方法来提高训练后的神经网络的泛化能力。首先，我们采用最近的一个变形方法表示（DR）[46，13]对3D面部网格P建模。DR功能将第i个顶点Pi = [Pix，Piy，Piz]编码为R9向量。因此，整个网格的DR特征表示为向量D∈R | P |×9。

请参阅有关如何从P计算DR特征D的补充材料，反之亦然。（应该是在附录里）

在获得一组（D1，...，DN）的DR特征后，其中N是对象的总数，我们遵循[21]来采样新的DR特征。更具体地说，我们在极坐标中采样一个向量（r，θ1，...，θm1），其中r观察到均匀分布U [0.6，1.3]，θi遵循均匀分布U [0，π/ 2]。我们计算其对应的笛卡尔坐标（a1，a2，...，am），并将所采样的DR特征插值为公式，从中进一步计算对应的面部网格。

在我们的实验中，我们使用m = 5，并且仅从相同性别和种族中选择样本。我们生成了10,000个新的3D面孔，其中亚洲/白种人/黑人的比例为0.65 / 0.30 / 0.05，男性/女性的比例为0.5 / 0.5。对于每个新采样的面孔，我们通过选择现有482个对象中，相同种族和性别的，最接近的3D面孔，来分配其UV纹理。

Synthetic Rendering.（合成渲染）

我们使用现成的高质量渲染引擎V-ray 2。在artistic的帮助下，我们建立了一个着色图来渲染照片真实的面部图像，给出了一个自定义漫反射贴图和一个通用的高光贴图。我们手动设置30种不同的光照条件，并进一步随机调整头的旋转度[[15°，+ 15°]的横摇，偏航和俯仰。渲染图像的背景是随机的，有大量的室内和室外图像。我们选择不渲染眼睛模型，并掩盖了眼睛区域，当测试时使用检测到的本地眼睛特征。

fig2：在训练期间，我们会在逼真的合成人脸图像上学习形状回归神经网络。在测试过程中，我们使用从投影纹理生成的UV扩散贴图来推断低多边形数形状模型。

3.3. Regressing Vertex Coordinates（回归顶点坐标）

我们的形状回归网络由特征编码器和形状解码器组成。深层面部识别功能以其在各种条件下（例如光照，头部姿势和面部表情）的鲁棒性而闻名，为编码后的功能自然提供了理想的选择。尽管任何现成的面部识别网络都足以满足我们的任务，但我们建议采用Light CNN-29V2 [47]，因为它在网络大小和编码效率之间具有良好的平衡性。预训练的Light CNN-29V2模型用于将输入图像编码为256维（？）特征向量。我们使用了加权的每个顶点L1损失（L1 loss）：面部区域的顶点权重为5（距鼻尖半径为95mm以内），其他顶点的权重为1。

对于形状解码器，我们使用了三个全连接的（FC）层，其输出大小分别为128、200和8,775。最后一个FC层直接预测由2,925个点组成的通用头部模型的级联顶点坐标，并使用200个预先计算的PCA组件进行初始化，解释了在10,000个增强3D面部形状中观察到的超过99％的方差。与无监督学习相比[16]，我们对高质量优先3D面部扫描数据集的可访问性，使通过监督获得更高的准确性成为可能。

3.4. Non-rigid Deformation（非刚性变形）

由形状回归神经网络生成的3D顶点坐标不适用于纹理投影，因为面部图像通常包含未知因素，例如相机固有，头部姿势和面部表情。同时，由于形状回归预测了整体面部形状，因此无法准确地重建眼睛，鼻子和嘴巴等局部部位；但是当与原始人脸图像进行比较时，它们对于质量感知还是很重要。我们建议利用以从粗糙到精细的方式，来检测到的人脸标志，并将非刚性变形公式化为一个优化问题，来一起优化摄像机固有的，外部的，面部表情和每个顶点的校正场。

Problem Formulation.（问题表述）

为了处理面部表情，我们将在FaceWarehouse [8]中将表情blendshape模型转移到相同的头部拓扑中，并请艺术家协助{B1，B2，...，BM}。（没看懂这部分）

这一部分内容写在了论文的纸质材料上，最后的总结是，将上述的这些放在一起，我们可以通过p来表示总体参数化向量。

Landmark Term.

我们采用全局到局部方法进行面部特征定位。为了进行全局推断，我们首先检测到标准的68个面部标志，然后使用该初始估计来裁剪包括眼睛，鼻子和嘴巴在内的局部区域，即总共裁剪了4张图像。然后，我们对裁剪后的图像进行精细的局部推断（有关更多详细信息，请参见补充材料）。我们建议最小化3D模型上的预测地标与检测到的地标之间的距离。（中间隔了一段公式说明）我们在M上预选m并遵循滑动方案[7]在每次迭代时更新17个面部轮廓界标的重心坐标。

Corrective Field Regularization.（校正场正则化）

为了实现一个平滑且较小的每顶点校正域，我们结合了以下两个损失（loss），

通过将拉普拉斯算子L保持在变形的网格上，第一个loss用于调整平滑变形（更多细节请参考[36]）。下面的那个是一个固定值，他来自上次的迭代结果，他表示估计的面部表情blendshape权重。

第二个loss用于强制执行较小的校正场，而λδ则用于平衡这两项。

Other Regularization Terms.

我们进一步规范了面部表情，焦距比例因子和相机外部的旋转分量，如下所示：

Summary.

所以总的损失函数就是：

然后讲了各个数值初始化值和其有估计的方法。

3.5. Texture Processing（纹理处理）

在非刚性变形时，我们使用估计的摄像头固有时间，头部姿势，面部表情和每个顶点校正将自拍纹理投影到通用模型的UV空间。通常，通常只有自拍上的前部区域可见，但我们使用482个subject中最接近查询subject之一的UV纹理来恢复其他区域（例如，头和颈的后部）的纹理。我们将贴近度定义为LightCNN-29V2嵌入之间距离的L1损失，即通过使用人脸识别。最后，给定前景投影的纹理和背景默认纹理，我们使用泊松图像编辑[30]混合它们。

4. Experimental Results

4.1. Implementation Details

对于形状回归，我们使用Adam优化器，其学习率为0.0001，并且500个时元的动量β1= 0.5，β2= 0.999。我们训练了总共10,000个合成渲染的面部图像，批次大小为64。对于非刚性变形，我们总共使用N = 5次迭代。当最小化公式（4）时，我们使用ωc= 25并且ωr= 10.在公式（2）中，我们设置λδ= 4，在公式（3）中，我们设置λf= 5和λq= 5。

4.2. Database and Evaluation Setup

Stirling/ ESRC 3D Faces Database(人脸数据库)

ESRC [12]是Di3D相机系统捕获的最新公共3D人脸数据库。该数据库还提供了在不同光照条件下从不同角度捕获的几幅图像。我们选择同时具有3D扫描和额中性面孔的受试者进行评估。共有129名受试者（男性62位，女性67位）进行测试。请注意，在此数据集中，大约95％的人是白种人。

JNU-Validation Database

JNU验证数据库是江南大学[25]收集的JNU 3D人脸数据库的一部分。它具有10个亚洲人的161张2D图像，以及3dMD捕获的3D面部扫描。由于在训练期间未使用验证数据库，因此我们将其视为亚洲人的测试数据库。每个对象的2D图像在[3，26]范围内。为了最大程度地减少不平衡数据的影响，我们选择每个主题的三个正面图像进行定量比较。

Our Test Data

由于没有可用于测试所有性别和种族的公共数据库，因此我们从表1的六个组中随机选择五个主题，并形成总共30个主题作为评估数据库。其他482次扫描用于几何和纹理的数据增强和训练/验证阶段。每个对象都有两张测试图像：由三星Galaxy S7拍摄的自拍图像和由摄影师从Sony a7R DSLR相机拍摄的图像。

Evaluation Setup

本文将他们的方法与包括3DMM-CNN [42]，Extreme 3D Face（E3D）[43]，PRNet [11]，RingNet [32]和GanFit [14]在内的几种最新方法进行了比较。每种方法的重构模型详细信息如表2所示。请注意，对于本文的方法和RingNet，在进行比较之前，都将眼睛，牙齿和舌头及其模型保持器移除。由于评估指标使用的是点到面误差，因此不相关的数据将增加总体误差。尽管删除这些部分也会稍微增加误差（例如，眼睛区域中没有可比较的数据），但引入的误差远小于直接使用原始模型的误差。

4.3. Quantitative Comparison

Evaluation Metric:（评估指标）

ground truth（？）

由于每种方法的拓扑都是固定的，因此首先使用七个预先选择的顶点索引来粗略地将重建的模型与ground truth情况对齐，然后通过迭代最近点（ICP）进一步完善模型[3]。鼻尖vt的顶点位置被选为ground truth和重建模型的中心。

ESRC and JNU-validation Dataset:

请注意，ESRC数据库提供的注释仅具有用于对齐的七个landmark，因此，我们不使用鼻尖，而是使用7个界标的平均值作为面部中心。在ESRC中，当d> 95时，我们的结果要优于其他方法，并且随着d的增加，我们的性能会更具弹性。这表明我们的方法比其他方法可以更好地复制整个头部的形状。在JNU验证数据库中，由于其他方法是从白种人主导的3DMM模型中训练出来的，而在我们的增强阶段也考虑了其他种族，因此我们可以在每个d值处获得更小的重构误差。

Our Test Dataset:

4.4. Ablation Study

为了证明所提出方法中各个模块的有效性，我们一次修改一个变量，并与以下替代方法进行比较：

• No Augmentation (No-Aug):

在不进行任何增强的情况下，我们仅从482个对象中重复采样了10,000张脸。

• Categorized-PCA Sampling (C-PCA):

代替基于DR特征的采样，我们提出了一种基于PCA的采样方法。我们训练了来自482位受试者的对象PCA模型，对于表1中的每个组，使用高斯随机向量x〜N（µi，Σ2i）来创建主要形状分量的权重，其中µi和Σ2i是均值向量，组中这些系数的协方差矩阵。我们使用这种增强方法对10,000张脸进行了采样

Game engine Rendering-Unity:

我们没有使用高质量的逼真的渲染器，而是使用标准游戏渲染引擎Unity来合成面部图像（关于游戏引擎应该是这篇文章里知道的最多的一部分了）。渲染图像的质量相对低于V射线。我们保留了基于DR特征的增强方法，并完全渲染了3.2节中提到的10000个合成面。

在图6中，我们提出的方法胜过所有其他选择。可以预期，如果不进行数据扩充（即No-Aug），则在所有方法中，重建的误差都是最严重的。C-PCA与我们的方法之间的差异证明，DR采样增强可创建更多自然的人工合成面部进行训练。 Unity与我们的方法之间的结果表明，renred图像的质量在弥合真实图像与合成图像之间的差距方面起着重要作用。

table2和fig4分别用不同方法比较了，文章内方法和其他方法之间的优劣性

4.4.1 Qualitative Comparison

图7与MoFA测试数据库中的最新技术并排显示了正面图像的形状估计方法。我们选择了GanFit [14]中显示的相同图像。我们的方法可以创建准确的人脸几何形状，同时还可以捕获区分特征，从而使每个人脸的身份易于与其他人区分开。同时，如表2所示，我们的结果保持了较低的几何复杂度。这使我们的化身即使在要求苛刻的情况下（例如在移动平台上）也可以投入生产。在图8中，我们选择了一些名人来比较我们的方法的几何精度。在图9中，我们在第3.5节中用混合的漫反射图展示了最终结果。

5. Conclusions and Future Works

在本文中，我们演示了一种有监督的学习方法，用于通过逼真的高分辨率漫射贴图来估计高质量3D脸部形状。为了促进面部图像合成，我们已经收集并处理了3D面部数据库，从中我们可以使用UV纹理对增强的3D面部形状进行采样以渲染出大量逼真的面部图像。与以前的方法不同，我们的方法利用了在数百万个合成的逼真的面部图像上训练的现成的面部识别神经网络的判别能力。

我们已经证明了该方法的可移植性，从准确的面部识别为目标，可以基于单个自拍照完全重建面部几何形状。在对合成生成的人脸图像进行训练时，我们在真实世界的图像上进行测试时观察到了强大的泛化能力。这在许多有趣的应用程序中打开了机会，包括VR / AR，电话会议，虚拟试戴，计算机游戏，特效等等。

Supplemental Material

Section 3.2. Scan Pre-processing（扫描预处理）

如图10所示，我们处理原始的带纹理的3D面部扫描数据以生成我们的3D面部表示，该3D面部表示由具有低多边形数的形状模型和用于保留细节的高分辨率漫射贴图组成。

fig10：第一行：左侧是具有密集拓扑结构的原始面部扫描，右侧是具有UV纹理的模型；下排：左侧是具有稀疏拓扑的处理过的面部模型，右侧是具有UV纹理的模型。

Section 3.2. Deformation Representation（变形表示）

在这里，我们给出变形表示（DR）功能的详细表述。 DR特征D将相对于参考网格PR的每个顶点周围的局部变形编码为R9向量。我们将所有482个经过处理的面部模型的平均面部作为参考网格。

Encode D from P.

Recover P from D.

给定DR特征D和参考网格PR，我们首先恢复每个顶点的仿射变换Ti。然后，我们尝试恢复最小化的最佳P：

Section 3.4. Landmark Localization

为了实现更高的地标定位精度，我们开发了一种从粗到精的方法。

首先，我们从检测到的面部边界框中预测所有面部标志。

然后，在获得初始地标的情况下，我们将眼睛，鼻子和嘴巴区域裁剪为第二阶段的小规模地标定位。图11显示了我们的地标标记以及用于小规模地标定位阶段的边界框。

我们已经使用了基于回归森林的方法[24]作为基本的地标预测指标，并且总共训练了4个地标预测指标，即针对整体的面部，眼睛，鼻子和嘴巴。

图11：我们的地标性标记包括104个点，即面部轮廓（1-17），眉毛（18-27），左眼（28-47），右眼（48-67），鼻子（68） -84）和嘴巴（85-104）。

（a）粗略检测所有地标和相应的边界框，以进行精细尺度检测。

（b）单独的局部细尺度检测结果。

Section 4.4. Different Rendering Quality（不同的渲染质量）

在本节中，我们首先说明用于高质量Vray渲染的30种手动创建的照明条件，如图12所示。然后，我们提供从Vray和Unity渲染的几个合成人脸图像，如图13所示。请注意，对于这两种渲染方法，我们随机化了头部姿势，环境图，照明条件和视场（FOV），以模拟现实世界中的自拍照。我们不渲染眼睛模型，因此，如第3.2节所述，我们在测试期间用检测到的面部标志物遮盖了眼睛区域。

Section 4.5. More Qualitative Results

这里展示一些结果比较的图片

Application - Audio-driven Avatar Animation（应用程序-音频驱动的头像动画）

我们自动生成的头部模型已准备好用于不同的应用。在这里，我们演示了一种由原始波形音频输入驱动的自动唇形同步的情况，如图21所示。对于数据收集和深度神经网络结构，我们采用与[23]相似的管道来驱动重建模型。所有动画混合形状都将转移到我们的通用拓扑中。请参阅我们的视频以获取更多详细信息。

你可能感兴趣的:(《 Acquiring High-Fidelity 3D Avatar from a Single Image》笔记)

Windows 图形显示驱动开发-WDDM 3.2-本机 GPU 围栏对象(四) 程序员王马 windows图形显示驱动开发驱动开发单片机 stm32
用于创建、打开和销毁本机围栏的D3DKMT内核API引入了以下D3DKMT内核模式API来创建和打开本机围栏对象。D3DKMTCreateNativeFence/D3DKMT_CREATENATIVEFENCED3DKMTOpenNativeFenceFromNTHandle/D3DKMT_OPENNATIVEFENCEFROMNTHANDLEDxgkrnl调用现有的D3DKMTDestroySy
地球科学数据学习笔记---流向与风向、浪向 fried-ghost 地球科学数据学习笔记学习笔记数据分析
一、流向（current）流向一般指流体前进的方向、去向，一般以正北方向为正，例如流体从南流向北，则流向为0°，其示意图如下二、风向与浪向风向与浪向一般都指来向，与流向相反，例如风从南吹向北，则为南风，风向为180°。气象数据中一般会将风速数据存成u、v两个分量（雷达数据除外），u分量表示纬向风，v分量表示经向风。u为正，表示西风，风向为270°；v为正，表示南风，风向为180°。示意图如下所示，
深入理解Kettle：ETL工具的学习与实践未知方程无解
本文还有配套的精品资源，点击获取简介：Kettle（Spoon）是Pentaho公司开发的开源ETL工具，用于数据整合和数据仓库建设。本学习笔记着重于Kettle的核心——转换引擎，详细探讨其数据处理的各个步骤，包括数据的输入、转换、输出以及工作原理，提供了一系列的学习资源和实践操作指南，旨在帮助学习者深入理解并掌握Kettle的转换引擎，从而提升数据处理能力。1.Kettle（Spoon）简介与
数据集/API 笔记：湿球黑球温度（WBGT）观测数据 UQI-LIUWJ 数据集笔记
data.gov.sgWBGT是一个综合指标，考虑了气温、湿度、风速和太阳辐射，与气温不同。报告的WBGT是过去15分钟内的平均值，每15分钟更新一次。API调用curl--requestGET\--urlhttps://api-open.data.gov.sg/v2/real-time/api/weather调用结果
数据集/API 笔记：新加坡最新的停车场可用车位信息 & 停车场信息 UQI-LIUWJ 笔记
数据每分钟更新一次使用date_time参数可获取特定时间点的最新停车场可用车位信息调用接口curl--requestGET\--urlhttps://api.data.gov.sg/v1/transport/carpark-availability调用结果API返回的查询时间"2025-03-04T09:10:36+08:00"代表的是API查询的时间，但每个停车场的update_datetim
Bert模型学习笔记文三路张同学其他 bert 学习深度学习
Bert模型学习笔记Fromhttps://www.bilibili.com/video/BV1Ey4y1874yemmm讲实话这个视频太简单了，不建议看。可以看看李沐的视频：https://www.bilibili.com/video/BV1PL411M7eQ这篇文章主要是四个部分：bert的整体架构如何做预训练mlm+nsp如何微调bert(没看)代码解析(没看)Bert架构基础架构是Tran
Python数据可视化 Pyecharts 制作 Scatter3D 3D散点图 Mr数据杨 Python 数据可视化数据可视化 python 数据分析 echarts
三维散点图是展示具有三个维度数据的有效工具，通过对数据点在三维空间中的分布进行可视化，可以直观地观察数据间的关系与趋势。借助pyecharts库的Scatter3D类，用户能够快速生成3D散点图，并自定义图表的各项参数，使图表更加符合展示需求。结合强大的视觉映射和交互功能，三维散点图不仅提升了数据分析的精度，还增强了用户与数据之间的互动性。文章目录Scatter3D：3D散点图Demo总结Scat
DeepSeek本地部署教程（Windows操作系统笔记本电脑适用）程序员辣条 AI产品经理产品经理大模型人工智能 DeepSeek Windows AI大模型
最近DeepSeek非常火，你想不想也本地部署，玩转AI呢？一、将DeepSeek部署到自己的电脑有以下好处：1.数据隐私与安全本地存储：所有数据保存在本地，避免第三方服务器存储带来的隐私风险。数据控制：完全掌控数据访问权限，防止未经授权的访问或泄露。2.性能优化低延迟：本地运行减少网络延迟，响应速度更快。资源利用：可根据硬件配置优化性能，充分利用本地计算资源。3.定制化灵活配置：可根据需求调整模
Bert学习笔记缓释多巴胺。大模型相关知识语言模型 bert
一、Bert架构BERT使用了双向的TransformerGPT使用从左到右的单向信息ELMo把单独训练的从左到右及从右到左的LSTM模型进行合并二、Bert预训练任务2.1遮蔽语言模型MLM任务：随机屏蔽（masking）部分输入token，然后只预测那些被屏蔽的token。问题：预训练任务与微调任务不一致原因：在finetuning期间从未看到[MASK]token，预训练和finetunin
DeepSeek安装部署笔记（二）山哥ol 笔记运维 python
Bat批处理文件的编写第五步启动openWebUI的批处理编写1、下面的代码，复制到文本文件，再改扩展名2、这样，在桌面直接双击此文件运行第五步启动openWebUI的批处理编写1、下面的代码，复制到文本文件，再改扩展名@echooffREM关闭回显使界面更简洁setCONDA_ROOT=D:\condasetENV_NAME=openwebuiREM使用’/K’参数保持CMD窗口不关闭，并执行后
【学习笔记5】Linux下cuda、cudnn、pytorch版本对应关系 longii11 linux pytorch 运维
一、cuda和cudnnNVIDIACUDAToolkit（CUDA）为创建高性能GPU加速应用程序提供了一个开发环境。借助CUDA工具包，您可以在GPU加速的嵌入式系统、桌面工作站、企业数据中心、基于云的平台和HPC超级计算机上开发、优化和部署您的应用程序。该工具包包括GPU加速库、调试和优化工具、C/C++编译器以及用于部署应用程序的运行时库。全球的深度学习研究人员和框架开发人员都依赖cuDN
springboot整合rabbitMQ twx95 java-rabbitmq spring boot rabbitmq
安装rabbitMQ虚拟机或者服务器上安装我这里使用的是vm虚拟机做演示第一步：安装docker参考linux安装docker-CSDN博客第二步：拉取rabbitMQ镜像3-management（镜像版本）dockerpullrabbitmq:3-management查看镜像是否拉取成功dockerimages第三步：运行rabbitMQdockerrun\-eRABBITMQ_DEFAULT_
python找色_Python获取图片位置像素色值及判断色值是否存在 weixin_39966941 python找色
#!/usr/bin/python#-*-coding:utf-8-*-fromPILimportImage#涛哥用代码看是那的错https://blog.kydbk.comimg=Image.open("test.png")#获取图片尺寸的大小(600,600)printimg.size#获取图片的格式pngprintimg.format#获取图片的图像类型RGBAprintimg.mode#显
React:Axios、Fetch-Jsonp获取API接口数据今天也很棒棒~ React react.js javascript json
不同模块可登录npm，搜索对应方法有官方文档https://www.npmjs.com/Axios步骤：{/*axios1.npminstallaxios--save安装axios模块2.importaxiosfrom'axios';3.varapi='http://www.phonegap100.com/appapi.php?a=getPortalList&catid=20';//接口后台允许了
Leetcode 刷题笔记1 动态规划part05 平乐君 leetcode 笔记动态规划
开始完全背包不同于01背包，完全背包的特色在于元素可以重复拿取，因此在递归公式和遍历顺序上都有些许不同。leetcode518零钱兑换||在组合方式中所用到的递推公式是dp[j]=dp[j-coins[i]]+dp[j]对于coins[i]>j的情况，forjinrange(coin[i],amount+1)不会执行，即实现dp[i][j]=dp[i-1][j]classSolution:defc
Leetcode 刷题笔记1 动态规划part06 平乐君 leetcode 笔记动态规划
leetcode322零钱兑换由于本题所求为最少零钱数所以递推公式中应该为dp[j]=min(dp[j],dp[j-coin]+1)classSolution:defcoinChange(self,coins:List[int],amount:int)->int:dp=[float('inf')]*(amount+1)dp[0]=0forcoinincoins:forjinrange(coin,a
Leetcode 刷题笔记1 动态规划part04 平乐君 leetcode 笔记动态规划
leetcode最后一块石头的重量||问题转化，把石头问题转化为背包问题，在target容量范围内所能装的最大石头重量classSolution:deflastStoneWeightII(self,stones:List[int])->int:total=sum(stones)target=total//2dp=[0]*(target+1)forstoneinstones:forjinrange(
React基础之useState 青红光硫化黑 react.js javascript 前端
useState是一个ReactHook(函数)，它允许我们向组件添加一个状态变量，从而控制组件的渲染效果import{useState}from"react"//使用useState实现计数器按钮functionApp(){//count是状态变量setcount是修改变量的方法const[count,setCount]=useState(0)//点击事件回调consthandleClick=(
python将pdf转换成word 勘察加熊人 typescript python pdf word
说明：我计划用python，把pdf文件转换成word文件step1:把python环境安装好，然后把helloworld跑起来step2:安装依赖：首先需要安装必要的Python库，在终端中运行，会开始下载依赖包，等待下载完成C:\Users\Administrator>pip--versionpip25.0.1fromC:\Users\Administrator\AppData\Local\P
【五.LangChain技术与应用】【31.LangChain ReAct Agent：反应式智能代理的实现】再见孙悟空_ AI 进阶之旅》langchain LangChain技术 LangChain输出解析器人工智能 langchain官方工具 Agent案例2
一、ReActAgent是啥？为什么说它比「普通AI」聪明？想象一下，你让ChatGPT查快递物流，它可能直接编个假单号糊弄你。但换成ReActAgent，它会先推理（Reasoning）需要调用哪个接口，再行动（Action）查询真实数据——这就是ReAct的核心：让AI学会「动脑子」再动手。举个真实案例（参考官方代码改的）：fromlangchain.agentsimportTool,init
迷你世界脚本计时器接口：MiniTimer 星空露珠笔记数据结构 lua 游戏
计时器接口：MiniTimer彼得兔更新时间:2023-04-2620:24:50具体函数名及描述如下:序号函数名函数描述1isExist(...)判断计时器是否存在2createTimer(...)添加计时器3deleteTimer(...)删除计时器4startBackwardTimer(...)启动倒计时5startForwardTimer(...)启动正向计时6pauseTimer(...
css心跳动画 —Qeyser Html CSS css 前端 java
图标引入CSS代码.icon{animation:bpm1slinear,pulse0.75s1slinearinfinite;}@keyframespulse{from,75%,to{transform:scale(1);}25%{transform:scale(0.9);}50%{transform:scale(1.2);}}@keyframesbpm{from{transform:scale
python求函数最值的方法_python计算波峰波谷值的方法（极值点） weixin_39542742 python求函数最值的方法
python求极值点主要用到scipy库。1.首先可先选择一个函数或者拟合一个函数，这里选择拟合数据：np.polyfitimportpandasaspdimportmatplotlib.pyplotaspltimportnumpyasnpfromscipyimportsignal#滤波等xxx=np.arange(0,1000)yyy=np.sin(xxx*np.pi/180)z1=np.pol
Kotlin 5种单例模式 tangweiguo03051987 Kotlin语法 kotlin 单例模式 javascript
在Kotlin中实现单例模式有多种方法，以下是几种常见的方法：饿汉式饿汉式是最简单的一种实现方式，在类加载时就完成了实例的初始化。//饿汉式objectSingleton1{funprintMessage(){println("===饿汉式")}}懒汉式懒汉式是延迟加载的方式，只有在第一次使用时才创建实例。classSingleton2privateconstructor(){companiono
自己的网页加一个搜索框，调用deepseek的API Lkkkkkkkcy java vue
一切源于一个学习黑马程序员视频的突发奇想在网页悬浮一个搜索按钮，点击可以实现调用deepseek文本模型回答你的问题前端实现前端使用vue实现的首先是整体页面：AIWidget.vue搜索{{item}}暂无搜索结果import{ref,watch}from"vue";import{Search}from"@element-plus/icons-vue";import{ElMessage}from
rhcsa个人学习笔记小峰彩铃学习笔记
一、配置网卡cd/etc/sysconfig/network-scripts/进入网卡文件夹vimifcfg-eth0修改网卡配置ipaddr=172.25.250.10netmask=255.255.255.0gateway=172.25.250.254dns=172.25.250.254systemctlrestartNetworkManagerifdowneth0;关闭网卡ifupeth0;
Linux | 学习笔记 Fomalhaut α PsA Linux知识库
Linux|学习笔记用户管理用户和组管理#查看用户身份[admin@CentOS8~]$idadminuid=1000(admin)gid=1000(admin)组=1000(admin),10(wheel)#切换用户,省略username则切换为root[admin@CentOS8~]$su-username#从命令行创建用户[admin@CentOS8~]$sudouseradduser01#
解决minikube无法获取到baseimage的问题 Unable to find image ‘gcr.io/k8s-minikube/kicbase 202409 如何在5年薪百万 kubernetes 容器云原生
问题Unabletofindimage'gcr.io/k8s-minikube/kicbase:v0.0.44@Unabletofindimage'gcr.io/k8s-minikube/kicbase:v0.0.44@sha256:eb04641328b06c5c4a14f4348470e1046bbcf9c2cbc551486e343d3a49db557e'locallydocker:Erro
rhce第二次笔记 Eoip_zacb 笔记
第二章：时间服务器东八区：UTC+8=CST(北京时间)应用层的时间协议：NTP（网络时间协议）：udp/端口：123Chrony软件：由chronyd（客户端）和chronyc（服务器）两个程序组成chronyd相当于一个守护者，守护进程；chronyc用于监测性能及配置1、软件安装（1）先配置好yum的相关文件#本地源[root@localhost~]#cat/etc/yum.repos.d/
Stable Diffusion模型采样方法与参数配置详解（含步数及画风适配表） Liudef06 Stable Diffusion 人工智能 stable diffusion AI作画
StableDiffusion模型采样方法与参数配置详解（含步数及画风适配表）以下为当前主流采样方法的性能对比及参数配置建议，结合显存占用、生成速度、适用场景等维度分类总结：一、采样方法对比表采样方法推荐步数显存占用生成速度适用画风/场景核心特点DPM++2MKarras20-30高较慢通用型（2D/3D、写实/动漫）细节最优，综合性能强[1]Eulera15-25低快动漫、快速迭代速度快，易崩图
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(