:)年生

二、Face Alignment in Full Pose Range: A 3D Total Solution（3DDFA）

这篇论文是关于人脸对齐的文章，但是在文章中作者也进行了三维人脸重建的任务，而且之后关于人脸重建的论文也大部分都引用了这篇文章，所以来学习一下这篇论文。

1.1阅读时间：2023.4.2-4.10

1.2背景：

在过去的 20 年里，一系列有效的框架被提出。最近，随着级联回归和卷积神经网络的引入，人脸对齐的准确性有了显著提高。然而，大多数现有的方法是为中等姿态设计的，假设偏航角小于 45◦和所有地标可见。当偏航角的范围扩大到 90◦，重大的挑战出现。这些挑战可以从三个主要方面加以区分:分别是建模问题、拟合问题、训练数据不足问题。

建模：当人脸偏离正面视野时，由于自遮挡，一些地标变得不可见。在中等姿态下，可以通过改变脸部轮廓地标的语义位置来解决这一问题，称为地标匹配。然而，在大的姿势，其中一半的脸被遮挡，一些地标不可避免地看不见。

拟合：全姿态面部对齐的另一个挑战来自于从正面到侧面的巨大的外观变化。级联线性回归模型和传统的非线性模型都不够灵活，无法统一覆盖这些复杂的变化，基于卷积神经网络(CNN)的方法在许多应用中显示出比传统方法更好的性能。为了有效的大姿态人脸对齐，需要将CNN与级联回归框架相结合。但现有方法大多采用单一网络完成拟合，这限制了其性能。

数据不足：手动标注大型人脸上的地标是非常繁琐的，因为被遮挡的地标必须“猜测”，这对大多数人来说是不可能的。

1.3使用数据集

1.3.1 300W-LP数据集：

300W_LP是一个包含300个人脸图像的数据集，通过300W数据基础上编辑扩展而来，用于人脸识别和关键点检测的研究。该数据集是在大规模人脸识别数据集LFW和部分人脸关键点检测数据集AFLW的基础上构建而成的。300W_LP数据集包含了多个姿态和表情下的人脸图像，每个图像都标注有68个关键点。这些关键点表示人脸的各个部位，包括眼睛、鼻子、嘴巴等。该数据集还包括了头部姿态、表情和光照等方面的变化，使得该数据集更适合用于人脸识别和关键点检测的研究。300WLP共有数据61225张（还有一半的数据增强：偏转，平移等操作的61225张）图片，其中

AFW:5207
AFW_Flip:5207
HELEN:37676
HELEN_Flip:37676
IBUG:1786
IBUG_Flip:1786
LFPW:16556
LFPW_Flip:16556

数据集参数：
header: 存储文件格式的描述信息。
version: 存储数据集的版本信息。
globals: 存储全局变量的信息。
pt2d: 存储人脸关键点坐标的信息，以68个点的x和y坐标表示。
roi: 存储人脸区域的位置信息，以左上角和右下角的坐标表示。Illum_Para: 存储人脸光照参数的信息。
Color_Para: 存储人脸颜色参数的信息。
Tex_Para: 存储人脸纹理参数的信息。
Shape_Para: 存储人脸形状参数的信息。
Exp_Para: 存储人脸表情参数的信息。
Pose_Para: 存储人脸姿态参数的信息。

示例：

参数：输出结果/shape

Header: b'MATLAB 5.0 MAT-file, Platform: PCWIN64, Created on: Wed Nov 18 15:36:38 2015'

version ：1.0

globals: []

roi (1, 4)

Illum_Para (1, 10) 光照参数包含了10个值，

平行光方向的X轴分量
平行光方向的Y轴分量
平行光方向的Z轴分量
环境光的强度
平行光的强度
平行光和环境光之间的强度比例
反射光强度的比例
高光反射的大小
高光反射的锐度
高光反射的中心位置

Color_Para (1, 7)

Red_Gain: 红色增益，表示红色通道的放大倍数。
Green_Gain: 绿色增益，表示绿色通道的放大倍数。
Blue_Gain: 蓝色增益，表示蓝色通道的放大倍数。
Red_Offset: 红色偏移，表示红色通道的偏移量。
Green_Offset: 绿色偏移，表示绿色通道的偏移量。
Blue_Offset: 蓝色偏移，表示蓝色通道的偏移量。
Gamma: gamma值，用于控制图像的亮度和对比度。

这些参数的作用是用于调整图像的颜色属性，从而使得图像看起来更加真实、自然。例如，通过调整Red_Gain、Green_Gain、Blue_Gain参数，可以改变图像的色彩饱和度和色调；通过调整Red_Offset、Green_Offset、Blue_Offset参数，可以调整图像的亮度和对比度；通过调整Gamma参数，可以改变图像的亮度和色彩层次。

。

Tex_Para: (199, 1)

Shape_Para: (199, 1)

Exp_Para :(29, 1)

pt2d: (2, 68)

Pose_Para: (1, 7) 前三个值（-0.048704468、-0.37336788、-0.24793532）：欧拉角，分别表示绕X、Y、Z轴旋转的角度。后三个值（203.04193、180.1507、-97.495697）：旋转中心，分别表示绕X、Y、Z轴旋转的中心点坐标。最后一个值（0.0012901439）：旋转角速度，表示旋转的速度大小。

1.3.2 300W-LP数据集：

AFLW2000-3D(2000)是AFLW2000-3D是一个基AFLW2000数据集的人脸姿态估计数据集。它包含了2000张人脸图像和每张图像对应的3D姿态参数，用于评估和比较不同的人脸姿态估计算法（本数据集为本文作者所创建）。

AFLW2000数据集是一个人脸对齐数据集，其中包含2000张人脸图像以及每张图像对应的68个关键点坐标。AFLW2000-3D在AFLW2000数据集的基础上，为每张图像提供了更加精细的3D姿态参数，包括旋转角度、旋转中心、以及相机内参等。相关参数：'__header__', '__version__', '__globals__', 'pt2d', 'Illum_Para', 'Color_Para', 'Tex_Para', 'Shape_Para', 'Exp_Para', 'Pose_Para', 'roi', 'pt3d_68'。大部分的参数所代表的的意思与300WLP差不多，其中pt2d代表人脸对齐21个关键点位置，pt3d_68代表三维人脸模型的68个关键点位置。

1.3.3 AFLW数据集：

AFLW 包含21080张姿态变化较大的人脸。每幅图像最多可标注21个可见地标。该数据库非常适合评价大姿态下的人脸对齐性能。

1.4基础知识
1.4.1 级联回归：

公式1：级联回归结构

级联回归是一个迭代优化的过程，每一次迭代都会在前一次迭代的基础上做一些微小的调整，直到最终得到所需的输出。在级联回归中，每一级回归器都会依次学习一些微小的调整，并将这些微调结果传递给下一级回归器。因此，级联回归能够逐步改善模型的输出结果，提高模型的性能。

公式表示的就是级联回归的迭代过程。其中，pk 表示在第 k 次迭代时优化得到的参数值，pk+1 表示在第 k+1 次迭代时的参数值，Regk 表示在第 k 次迭代时的正则化项，Fea(I,pk) 表示在当前参数值下，图像 I 的特征表示，也可以理解为预测结果。在每一次迭代中，我们先根据当前的参数值，计算出预测结果，然后计算损失函数，并在损失函数上加上正则化项的惩罚，得到最终的目标函数。接着使用优化算法（如梯度下降法），在目标函数上沿着负梯度方向更新参数值，使得目标函数下降。这样反复迭代，直到收敛或达到预设的迭代次数，得到最优的参数值。

1.4.2 3dmm：

公式2-3：3DMM主要算法公式

第一个是3dmm的主要内容，第二个公式是3d人脸模型投影到2d平面，具体参数见上一文章。

1.5本文工作

为了解决当偏航角的范围扩大到 90◦出现的问题，本文作者做了如下工作，为了解决自遮挡的挑战，我们认为在大姿态下，拟合3DMM比检测 2D标志更合适。从 3DMM估计的可见性使我们能够只匹配检测到的图像模式的顶点，所以使用3dmm来拟合人脸，实现人脸对齐工作。为了处理大姿态拟合的问题，提出新型级联卷积神经网络作为回归器，引入PNCC和PAF两种输入特征，还提出新的代价函数优化加权参数距离损失。为了处理训练数据不足的问题，作者构建了一个由对二维人脸图像和三维人脸模型组成的人脸数据库。我们进一步阐明了一种人脸剖面方法，在大姿态下合成 60k+训练样本。合成的样本很好地模拟了大姿态下的人脸外观，提高了之前和提出的人脸对齐方法的性能。

1.5.1本文网络结构

图一：本文网络结构

本文的网络结构采用双流CNN网络，输入的是一张2d人脸图像和一个初始的3d人脸参数模型pk ，pk 包含234维参数， 6维位姿参数[q0, q1, q2, q3, t2dx, t2dy]，199 维形状参数 αid 和 29维表达参数αexp ，双流网络上部分输入的是人脸图像和PNCC深度图像，分别都是200*200*3的，CNN网络由5个卷积层4个池化层和一个全连接组成，下半部分的输入图像是人脸图像和锚点数据，是200*200*3的，CNN网络由一个PAC卷积层和3个卷积，3个池化层和一个全连接层组成，最终双流网络的输出经过一个全连接层来更新pk参数，整个网络的输出结果为

公式4：网络结构

整个网络的输入特征满足三个要求：

1、输入是一个平滑的图像

2、输入的特征依赖于CNN输出

3、拟合完成时输入特征要具有判别性。

在人脸对齐中，特征图可以理解为一种表示人脸信息的二维图像数据，它是经过卷积神经网络处理后得到的。特征图的作用是提取图像中的重要特征信息，以供后续的人脸对齐处理使用。而这里所提到的“convolvable property”则是指特征图可以被卷积操作处理，因此它应该是一个二维的平滑地图，反映当前拟合的准确性。

具体来说，每一级的回归模型都会根据当前的输入特征预测出一组参数，这些参数会被用于计算下一个阶段的特征。而这些参数的预测值是基于CNN输出的，因此需要将CNN的输出作为反馈特性传递给回归模型，以便更准确地预测下一个阶段的特征。

输入特征应该包含与人脸姿态、形状等相关的信息，并且这些信息应该足以让回归网络能够准确地预测出地真参数。如果输入特征缺乏这些信息，回归网络可能无法正确地拟合目标，从而导致级联回归无法收敛。

1.5.2 PAF（Pose Adaptive Convolution）【是一种对姿态适应的特征表示方法，通过将人脸的关键点投影到图像上，将图像中关键点之间的方向信息编码到PAF中。PAF的主要作用是在训练阶段将姿态信息引入模型中，以提高模型对姿态变化的鲁棒性和准确性。】

图2：PAF

给定当前模型参数p，我们首先投影3DMM并在图像平面上采样特征锚，得到64 × 64 × 2【解释：当将3DMM模型投影到图像平面上时，模型中的某些点可能会被遮挡而不可见。对于可见的点，它们的投影点会出现在图像上，可以在图像中采样对应的特征点，作为可见点的投影特征锚点。】的投影特征锚V ( p )锚(图4 ( b ) )。其次，在每个特征锚处裁剪d × d面片，并根据其柱坐标将面片拼接成( 64 * d ) × ( 64 * d )面片图(图4 ( c ) )。最后在补丁图上以d为步长进行d × d卷积，生成64 × 64的响应图PAF(图4 ( d ) )。

1.5.3 PNCC（Projected Normalized Coordinate Code）【是一种对人脸形状进行编码的方法，将人脸上每个像素点的位置信息进行归一化处理，并编码为一个向量，用于表示人脸形状的特征。PNCC的主要作用是在重建阶段将人脸形状信息引入模型中，以提高模型对人脸形状的还原能力。】

图3：PNCC

公式5：NCC算法

NCC（Normalized Cross Correlation）是一种用于在3D人脸模型和2D图像之间进行配准的方法。其中S为 3DMM的平均形状。经过归一化处理后，每个顶点的三维坐标唯一分布在[0,0,0]和[1,1,1]之间，可以认为是一个顶点索引，我们称之为归一化坐标码(NCC)(图3(a))。由于NCC有三个通道作为RGB，我们也可以显示NCC作为人脸纹理。在配准过程中，作者使用了人脸的纹理信息来提高匹配的准确性。在文章中提到，NCC是在RGB（红绿蓝）三个通道上计算的，因此可以将NCC作为人脸纹理来显示。这意味着，在完成3D人脸模型和2D图像之间的配准后，可以将NCC的RGB值映射到人脸表面，而在3D模型上显示出人脸的纹理信息。

公式6：PNCC算法

在拟合过程中，以模型参数 pk 为参数，采用 Z-Buffer 对NCC着色的投影3D人脸进行渲染，其中，Z-Buffer(ν， τ)呈现由τ着色的三维网格ν， V3d(p)为投影的三维面。我们调用渲染的图像投影归一化坐标码。然后，PNCC与输入图像进行堆叠，并发送给CNN。

公式理解：PNCC是在将NCC作为纹理贴到3D人脸模型上，并根据视角和相机参数将其转换成2D图像后得到的结果。具体而言，V3d(p)表示3D人脸模型上的每个顶点在2D图像上的投影位置，而NCC则提供了在该位置的纹理信息。Z-Buffer则是用来计算3D人脸模型在投影到2D图像上时每个像素点的深度信息，进而确定每个像素点是否需要被绘制。因此，PNCC可以看作是基于NCC纹理贴图的2D人脸图像，其中每个像素点对应着3D人脸模型上的一个顶点，且带有深度信息的图像。

1.5.4 损失函数

公式7：PDC损失函数

初始参数p0 是固定的，初始化指定。在每次迭代中，CNN的输入是上一次迭代的输出参数p（称为当前参数），CNN的输出是参数更新量∆p，即CNN学习到的从当前参数p到最佳拟合参数pg的差异。然后，使用当前参数和∆p来更新参数，即pnew = p + ∆p。因此，在下一次迭代中，pnew 就变成了下一轮迭代的p0 。这样，初始参数p0 在每次迭代中都会变化。

PDC传统上用于基于回归的模型拟合。但 p 中不同的尺寸对合成三维面有不同的影响。例如，在偏移量相同的情况下，偏航角会带来比形状参数更大的对准误差，而PDC对形状参数进行了同等的优化，导致效果不佳。

公式8：VDC损失函数

V(·)为脸型的构造和投影，为 3dmm弱投影公式。我们称之为顶点距离代价(VDC)。与 PDC相比，VDC通过显式考虑参数语义，较好地模拟了拟合误差。然而，VDC本身不是凸的，优化并不保证收敛于真实人脸参数pg 。此外，我们观察到VDC呈现出病态曲率，因为位姿参数的方向总是比 PCA系数呈现出更高的曲率。因此，采用梯度下降优化VDC时，由于存在“之字形”问题，收敛速度非常缓慢。二阶优化是处理病理曲率的首选方法，但它们昂贵且难以在GPU上实现。

公式9：WPDC损失函数

这篇论文中的损失函数 Ewpdc 是用于训练网络的。具体来说，它是由两个部分组成的。第一个部分是 (∆p−(pg −p0 ))，表示实际的变换与期望的变换之间的误差。其中，∆p 表示网络预测的变换，(pg −p0 ) 表示目标变换，pg 表示全局的期望变换，p0 表示当前的估计变换。第二个部分是 diag(w)，表示权重对误差的影响。在这个论文中，作者使用了一个基于距离的权重 w，以使更接近目标的点有更高的权重，而更远离目标的点则具有更小的权重。两个部分相乘并相加即可得到损失函数 Ewpdc。损失函数的目标是尽可能地减小实际变换和期望变换之间的误差，以使得网络能够更准确地预测出人脸姿态。

这样的设计可以更好地处理一些参数对结果影响较小的情况，避免因为一些细节差异而导致模型过度拟合。同时，该设计也可以更好地利用真实参数的信息，提高模型的精度和鲁棒性。在这篇论文中，公式中的Z表示权重矩阵w的最大值，具体来说，它是对于每个元素的绝对值的最大值，即：Z = max(|w(i,j)|)

这个Z用于对损失函数进行正则化，使得模型对于参数的误差的惩罚更加平衡和合理。

公式10：OWPDC损失函数

其中w为权值向量，∆p 为CNN输出，pc = p0 +∆p 为当前预测参数，0 和1分别为 0和1 向量，<_元素是小于的。在公式10中，通过在当前参数 pc 上添加一个加权参数更新 diag(w)( pg −pc )，我们希望新面孔在有限更新的情况下更接近地面真实面孔。请注意，λ||diag(w) (pg −pc )||2∗是OWPDC的梯度的平方和，它模拟了需要调整多少CNN权值来预测每个参数。我们使用这个惩罚项来选择最有利于拟合且最容易学习的参数。w的范围被限制为[0,1]，以确保参数被优化到 pg 。显然，当 λ 设置为 0 时，将会有一个简单的解决方案，w = 1, OWPDC会恶化到PDC。

1.6实验结果

1.6.1 NME比对算法

公式11：NME算法

N表示测试样本的数量，xi表示算法预测的第i个样本的人脸关键点坐标，xi*表示第i个样本的真实关键点坐标，d表示归一化系数。NME越小，代表预测结果与真实结果的差距越小，模型的性能越好。

1.6.2单独对PAF和PNCC做评估

1.6.2 OWPDC的权值:反映了参数的优先级

1.6.3 与其他算法进行对比

1.7代码解析

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
【安装环境】配置MMTracking环境 xuanyu22 安装环境机器学习神经网络深度学习 python
版本v0.14.0安装torchnumpy的版本不能太高，否则后面安装时会发生冲突。先安装numpy，因为pytorch的安装会自动配置高版本numpy。condainstallnumpy=1.21.5mmtracking支持的torch版本有限，需要找到合适的condainstallpytorch==1.11.0torchvision==0.12.0cudatoolkit=10.2-cpytor
Python(PyTorch)和MATLAB及Rust和C++结构相似度指数测量导图亚图跨际 Python 交叉知识算法量化检查图像压缩质量低分辨率多光谱峰值信噪比端到端优化图像压缩手术机器人三维实景实时可微分渲染重建三维可视化
要点量化检查图像压缩质量低分辨率多光谱和高分辨率图像实现超分辨率分析图像质量图像索引/多尺度结构相似度指数和光谱角映射器及视觉信息保真度多种指标峰值信噪比和结构相似度指数测量结构相似性图像分类PNG和JPEG图像相似性近似算法图像压缩，视频压缩、端到端优化图像压缩、神经图像压缩、GPU变速图像压缩手术机器人深度估计算法重建三维可视化推理图像超分辨率算法模型三维实景实时可微分渲染算法MATLAB结构
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Pyorch中 nn.Conv1d 与 nn.Linear 的区别迪三 #NN_Layer 神经网络
即一维卷积层和全联接层的区别nn.Conv1d和nn.Linear都是PyTorch中的层，它们用于不同的目的，主要区别在于它们处理输入数据的方式和执行的操作类型。nn.Conv1d通过应用滑动过滤器来捕捉序列数据中的局部模式，适用于处理具有时间或序列结构的数据。nn.Linear通过将每个输入与每个输出相连接，捕捉全局关系，适用于将输入数据作为整体处理的任务。1.维度与输入nn.Conv1d（一
图片中的上采样，下采样和通道融合(up-sample, down-sample, channel confusion) 迪三 #图像处理_PyTorch 计算机视觉深度学习人工智能
前言以conv2d为例（即图片），Pytorch中输入的数据格式为tensor，格式为:[N,C,W,H,W]第一维N.代表图片个数，类似一个batch里面有N张图片第二维C.代表通道数，在模型中输入如果为彩色，常用RGB三色图，那么就是3维，即C=3。如果是黑白的，即灰度图，那么只有一个通道，即C=1第三维H.代表图片的高度，H的数量是图片像素的列数第四维W.代表图片的宽度，W的数量是图片像素的
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的