EKO_KL

齐次坐标概念&&透视投影变换推导

透视投影是3D固定流水线的重要组成部分，是将相机空间中的点从视锥体(frustum)变换到规则观察体(Canonical View Volume)中，待裁剪完毕后进行透视除法的行为。在算法中它是通过透视矩阵乘法和透视除法两步完成的。

透视投影变换是令很多刚刚进入3D图形领域的开发人员感到迷惑乃至神秘的一个图形技术。其中的理解困难在于步骤繁琐，对一些基础知识过分依赖，一旦对它们中的任何地方感到陌生，立刻导致理解停止不前。

没错，主流的3D APIs如OpenGL、D3D的确把具体的透视投影细节封装起来，比如

gluPerspective(…)就可以根据输入生成一个透视投影矩阵。而且在大多数情况下不需要了解具体的****算法也可以完成任务。但是你不觉得，如果想要成为一个职业的图形程序员或游戏开发者，就应该真正降伏透视投影这个家伙么？我们先从必需的基础知识着手，一步一步深入下去（这些知识在很多地方可以单独找到，但我从来没有在同一个地方全部找到，但是你现在找到了）。

我们首先介绍两个必须掌握的知识。有了它们，我们才不至于在理解透视投影变换的过程中迷失方向（这里会使用到向量几何、矩阵的部分知识，如果你对此不是很熟悉，可以参考

可以找到一组坐标(v1,v2,v3)，使得

v = v1 a + v2 b + v3 c （1）

而对于一个点p，则可以找到一组坐标（p1,p2,p3），使得

p - o = p1 a + p2 b + p3 c （2）

从上面对向量和点的表达，我们可以看出为了在坐标系中表示一个点（如p），我们把点的位置看作是对这个基的原点o所进行的一个位移，即一个向量--p - o（有的书中把这样的向量叫做位置向量--起始于坐标原点的特殊向量），我们在表达这个向量的同时用等价的方式表达出了点p:

p = o + p1 a + p2 b + p3 c (3)

(1)(3)是坐标系下表达一个向量和点的不同表达方式。这里可以看出，虽然都是用代数分量的形式表达向量和点，但表达一个点比一个向量需要额外的信息。如果我写出一个代数分量表达(1, 4, 7)，谁知道它是个向量还是个点！

我们现在把（1）（3）写成矩阵的形式：

这里(a,b,c,o)是坐标基矩阵，右边的列向量分别是向量v和点p在基下的坐标。这样，向量和点在同一个基下就有了不同的表达：3D向量的第4个代数分量是0，而3D点的第4个代数分量是1。像这种这种用4个代数分量表示3D几何概念的方式是一种齐次坐标表示。

"齐次坐标表示是计算机图形学的重要手段之一，它既能够用来明确区分向量和点，同时也更易用于进行仿射（线性）几何变换。"-- F.S. Hill, JR

这样，上面的(1, 4, 7)如果写成（1,4,7,0），它就是个向量；如果是(1,4,7,1)，它就是个点。

下面是如何在普通坐标(Ordinary Coordinate)和齐次坐标(Homogeneous Coordinate)之间进行转换：

从普通坐标转换成齐次坐标时，

如果(x,y,z)是个点，则变为(x,y,z,1);

如果(x,y,z)是个向量，则变为(x,y,z,0)

从齐次坐标转换成普通坐标时，

如果是(x,y,z,1)，则知道它是个点，变成(x,y,z);

如果是(x,y,z,0)，则知道它是个向量，仍然变成(x,y,z)

以上是通过齐次坐标来区分向量和点的方式。从中可以思考得知，对于平移T、旋转R、缩放S这3个最常见的仿射变换，平移变换只对于点才有意义，因为普通向量没有位置概念，只有大小和方向，这可以通过下面的式子清楚地看出：

而旋转和缩放对于向量和点都有意义，你可以用类似上面齐次表示来检测。从中可以看出，齐次坐标用于仿射变换非常方便。

此外，对于一个普通坐标的点P=(Px, Py, Pz)，有对应的一族齐次坐标(wPx, wPy, wPz, w)，其中w不等于零。比如，P(1, 4, 7)的齐次坐标有(1, 4, 7, 1)、（2, 8, 14, 2）、（-0.1, -0.4, -0.7, -0.1）等等。因此，如果把一个点从普通坐标变成齐次坐标，给x,y,z乘上同一个非零数w，然后增加第4个分量w；如果把一个齐次坐标转换成普通坐标，把前三个坐标同时除以第4个坐标，然后去掉第4个分量。

由于齐次坐标使用了4个分量来表达3D概念，使得平移变换可以使用矩阵进行，从而如F.S. Hill, JR所说，仿射（线性）变换的进行更加方便。由于图形硬件已经普遍地支持齐次坐标与矩阵乘法，因此更加促进了齐次坐标使用，使得它似乎成为图形学中的一个标准。

简单的线性插值

这是在图形学中普遍使用的基本技巧，我们在很多地方都会用到，比如2D位图的放大、缩小，Tweening变换，以及我们即将看到的透视投影变换等等。基本思想是：给一个x属于[a, b]，找到y属于[c, d]，使得x与a的距离比上ab长度所得到的比例，等于y与c的距离比上cd长度所得到的比例，用数学表达式描述很容易理解：

这样，从a到b的每一个点都与c到d上的唯一一个点对应。有一个x，就可以求得一个y。

此外，如果x不在[a, b]内，比如x < a或者x > b，则得到的y也是符合y < c或者y > d，比例仍然不变，插值同样适用。

透视投影变换

好，有了上面两个理论知识，我们开始分析这次的主角--透视投影变换。这里我们选择OpenGL的透视投影变换进行分析，其他的APIs会存在一些差异，但主体思想是相似的，可以类似地推导。经过相机矩阵的变换，顶点被变换到了相机空间。这个时候的多边形也许会被视锥体裁剪，但在这个不规则的体中进行裁剪并非那么容易的事情，所以经过图形学前辈们的精心分析，裁剪被安排到规则观察体(Canonical View Volume, CVV)中进行，CVV是一个正方体，x, y, z的范围都是[-1，1]，多边形裁剪就是用这个规则体完成的。所以，事实上是

透视投影变换由两步组成：

1）用透视变换矩阵把顶点从视锥体中变换到裁剪空间的CVV中。

2） CVV裁剪完成后进行透视除法（一会进行解释）。

我们一步一步来，我们先从一个方向考察投影关系。

上图是右手坐标系中顶点在相机空间中的情形。设P(x,z)是经过相机变换之后的点，视锥体由eye--眼睛位置，np--近裁剪平面，fp--远裁剪平面组成。N是眼睛到近裁剪平面的距离，F是眼睛到远裁剪平面的距离。投影面可以选择任何平行于近裁剪平面的平面，这里我们选择近裁剪平面作为投影平面。设P"(x",z")是投影之后的点，则有z" = -N。通过相似三角形性质，我们有关系：

同理，有

这样，我们便得到了P投影后的点P"

从上面可以看出，投影的结果z"始终等于-N，在投影面上。实际上，z"对于投影后的P"已经没有意义了，这个信息点已经没用了。但对于3D图形管线来说，为了便于进行后面的片元操作，例如z缓冲消隐算法，有必要把投影之前的z保存下来，方便后面使用。因此，我们利用这个没用的信息点存储z，处理成：

这个形式最大化地使用了3个信息点，达到了最原始的投影变换的目的，但是它太直白了，有一点蛮干的意味，我感觉我们最终的结果不应该是它，你说呢？我们开始结合CVV进行思考，把它写得在数学上更优雅一致，更易于程序处理。假设能够把上面写成这个形式：

那么我们就可以非常方便的用矩阵以及齐次坐标理论来表达投影变换：

其中

哈，看到了齐次坐标的使用，这对于你来说已经不陌生了吧？这个新的形式不仅达到了上面原始投影变换的目的，而且使用了齐次坐标理论，使得处理更加规范化。注意在把变成的一步我们是使用齐次坐标变普通坐标的规则完成的。这一步在透视投影过程中称为透视除法（Perspective Division），这是透视投影变换的第2步，经过这一步，就丢弃了原始的z值（得到了CVV中对应的z值，后面解释），顶点才算完成了投影。而在这两步之间的就是CVV裁剪过程，所以裁剪空间使用的是齐次坐标，主要原因在于透视除法会损失一些必要的信息（如原始z，第4个-z保留的）从而使裁剪变得更加难以处理，这里我们不讨论CVV裁剪的细节，只关注透视投影变换的两步。

矩阵

就是我们投影矩阵的第一个版本。你一定会问为什么要把z写成

有两个原因：

1） P"的3个代数分量统一地除以分母-z，易于使用齐次坐标变为普通坐标来完成，使得处理更加一致、高效。

2）后面的CVV是一个x,y,z的范围都为[-1，1]的规则体，便于进行多边形裁剪。而我们可以适当的选择系数a和b，使得这个式子在z = -N的时候值为-1，而在z = -F的时候值为1，从而在z方向上构建CVV。

接下来我们就求出a和b：

这样我们就得到了透视投影矩阵的第一个版本：

使用这个版本的透视投影矩阵可以从z方向上构建CVV，但是x和y方向仍然没有限制在[-1,1]中，我们的透视投影矩阵的下一个版本就要解决这个问题。

为了能在x和y方向把顶点从Frustum情形变成CVV情形，我们开始对x和y进行处理。先来观察我们目前得到的最终变换结果：

我们知道-Nx / z的有效范围是投影平面的左边界值（记为left）和右边界值（记为right），即[left, right]，-Ny / z则为[bottom, top]。而现在我们想把-Nx / z属于[left, right]映射到x属于[-1, 1]中，-Ny / z属于[bottom, top]映射到y属于[-1, 1]中。你想到了什么？哈，就是我们简单的线性插值，你都已经掌握了！我们解决掉它：

则我们得到了最终的投影点：

下面要做的就是从这个新形式出发反推出下一个版本的透视投影矩阵。注意到是经过透视除法的形式，而P"只变化了x和y分量的形式，az+b和-z是不变的，则我们做透视除法的逆处理--给P"每个分量乘上-z，得到

而这个结果又是这么来的：

则我们最终得到：

M就是最终的透视变换矩阵。相机空间中的顶点，如果在视锥体中，则变换后就在CVV中。如果在视锥体外，变换后就在CVV外。而CVV本身的规则性对于多边形的裁剪很有利。OpenGL在构建透视投影矩阵的时候就使用了M的形式。注意到M的最后一行不是(0 0 0 1)而是(0 0 -1 0)，因此可以看出透视变换不是一种仿射变换，它是非线性的。另外一点你可能已经想到，对于投影面来说，它的宽和高大多数情况下不同，即宽高比不为1，比如640/480。而CVV的宽高是相同的，即宽高比永远是1。这就造成了多边形的失真现象，比如一个投影面上的正方形在CVV的面上可能变成了一个长方形。解决这个问题的方法就是在对多变形进行透视变换、裁剪、透视除法之后，在归一化的设备坐标(Normalized Device Coordinates)上进行的视口(viewport)变换中进行校正，它会把归一化的顶点之间按照和投影面上相同的比例变换到视口中，从而解除透视投影变换带来的失真现象。进行校正前提就是要使投影平面的宽高比和视口的宽高比相同。

便利的投影矩阵生成函数

3D APIs都提供了诸如gluPerspective(fov, aspect, near, far)或者D3DXMatrixPerspectiveFovLH(pOut, fovY, Aspect, zn, zf)这样的函数为用户提供快捷的透视矩阵生成方法。我们还是用OpenGL的相应方法来分析它是如何运作的。

gluPerspective(fov, aspect, near, far)

fov即视野，是视锥体在xz平面或者yz平面的开角角度，具体哪个平面都可以。OpenGL和D3D都使用yz平面。

aspect即投影平面的宽高比。

near是近裁剪平面的距离

far是远裁剪平面的距离。

上图中左边是在xz平面计算视锥体，右边是在yz平面计算视锥体。可以看到左边的第3步top = right / aspect使用了除法（图形程序员讨厌的东西），而右边第3步right = top x aspect使用了乘法，这也许就是为什么图形APIs采用yz平面的原因吧！

下篇

原文地址：http://www.alchemy3d.cn/blog/post/5.html

在上一篇文章中我们讨论了透视投影变换的原理，分析了OpenGL所使用的透视投影矩阵的生成方法。正如我们所说，不同的图形API因为左右手坐标系、行向量列向量矩阵以及变换范围等等的不同导致了矩阵的差异，可以有几十个不同的透视投影矩阵，但它们的原理大同小异。这次我们准备讨论一下Direct3D（以下简称D3D）以及J2ME平台上的JSR184（M3G）（以下简称M3G）的透视投影矩阵，主要出于以下几个目的：

（1）我们在写图形引擎的时候需要采用不同的图形API实现，当前主要是OpenGL和D3D。虽然二者的推导极为相似，但D3D的自身特点导致了一些地方仍然需要澄清。

（2） DirectX SDK的手册中有关于透视投影矩阵的一些说明，但并不详细，甚至有一些错误，从而使初学者理解起来变得困难，而这正是本文写作的目的。

（3） M3G是J2ME平台上的3D开发包，采用了OpenGL作为底层标准进行封装。它的透视投影矩阵使用OpenGL的环境但又进行了简化，值得一提。

本文努力让读者清楚地了解D3D与M3G透视投影矩阵的原理，从而能够知道它与OpenGL的一些差别，为构建跨API的图形引擎打好基础。需要指出的一点是为了完全理解本文的内容，请读者先理解上一篇文章《深入探索透视投影变换》的内容，因为OpenGL和它们的透视投影矩阵的原理非常相似，因此这里不会像上一篇文章从基础知识讲起，而是对比它们的差异来推导变换矩阵。我们开始！

OpenGL与D3D的基本差异

前面提到，不同API的基本差异导致了最终变换矩阵的不同，而导致OpenGL和D3D的透视投影矩阵不同的原因有以下几个：

（1） OpenGL默认使用右手坐标系，而D3D 默认使用左手坐标系。

（2） OpenGL使用列向量矩阵乘法而D3D使用行向量矩阵乘法。

（3） OpenGL的CVV的Z范围是[-1, 1]，D3D的CVV的Z范围是[0, 1]。

以上这些差异导致了最终OpenGL和D3D的透视投影矩阵的不同。

D3D的透视投影矩阵推导

我们先来看最最基本的透视关系图（上一篇文章开始的时候使用的图）：

这里我们考察的是xz平面上的关系，yz平面上的关系同理。这里o是相机位置。np是近裁剪平面，也是投影平面，N是它到相机的距离。fp是远裁剪平面，F是它到相机的位置。p是需要投影的点，p"是投影之后的点。根据相似三角形定理，我们有

则有

注意到OpenGL使用右手坐标系，因此应该使用-N（请参考上一篇文章的这一步），而D3D使用左手坐标系，因此使用N，这是二者的不同点之一。这样，我们得到投影之后的点

第三个信息点是变换之后的z在投影平面上的位置，也就是N，它已经没用了，我们把p"写成

从而用第三个没用信息点它来存储z（如果读者对这一点不太了解，请参考上一篇文章）。接下来我们求出a和b，从而在z方向上构建CVV。请注意这里是OpenGL和D3D的另一个不同点，OpenGL的CVV的z范围是[-1, 1]，而D3D的CVV的z范围是[0, 1]。也就是说，D3D 中在近裁剪平面上的点投影之后的点会处于CVV的z=0平面上，而在远裁剪平面上的点投影之后的点会在CVV的z=1平面上。这样我们的计算方程就是

从而我们得到了透视投影矩阵的第一个版本

即

这个时候第三个分量变换到CVV情形了，CVV的z范围是[0,1]。接下来根据上一篇文章所讲到的，我们要把前两个分量变成CVV情形，CVV的x和y范围是[-1, 1]，如下图所示：

使用线性插值，我们有：

这里left和right是投影平面的左右范围，top和bottom是投影平面的上下范围。xcvv和ycvv是我们需要算出的在CVV情形中的x和y，也就是我们要计算出的结果。但在算出它们之前，我们先把上面的式子写成：

这里有一个需要注意的地方，如果投影平面在x方向上居中，则

那么第一个式子就可以销掉等号两边的1/2，写成

同理，如果投影平面在y方向上居中，则第二个式子可以写成

则我们现在分两种情况讨论：

（1）投影平面的中心和x-y平面的中心重合（在x和y方向上都居中）

（2）一般情况

我们分别讨论：

（1）特殊情况方程

这组是特殊情况，方程比较简单，但也是使用频率最高的方式（这是D3DXMatrixPerspectiveLH、D3DXMatrixPerspectiveRH、D3DXMatrixPerspectiveFovLH、D3DXMatrixPerspectiveFovRH四个方法所使用的情况）。我们导出它：

则我们反推出透视投影矩阵：

其中

而r-l和t-b可以分别看作是投影平面的宽w和高h。最后那个矩阵就是D3D的透视投影矩阵之一。另外呢，如果我们不知道right、left、top以及bottom这几个参量，也可以根据视野（FOV - Field Of View）参量来求得。下面是两个平面的视野关系图：

其中，两个fov分别是在x-z以及y-z平面上的视野。如果只给了一个视野，也可以通过投影平面的宽高比计算出来：

用一个视野算出w或者h，然后用宽高比算出h或者w。

（2）一般情况的方程

这组方程比较繁琐，但更具一般性（和OpenGL一般矩阵的推导一致，这也是D3DXMatrixPerspectiveOffCenterLH和D3DXMatrixPerspectiveOffCenterRH两个方法所使用的情况）。我们导出它：

我们继续反推出透视投影矩阵：

其中

最后那个矩阵就是D3D的一般透视投影矩阵。

好了，目前为止，我们已经导出了D3D的两个透视投影矩阵。下面我把上一篇导出的OpenGL的透视投影矩阵写出来，大家可以拿它和刚刚导出的D3D的一般性透视投影矩阵做一个对比。

如果仔细观察，可以发现二者在元素的布局上是一个转置的关系，这个就是由它们使用的左右手坐标系以及使用的行列矩阵的差异造成的。而另外在一些元素的细节上也存在着差异，这是由于D3D的CVV的z范围不同造成的。可见在原理相同的情况下，细微的环境差异可以造成非常大的变化，而这就是透视投影矩阵存在诸多不同版本的原因。一般情况的透视投影矩阵也可以使用视野方式来定义，方法和特殊情况相同。

M3G的透视投影矩阵

M3G是对OpenGL进行的一个封装，它的透视投影变换矩阵被放到了类Camera里面。因为它封装了OpenGL，因此环境和OpenGL相同：右手坐标系、列向量乘法、CVV范围[-1， 1]。它唯一和OpenGL有些差异的地方就在于它只使用投影平面的中心和x-y平面的中心重合（在x和y方向上都居中）的情况（就是我们上面D3D的第一种特殊情况）。我们用OpenGL透视投影矩阵最终版本来说明（再次提醒，如果读者对此感到迷惑，请参考第一篇文章）：

上面是OpenGL透视投影矩阵的最终版本，也是一般性版本，我们要把它变成特殊性，版本，非常简单，和上面D3D的特殊情况一样，我们从对x和y进行插值的那一步来看：

和D3D的第一种情况一样，销掉两边的1/2，得到：

则我们反推出透视投影矩阵：

最右边那个矩阵就是M3G的透视投影矩阵。仍然可以通过视野参数来设置透视投影矩阵，这里请读者自行推导，方法与上面D3D的完全相同。

目标检测YOLO实战应用案例100讲-基于深度学习的自动驾驶目标检测算法研究（续）林聪木目标检测 YOLO 深度学习
目录基于双蓝图卷积的轻量化自动驾驶目标检测算法5.1引言5.2DarkNet53网络冗余性分析5.3双蓝图卷积网络5.4实验结果及分析基于深度学习的自动驾驶目标检测算法研究与应用传统的目标检测算法目标检测基线算法性能对比与选择相关理论和算法基础2.1引言2.2人工神经网络2.3FCOS目标检测算法2.4复杂交通场景下的目标检测难点与FCOS改进方案基于FCOS的目标检测算法改进3.1引言3.2Re
纹理贴图算法研究论文综述点云SLAM 算法图形图像处理算法纹理贴图计算机图形学计算机视觉人工智能虚拟现实（VR）纹理贴图算法综述
纹理贴图（TextureMapping）是计算机图形学和计算机视觉中的核心技术，广泛应用于三维重建、游戏渲染、虚拟现实（VR）、增强现实（AR）等领域。对其算法的研究涵盖了纹理生成、映射、缝合、优化等多个方面。1.引言纹理贴图是指将二维图像纹理映射到三维几何表面上，以增强模型的视觉真实感。传统方法主要关注静态几何模型上的纹理生成与映射，而近年来，随着多视角图像重建、RGB-D扫描、神经渲染的发展，
机器人工程专业毕设选题推荐
文章目录1前言2如何选题3选题方向2.1嵌入式开发方向2.2物联网方向2.3移动通信方向2.4人工智能方向2.5算法研究方向2.6移动应用开发方向2.7网络通信方向3.4学长作品展示4最后1前言近期不少学弟学妹询问学长关于电子信息工程专业相关的毕设选题，学长特意写下这篇文章以作回应！以下是学长亲手整理的物联网相关的毕业设计选题，都是经过学长精心审核的题目，适合作为毕设，难度不高，工作量达标，对毕设
FP16、BF16、INT8、INT4精度模型加载所需显存以及硬件适配的分析 herosunly 大模型精度 BF16 硬件适配
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了FP16、INT8、INT4精度模型加载占用显存大小的分析，希望对学习大
搜索领域知识图谱的知识推理算法研究搜索引擎技术知识图谱算法人工智能 ai
搜索领域知识图谱的知识推理算法研究关键词：知识图谱、知识推理、搜索算法、图神经网络、路径推理、规则推理、表示学习摘要：本文深入探讨搜索领域中知识图谱的知识推理算法。我们将从知识图谱的基本概念出发，分析不同类型的知识推理算法原理，包括基于规则的推理、基于表示的推理和基于路径的推理。通过实际案例和代码实现，展示这些算法如何提升搜索效果，最后讨论该领域的未来发展趋势和挑战。背景介绍目的和范围本文旨在系统
点云从入门到精通技术详解100篇-点云滤波算法及单木信息提取格图素书人工智能
目录知识储备点云滤波算法及单木信息提取点云条件滤波单木信息提取1.点云预处理2.点云密度计算3.密度阈值筛选4.骨架提取5.骨架细化优化方向前言国内外研究现状激光雷达研究现状点云数据的滤波算法研究现状单木分割应用现状LiDAR工作原理与点云数据的组成2.1LiDAR系统的内部结构2.1.1激光测距单元2.1.2光学机械扫描单元2.1.3惯性导航系统INS2.1.4动态差分GPS2.2定位原理2.3
室内定位论文集-20241011期程序员石磊室内定位论文集基于深度学习的室内定位室内定位
QLOC：基于量子指纹的大规模定位实用算法研究问题当前的定位技术在处理涉及大量设备的大型部署时往往存在不准确和低效的问题。方法该研究引入了一种新颖的量子指纹基算法，称为QLOC，旨在为广泛的室内环境提供精确的定位服务，并尽量减少计算需求。创新点设计了一种高效的量子算法，在设备数量增加的情况下能很好地扩展。通过严格测试与真实世界场景和基准对比验证了所提方案的有效性。结论QLOC代表了一个重要的进展，
北斗导航｜基于改进小龙虾优化算法的GPS接收机自主完好性监测算法研究北斗猿卫星导航算法 matlab
详细介绍基于改进小龙虾优化算法（COA）的GPS接收机自主完好性监测算法的原理、公式和MATLAB实现。主要内容如下：RAIM基础原理与问题定义：介绍最小二乘残差法的数学模型，包括伪距观测方程、故障检测统计量和故障识别方法。改进小龙虾优化算法设计：详细说明COA的三种行为模式及其数学表述，以及三种改进策略（非线性温度更新、自适应视野调整、混合变异机制）。融合改进COA的RAIM算法：阐述种群初始化
python深度学习毕业设计项目选题汇总 kooerr 毕业设计 python 毕设
文章目录1前言1.1选题注意事项1.1.1难度怎么把控？1.1.2题目名称怎么取？1.2开题选题推荐1.2.1起因1.2.2核心-如何避坑(重中之重)1.2.3怎么办呢？2选题概览3项目概览题目1:图像隐写算法研究与实现题目2:Django股价预测可视化系统题目3:大数据招聘数据可视化系统题目4:深度学习车道线检测题目5:深度学习交通车流量计数系统题目6:深度学习遮挡下的人脸识别题目7:深度学习照
探索算法秘境：量子随机游走算法及其在图论问题中的创新应用
目录编辑一、量子随机游走算法的起源与原理二、量子随机游走算法在图论问题中的创新应用三、量子随机游走算法的优势与挑战四、结语在算法研究的浩瀚星空中，总有一些领域如同遥远星系，闪烁着神秘而诱人的光芒。今天，我们将一同深入这片算法秘境，探索一个相对偏僻但极具潜力的算法——量子随机游走算法（QuantumRandomWalk,QRW），并揭示它在图论问题中的创新应用。一、量子随机游走算法的起源与原理量子随
AI人工智能在自动驾驶的路径规划算法研究 AI大模型应用工坊 AI大模型开发实战人工智能自动驾驶算法 ai
AI人工智能在自动驾驶的路径规划算法研究关键词：AI人工智能、自动驾驶、路径规划算法、环境感知、智能决策摘要：本文聚焦于AI人工智能在自动驾驶路径规划算法方面的研究。首先介绍了研究的背景和意义，阐述了自动驾驶路径规划的基本概念和重要性。接着详细探讨了核心概念，包括路径规划的原理、架构以及与其他自动驾驶模块的联系，并通过Mermaid流程图进行直观展示。对多种核心路径规划算法的原理进行了深入剖析，使
李晓梅老师在并行算法领域太厉害了，为什么没有评院士？好好学习啊天天向上算法
李晓梅老师是我国数值并行算法研究的开拓者之一。她主持了银河-I、银河-II巨型计算机应用软件的研制与开发，首次在我国建立了“并行线性代数库”、“并行特征值特征向量库”、“并行快速变换库”，研制了我国第一个“中期数值天气预报多任务并行软件系统”，在我国首次建立起向量地震数据处理软件系统等。她为银河-I/银河-II超级计算机研制和数值天气预报、核模拟、石油勘探等领域的向量化应用软件研制，及我国并行计算
文生图模型的dev、fast、full版本的区别 Liudef06小白 AI作画
在文生图模型领域，StableDiffusion的dev、fast、full版本分别对应不同的技术定位和应用场景，其核心区别体现在功能全面性、运行效率及硬件适配性上。以下是具体对比分析：1.Dev版本（开发者版）核心定位：面向算法研究者与深度定制开发者，强调灵活性与可扩展性。技术特性：开源架构：提供完整的模型代码库（如基于PyTorch的实现），允许用户修改网络结构、调整超参数（如学习率、扩散步数
经典算法研究（1）：SIFT算法1 乔qiao 图像处理
作者：qxl邮箱：[email protected]系列文章链接一、经典算法研究（1）：SIFT算法1二、经典算法研究（1）：SIFT算法2三、文章目录系列文章链接前言一、Sift算法原理介绍1.0基础概念高斯金字塔八度为什么要构建高斯金字塔？高斯金字塔构建步骤如何描述尺度空间？构建差分高斯金字塔尺度空间的连续性下一个八度的第一幅图像如何确定前言学习sift算法记录一、Sift算法原理介绍尺度不变
深度强化学习实战：玩转 Atari 游戏谷雪_658 游戏 python 开发语言
在人工智能技术蓬勃发展的当下，深度强化学习凭借其在复杂决策场景中的出色表现，成为众多研究人员和开发者关注的焦点。Atari游戏系列以其丰富的游戏环境和多样化的任务设定，成为深度强化学习算法研究与实践的经典测试平台。通过在Atari游戏中应用深度强化学习算法，不仅能够深入理解强化学习的核心原理，还能探索其在实际场景中的应用潜力。本文将带领读者从零开始，通过实战操作，掌握使用深度强化学习算法玩转Ata
乾元通渠道商中标西藏2024年应急装备采购配置项目爱研究的小梁智能路由器信息与通信
近日，乾元通渠道商中标西藏2024年应急装备采购配置项目（应急通信车替换升级设备及多链路聚合设备），乾元通作为设备厂家，为项目提供通信指挥类装备（多链路聚合设备）QYT-X1。青岛乾元通数码科技有限公司作为国家应急产业企业，深耕于数据调度算法研究，参与了多项国家及省部级应急救灾通讯保障项目，致力于解决在地震灾害、塌方事故等自然灾害现场，快速组建可靠网络需求。设备采用多链路聚合技术，具有4G/5G、
科研学习论文解读——面向电商内容安全风险管控的协同过滤推荐算法研究(1) 2401_84296945 学习安全推荐算法
面向电商内容安全风险管控的协同过滤推荐算法研究-中国知网(cnki.net)")面向电商内容安全风险管控的协同过滤推荐算法研究*摘要：**[目的/意义]随着电商平台商家入驻要求降低以及商品上线审核流程简化，内容安全风险问题成为协同过滤推荐算法伦理审查的核心问题之一。[方法/过程]本文将内容安全风险问题纳入用户协同过滤推荐算法的优化过程，提出一种改进的推荐算法。首先，采用混合研究方法对内容安全风险商
AIGC提示(prompt)飞升方法：走向专家之路 herosunly 大模型 AIGC prompt 专家之路
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了AIGC提示(prompt)飞升方法：走向专家之路，希望对学习大语言模型
最新电子科学与技术专业毕设选题题目推荐 Mdc_stdio 单片机
文章目录1前言2如何选题3选题方向2.1嵌入式开发方向2.2物联网方向2.3移动通信方向2.4人工智能方向2.5算法研究方向2.6移动应用开发方向2.7网络通信方向3.4学长作品展示4最后1前言近期不少学弟学妹询问学长关于电子信息工程专业相关的毕设选题，学长特意写下这篇文章以作回应！以下是学长亲手整理的物联网相关的毕业设计选题，都是经过学长精心审核的题目，适合作为毕设，难度不高，工作量达标，对毕设
目标检测YOLO实战应用案例100讲-基于改进YOLO v7的智能振动分拣系统开发林聪木目标检测 YOLO 目标跟踪
目录前言课题国内外研究现状物料分拣研究现状目标检测算法研究现状振动视觉分拣系统的总体设计2.1振动盘视觉分拣系统的总体设计方案2.2振动盘视觉分拣系统的硬件选型2.2.1振动盘的选型2.2.2相机系统2.2.3运动控制器选型2.3振动盘视觉分拣系统的软件方案设计2.3.1振动盘视觉分拣系统软件开发需求分析2.3.2振动盘视觉分拣系统软件环境基于YOLOv7的模型改进3.1YOLOv7算法原理和网络
基于 Q-learning 的城市场景无人机三维路径规划算法研究，可以自定义地图，提供完整MATLAB代码 IT猿手 Qlearning 无人机路径规划 MATLAB 无人机算法 matlab 无人机路径规划强化学习深度学习 qlearning
一、引言随着无人机技术的不断发展，其在城市环境中的应用越来越广泛，如物流配送、航拍测绘、交通监控等。然而，城市场景具有复杂的建筑布局、密集的障碍物以及多变的飞行环境，给无人机的路径规划带来了巨大的挑战。传统的路径规划算法在三维复杂空间中往往难以满足实时性和最优性的要求。因此，研究一种有效的无人机三维路径规划算法具有重要的现实意义。Q-learning算法作为一种强化学习方法，能够通过与环境的交互学
基于Transformer的算力供需动态平衡算法研究与实践九章云极AladdinEdu transformer 算法深度学习人工智能 gpu算力架构智能电视
引言：算力供需失衡的困境与机遇随着大模型、AIGC等技术的爆发式发展，全球AI算力需求呈现指数级增长。OpenAI数据显示，2012至2020年间，训练AI模型所需的算力增长了30万倍，而传统算力调度系统仍停留在静态分配阶段。本文提出一种基于Transformer架构的算力需求预测模型，通过动态感知-预测-调度机制，实现算力资源的智能化供需平衡，为构建新一代AI算力基础设施提供新思路。一、现有方法
【创新未发表】Matlab实现飞蛾扑火优化算法MFO-Kmean-Transformer-LSTM组合状态识别算法研究天天Matlab代码科研顾问 matlab 算法 transformer
✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。往期回顾关注个人主页：Matlab科研工作室个人信条：格物致知,完整Matlab代码及仿真咨询内容私信。内容介绍一、引言随着工业自动化和智能制造的飞速发展，对工业设备状态监测与故障诊断的需求日益迫切。传统的监测方法往往依赖于人工经验，效率低下且难以应对复杂多变的工业环境。近年来，基于数
下载URL包含Signature和OSSAccessKeyId的实战代码 herosunly Python爬虫实战教程爬虫 python 下载文件 signature 实战代码
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。今天给大家带来的文章是：下载URL包含Signature和OSSAccessKeyId
基于机器学习的舆情分析算法研究赵谨言论文经验分享毕业设计
标题:基于机器学习的舆情分析算法研究内容:1.摘要随着互联网的飞速发展，舆情信息呈现爆炸式增长，如何快速准确地分析舆情成为重要课题。本文旨在研究基于机器学习的舆情分析算法，以提高舆情分析的效率和准确性。方法上，收集了近10万条社交媒体的舆情文本数据，利用多种机器学习算法如支持向量机、朴素贝叶斯、决策树等进行训练和优化。结果表明，经过优化的支持向量机算法在舆情分类的准确率上达到了85%以上，明显高于
基于深度学习的人脸属性识别算法研究赵谨言论文经验分享毕业设计
标题:基于深度学习的人脸属性识别算法研究内容:1.摘要随着人工智能技术的快速发展，人脸属性识别在安防监控、人机交互等领域具有重要的应用价值。本文旨在研究基于深度学习的人脸属性识别算法，以提高识别的准确性和效率。通过构建深度卷积神经网络模型，使用大规模的人脸数据集进行训练和优化。实验结果表明，所提出的算法在多个公开人脸属性数据集上取得了较好的识别效果，平均识别准确率达到了85%以上。研究表明，基于深
目标检测YOLO实战应用案例100讲- 无人机平台下露天目标检测与计数林聪木目标检测 YOLO 无人机
目录知识储备基于YOLOv8改进的无人机露天目标检测与计数一、环境配置与依赖安装二、核心代码实现（带详细注释）1.改进YOLOv8模型定义（添加注意力机制）2.无人机视角数据增强（drone_augment.py）3.多目标跟踪与计数（tracking_counter.py）4.完整推理流程（main.py）三、关键技术优化点四、数据集配置示例前言目标检测算法研究现状分析基于检测方法的目标计数研究
数据挖掘实验：k_means、k_medoids聚类算法的实现（Python）一只西绿柿课程实验数据挖掘聚类算法 python
目录前言一、k-means算法二、k-medoids算法三、实验结果展示总结前言本文是基于划分的聚类算法研究与实现，实现了k均值及k中心点聚类算法，并在数据集上完成测试。用户输入k的值，可对数据集中的数据进行聚类。一、k-means算法k-means算法使用簇的均值点作为簇的形心。首先在数据集中随机选择k个点作为k个簇的初始均值，对于数据集中的每个点，根据欧式距离将其分配至距离最近的簇。然后k均值
【影响因子高】【数据驱动】自组织方向感知数据分区算法研究（Matlab代码实现）然哥依旧算法 matlab 人工智能
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述2运行结果3参考文献4Matlab代码、数据、文章⛳️赠与读者‍做科研，涉及到一个深在的思想系统，需要科研者逻辑缜密，踏实认真，但是不能只是努力，很多时候借力比努力更重要，然后还要有仰望星空的创新点和启发点。当哲学课上老师问你什么是科学，什么是电的时
乾元通渠道商中标大理市自然灾害应急能力提升项目爱研究的小梁信息与通信智能路由器
近日，乾元通渠道商中标云南省大理市自然灾害应急能力提升项目，乾元通作为设备厂家，为项目提供通信指挥类装备（多链路聚合设备）QYT-X1。青岛乾元通数码科技有限公司作为国家应急产业企业，深耕于数据调度算法研究，参与了多项国家及省部级应急救灾通讯保障项目，致力于解决在地震灾害、塌方事故等自然灾害现场，快速组建可靠网络需求。设备采用多链路聚合技术，具有4G/5G、专网、卫星网、宽带自组网、WiFi等多种
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。

齐次坐标概念&&透视投影变换推导

OpenGL与D3D的基本差异

M3G的透视投影矩阵

你可能感兴趣的:(算法研究)