i_dovelemon

GraphicsLab Project之光照贴图烘焙(一)

作者：i_dovelemon
来源：CSDN
日期：2018-05-19
主题：Radiosity Algorithm, Global Illumination, Barycentric Coordinate

引言

早在Quake的时代，卡马克就首创了使用Surface Caching来实现预先烘焙的光照贴图(Light Map)效果。在这之后，光照贴图实现的GI效果慢慢的得到了游戏开发者和学术界的共同推进，慢慢的发展出了很多不同的算法。EA的DICE曾讲述了GI效果的前世今生，在这里可以了解到相关的技术。

接下来的几篇文章我将向大家讲述如何实现一个简单的光照贴图烘焙程序，用于烘焙出场景里面的GI效果。最终希望在此基础上，实现Valve在Source引擎中实现的Radiosity Normal Map的光照烘焙效果。

在实现Radiosity Normal Map之前，我们需要先实现一个Old School的光照烘焙程序，然后在此基础上进行改进。下面我们来看看如何实现一个最基本的Light Map Baker吧。（题图是本文实现的Baker所烘焙出来的效果）

光照贴图

在所有开始之前，我们先来了解下什么是光照贴图，以及我们为什么要烘焙光照贴图。

在大家初次学习光照的时候，所有的教程都会讲解如何实现一个平行光，点光源，聚光灯等等实时的光照效果。但是这些光照效果是直接光照（Direct Lighting），也就是只考虑了光源对物体本身的光照效果。实际上在现实世界里面，物体会反射光源的光，从而导致其他的物体被物体反射的光所照亮（Indirect Lighting）。这样就导致了影子看上去不是全黑的，一个颜色的墙壁会染上其他墙壁的颜色等等效果，见下图。

而对于间接光照，现在没有太好的实时渲染方案。最简单的实现间接光照效果的方法，就是对一个静态的场景，预先使用支持GI的渲染器，烘焙出想要的GI效果。比如这篇文章就讲述了如何使用Blender预先烘焙好光照贴图，然后在程序中使用。如果你的引擎仅仅是希望这样，那么直接使用现成的渲染器来烘焙光照贴图是最省力的做法，效果也不错。

由于我想实现的是Radiosity Normal Map，它的渲染需要对离线渲染器做一些修改，所以需要自己实现一套离线渲染程序，所以就有了这篇文章。当然，本来就是为了学习，做更多的东西才是最好的做法。

光照贴图的形式多种多样。一般来说，我们会给一个合适大小的场景单独烘焙一整张光照贴图，它看起来像这样：

好了，在了解了光照贴图的作用之后，我们就需要了解如何烘焙光照贴图了。

辐射度算法(Radiosity Algorithm)

实现烘焙的算法有很多，比如Path Tracer, Photo Mapping还有Radiosity Algorithm等等。本文将要实现的方案是基于Radiosity Algorithm。

这里有一篇文章，很清晰的讲述了Radiosity Algorithm的机理。我不认为我能够讲解的比他的还要清楚明了，所以关于Radiosity Algorithm的解释，我就不在赘述了。当然，如果你和我一样相信他所讲的就是全部了，那么你依然无法根据那篇文章实现烘焙功能，至少效果是不太正确的。所以我在这里讲述一些它所没有涉及的部分。

大体上，基于Radiosity Algorithm的烘焙程序，是由如下的步骤组成的：

预先分割场景，准备LightPatch

循环迭代，计算每一个LightPatch所受到的光照

根据每一个LightPatch最终接受到的光照值，生成LightMap

下面将依次讲解每一个步骤。

光照烘焙程序

分割场景

场景分割方案有多种不同的方式。我这里由于最终需要的结果是一张LightMap，所以就根据LightMap来分割场景。

正如前面我们讲述了那样，对于一个场景，我们使用一整张LightMap，来表示它的光照烘焙结果，而不是每一个物体一张光照贴图。这就导致了，场景中所有物体的UV，除了本身进行光照渲染时需要使用的访问Albedo,Normal等等的传统UV，还需要另外一套对应于光照贴图的UV坐标，也就是说整个场景的第二套UV坐标是统一在一个UV坐标系里面的。这样才能够统一的访问光照贴图，得到对应的光照结果。

根据辐射度算法一文的描述，一个LightPatch就对应了光照贴图里面的一个像素。而对于一个LightPatch，我们需要知道它所在场景的点的位置(Position)以及法线(Normal)。那么，对于光照贴图里面的任意一个像素，我们都能够知道它的UV坐标。而模型文件中保存了场景中所有三角形的顶点位置，法线和UV的信息。我们能否根据LightMap中像素的UV坐标，来得到对应的LightPatch所在点的位置及法线信息了。答案当然是可以的了。

Barycentric coordinate

在这里我们需要使用三角形的barycentric coordinate system来求出我们需要的信息。关于barycentric coordinate system的详细信息，可以看这里。

根据wiki的描述，我们能够得到一个三角形的如下关系式：

r = λ 0 * r 0 + λ 1 * r 1 + λ 2 * r 2

其中：

(λ0+λ1+λ2=1) ( λ 0 + λ 1 + λ 2 = 1 )

0≤λ0≤1 0 ≤ λ 0 ≤ 1

0≤λ1≤1 0 ≤ λ 1 ≤ 1

0≤λ2≤1 0 ≤ λ 2 ≤ 1

r为三角形上一点的信息

r0,r1,r2为三角形三个定点的信息

这样，我们就可以把r替换为position和uv，得到如下的对应关系

p=λ0∗p0+λ1∗p1+λ2∗p2 p = λ 0 ∗ p 0 + λ 1 ∗ p 1 + λ 2 ∗ p 2

uv=λ0∗uv0+λ1∗uv1+λ2∗uv2 u v = λ 0 ∗ u v 0 + λ 1 ∗ u v 1 + λ 2 ∗ u v 2

根据上面的两个公式，只要我们知道了三个定点的位置信息和uv信息，在根据三角形中任意一点的位置uv信息，我们就能够得到该uv所对应点的位置信息，而这正是我们想要的。

分割实现

根据前面一小节的描述，我们已经能够根据光照贴图中像素的uv坐标，来得到对应的LightPatch所在的三角形，以及三角形中该点的位置。如下是完整的分割代码：

void PrepareLightPatch() {
    memset(m_Patch, 0, sizeof(m_Patch));

    // Calculate uv for every patch
    for (int32_t h = 0; h < kLightMapHeight; h++) {
        for (int32_t w = 0; w < kLightMapWidth; w++) {
            m_Patch[h][w].uv = math::Vector((w + 0.5f) * 1.0f / kLightMapWidth, (kLightMapHeight - h - 0.5f) * 1.0f / kLightMapHeight, 0.0f);
        }
    }

    // Collect all faces
    struct Face {
        struct {
            math::Vector uv;
            math::Vector pos;
            math::Vector normal;
        } vertex[3];
    };
    std::vector faces;
    faces.clear();

    scene::ModelEffectParam effectParam;
    scene::ModelMaterialParam materialParam;
    float* vertexBuf = NULL;
    float* texBuf = NULL;
    float* normalBuf = NULL;
    int32_t faceNum = scene::ModelFile::ExtractModelData(kSceneModelFile, effectParam, materialParam, &vertexBuf, &texBuf, &normalBuf);

    int32_t vertexOffset = 0, uvOffset = 0, normalOffset = 0;
    for (int32_t i = 0; i < faceNum; i++) {
        Face face;

        for (int32_t j = 0; j < 3; j++) {
            face.vertex[j].uv.x = texBuf[uvOffset++];
            face.vertex[j].uv.y = texBuf[uvOffset++];
            face.vertex[j].uv.z = 0.0f;
            face.vertex[j].uv.w = 0.0f;
            face.vertex[j].pos.x = vertexBuf[vertexOffset++];
            face.vertex[j].pos.y = vertexBuf[vertexOffset++];
            face.vertex[j].pos.z = vertexBuf[vertexOffset++];
            face.vertex[j].pos.w = 1.0f;
            face.vertex[j].normal.x = normalBuf[normalOffset++];
            face.vertex[j].normal.y = normalBuf[normalOffset++];
            face.vertex[j].normal.z = normalBuf[normalOffset++];
            face.vertex[j].normal.w = 0.0f;
        }

        faces.push_back(face);
    }

    scene::ModelFile::RelaseBuf(&vertexBuf, &texBuf, &normalBuf);

    // Calculate data for every patch
    for (int32_t h = 0; h < kLightMapHeight; h++) {
        for (int32_t w = 0; w < kLightMapWidth; w++) {
            math::Vector uv = m_Patch[h][w].uv;

            bool found = false;
            for (int32_t i = 0; i < faceNum; i++) {
                // Using triangle's barycentric coordinate system to calculate world position of light patch
                // https://en.wikipedia.org/wiki/Barycentric_coordinate_system
                float x = uv.x;
                float y = uv.y;
                float x1 = faces[i].vertex[0].uv.x;
                float x2 = faces[i].vertex[1].uv.x;
                float x3 = faces[i].vertex[2].uv.x;
                float y1 = faces[i].vertex[0].uv.y;
                float y2 = faces[i].vertex[1].uv.y;
                float y3 = faces[i].vertex[2].uv.y;

                float lambda0 = ((y2 - y3) * (x - x3) + (x3 - x2) * (y - y3)) / ((y2 - y3) * (x1 - x3) + (x3 - x2) * (y1 - y3));
                if (lambda0 < 0.0f || lambda0 > 1.0f) continue;

                float lambda1 = ((y3 - y1) * (x - x3) + (x1 - x3) * (y - y3)) / ((y2 - y3) * (x1 - x3) + (x3 - x2) * (y1 - y3));
                if (lambda1 < 0.0f || lambda1 > 1.0f) continue;

                float lambda2 = 1.0f - lambda0 - lambda1;
                if (lambda2 < 0.0f || lambda2 > 1.0f) continue;

                m_Patch[h][w].pos = faces[i].vertex[0].pos * lambda0 + faces[i].vertex[1].pos * lambda1 + faces[i].vertex[2].pos * lambda2;
                m_Patch[h][w].normal = faces[i].vertex[0].normal;
                m_Patch[h][w].valid = true;

                m_ValidPatch.push_back(&m_Patch[h][w]);

                found = true;
                break;
            }

            if (found == false) {
                m_Patch[h][w].valid = false;
            }
        }
    }
}

这里有几个点需要注意。

并不是光照贴图里面所有的像素都是有效的，有些像素本身就没有被使用

根据barycentric coordinate system，在已知三角形三个顶点信息和已知点信息的情况下，求

λ0 λ 0 ,

λ1 λ 1 ,

λ2 λ 2 的公式在wiki中已经给出

如果求出的

λ λ 值不满足前面给出的条件，那么就表示该点不在这个三角形中

这里的分割使用的是最粗暴的做法，如果你的lightmap非常大，可能要等一段时间才能够分割完:)

计算LightPatch接受的光照值

这里的做法和辐射度一文中的做法大体上一样。

在已经知道了LightPatch的位置和法线之后，我们就从LightPatch所在的点向法线方向望去，渲染一个半立方体(hemicube)

然后用这张半立方体贴图乘上一个权重贴图，得到一张新的半立方体贴图

在根据这张新的光照贴图累计所有像素之和，得到LightPatch所接受到的光照。

这里有两个不同的地方：权重贴图的预计算和最后计算LightPatch所接受的光照。

权重贴图

实际上这个权重贴图里面存放的是一个名为Form Factor(View Factor)的系数。我们定义两个LightPatch，一个LightPatch为Receiver，即接受其他所有LightPatch所发射过来的光照，另外一个LightPatch为Sender，发射它本身的光照。那么Sender的光照并不是完全等值的被Receiver给接受。根据这两个LightPatch法线，和观察向量以及两者之间的距离不同，会呈现不同的衰减状态，如下图所示：

所以这个Form Factor的完整定义如下所示：

F i - j = c o s θ i c o s θ j π r 2 A j

其中：

cosθi c o s θ i 为光照方向与Receiver法线方向的余弦值，及Lambert Law

cosθj c o s θ j 也是同样的定义，不够在实际使用中我们却不使用它（原因是我们并没有保存Sender的法线），而是近似的做法，使用光照方向与观察向量的余弦值，及辐射度算法一文中透视修正的部分。

r r 值的就是Sender的LightPatch投影到半立方体之上后，距离Receiver的距离

Aj A j 表示是半立方体上每一个像素的面积

如果你只考虑了前面两项，你能够得到一个差不多的结果。但是当你渲染球体光源的时候，会发现它的光照半径是一个正方形，不够柔和。如下是更改前和更改后的对比图：

更多关于FormFactor的知识，看这里。

如下shader代码是计算实际FormFactor的：

#version 450

in vec2 vsTexCoord;

out vec3 oColor;

uniform int glb_Face;
uniform int glb_LightPatchWidth;
uniform int glb_LightPatchHeight;

float calc_perspective_correction_factor(vec2 uv) {
    vec3 l = vec3((uv - vec2(0.5, 0.5)) * 2.0, 1.0);
    l = normalize(l);
    float vdotl = dot(vec3(0.0, 0.0, 1.0), l);
    vdotl = max(0.0, vdotl);
    return vdotl;
}

float calc_lambert_law_factor(vec2 uv, int face) {
    vec3 n = vec3(0.0, 0.0, -1.0);
    vec3 l = vec3(0.0, 0.0, 0.0);
    vec2 p = (uv - vec2(0.5, 0.5)) * 2.0;
    if (face == 0) {
        l = vec3(1.0, -p.y, p.x);
    } else if (face == 1) {
        l = vec3(-1.0, -p.y, -p.x);
    } else if (face == 2) {
        l = vec3(p.x, 1.0, p.y);
    } else if (face == 3) {
        l = vec3(p.x, -1.0, -p.y);
    } else if (face == 4) {
        l = vec3(p.x, -p.y, -1.0);
    }

    l = normalize(l);
    return max(0.0, dot(n, l));
}

float calc_area_factor(vec2 uv, int face, int w, int h) {
    float deltaArea = 4.0 / (1.0 * w * h);

    vec3 l = vec3(0.0, 0.0, 0.0);
    vec2 p = (uv - vec2(0.5, 0.5)) * 2.0;
    if (face == 0) {
        l = vec3(1.0, -p.y, p.x);
    } else if (face == 1) {
        l = vec3(-1.0, -p.y, -p.x);
    } else if (face == 2) {
        l = vec3(p.x, 1.0, p.y);
    } else if (face == 3) {
        l = vec3(p.x, -1.0, -p.y);
    } else if (face == 4) {
        l = vec3(p.x, -p.y, -1.0);
    }

    float r = length(l);

    return deltaArea / (3.1415926 * r * r);
}

void main() {
    float vdotl = calc_perspective_correction_factor(vsTexCoord);
    float ndotl = calc_lambert_law_factor(vsTexCoord, glb_Face);
    float area = calc_area_factor(vsTexCoord, glb_Face, glb_LightPatchWidth, glb_LightPatchHeight);
    oColor = vec3(vdotl * ndotl * area, vdotl * ndotl * area, vdotl * ndotl * area);
}

当然上面的结果也要和辐射度一文一样，需要单位化权重值得到最终的结果。

LightPatch光照计算

在辐射度一文中说，计算最后的光照贴图，需要将hemicube中所有像素相加，然后在除以像素总数。我在实际开发的过程中，发现如果这么做了，最后得到的结果就只是黑暗的一片。根据这篇文章的描述，Radiosity Algorithm有很多的变种。比如类似本文的这种，叫gathering-variant，是从Receiver的角度去收集（gathering）其他LightPatch所照射过来的光照。还有如Shooting-variant和Shooting and Sorting-variant，从从Sender的角度，去发射光线，然后更新每一个Receiver的光照。并且，作者对比了几种变种，在迭代100次之后的结果，如下图所示：

从对比的结果来看，Shooting的变种完爆Gathering的变种。感兴趣的同学可以自行研究如何实现Shooting的变种。

当然，对于Gathering的变种，我经过尝试之后发现，只要去除掉最后一步除以像素总数的操作，也能够得出比较正确的结果，如题图所示那样。不过也有一点问题，就是多次迭代之后，整张图会变的非常白，暗部缺失。当然这个问题，也可以通过调节光照来缓解。

一些简单优化

在不进行任何优化的话，渲染一张1024*1024的光照贴图迭代1次就要花费我将近7-8个小时。不能忍。所以，为了提高速度，加快对结果的审查，我简单的优化了下程序，基本能够忍受最终渲染的时长。

关闭垂直同步

默认情况下，OpenGL是开启垂直同步的，也就是说SwapBuffer之类的函数，会强制等待屏幕的刷新，然后才能够继续进行下去。由于我的baker程序是把每一个LightPatch的一次hemicube分到了一帧里面去计算，这就导致了整体的时间由于垂直同步而拖慢了很多。所以我就修改了渲染库，添加了对垂直同步开启/关闭的支持。在这种情况下，我关闭了垂直同步的操作，速度立马飞起。原先由于强制刷新，每一个LightPatch，一次hemicube的计算需要16.6ms左右。关闭了垂直同步之后，只需要使用2-4ms左右。

关于垂直同步的信息，可以看这里。

所有像素之和

由于每一次LightPatch的计算，都需要统计hemicube的所有像素之和。我优化前的做法是把贴图回读到CPU上，然后手动的依次叠加到一起。这个计算方法十分的低效。我们可以利用现代硬件mipmap的特性，为我们计算一张图的所有像素的平均值，然后根据这个平均值来计算整个像素图的所有像素之和。利用mipmap，产生的最低一级的mip，就是整张图的平均像素。

这个操作，可以看龚大在OpenGPU上的回答。

总结

以上就是一个基本的基于Radiosity Algorithm的光照贴图的烘焙程序实现。其中有很多可以改进的地方。比如使用多线程加速LightPatch的光照计算，或者使用OpenCL/CUDA等GPU加速计算，更甚的使用辐射度一文中讲述的差值方法来加快计算。我这里为了概念的解释和了解，都没有进行这些尝试。等到最终我需要在实际场合下使用LightMap的时候，或许会专门设计一个LightMapBaker的GUI工具程序，用于快速产生光照贴图。谁知道了！！！

另外需要补充说明的是，以上的烘焙程序只是烘焙了场景的Diffuse部分。由于Diffuse模型，大部分采用的是Perfect Diffuse，即不管观察者处于什么视角，在同样的光照条件下，同一个表面的光照效果总是一致的。Radiosity Alogrithm也更加适合烘焙diffuse部分。虽然经过近似改进，也能够模拟Specular，但那不在本文范畴，就不再赘述。感兴趣的可以在文献[3]中找到答案。

完整的代码可以在我的Github上找到。

为了方便，很多处理我都使用了最粗暴的方法。比如我假设了场景中所有材质都是完全的白色材质，同时光源的处理也硬编码到shader文件中。

如果发现有什么错误或者对于本文有什么不理解的地方，非常欢迎大家可以在评论中指出讨论。

参考文献

[1] Quake’s Lighting Model: Surface Caching
[2] A Certain Slant of Light - Past, Present and Future Challenges of Global Illumination in Games
[3] Half-Life 2 / Valve Source Shading
[4] 第十五课：光照贴图（Light Map）
[5] 辐射度算法
[6] Barycentric Coordinate System-Wiki
[7] Radiosity-A Program’s Perspective
[8] Radiosity Overviewer
[9] SwapBuffers的等待，虚伪的FPS
[10] 像素平均值快速求法
[11] Radiosity Algorithm(Computer Graphics)-Wiki

【Linux 下的 bash 无法正常解析, Windows 的 CRLF 换行符问题导致的】待磨的钝刨 linux bash windows
文章目录报错原因：解决办法：方法一：用`dos2unix`修复方法二：手动转换换行符方法三：VSCode或其他编辑器手动改总结这个错误很常见，原因是你的wait_for_gpu.sh脚本文件格式不对，具体来说是Windows的CRLF换行符问题导致的，Linux下的bash无法正常解析。hadoop@hadoop:~/anaconda3$bashwait_for_gpu.sh:invalidopt
A Software as a Service (SaaS) W_X_99515681 数据结构
IntroductionThisfinalprojectisacomprehensiveassignmentdesignedtoassessyourmasteryofwebdevelopmentconceptscoveredthroughoutthecourse.Itisasignificantundertakingthatwillrequiresubstantialtimeanddedicati
PROG2005 TypeScript and Angular W_X_99515681 机器学习
PROG2005Assessment2PROG2005PROGRAMMINGMOBILESYSTEMSSummaryTitleAssessment2–Programmingproject-TypeScriptandAngularTypeIndividualsubmission(NOTagroup)DueDateWeek4Mondayat11:59PMNSWtimeLengthRefertothea
Ubuntu实时读取音乐软件的音频流冬瓜~ Linux开发 ubuntu 音视频数据库 portaudio
文章目录一.前言二.开发环境三.具体操作四.实际效果一.前言起因是这样的，我需要在Ubuntu中，实时读取正在播放音乐的音频流，然后对音频进行相关的处理。本来打算使用的Pipewire+Helvum的方式实现，好处是可以直接利用Helvum图形化工具对软件输出的音频进行重定向，但是由于使用的是Ubuntu20.04，默认的音频服务器使用的是PulseAudio，替换为Pipewire后，播放的音频
Unity 与 JavaScript 的通信交互：实现跨平台的双向通信 Front_Yue 3D技术实践指南 unity javascript 3d
前言在现代游戏开发和Web应用中，Unity和JavaScript的结合越来越常见。Unity是一个强大的跨平台游戏引擎，而JavaScript是Web开发的核心技术之一。通过Unity和JavaScript的通信交互，开发者可以实现从Unity到Web页面的功能扩展，或者从Web页面控制Unity的行为。这种双向通信的能力为开发者提供了更多的可能性，例如在Unity中嵌入Web视图，或者在Web
【Rust日报】 2020-02-17 WASM向量图形 --wasm_svg_graphics 0.3.0 Rust语言中文社区
WASM向量图形--wasm_svg_graphics0.3.0一个用于通过WASM渲染SVG图形的Rust库它提供了快速有效的方法，可以使用WebAssembly与SVG进行交互。它能够：声明形状和样式以用于这些形状使用SVG标签将这些形状渲染到DOM自动检测两个形状是否相同，因此只有一个SVG将添加到DOM中声明已命名的项目/容器，以便以后进行例如隐藏，重新显示和重新放置之类的调整。声明开发团
H800能效架构实战解析智能计算研究中心其他
内容概要H800能效架构以异构计算资源调度与动态功耗控制为核心，通过系统级协同设计实现算力密度与能耗优化的双重目标。其核心技术覆盖智能负载分配、电压频率动态调节及热管理三大模块，形成从芯片级到数据中心级的垂直优化链路。在架构设计中，异构资源调度算法通过实时分析任务特征与硬件状态，动态分配CPU、GPU及专用加速器资源，最大化硬件利用率；动态功耗模块则基于负载波动自适应调整供电策略，结合多级电压频率
GIS三维可视化进阶：Three.js集成Cesium引擎实现全球地形LOD与OGC标准服务调用贝格前端工场 javascript 开发语言 ecmascript
Three.js与Cesium引擎基础介绍Three.js是一款基于JavaScript的开源三维图形库，它提供了丰富的API用于创建和操作三维场景、物体、材质等。在Web端的三维可视化领域应用广泛，因其能够在浏览器中高效渲染复杂的三维模型和场景，大大降低了开发人员创建三维交互内容的门槛。通过简单的代码，即可实现如创建三维几何体（立方体、球体等）、为物体添加材质（如纹理材质、光照材质）以及设置相机
【设计模式】外观模式浅慕Antonio 设计模式设计模式
第8章外观模式8.1配置相关范例核心问题游戏配置项复杂，直接调用业务类导致耦合度高：图形配置类//图形相关类classGraphic{private://单件模式实现Graphic()=default;Graphic(constGraphic&)=delete;Graphic&operator=(constGraphic&)=delete;~Graphic()=default;public:sta
超高性能机甲机器人技术方案和尚448 机器人
###**超高性能人形机甲机器人技术方案****(代号：ProjectTitan-X)**---####**一、核心参数指标**|项目|参数要求|实现方案||----------------------|----------------------|------------------------||整机重量|≤80kg|碳纤维骨骼+石墨烯肌肉||运动速度|百米冲刺≤9.5秒|仿生肌腱驱动系统||
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
英伟达常用GPU参数速查表，含B300..... Ai17316391579 深度学习服务器人工智能机器学习服务器电脑计算机视觉深度学习神经网络
英伟达常用GPU参数速查表，收藏备用：含RTX5090、RTX4090D、L40、L20、A100、A800、H100、H800、H20、H200、B200、B300、GB300.....专注于高性能计算人工智能细分领域kyfwq001#5090##4090##英伟达“新核弹”B200发布##英伟达##英伟达B300##GPU##服务器##显卡##英伟达H800/A800芯片将禁售#
学习笔记——GPU 鹤岗小串 gpu算力分布式信息与通信系统架构硬件架构运维笔记
本文为学习笔记，故只对知识点依据自己的理解作概要总结，方便以后复习激活记忆。注：本文中GPU的讲解以A100型号为例，V100跟A100的架构差别不大也可适用，但是其他架构可能会有所出入。一、GPU硬件结构NVIDIAA100GPU的硬件结构HBM2：显存MemoryController：负责控制HBM2和L2Cache之间的通信High-SpeedHub：GPU总线，将NVLink、PCIE、E
【地图 Map3d】——2 花花 Show Python pyecharts—从0到精通信息可视化数据分析 python
解锁数据可视化的魔法钥匙——pyecharts实战指南在这个数据为王的时代，每一次点击、每一次交易、每一份报告背后都隐藏着无尽的故事与洞察。但你是否曾苦恼于如何将这些冰冷的数据转化为直观、吸引人的视觉盛宴？欢迎来到《pyecharts图形绘制大师班》在这里，你将不再受限于单调的表格和图表，而是学会如何运用pyecharts这一强大的Python数据可视化库，将复杂的数据转化为令人惊叹的交互式图形。
Roblox 开源 AI 3D 生成模型，游戏开发迎来智能化变革 Yvette-W IT职业圈人工智能 3d 游戏
如果说过去的3D游戏开发需要建模师一笔一划地雕刻细节，如今AI的加入正在彻底改变这一模式。Roblox最新发布的3D生成AI模型——Cube，允许开发者用简单的文本指令，快速生成3D物体。更重要的是，Roblox还开放了Cube的开源版本，这意味着不仅Roblox开发者，任何游戏开发团队甚至个人创作者，都可以利用这项技术来提升创作效率。这一突破不仅能让游戏开发变得更快、更简单，也让AI在3D生成领
OpenGL.error.GLError: GLError( err = 12289, AI算法网奇 python基础 python宝典 python opengl
目录报错信息：报错代码：测试代码：报错信息：libEGLwarning:DRI2:failedtocreatedriscreenlibEGLwarning:DRI2:failedtocreatedriscreenTraceback(mostrecentcalllast):File"/shared_disk/users/lbg/project/online/NeuralLocalizerFields
显卡（Graphics Processing Unit，GPU）架构详细解读 m0_74824112 面试学习路线阿里巴巴架构大数据网络
显卡架构主要分为两大类：GPU核心架构（也称为图形处理单元架构）和显卡的其他组件（如内存、控制器、输出接口等）。本篇文章将对显卡架构进行详细分析，重点介绍GPU核心架构、显卡计算单元、显存结构、显卡管线、以及显卡与主机系统的协同工作等。1.显卡架构的基本组成显卡架构可以分为以下几个主要部分：1.1GPU核心（计算单元）GPU核心是显卡的核心部分，负责执行图形渲染和计算任务。GPU核心通常由多个流处
GPU架构分类大明者省架构
一、NVIDIA的GPU架构NVIDIA是全球领先的GPU生产商，其GPU架构在图形渲染、高性能计算和人工智能等领域具有广泛应用。NVIDIA的GPU架构经历了多次迭代，以下是一些重要的架构：1.Tesla（特斯拉）架构（2006年发布）特点：NVIDIA推出的首个通用GPU计算架构，支持使用C语言进行GPU编程，标志着GPU开始从专用图形处理器转变为通用数据并行处理器。性能：具有128个流处理器
轻松帮你搞清楚Python爬虫数据可视化的流程 liuhaoran___ python
Python爬虫数据可视化的流程主要是通过网络爬取所需的数据，并利用相关的库将数据分析结果以图形化的方式展示出来，帮助用户更直观地理解数据背后的信息。Python爬虫+数据可视化步骤1.获取目标网站的数据使用`requests`或者`selenium`库从网页上抓取信息。对于动态加载内容的页面可以考虑结合JavaScript渲染引擎。2.解析HTML内容提取有用信息常见工具如BeautifulSo
Python最佳实践项目Cookiecutter常见问题解决方案柯茵沙
Python最佳实践项目Cookiecutter常见问题解决方案python-best-practices-cookiecutterPythonbestpracticesprojectcookiecutter项目地址:https://gitcode.com/gh_mirrors/py/python-best-practices-cookiecutter项目基础介绍本项目是一个Python最佳实践的
一切皆是映射：实现神经网络的硬件加速技术：GPU、ASIC（专用集成电路）和FPGA（现场可编程门阵列） AI天才研究院 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
文章目录一切皆是映射：实现神经网络的硬件加速技术：GPU、ASIC（专用集成电路）和FPGA（现场可编程门阵列）1.背景介绍2.核心概念与联系3.核心算法原理&具体操作步骤3.1算法原理概述3.2算法步骤详解3.2.1GPU加速3.2.2ASIC加速3.2.3FPGA加速3.3算法优缺点GPUASICFPGA3.4算法应用领域4.数学模型和公式&详细讲解&举例说明4.1数学模型构建4.2公式推导过
python中如何组织项目工程文件晓风残月淡 python爬虫 python 开发语言项目工程文件
一、项目工程文件目录一个典型的Python项目工程目录结构可以帮助你更好地组织代码、资源和测试，从而使得项目更加清晰和易于维护。my_project/│├──my_project/#项目的主代码包│├──__init__.py#包初始化文件│├──module_1.py#示例模块1│└──module_2.py#示例模块2│├──tests/#测试代码目录│├──__init__.py#测试包初始
CAD二次开发踩过的坑我的sun&shine CAD二次开发 c++
CAD二次开发踩过的坑CAD二次开发踩过的坑一、3D图形编译不过二、智能指针三、多文档操作规范流程四、CAD系统变量（参数）大全五、细节注意CAD图纸在软件中出现许多连接线线怎么关闭C++try无法展开无调试信息：重新生成变量已被优化掉,因而不可用两个列表中选中第一个再选第二个时第一个的选中见了预览时无法找到k3DDrawing无法缩放：静态框的通知打开intersectWith无法求交点对话框老
算法设计与分析4（变治法） songx_99 算法设计与分析算法
变治法将问题转化为一个或数个有一定关联当形式上不同的更加简单或更加好解决的子问题。变治法的应用：预排序思想用预排序可以简化许多问题，如检查元素唯一性，检查出现次数最多的元素等堆算法堆的定义首先它是一个完全二叉树，完全二叉树表明树的每一层都是满的，只有最后一层最右边的元素有可能缺位。且父结点的值大于它的两个子节点，则称是一个大根堆，若值小于两个子节点，称小根堆堆化有向下调整，向上调整两种，大致思路相
OpenGL ES 如何渲染 16bit 图像？字节流动 OpenGL ES 3.0 OpenGLES 音视频图形渲染 Android c++
未经作者（微信ID：Byte-Flow）允许，禁止转载文章首发于公众号：字节流动最近有不少读者私信问OpenGLES如何处理16bit图像（P010）？然后我直接贴给他们一段在OpenGL环境下验证过的上传16bit图像数据的代码glTexImage2D(GL_TEXTURE_2D,0,GL_R16UI,width,height,0,GL_RED_INTEGER,GL_UNSIGNED_SHORT
C++基础系列【26】排序和查找算法程序喵大人 C++基础系列 c语言算法开发语言 c++
博主介绍：程序喵大人35-资深C/C++/Rust/Android/iOS客户端开发10年大厂工作经验嵌入式/人工智能/自动驾驶/音视频/游戏开发入门级选手《C++20高级编程》《C++23高级编程》等多本书籍著译者更多原创精品文章，首发gzh，见文末记得订阅专栏，以防走丢C++基础系列专栏C语言基础系列专栏C++大佬养成攻略专栏C++训练营排序与查找算法的重要性不用过多介绍了吧，面试也经常考察。
设计模式之桥接模式周努力. 设计模式设计模式桥接模式 java
目录1.概念2.代码实现3.应用场景桥接模式(BridgePattern)也是我们结构型设计模式的一种，桥接模式整体来说对于开发者需要深刻理解好抽象类这个概念，而且比较考验在开发前就要设计好桥接点来进行开发，所以整体的理解难度我认为是比较高，接下来我将从概念和一个示例来演示该模式。1.概念桥接模式就是将抽象与实现解藕，使两者都可以独立变化。在现实生活中，某些类具有两个或多个维度的变化，如图形既可按
sudo apt-get install package时出现E：无法定位软件包 God.v ubuntu linux centos
sudoapt-getinstallpackage时出现E：无法定位软件包在Ubuntu上安装openssl-devel时遇到无法定位软件包的问题，查阅文章，大多是换源和在“软件和更新”中更换下载地址的方法，而我尝试过后并无卵用，如果接下来的方法不适用你的情况，你也不妨考虑以上两种办法。其实很简单，区分centos和Ubuntu等在安装文件时的名称差别，对于这两种图形界面来说，将openssl-d
YOLO算法全面改进指南（二） niuTaylor YOLO改进 YOLO 算法
以下是为YOLO系列算法设计的系统性改进框架，结合前沿技术与多领域创新，提供可支持高水平论文发表的详细改进思路。本方案整合了轻量化设计、多模态融合、动态特征优化等创新点，并给出可验证的实验方向。一、多模态提示驱动的开放场景检测系统1.核心创新三模态提示机制：文本提示编码器：基于RepRTA（可重参数化区域文本对齐）构建轻量级文本编码网络，将自然语言描述映射为128维语义向量。视觉提示编码器：采用S
大规异构集群混合并行分布式训练系统，解决算力不均衡问题 HETHUB 爱串门的小马驹万卡大规模集群大模型训练异构集群大规模集群分布式大模型训练
视频教程在这：3.2大规模异构集群，混合并行分布式系统，解释算力不均衡问题HETHUB_哔哩哔哩_bilibili一、大规模异构集群出现的原因：同一种GPU数量有限难以构建大规模集群：训练大规模模型依赖于大量的计算资源。例如，训练GPT-4模型（1.8万亿个参数）需要25000个A100GPU。用一种GPU加速器构建大规模集群是一个挑战。使用多种类型的GPU加速器构建大规模集群是解决同构GPU加速
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那