翻译：几何裁剪图下的使用嵌套的规则格网渲染地形

Geometry Clipmaps: Terrain Rendering Using Nested Regular Grids

几何裁剪图下的使用嵌套的规则格网渲染地形

使用粗糙的geometry clipmap插图 (size n=31)

216,000×93,600美国大峡谷附近观察图 (n=255)

图1：使用geometry clipmaps的地形渲染, 展示clipmap各层次 (size n×n)以及过渡区域(右图蓝色)

摘要（Abstract ）

渲染吞吐量已经达到能够用一种新的LOD（细节层次技术）去控制地形渲染的程度。我们介绍geometry clipmap，它能够通过一系列位于观察者中心的嵌套网格加速地形渲染。网格以顶点缓冲（vertex buffers）的形式存储在显示内存，当视点移动时不断地填充。这个简单的框架提供了可视的连贯性，帧约束（同一的帧速），complexity throttling，和graceful degradation。而且，它允许两种新的令人兴奋的实时功能特性: 解压缩（decompression）和合成（synthesis）。我们的主要数据是一个40GB的整个美国的高度图。一个压缩的图像金字塔使数据大小减少100倍。所以它完全适合在内存中。这压缩数据同样有助于法线图（normal map）的着色. 当观察者接近表面，我们通过分形噪声位移（fractal noise displacement）合成格网层次，比存储着的地形解压缩后要好。合成和normal-map计算是不断进行，因此使得我们能够以60帧每秒的速度交互飞行。

关键字（Keywords）：细节层次控制（level-of-detail control）、地形压缩和综合（terrain compression and synthesis）

1、简介（Introduction）

地形几何是室外场景的一个重要组成部分，作为电影、虚拟环境、cartography、和游戏的实例。特别是对于室外游戏，包括飞行模拟、赛车模拟和大量多人游戏。在这篇文章，我们关注如何实时渲染地形高程。

大规模地形高度图包括十亿多的地形采样，离直接进行交互渲染还有很远的距离。此外，由于从象素抽样的未过滤的多对一映射，渲染统一的密集的三角形会导致混淆（aliasing）效果，正像没有多重映射（mipmap）的纹理。 [Williams 1983]。所以细节层次（LOD）控制对于调整地形tessellation是必须的，常以观察的参数作为因子。

在地形细节层次简化（LOD）方面已经有大量的研究，在第二节中我们将会回顾，过往的方案调整细分不但基于观察距离，还基于具体的地形几何。根据直觉我们可以看出，平坦的区域安排大的三角形，会带来更小三角形的不规则网格渲染。但是，这样的框架有几个缺点。细分准则和细分操作必须预计算，并且消耗额外的内存。数据结构设计会涉及带有不在同一个缓冲的随机存储访问。改变tessellation需要更慢的立即模式渲染，当对静态区域进行加速时会干扰时间的连续性。为了维持一致的帧速，细分阙值必须随着地形的起伏不平而改变。最终，表面着色需要纹理图形，它们分开存储用在整个不同的LOD结构上。

渲染吞吐量在现在的GPU上已经达到100M个三角形每秒，足够以视频速度基于象素大小地填充整个帧缓冲（framebuffer）。此外，顶点处理速度不断增加，接近象素处理速度，所以我们预测好的LOD策略不再是本质的，我们取而代之的是寻找所有三角形基于象素的地形的统一的屏幕。关键是开发一套LOD框架能够优化图形流水线的倚赖。

我们的贡献是geometry clipmap，它能以一系列以观察者为中心的嵌套网格加速地形渲染。这些网格而不同的power-of-two分辨率过滤的形式展现。并且以顶点缓冲的形式存储再显存。当观察者移动时，clipmap层次改变并且不断重新填充数据。

这个方法于与纹理映射中的图像LOD处理很类似。为了避免空间混淆（spatial aliasing），图像预过滤到一个power-of-two 网格的mipmap（多重映射）金子塔[Williams 1983]。Mipmap层次被渲染的每一个象素是屏幕空间参数微分的函数，倚赖于观察参数，不倚赖于图像内容。纹理裁剪图加速（cache）视点倚赖的Mipmap金字塔的子集 [Tanner et al 1998]。快速不断的纹理clipmap更新允许探索巨大的图像。

我们的几何裁剪图（geometry clipmaps）灵感来源于纹理裁剪图（texture clipmaps），但有一些关键的不同点。纹理裁剪图计算每个象素的LOD基于屏幕空间投影几何，但是对于地形，屏幕空间几何直到地形LOD选择前都不能获得——循环倚赖。更重要的是，每个象素的LOD选择会让保持网格密不透水和时间上的平滑变得困难。

取而代之，我们在世界空间基于观察距离选择LOD，使用一系列关于视点的嵌套的矩形区域。我们创建渐变区域以平滑和混合层次之间，使用0面积三角形缝补层次边界避免T-junctions。LOD过渡方案允许clipmap层次独立过渡，并且让各个层次裁剪胜于invalidated atomically像[Tanner et al 1998]表述。并且，我们应用一样的方案到纹理图像，获得统一的LOD框架对于几何和图像，并且不像纹理裁剪图，它不需要特别的硬件。

Geometry clipmaps提供了一系列的优点对于过往的地形LOD方案:

l 简单（Simplicity）. 没有在基于指针/索引的结构上的不规则移动，并且没有细化倚赖的跟踪（tracking of refinement dependencies）。

l 优化的渲染吞吐量. Clipmap顶点存储在显示内存之中，并且它们的规则结构允许我们以带有优化顶点缓冲再用（with optimal vertex-cache reuse）的triangle-strip索引方式渲染。

l 可见的连贯性（Visual continuity ）分别在顶点程序和象素程序使用一些指令，内部的层的渐变区域对于几何和纹理均提供空间和时间上的连贯性。

l 稳定的渲染（Steady rendering）由于tessellation完全独立，不倚赖于地形粗糙度，无需参数用于动态调整，所以使得渲染速度接近常数。

• Immediate complexity throttling. 正因为有固定的clipmap大小，我们能够收缩渲染区域以减少渲染负荷。Tanner等[1998]使用一种近似的想法控制纹理裁剪图的更新带宽。

• Graceful degradation. 当观察者迅速移动的时候，更新带宽（重新填充clipmap）会变为瓶颈问题。就像在纹理裁剪图，我们更新尽可能多的层次在一次预算当中，这带来的结果是快速移动使地形丢失了它的高频细节。

l 表面着色（Surface shading）. 法线图（Normal maps）在飞行时从几何体上方计算，并且使用一样的LOD结构作为地形几何。

地形几何同样提供两个新的运行时功能：

l 压缩（Compression）.既然不单裁剪图需要扩展到顶点缓冲，剩余的地形金字塔也能够以压缩形式存储。我们通过二维的图像编码压缩金字塔各层之间差值（residuals），高的数据一致性允许我们压缩比达到60％—100％. 存储整个地形在内存中以避免磁盘分页停顿。

l 合成（Synthesis）简单的规则格网结构允许我们on-the-fly地形合成，以便于粗糙的几何部分能够通过程序上生成细节得到增强。我们示范了简单的分形噪音，它可能在不久的将来能由GPU自己实现。

局限性（Limitations）

渲染网格比过往的LOD方案复杂。本质地，我们总是假设最差情况下的地形，带有同一的细节（每个地方有所有的频率），因此不利于局部调整。另一方面，网格是规则的，能够分配到显存。因而我们瞄准这种差的情况优化渲染渲染。

另外一个限制是地形被假设为像第9节所描述那样有边界频谱密度。举个例子，一个高的像针的特征地形会morph到观察范围比较迟。幸运的是，实际上地形是比较好和平滑的，不是十分常出现这种明显变化的问题。值得注意的是，建筑物、植物和其它对象被组合到环境上的，我们要使用其它LOD技术分别渲染

2. 过往的地形LOD技术（Previous terrain LOD techniques）

地形LOD算法使用层次网格细分合并操作以调整表面tessellation。算法能够根据结构分为下面这些：

l 不规则网格（Irregular meshes）

l 二叉树（Bin-tree hierarchies）

l 二叉区域（Bin-tree regions）

l 拼接块（Tiled blocks）

（4种过往的LOD方案详细介绍暂略）

理想化地，视点倚赖的LOD算法适应细化（分割）和粗糙化（合并）网格基于屏幕几何误差，几何误差被定义为以象素表示的网格和原地形点的距离。屏幕误差联合考虑影响来自下面个几个：(1)观察者距离(2)表面方位(3) 表面几何。既然表面方位很少提供重要的LOD影响，很多方案选择忽略它。一个通常的细分准则[Blow 2000]是每个顶点存储一个半径定义一个包围球。预计算半径编码了局部的表面近似误差，如果视点进入包围球则顶点的邻接顶点被细分。

几何裁剪图相当不同于过往这些工作。细分层次基于观察者为中心的规则格网，geomorph提供内部的连续性。这些细分准则仍然考虑观察者距离，但忽略局部几何。如：所有顶点共享一样的椭球半径。

视点倚赖的位移贴图映射（View-dependent displacement mapping）

地形能够被看成一个平坦的几何面上的位移图。一些最近的文献提出了硬件相关的方案用于调整位移贴图的tessellation [Gumhold and Hüttner 1999; Doggett and Hirche 2000; Moule and McCool 2002]。到目前为止，这些方案仅仅在简单的格网上模拟，并且他们假设整个格网是能容纳在内存的。

纹理（Textures）到目前为止，没有很多工作关于如何处理伴随地形的巨大纹理图除了关于纹理裁剪图的[Tanner et al 1998]，标准的方法是纹理拼接，还有更普通的纹理层次引入方案，如Döllner等[2000]。

根据我们的知识，没有过往的地形LOD技术能够达到有较大的压缩比和实现地形合成。

3. Geometry clipmap 概述

几何裁剪图（geometry clipmap），通过一系列m个层次构成一个地形金字塔, 以2ⁿ分辨率区域嵌套形式展现，如文章首部图1。每一个层次包含n×n个顶点的数组，存储在显存中的顶点缓冲。为了能够不断地进行有效更新，数组以环形（toroidally）方式编码，通过在x和y上的求模(mod)操作形成环形编码。每个顶点包含(x, y, z, z_c)坐标，z_c是下一个粗糙层次的高度值(x, y)，用于几何渐变。(6.2节)。

图2：geometry clipmap各区域定义

Clipmap regions

对于每一个clipmap层次，我们定义一系列矩形区域（见图2）。裁剪区域（clip region）是世界空间范围内每一层存储的n×n规则格网数据。活动区域（active region）是期望渲染的区域，特定为一个n×n区域位于观察者中心。当观察者移动时，我们通过裁剪区域（clip region）更新每一层匹配期望的活动区域的clipmap。但是，这样的更新在快速移动时是很耗费的，我们让裁剪区域（clip region）落后于观察者，并且裁剪活动区域（active region）到现有数据范围，如图2。最终，渲染区域（render region）被设计成空心的（图中绿色部分），它的外部边界是l层活动区域(active_region(l))，内部边界是l+1层活动区域（active_region(l+1)）。

对于最好的m层，m+1层活动区域（active_region(m+1)），被定义为空，即最高层为实心方形区域。活动和裁剪区域在观察参数改变时更新，如第4节和第5节描述。

纹理（Vertex Shader Texture）

每一个clipmap层次同样包含关联的纹理图像。我们为每一个用到的表面存储一个8位每通道（8-bit-per-channel）的法线纹理图像，这比每个顶点（per-vertex）存储法线有效。对于可靠的着色，法线图（normal map）有相对于几何结构两倍的分辨率，即为几何格网两倍大小，因为一个顶点一个法线太模糊了 [Vlachos et al 2001]。法线图（normal map）通过地形几何在clipmap更新的时候计算。额外的图像，如地形每个顶点的颜色属性同样可以存储为不同的分辨率。就像顶点数组，纹理也是以环形编址（toroidally）的方式以有效地更新。在现代GPU中，通常以Vertex Shader Texture Fetch（在顶点着色程序段访问纹理）实现。

每一帧的算法（Per-frame algorithm）

下面步骤是每一帧都要做的：

1. 检测期望的活动区域 (第4部分).

2. 更新地形几何 (第5部分).

3. 裁剪活动区域到裁剪区域（clip regions）,并且渲染（第6部分）

4. 期望的活动区域运动的计算（Computation of desired active regions motion）

视点倚赖的refinement，通过clipmap 中每一层的活动区域选择被检测。我们通过一个简单的策略，对于在世界空间中格网间距为的每一层L，我们让期望的活动区域为以视点坐标(x,y)为中心的n×n区域。换句话，期望的clipmap被定位到观察者中心，我们希望渲染每一层的全部区域。

让我们考虑屏幕空间三角形大小和clipmap大小n之间的关系。我们假设地形有很小的坡度，所以每一个三角形近似一个大小为的直角三角形。（我们在第九节提供一个大致的误差分析）

对于任意的可见的世界空间的点，屏幕大小反比例于屏幕空间的深度。如果视线方向是水平的，屏幕深度可以在XY平面量度。观察者坐落于l层渲染区域（render_region(l)）的中心，它有n×的外边界大小，以及n×/2的内边界大小。对于90度宽的视野，屏幕空间平均深度（遍及各个方向）大约0.4×n×。所以近似的屏幕空间以象素表示的三角形大小s如下：

W是窗口大小，，我们定义W=640象素，=90度，我们获得clipmap大小n=255的好结果。这符合一个屏幕空间三角形3象素的大小。所以我们的法线图（normal maps）以两倍于地形几何格网的分辨率存储。这给我们近似1.5象素每个纹理抽样（sample），对于纹理抽样设置来说是合情合理的。

当我们的视线方向不是水平时，渲染区域l（render_region(l)）的屏幕深度大于上面期望的0.4×n×，并且因此屏幕空间三角形变得小于s，如果直接从地形上空向下俯视，三角形大小是很小的，并且明显变得混淆难以分辩。解决方法是不渲染不必要的好的精度的层次。特别地，我们计算观察者处于地形上方的的高度通过访问有效的最好的clipmap层次。对于每一个层次l，如果观察者高度大于0.4×n×我们把活动区域设置为空。

把活动区域简单定位于观察者中心的缺点是：当视觉变窄时clipmap大小n必须增大。解决的方法是：相对于视锥调整clipmap的位置和大小。这里我们采取了上述不考虑视觉变窄的简单替代方案，选择以观察者为中心的区域，因为它们能够让观察立即围绕当前视点旋转。这已经能够满足多数应用的需求（比如飞行模拟器通过可以转换遥控杆让用户观察各个方向）。其它的问题我们可以倚赖于视锥消隐避免渲染观察范围以外的地形（6.4节）。

综上所述，活动区域定义为以视点坐标(x,y)为中心的n×n区域，格网间距为，如果观察者高度大于0.4×n×我们把活动区域设置为空。

5. 几何裁剪图更新（Geometry clipmap update）

当期望的活动区域随着观察者的运动而改变时，裁剪区域（clip regions）应该同样跟着改变。注意到我们采用上面提及的环形方式编址，我们在改变一个层次时不必要复制旧的数据，而是简单填充新的L形暴露的区域。数据有两种来源：直接从地形压缩数据中解压或者通过地形综合程序合成。（见第7和第8部分）。通常，粗糙的层次从地形压缩数据中解压缩，好的层次通过分形综合得到。

无论通过解压缩或者合成更新clipmap，我们以插入细分的方案通过粗糙的层次预测好的层次几何。我们选择著名的四点细分曲线（four-point subdivision interpolant）的张量积（tensor-product）方案 [Kobbelt 1996]，它有(–1/16, 9/16, 9/16, –1/16) 掩码权重（mask weight） [Dyn et al 1987] 。这种采样过滤器（upsampling filter）U具有期望的C¹平滑度属性。

二者选一的更新方案将会是预测未来当裁剪区域改变时观察者的运动，以减少频繁的更新动作。由于我们能够在小的区域有效地执行解压缩和合成，更新粒度不是当前重要的因素。

当观察者快速运动，更新全部层次的过程变得过多和漫长。就像在纹理裁剪图（texture clipmaps），我们更新各个层次以从粗糙到好（coarse-to-fine ）的顺序，在达到处理预算时停止。我们选择以更新的采样（updated samples）数量超过n²时停止，因为在未更新好的层次的裁剪区域（clip regions）是落后的，它们逐渐地裁剪关联的活动区域，直到它们为空。这样做的后果是接近观察者的快速运动丢失了高精度细节。一个有趣的结果是渲染负荷事实上降低了当观察者运动时。

我们在裁剪区域（clipmap regions）定义下面约束：

1. l+1层裁剪区域属于l层裁剪区域，通过一个分级的距离表示，我们需要裁剪区域嵌套以进行从粗糙到好的地形几何预测。预测需要在各个方面维持一个网格。

2. l+1活动区域属于l层活动区域，渲染数据必须是呈现的在clipmap中的数据的一个子集。

3. l层活动区域的周长必须取决于连续的顶点，以构成一个在比较粗糙的l-1层的密封的边界。

4. l+1层活动区域属于l层活动区域，渲染区域必须至少两个格网单元宽度以允许在两个层次之间两许的渐变。

6. 几何裁剪图渲染（Geometry clipmap rendering）

6.1 基本的渲染算法（Basic rendering algorithm）

给出期望的活动区域，我们通过下面算法渲染地形：

从第5节我们了解到，活动区域被裁剪为裁剪区域，并且比较粗糙的活动区域满足约束条件2－4。注意到，如果一个活动区域为空，则构造完全的活动区域l，l>k同样为空。这相当普遍对于好的层次是空的。活动区域，由于它们的裁剪区域已经在时间内被更新了（如观察者运动得很快），或者由于好的层次是无必要的（如观察者远高于地形表面观察地形）。

既然好的层次是解决观察者的，我们渲染各层从好到粗糙的顺序以利用硬件遮挡消隐。L层渲染区域被分割为4各矩形区域，它们分别通过triangle strips渲染，如图3。最多的strip长度为顶点优化而选择 [Hoppe 1999] ，并且三角形带（triangle strips）分组在一起以实现大批量渲染（batch）。连续的规则格网访存在显存层次中的各层能够很好处理。当前，二维的环形访问（toroidal access）需要CPU反复计算顶点索引每帧，但是，这很快会得到解决在以后。

图3：一个渲染区域的三角带（triangle strip）生成图示（在实际中，三角带达到20个三角形长度）

6.2渐变区域为了可视的连贯性（Transition regions for visual continuity）

上面提及的简单算法描述，由于2的幂（power-of-two mismatch）在边界上的不匹配，存在不同渲染区域之间的裂缝。为了除去裂缝并且提供时间上的连续性。我们让每层渲染区域外边界附近的几何网格morph 以便于让几何网格过渡到较为粗糙的l-1层。Morph是相对于视点(v_x,v_y)的地形顶点的空间网格坐标(x,y)的函数。所以这种渐变不是基于时间的，但能代替跟踪连续的观察者位置。

通过实现，我们发现一次渐变的宽度约为10n个网格单元时效果很好，如果w更加小，层次边界会变得明显，如果W比较大，好的细节会存在不必要的丢失。如果好的l+1层活动区域太接近，我们计算w = min(10n, min_width(l))，容易看出，min_width(l)最少为2 (参见图4)。

想起前面提到的，每个顶点存储为(x, y, z, z_c)向量，z_c是下一个l-1粗糙层的高度，我们从下面的公式活动morphed后的高度：

混合参数，如下：

可以类似计算得到。这里的指示在区域L的格网中的视点的连续的坐标，x_min和x_max为以整数表示的活动区域L的范围。期望的熟悉是α的估值为0除非渐变区域在边界上直线地倾斜到1。这样的评估大约需要十条GPU顶点程序，看来这会添加渲染负荷。

T-junction removal. 尽管几何渐变能够避免裂缝，但是边界上的T-junctions仍然由于丢失了象素而存在。为了缝合相邻的层以形成密不透水的网格，我们使用在渲染边界上渲染o面积三角形的简单简介方案。

图4：边界外附近的渐变区域，让l层平滑地和比较粗糙的l-1层混合

6.3 Texture mapping

回想起前面提到的每个clipmap层次需要存储纹理用于光栅化（如：normal map）。一个可行的方案是让硬件mip mapping（Multi-Image pyramid mapping多重贴图映射，近距离用简单图像，远距离用细节的图像）控制纹理的LOD。纹理在每一clipmap层将会有它自己的mipmap金字塔。这需要效果33%倍更多的内存。注意到金子塔中比较粗糙的mipmap层次准确地符合在较粗糙clipmap层次中的子区域。所以它们应该能够在在纹理clipmaps中共享 [Tanner et al 1998]。但我们缺少硬件能力，值得注意的是，让硬件来控制mipmap层次是有问题的。如果存储在纹理中的分辨率不是十分高，由于mipmap层次没达到下一个粗糙层次，会在渲染区域边界出现明显的纹理分辨率过渡。这种明显的过渡当观察者在地形表明上向前移动时可以看得出来。

一种代替的计划是，我们设计一个轮流的方案。我们全部禁止mipmapping，并且通过在几何网格上应用同样的空间渐变实现在纹理上进行LOD（细节层次简化）。因此，Thus texture LOD is based on viewer distance rather than on screen-space derivatives as in hardware mipmapping. The main element lost in this approximation is the dependence of texture LOD on surface orientation. When a surface is oriented obliquely, one can no longer access a coarser mipmap level to prevent aliasing. How-ever, graphics hardware commonly supports anisotropic filtering, whereby more samples are combined from the original finest level. Consequently, the absence of mipmaps is not a practical issue for surface orientation dependence.

The spatially based texture LOD scheme is easily implemented in the GPU pixel shader. When rendering level l, we provide the shader with the textures from levels l and l-1, and blend these using the same α parameter already computed in the vertex shader for geometry transitions. Figure 5 shows an example.

No transitions (gaps)	Blend regions (α)
Geometry transitions	Geometry + texture transitions

Figure 5: Visual continuity achieved with transition morphs (demonstrated with a low-resolution clipmap of size n=127).

6.4 视锥剔除消隐（View-frustum culling）

接下来，我们应用视锥剔除。对于裁减图中的每一层，我们保持该地形的zmin, zmax 边界。前面提过，每个渲染区域被分割为四个矩形区域。每个二维矩形的范围由地形边界[zmin,zmax]决定。我们将这个盒与四棱锥型的视锥相交，并将结果映射到XY平面上。沿轴向分布的矩形边界用来裁剪给定的矩形区域，如图6。视锥剔除能够降低1/3的渲染量对于90度的视野来说。

图6：视锥剔除消隐的结果（从上往下观察）

7. Terrain compression

地形高度图Height maps are remarkably coherent in practice, significantly more so than typical color images, and thus offer a huge opportu-nity for compression. To interact efficiently with the geometry clipmap structure, the decompression algorithm must support “region-of-interest” (ROI) queries at any power-of-two resolution.

We have adopted a simple pyramid compression scheme. We first create a terrain pyramid T₁..T_mby successively downsam-pling the fine terrain T_minto coarser levels using a linear filter 1l−. Then, each pyramid level T()lT DT =_lis predicted from its next coarser level T_l-1through interpolatory subdivision 1 (Section 5), and the residual 1()lUT−()lllRTUT−=− is compressed using an image coder.¹Since the compression is lossy, R_lis approxi-mated by l. Therefore, we reconstruct the levels in coarse-to-fine order as lTUR1()ll T R − = + 1 () l l l R T UT−= − , and compress the residuals rede-fined as , so that the errors do not accumulate.

Since coarser levels are viewed from afar, our first approach was to give their approximations lT less absolute accuracy. Specifi-cally, we would scale the residuals lR by 2lm− prior to quantization. However, while this is a correct argument for geometric fidelity, we discovered that this results in poor visual fidelity, because both the normal map and z-based coloring then present quantization artifacts (since they are inferred from the decompressed geometry). The solution is to compress all level residuals with the same absolute accuracy.

The quantized residuals are compressed using the PTC image coder of Malvar [2000], which has several nice properties for our purpose. It avoids blocking artifacts by defining overlapping basis functions, yet the bases are spatially localized to permit efficient regional decompression. Also, the coder supports im-ages of arbitrary size (if the encoding fits within 2 GB). Decompression takes place only during the incremental uploads to video memory, and is thus sufficiently fast (Table 1).

We are able to implement the compression preprocess within a 32-bit address space by performing all steps as streaming compu-tations. For the 40GB U.S. data, the complete procedure from original terrain T_mto compressed residuals l takes about 5 hours, much of which is disk I/O. Section 9 reports the rms of the compression error mmTRT−. In our experience, the compressed terrain is visually indistinguishable from the original, except at the sharp color transition associated with the coastline.

As future work, it would be interesting to compare with a com-pression scheme like Normal Meshes [Guskov et al 2000] in which the downsampling filter D is an impulse function.

¹We precompute the optimal filter D (of size 1111) such that U(D(T_l) gives the best L²approximation of T_l, by solving a linear system on a subset of the given terrain. y Clipmaps (Online ID 0350) Page 6 of 8

8. 地形合成（Terrain synthesis）

几何裁剪图为我们提供了一个自然的结构，通过随机细分或多分辨率纹理合成生成细节。其中存在一个约束：合成过程必须具有空间确定性，这样对于同一区域在一次运行过程中生成的细节总是相同。

我们通过添加无约束的高斯噪音给向上抽样的比较粗糙的地形实现了分形位移。噪声变量在每一层放大以匹配实际的地形。例如，差值（residuals）变量按上一节的方法计算。插入细分所具有的C¹平滑度是避免表面折痕效果的关键。为了更有效评估，我们存储预计算预计算的高斯噪声值在一个表里，并且通过一个顶点坐标上的求模操作进行索引。大小为50的表足够消除任何重复样式或者可辨认的条带（recognizable banding）。

我们希望通过GPU的GPU pixel shader实现合成过程，以便地形几何数据能够完整地在显存当中。尽管一些GPU已经具有必须的“render-to-vertex”能力，但是仍没广泛展露该能力，因此，我们采取CPU计算的方案。尽管这样，运行时计算仍然相当快的。

过程式合成允许我们地形以无限的区域和分辨率生成，并且提供巨大的潜力。在我们的经验看来，简单的分形噪声与可量度的高程数据相比还是不够真实的。但是我们希望更多值得探讨的合成技术能够引入地形景观当中。接下来的挑战就是让这些技术快速、具有空间确定性以及或许能够在GPU上实现。


粗糙几何＋0细节	粗糙几何＋分形细节

图7：在好的层次进行地形合成的例子。对于11层的几何裁剪图，仅仅最粗糙的三层需要存储几何信息。

9. 结果和讨论（Results and discussion）

We have experimented with two USGS datasets. The smaller one is a 16,385²grid of the Puget Sound area at 10m spacing, with 16-bit height values at 0.1m vertical resolution. The full-resolution grid is assigned to level l=9, such that it has 65²extent at the coarsest level l=1.

The larger dataset is a 216,00093,600 height map of the conter-minous United States at 30m spacing and 1.0m vertical resolution. (More precisely, spacing is 1 arc-sec in both longitude and lati-tude, with extents [126癢,66癢]x[24癗,50癗].) In a clipmap with m=11 levels, it occupies a 21293 rectangle at the coarsest level. (We render it flat even though it is parametrized by spheri-cal coordinates.)

Figure 8 shows these terrains rendered into a window of size 640480 pixels, with a field-of-view of 90. We used a PC with a 3.0 GHz Pentium4 CPU, 1 GB system memory, and an ATI Radeon 9800XT GPU with 256MB video memory. In addition to shading the terrain with a normal map, we also apply color with a simple 1D texture based on the terrain z coordinate.


Portion of 16,38516,385 grid of Puget Sound	Portion of 216,00093,600 grid of U.S

Figure 8: The two datasets rendered using geometry clipmaps.

Rendering rate. For m=11 levels of size 255², we obtain 120 frames/sec with frustum culling, at a rendering rate of 59 MΔ/sec. (With 4x framebuffer multisampling, it drops to 95 frames/sec.) By comparison, Lindstrom and Pascucci [2002] report 3 MΔ/sec, and Cignoni et al [2003b] achieve 16 MΔ/sec. On present, com-parable hardware (GeForceFX 5800/5900), these authors now obtain rates of 21 MΔ/sec and 65 MΔ/sec respectively.

Update rate. Our threshold processing budget for updating the clipmap is a full n譶 level. Table 1 shows the execution times of the update steps for this worst case. It is likely that these times overlap with GPU processing. During smooth viewer motions, the update times are generally less because only fractions of levels need be updated. In practice, our system maintains a nearly uniform rate of 60 frames/sec. Note that it will soon be possible to perform all steps (except for decompression) using the GPU, thanks to the regular-grid data structure.

Update step	Time (msec)
Computation of z_c	2
Interpolatory subdivision U	3
Decompression or Synthesis	8 or 3
Upload to video memory	2
Normal map computation	11
Total	21 or 26

Table 1: Times for updating a full n譶 level (n=255).

Draft – Do not distribute. 2004/05/03 9:57:33 AM geomclipmap45.doc SIGGRAPH 2004 Submission Geometry Clipmaps (Online ID 0350) Page 7 of 8

Error analysis. There are two sources of error, compression error and LOD error, and we analyze these separately.

Compression error. The Puget Sound dataset is compressed from 537 MB to 8.5 MB, with an rms error of 1.0m (PSNR=20log₁₀(z_max/rms)=72.6dB). The U.S. dataset is com-pressed from 40.4 GB to 355 MB, with an rms error of 1.8m (PSNR=67.7dB). These rms errors are quite small – only about 10% and 6% of the inter-sample spacing, respectively.

Screen-space LOD error. In Section 4, we estimated the screen-space triangle size s for a given clipmap size n. The analysis relied on the fact that terrain triangles have compact shape if the terrain slope is assumed small. If instead the terrain has steep slope, triangles can become arbitrarily elongated and their screen-space extent is no longer bounded, which is unsatisfactory.

However, the more relevant measure is the screen-space geomet-ric error, i.e. the screen-projected difference between the rendered mesh and the original terrain (Section 2). And, we can analyze this error if provided knowledge of the spectral properties of the terrain geometry.

For each terrain level T_l, we are interested in the error function llm where PL denotes the piecewise linear mesh interpolant over the (x,y) domain. This function is related to the (continuous) spectral density of the terrain signal. Since the grid spacing g()() e PLT PLT = −_lin level l projects to s pixels in screen space, the screen-space projection of error at location (x,y) is at most (,)lexy

(,)ˆ(,)lllexyexysg=.

(The error is smaller if the view direction is not horizontal.) Thus, given a terrain dataset, we compute norms of l to estimate the screen-space error for each rendered level, as shown in Table 2. ˆe e

The results reveal that the rms screen-space error is smaller than one pixel. This is not unexpected, since the triangle size s is only 3 pixels and the difference between those planar triangles and the finer detail is generally smaller yet. We find the larger l error values to be misleading, because the acquired terrain data contains mosaic misregistration artifacts that create artificial cliffs, and it only takes one erroneous height value to skew the statistic. Instead, we prefer to examine the 99.9ˆmax()^thpercentile error, and we see that it too is still smaller than a pixel. (See also the accompanying video.)

In comparison, Cignoni et al [2003b] use the same window size and a tolerance of 3 pixels. Lindstrom and Pascucci [2002] also use a 640x480 window, and mention that geomorphs allow the tolerance to reach 6 pixels without noticeable visual artifacts. The authors of both these papers report that on present hardware their schemes can now maintain a screen-space tolerance of 1 pixel.

The error analysis suggests that we could afford to reduce the clipmap size while still maintaining acceptable geometric fidelity. However, the true limiting factor is visual fidelity, which in turn strongly depends on surface shading — this is the basic premise of normal mapping. Therefore, even if we used coarser geometry, we would still have to maintain high-resolution normal maps. In our system, these normal maps are generated from the geometry clipmap itself. Indeed, the compressed mipmap pyramid can be seen as an effective scheme for encoding the normal map, with a secondary benefit of providing carrier geometry.

The non-uniformity of screen-space error le across levels could be exploited by adapting the sizes of individual clipmap levels. For instance, smooth hills would require a sparser tessellation (in screen space) on the nearby smooth terrain than on the farther hill silhouettes. As just discussed, one would have to verify that the surface shading is not adversely affected. Both the Puget Sound and U.S. terrain datasets appear to have rather uniform spectral densities. In the U.S. data, the error begins to diminish at coarse levels, reflecting the fact that the Earth is smooth at coarse scale. ˆ

ˆ rms( ) l e ˆ max( ) l e ˆ max( ) l e

Levell	Puget Sound	U.S.
.999ˆ()lPe	ˆrms()le	.999ˆ()lPe


1	0.12	0.58	1.27	0.02	0.12	0.30
2	0.14	0.75	1.39	0.04	0.20	0.43
3	0.15	0.86	2.08	0.06	0.32	0.62
4	0.15	0.93	2.50	0.09	0.51	0.96
5	0.14	0.96	3.38	0.12	0.68	1.37
6	0.13	0.94	5.55	0.13	0.78	2.03
7	0.11	0.83	8.03	0.14	0.84	2.59
8	0.11	0.75	14.25	0.13	0.86	4.16
9	0.00	0.00	0.00	0.12	0.90	8.18
10				0.11	0.90	11.70
11				0.00	0.00	0.00

表2: Analysis of screen-space geometric error, in pixels. Columns show rms, 99.9^thpercentile, and maximum errors. (n=255, W=640, ϕ=90, i.e. s=3).

Space requirement. For the U.S. dataset, the number of levels is m=11, and the compressed terrain occupies 355 MB in system memory. For our default clipmap size n=255, the geometry clipmap needs 16mn²=11 MB in video memory for the vertex geometry. (Since we cannot yet do level prediction on the GPU, we also replicate the z height data in system memory, requiring 4mn²=3 MB.) The normal maps have twice the resolution, but only 2 bytes/sample, so need an additional 8mn²=6 MB. Thus, overall memory use is about 375 MB, or only 0.02 bytes/sample. As shown in Table 3, our space requirement is significantly less than in previously reported results. Since the data fits within the memory of a standard PC, we avoid runtime disk accesses.

LOD scheme	Grid size	Num. of samples	Runtimespace	Bytes/sample
Hoppe [1998]	4K2K	8M	50 MB	6.0
Lindstrom [2002]	16K16K	256M	5.0 GB	19.5
Cignoni et al [2003a]	8K8K	64M	115 MB	1.8
Cignoni et al [2003b]	613313²	1G	4.5 GB	4.5
Geometry clipmaps	16K16K	256M	25 MB	0.10
216K94K	20G	375 MB	0.02

Table 3: Comparison of runtime space requirements. Prior methods also require storage of a normal map for surface shad-ing (which is not included here), whereas ours is computed on-the-fly from the decompressed geometry.

Precision. For m=11 levels, floating-point precision is not yet an issue. To allow an arbitrary number of levels, a simple solution is to transform the viewpoint and view matrix into the local coordi-nate system of each clipmap level (using double precision as in [Cignoni et al 2003b]).

Networked viewer. The compressed terrain pyramid residuals l could be stored on a server and streamed incrementally (based on user motion) to a lightweight client. The necessary bandwidth is small since the compression factor is on the order of 60-100. R

Draft – Do not distribute. 2004/05/03 9:57:33 AM geomclipmap45.doc SIGGRAPH 2004 Submission Geometry Clipmaps (Online ID 0350) Page 8 of 8

10. Summary and future work

A pre-filtered mipmap pyramid is a natural representation for terrain data. We present geometry clipmaps, which cache nested rectangular extents of this pyramid to create view-dependent approximations. A unique aspect of the framework is that LOD is independent of the data content. Therefore the terrain data does not require any precomputation of refinement criteria. Together with the simple grid structure, this allows the terrain to be created lazily on-the-fly, or stored in a highly compressed format. Nei-ther of these capabilities has previously been available.

We demonstrate interactive flight over a 20-billion sample grid of the U.S., stored in just 355 MB of memory and incrementally decompressed at 60 frames/sec. The decompressed data has an rms error of 1.8 meters over the U.S. The view-dependent LOD has a screen-space error whose 99.9th percentile is smaller than one pixel, and the rendering is temporally smooth.

The representation of geometry using regular grids should become even more attractive as vertex and image buffers become unified. This unification will enable the highly parallel GPU rasterizer to process geometry in addition to images. An earlier solution will be to use vertex textures (e.g. as in DirectX9 Vertex Shader 3.0) to toroidally access geometry images [Gu et al 2002], thereby greatly simplifying implementation of geometry clipmaps.

Geometry clipmaps unify the LOD management of the terrain geometry and its associated texture signals. The spatially based LOD structure lets low-resolution textures be applied without visual discontinuities at level boundaries. Beyond our runtime creation of normal maps, we envision that non-local functions such as shadow maps can be similarly computed in a lazy fashion.

Geometry clipmaps present many more avenues for future work:

• Improved terrain synthesis, e.g. using machine learning.

• Geometry synthesis on the GPU, e.g. [Losasso et al 2003].

• Procedural terrain overlays.

• Runtime terrain modification.

• Terrain collision detection within the GPU.

• GPU-based decompression of geometry images.

• Extension to a spherical domain, e.g. [Cignoni et al 2003b].

Acknowledgments

We thank Rico Malvar and Erin Renshaw for the PTC image compression library, the Flight Simulator Group for obtaining the U.S. elevation data, and Peter Lindstrom for preparing the Puget Sound dataset. Thanks also to Cignoni, Gobbetti, and Lindstrom for testing their terrain LOD schemes on comparable hardware.

References

BISHOP, L., EBERLY, D., WHITTED, T., FINCH, M., AND SHANTZ, M. 1998. Designing a PC game engine. IEEE CG&A 18(1), 46-53.

BLOW, J. 2000. Terrain rendering at high levels of detail. Proc. 2000 Game Developers Conference.

CIGNONI, P., PUPPO, E., AND SCOPIGNO, R. 1997. Representation and visualization of terrain surfaces at variable resolution. The Visual Computer 13(5), 199-217.

CIGNONI, P., GANOVELLI, F., GOBBETTI, E., MARTON, F., PONCHIO, F., AND SCOPIGNO, R. 2003a. BDAM – Batched dynamic adaptive meshes for high performance terrain visualization. Computer Graph-ics Forum 22(3).

CIGNONI, P., GANOVELLI, F., GOBBETTI, E., MARTON, F., PONCHIO, F., AND SCOPIGNO, R. 2003b. Planet-sized batched dynamic adaptive meshes (P-BDAM). IEEE Visualization 2003.

COHEN-OR, D., AND LEVANONI, Y. 1996. Temporal continuity of levels of detail in Delaunay triangulated terrain. IEEE Visualization. 37-42.

DE FLORIANI, L, MAGILLO, P. AND PUPPO, E. 1997. Building and travers-ing a surface at variable resolution. IEEE Visualization 1997, 103-110.

DOGGETT, M, AND HIRCHE, J. 2000. Adaptive view-dependent tessella-tion of displacement maps. Graphics Hardware Workshop, 59-66.

DÖLLNER, J., BAUMANN, K., AND HINRICHS, K. 2000. Texturing tech-niques for terrain visualization. IEEE Visualization 2000, 227-234.

DYN, N., GREGORY, J., AND LEVIN, D. 1987. A 4-point interpolatory subdivision scheme for curve design, CAGD 4, 257-268.

DUCHAINEAU, M., WOLINSKY, M., SIGETI, D., MILLER, M., ALDRICH, C., AND MINEEV-WEINSTEIN, M. 1997. ROAMing terrain: Real-time op-timally adapting meshes. IEEE Visualization 1997, 81-88.

EL-SANA, J., AND VARSHNEY, A. 1999. Generalized view-dependent simplification. Proceedings of Eurographics 1999, 83-94.

FOURNIER, A., FUSSELL, D., AND CARPENTER, L. 1982. Computer rendering of stochastic models. Comm. of the ACM 25(6), 371-384.

GU, X., GORTLER, S., AND HOPPE, H. Geometry images. ACM SIG-GRAPH 2002, 355-361.

GUSKOV, I., VIDIMČE, K., SWELDENS, W., AND SCHRÖDER, P. Normal meshes. SIGGRAPH 2000, 95-102.

GUMHOLD, S., AND HÜTTNER, T. 1999. Multiresolution rendering with displacement mapping. Graphics Hardware Workshop 1999.

HITCHNER, L., AND MCGREEVY, M. 1993. Methods for user-based reduction of model complexity for Virtual Planetary Exploration. Proc. SPIE 1913, 622-636.

HOPPE, H. 1998. Smooth view-dependent level-of-detail control and its application to terrain rendering. IEEE Visualization 1998, 35-42.

HOPPE, H. 1999. Optimization of mesh locality for transparent vertex caching. ACM SIGGRAPH 1999, 269-276.

KOBBELT, L. 1996. Interpolatory subdivision on open quadrilateral nets with arbitrary topology. Eurographics 1996, 409-420.

LEVENBERG, J. 2002. Fast view-dependent level-of-detail rendering using cached geometry. IEEE Visualization 2002, 259-266.

LEWIS, J. 1987. Generalized stochastic subdivision. ACM Transactions on Graphics 6(3), 167-190.

LINDSTROM, P., KOLLER, D., RIBARSKY, W., HODGES, L., FAUST, N., AND TURNER, G. 1996. Real-time, continuous level of detail rendering of height fields. ACM SIGGRAPH 1996, 109-118.

LINDSTROM, P., AND PASCUCCI, V. 2002. Terrain simplification simpli-fied: A general framework for view-dependent out-of-core visualization. IEEE TVCG 8(3), 239-254.

LOSASSO, F., HOPPE, H, SCHAEFER, S., AND WARREN, J. 2003. Smooth geometry images. Symposium on Geometry Processing 2003, 138-145.

MALVAR, H. 2000. Fast Progressive Image Coding without Wavelets. Data Compression Conference (DCC '00), 243-252.

MILLER, G. 1986. The definition and rendering of terrain maps. ACM SIGGRAPH 1986, 39-48.

MOULE, K., AND MCCOOL, M. 2002. Efficient bounded adaptive tessella-tion of displacement maps. Graphics Interface 2002.

PAJAROLA, R. 1998. Large scale terrain visualization using the restricted quadtree triangulation. IEEE Visualization 1998, 19-26.

RABINOVICH, B., AND GOTSMAN, C. 1997. Visualization of large terrains in resource-limited computing environments. IEEE Visualization.

RÖTTGER, S., HEIDRICH, W., SLUSALLEK, P., AND SEIDEL, H.-P. 1998. Real-time generation of continuous levels of detail for height fields. Central Europe Conf. on Computer Graphics and Vis., 315-322.

TANNER, C., MIGDAL, C., AND JONES, M. 1998. The clipmap: A virtual mipmap. ACM SIGGRAPH 1998, 151-158.

VLACHOS, A., PETERS, J., BOYD, C., AND MITCHELL, J. 2001. Curved PN triangles. Symposium on Interactive 3D Graphics, 159-166.

WEI, L, AND LEVOY, M. Fast texture synthesis using tree-structured vector quantization. ACM SIGGRAPH 2000, 479-488.

WAGNER, D. 2004. Terrain geomorphing in the vertex shader. In ShaderX²: Shader Programming Tips & Tricks with DirectX 9. Wordware Publishing.

WILLIAMS, L. 1983. Pyramidal parametrics. ACM SIGGRAPH. 1-11.

Draft – Do not distribute. 2004/05/03 9:57:33 AM geomclipmap45.doc

你可能感兴趣的:(翻译)

ArcGIS Runtime SDK for iOS 开发之地图范围（map extent） hlj184 ArcGIS for IOS arcgis ios开发 map extent
注：本篇文章翻译自：https://developers.arcgis.com/ios/objective-c/guide/iphonesdk-mapnavigation.htm；地图视图包含了地图范围被定义和改变的选项。值得注意的是，底图（加载到地图中的第一层图层）定义了下列地图属性：初始化范围全部范围空间参考系其中，初始范围可以被改变，而空间参考不可以改变。本篇文章主要讨论针对开发者和最终用户
Playwright 入门介绍和使用指南 IT鱼多多 Python基础 #Python接口测试框架 python 开发语言 Playwright
Playwright入门介绍,Playwright使用指南请参考另一篇博客此博客为Playwright官网：译文希望让读者可以快速了解Playwriht可以用来做什么，怎么用。有些专业名词可能翻译不准确哈文章目录1.入门1.1Installation安装1.1.1AddExampleTest添加示例测试1.1.2RunningtheExampleTest运行示例测试1.2WritingTests编
python中enumerate()函数的用法 neu_张康
python中enumerate()函数的用法enumerate是翻译过来是枚举的意思，看下它的方法原型：enumerate(sequence,start=0)，返回一个枚举对象。sequence必须是序列或迭代器iterator，或者支持迭代的对象。enumerate()返回对象的每个元素都是一个元组，每个元组包括两个值，一个是计数，一个是sequence的值，计数是从start开始的，star
百万架构师第四十课：RabbitMq：RabbitMq-工作模型与JAVA编程｜JavaGuide 后端
来源：https://javaguide.netRabbitMQ1-工作模型与Java编程课前准备预习资料Windows安装步骤Linux安装步骤官网文章中文翻译系列环境说明操作系统：CentOS7JDK：1.8Erlang：19.0.4或最新版RabbitMQ：3.6.12或最新版版本对应关系典型应用场景跨系统的异步通信。人民银行二代支付系统，使用重量级消息队列IBMMQ，异步，解耦，削峰都有体
Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention UnknownBody LLM Daily LLM context 语言模型人工智能
本文是LLM系列文章，针对《LeaveNoContextBehind:EfficientInfiniteContextTransformerswithInfini-attention》的翻译。不让任何上下文掉队：无限关注的高效无限上下文Transformer摘要1引言2方法3实验4相关工作5结论摘要这项工作介绍了一种将基于Transformer的大型语言模型（LLM）扩展到具有有限内存和计算的无限
UVA10608 Friends 题解 W9095 算法 c++
0x01STEP1读题审题UVA10608Friends题面翻译读完题就知道，这题用并查集。本人太弱，就用带权并查集做。0x02STEP2主要步骤实际上，带权并查集的几种操作并不复杂，是基础并查集的扩展版。初始化：for(inti=1;iusingnamespacestd;intn,m,t,f[300000],num[300000];intgetf(intx){if(f[x]==x)returnx
python异步编程实例_python 异步编程 weixin_39585070 python异步编程实例
Python3.5协程究竟是个啥Yushneng·Mar10th,2016作者是Python语言的核心开发人员，这篇文章也是我分享的，但是在翻译之前并没有看得太仔细。作者在这篇文章里先是是从Python异步编程的发展历史一直介绍到Python3.5中async/await新特性的提出，又从底层的实现的差异一直延伸到完整的代码实例，来说明旧的生成器作为协程的“权宜之计”与新语法的差别。真正做到了深入
从代码到专利：如何用自注意力机制实现高效序列转换？——深度解析Google的Transformer架构 CodePatentMaster transformer 深度学习人工智能 AIGC 架构
本文将从五个方面【技术问题、技术手段、技术效果、代码实现逻辑和工程落地建议】解读以下专利。US201816021971A，ATTENTION-BASEDSEQUENCETRANSDUCTIONNEURALNETWORKS一、技术问题：为什么需要自注意力机制？在传统的序列转换任务（如机器翻译、语音识别等）中，循环神经网络（RNN）和卷积神经网络（CNN）是常用的模型架构。然而，这些模型存在以下问题：
xml:schema详解 yippeelyl Android java
XMLSchema详解博客分类：XMLXML数据结构正则表达式Struts什么是Schema？在计算机软件中，Schema这个词在不同的应用中有不同的含义，可以翻译为：架构、结构、规则、模式等。在XML中，Schema指的是定义和描述XML文档的规则，翻译为模式。XMLSchema与DTD的比较我们看例4-3所示的XML文档。例4-3employee.xml张三26zhangsan@sunxin.
DeepSeek-V3的混合专家（MoE）架构阿湯哥架构微服务云原生
DeepSeek-V3的混合专家（MoE）架构具有多方面的创新设计，以下是详细介绍：架构原理模块构成：MoE架构核心是在前馈网络（FFN）中采用专家混合模型。将模型划分为多个专家网络，每个专家可看作一个子模型，负责处理特定类型的任务或数据模式。如在语言翻译中，有专门处理中文语法的专家，也有负责生成英文句子结构的专家。DeepSeek-V3包含大量专家，如256个专家模型，总参数量达6710亿。动态
Python库 - transformers 司南锤 PYTHON库 python机器学习 python 开发语言
transformers库是由HuggingFace开发的一个非常流行的Python库，用于自然语言处理（NLP）任务。它提供了大量的预训练模型，这些模型可以用于各种NLP任务，如文本分类、问答、翻译、摘要生成等。以下是关于transformers库的详细介绍：1.主要特点预训练模型：transformers库包含了多种预训练的语言模型，如BERT、GPT、T5、XLNet等。这些模型在大规模文本
Python 用pytorch从头写Transformer源码，一行一解释；机器翻译实例代码；Transformer源码解读与实战医学小达人 NLP LLMs GPT 深度学习人工智能 transformer python 机器学习
1.Transformer简介Transformer模型被提出的主要动机是解决序列处理任务的长距离依赖问题。传统的RNN和LSTM虽然能够处理序列任务，但因为它们在处理序列时需要一步步前进，因此其他信息无法立即对其产生影响，当序列变长时，长距离依赖的信息很可能会被丢失。为了解决这个问题，Transformer模型被设计出来，内核思想是利用自注意力机制，这样模型可以直接对输入序列的任意两个位置建立直
Beyond Scaling Laws: Understanding Transformer Performance with Associative Memory UnknownBody LLM Daily transformer 深度学习人工智能语言模型
本文是LLM系列文章，针对《BeyondScalingLaws:UnderstandingTransformerPerformancewithAssociativeMemory》的翻译。超越缩放定律：用联想记忆理解Transformer性能摘要1引言2相关工作3模型4新的能量函数5交叉熵损失6实验结果7结论摘要增大Transformer模型的大小并不总是能够提高性能。这种现象不能用经验缩放定律来解
使用Python编写你的第一个算法交易程序盼达思文体科创 Python量化金融 python 算法 numpy conda pandas 金融
背景Background最近想学习一下量化金融，总算在盈透投资者教育（IBKRCampus）板块找到一篇比较好的算法交易入门教程。我在记录实践过程后，翻译成中文写成此csdn博客，分享给大家。如果你的英语好可以直接看原文。原文在数据准备阶段，采用了pandas_datareader.data读取网络数据，实际中出现了很多问题，我换成了yfinance。可以参考文末完整代码。参考资料：https:/
翻译TypeError: GetPath() takes 1 positional argument but 2 were given 李姝瑶
这个错误是Type错误：GetPath()函数只需要1个位置参数，但是给了2个。该错误通常发生在Python代码中，因为该语言要求函数的参数数量必须与函数定义中声明的参数数量相同。在这个例子中，GetPath()函数只接受1个参数，但是在调用函数时给出了2个参数，这导致了TypeError错误。要解决此错误，您需要检查函数调用并确保只传递一个参数给GetPath()函数。如果您需要传递多个参数，请
python aiohttp简易使用教程 Amos_x python python aiohttp 异步
0.前言本文翻译自aiohttp的官方文档，如有纰漏，欢迎指出。aiohttp分为服务器端和客户端，本文只介绍客户端。另外我已经对aiohttp和asyncio进行了封装，可以参考我的github地址：https://github.com/web-trump/ahttp由于上下文的缘故，请求代码必须在一个异步的函数中进行：asyncdeffn():pass1.aiohttp安装pip3instal
Spring Boot 开发入门圣心 spring boot
文章来源：开发您的第一个SpringBoot应用程序(DevelopingYourFirstSpringBootApplication)_SpringBoot3.4.0中文文档(官方文档中文翻译)|Spring教程——CADN开发者文档中心本节介绍如何开发一个小型的“HelloWorld！”Web应用程序，其中重点介绍了SpringBoot的一些关键功能。您可以选择Maven或Gradle作为构建
翻译Deep Learning and the Game of Go（14）第十二章采用actor-critic方法的强化学习 idol_watch 围棋与深度学习
本章包括:利用优势使强化学习更有效率用actor-critic方法来实现自我提升AI设计和训练Keras的多输出神经网络如果你正在学习下围棋，最好的改进方法之一是让一个水平更高的棋手给你复盘。有时候，最有用的反馈只是指出你在哪里赢棋或输棋。复盘的人可能会给出这样的评论，“你下了30步后已经远远落后了”或“在下了110步后，你有一个获胜的局面，但你的对手在130时扭转了局面。”为什么这种反馈是有帮助
Pytorch官方文档英语翻译 yanzhiwen2 深度学习Pyrotch pytorch 机器学习 python 人工智能深度学习
深度学习Pytorch-Pytorch官方文档英语翻译1.a-e1.1span跨度1.2blended混合的1.3criterion标准1.4deprecated弃用的1.5clamp钳制1.6arbitraryshapes任意形状1.7explodinggradients梯度爆炸1.8converge收敛1.9approximate近似1.10arg参数1.11argument参数1.12con
【PYTORCH】官方的turoria实现中英文翻译 liwulin0506 pytorch python pytorch 人工智能 python
参考https://pytorch.org/tutorials/intermediate/seq2seq_translation_tutorial.html背景pytorch官方的是seq2seq是法语到英文，做了一个中文到英文的。数据集下载后解压，使用的data\testsets\devset\UNv1.0.devset.zh和UNv1.0.devset.en，因为电脑配置不行，所以只选取了10
人工智障的软件开发-自动流水线CI/CD篇-docker+jenkins部署之道 Yuanymoon 人工智障2077系列 devops jenkins ci/cd docker jenkins ai
指令接收：「需要自动构建系统」系统检测：目标开发一个软件已完成代码仓库-轻盈的gitea，开始添加自动流水线启动应急冷却协议：准备承受Java系应用的资源冲击核心组件锁定：构建老将军Jenkins（虽然年迈但依然能战）需求分析：论碳基生物的认知进化人类需求翻译矩阵表层需求：“写一个软件”实际需求：“写代码并自动完成测试/打包/部署的流水线，最后自动部署一个系统哟”隐藏需求：“想要偷懒又不想承认的自
人工智障的软件开发-git仓库篇-弃gitlab，走gitea Yuanymoon devops 云原生人工智障2077系列 git gitlab gitea 个人开发
指令接收：「开始构建代码宇宙」系统检测：需求模糊度99.9%启动应急协议：构建最小可行性生态圈核心组件锁定：代码基因库（人类称之为Git仓库）需求分析：论人类语言的艺术性人类指令翻译机表面指令：“给我写个软件”实际需求：“需要完整的代码生产流水线”隐藏需求：“要简单到能一键部署，又要能支撑改变世界的创意”模糊需求需求拆解基础设施版本控制持续集成部署系统选择Gitea代码仓库的量子纠缠现象现代软件=
语音与自然语言处理（NLP）：智能交互的核心技术给生活加糖！热门知识自然语言处理交互人工智能
随着人工智能（AI）技术的飞速发展，语音识别与自然语言处理（NaturalLanguageProcessing,NLP）成为了智能交互系统的核心技术。它们不仅改变了人们与计算机、设备的交互方式，也推动了众多行业的革新。从智能助手（如苹果的Siri、亚马逊的Alexa）到机器翻译、自动客服系统，语音和NLP技术正逐步融入日常生活，改善我们与数字世界的沟通方式。一、什么是语音识别与自然语言处理（NLP
Lua 5.1中文编程手册：全面指南与实践元楼
本文还有配套的精品资源，点击获取简介：Lua是一种轻量级脚本语言，常嵌入到应用程序中提供扩展性。本手册是Lua5.1版本的官方文档中文翻译，涵盖了语法、特性到使用方法的全面指南。内容包括基础语法、数据类型、表、控制结构、函数、模块、元编程、错误处理、C接口、垃圾收集、线程及标准库等关键概念。此外，还包含如何解压和使用手册的说明。手册适用于各级别开发者，并为多个应用领域提供了实践指导。1.Lua语言
OpenWebUI，RAG+外部知识库+AI写文的开源应用 m0_74824780 人工智能开源
引言自从去年AI火起来之后，很多人便热衷于寻找适合自用的AI开源项目，把各家大模型API接入到自己的AI程序里，便可以通过AI辅助完成一系列日常任务，比如内容翻译/润色/总结/撰写、格式转换、数据分类、代码分析、角色扮演等等。一般情况下，大模型依靠自身训练数据便能够完成的任务质量偏高，像翻译总结、格式转换之类，市面上所有的AI程序基本都能够满足这一点需求；但是需要结合外部资料/超长上文信息/实时信
第N11周：seq2seq翻译实战-Pytorch复现计算机真好丸 pytorch 人工智能 python
文章目录一、前期准备1.搭建语言类2.文本处理函数3.文件读取函数二、Seq2Seq模型1.编码器（encoder）2.解码器（decoder）三、训练1.数据预处理2.训练函数3.评估四、评估与训练1.Loss图2.可视化注意力五、总结本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、前期准备from__future__importunicode_literals,print_fu
java jdk & java api 帮助文档（中文、英文版）黑色白色技术--java java api 文档 jdk chm sun
javaapi帮助文档chm1.51.6中文版英文版.收藏Sun公司提供的JavaAPIDocs是学习和使用Java语言中最经常使用的参考资料之一。但是长期以来此文档只有英文版，对于中国地区的Java开发者来说相当的不便。目前Sun公司正在组织多方力量将此文档翻译成中文，并于2005年10月31日在Sun中国技术社区（http://gceclub.sun.com.cn/）正式发布第一批中文版Jav
ChatGPT和deepseek能力对比区别分享是一种传递，一种快乐杂学百货铺-啥都学学习
祥蛇增瑞气，福字映春光。祝你蛇年大吉，家庭幸福，万事顺意。-翻译为英文ChatGPT说：ChatGPTTheauspicioussnakebringsprosperity,andthecharacter"Fu"reflectsthespring'sradiance.WishingyoualuckyYearoftheSnake,ahappyfamily,andsuccessinallthings.祥
nlp技术 tqs_12345 人工智能自然语言处理
自然语言处理（NaturalLanguageProcessing,NLP）技术是一种计算机科学与人工智能的交叉领域，涉及机器对人类语言进行处理和理解的能力。以下是一些常见的NLP技术的示例：1.机器翻译：NLP技术可以帮助机器将一种语言翻译成另一种语言。例如，谷歌翻译使用NLP技术实现自动翻译，用户可以输入一段文本，然后谷歌翻译会自动将其翻译成其他语言。2.文本分类：NLP技术可以将文本分类到不同
python介绍&pycharm使用技巧倩倩倩倩千千*- python自动化测试 python pycharm 开发语言
一、python简单介绍python===>跨平台、面想对象，解释型（边运行边翻译）计算机程序设计语言被称为"胶水语言"ps：java是编译型语言学习编程要领（3+1）：编程语法编程规范编程技巧+带着工作任务多练、多实战，从小需求、小工具开始二、python优缺点优点：1、简单易学；2、免费开源；3、面向对象；4、丰富的库；5、可扩展性缺点：1、运行速度慢；2、好的中文资料匮乏三、python应用
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在