TTangled

Real-time Rendering (3rd edition)学习笔记第3章

第3章图像处理单元（The Graphics Processing Unit）
- 3.1 GPU 管道概述
- 3.2 可编程着色器阶段（The Programmable Shader Stage）
- 3.3 可编程着色的演变（The Evolution of Programmable Shading）
- - 3.3.1 着色器模型的比较（Comparison of Shader Models）
- 3.4 顶点着色器（The Vertex Shader）
- 3.5 几何着色器（The Geometry Shader）
- - 3.5.1 流输出（Stream Output）
- 3.6 像素着色器（The Pixel Shader）
- 3.7 合并阶段（The Merging Stage）
- 3.8 效果（Effects）
- Further Reading and Resources

第3章图像处理单元（The Graphics Processing Unit）

“The display is the computer.”—Jen-Hsun Huang

从历史上看，硬件图形加速始于管线的末端，首先对三角形的扫描线进行栅格化。随后，一代又一代的硬件开始备份管道(back up the pipeline)，直到一些更高级别的应用程序级算法被提交给硬件加速器。专用硬件相对于软件的唯一优势是速度，但是速度至关重要。
在过去的十年中，图形硬件经历了不可思议的转变。 1999年交付的第一款包含硬件顶点处理的消费类图形芯片（NVIDIA的GeForce256）。NVIDIA创造了图形处理单元（graphics processing unit,GPU）一词，以将GeForce 256与以前可用的仅光栅化芯片区分开来，并因此停滞[898]。在接下来的几年中，GPU从复杂的固定功能管道的可配置实现发展到高度可编程的空白状态，开发人员可以在其中实现自己的算法。各种可编程着色器(shaders)是控制GPU的主要方法。顶点着色器可对每个顶点执行各种操作（包括变换和变形）。类似地，像素着色器处理单个像素，从而允许对每个像素评估复杂的着色方程式。几何着色器允许GPU动态创建和销毁几何图元（点，线，三角形）。可以将计算的值写入多个高精度缓冲区，并重新用作顶点或纹理数据。为了提高效率，流水线的某些部分仍然是可配置的，而不是可编程的，但是趋势是朝着可编程性和灵活性的方向发展[123]。

3.1 GPU 管道概述

GPU实现了第2章中描述的几何和栅格化概念管线阶段。这些阶段分为具有不同程度的可配置性或可编程性的几个硬件阶段。图3.1显示了根据各个阶段的可编程性或可配置性对其进行颜色编码的各个阶段。请注意，这些物理阶段的划分与第2章中介绍的功能阶段略有不同。

图3.1 渲染管道的GPU实现。阶段根据用户对其操作的控制程度进行颜色编码。绿色阶段是完全可编程的。黄色阶段是可配置的，但不可编程，例如，裁剪阶段可以选择性地执行剔除或添加用户定义的裁剪平面。蓝色阶段的功能是完全固定的。

顶点着色器是一个完全可编程的阶段，通常用于实现“模型和视图变换”，“顶点着色”和“投影”功能阶段。几何着色器是一个可选的，完全可编程的平台，可在图元的顶点（点，线或三角形）上运行。它可用于执行每个图元的着色操作，销毁图元或创建新的图元。裁剪，屏幕映射，三角形设置和三角形遍历阶段是固定功能阶段，可实现相同名称的功能阶段。与顶点和几何着色器一样，像素着色器是完全可编程的，并执行“像素着色”功能阶段。最后，合并阶段介于着色器阶段的完全可编程性和其他阶段的固定操作之间。尽管它不是可编程的，但它是高度可配置的，可以设置为执行多种操作。当然，它实现了合并功能阶段，负责修改颜色，Z缓冲区，混合，模板和其他相关缓冲区。
随着时间的流逝，GPU管道已从硬编码操作演变为增加灵活性和控制能力。可编程着色器阶段的引入是这一发展过程中最重要的一步。下一节将介绍各个可编程阶段的通用功能。

3.2 可编程着色器阶段（The Programmable Shader Stage）

现代着色器阶段（即在Vista上支持Shader Model 4.0，DirectX 10及更高版本的着色器）使用公共着色器核心（common-shader core）。这意味着顶点，像素和几何着色器共享一个编程模型。在本书中，我们区分了通用着色器核心，应用程序程序员看到的功能描述和统一着色器（统一映射到该核心的GPU架构）。参见18.4节。通用着色器核心是API；具有统一的着色器是GPU的功能。较早的GPU在顶点着色器和像素着色器之间的通用性较低，并且没有几何着色器。尽管如此，该模型的大多数设计元素还是由较旧的硬件共享的。在大多数情况下，较旧版本的设计元素比较简单或缺失，没有根本不同。因此，目前我们将重点关注Shader Model 4.0，并在后面的部分中讨论较旧的GPU shader模型。
描述整个编程模型远远超出了本书的范围，并且已经有许多文档，书籍和网站[261，338，647，1084]。但是，请按顺序进行一些评论。使用类似于C的着色语言(shading languages)（例如HLSL，Cg和GLSL）对着色器进行编程。它们被编译为与机器无关的汇编语言，也称为中间语言（intermediate language,IL）。以前的着色器模型允许直接使用汇编语言进行编程，但是从DirectX 10开始，使用该语言的程序仅作为调试输出可见[123]。通常在驱动程序中，在单独的步骤中将此汇编语言转换为实际的机器语言。这种安排允许不同硬件实现之间的兼容性。这种汇编语言可以看作是定义虚拟机，其是着色语言编译器的目标。
该虚拟机是具有各种类型的寄存器和数据源的处理器，并通过一组指令进行编程。由于许多图形操作是在短矢量（最大长度为4）上完成的，因此该处理器具有4路SIMD（单指令多数据(single-instruction multiple-data)）功能。每个寄存器包含四个独立的值。基本数据类型是32位单精度浮点标量和向量。最近还添加了对32位整数的支持。浮点向量通常包含诸如位置（xyzw），法线，矩阵行，颜色（rgba）或纹理坐标（uvwq）之类的数据。整数最常用于表示计数器，索引或位掩码。还支持聚合数据类型，例如结构，数组和矩阵。为了方便使用向量，还支持旋转（复制）任何向量组件。即，向量的元素可以根据需要重新排序或复制。类似地，还支持仅使用指定矢量元素的遮罩。
绘制调用(draw call)调用图形API来绘制一组基元，从而使图形管道得以执行。每个可编程着色器阶段都有两种类型的输入：统一输入(uniform inputs)，其值在整个绘制调用期间保持恒定（但可以在绘制调用之间更改），以及变化的输入(varying inputs)，这些输入对于着色器处理的每个顶点或像素都是不同的。纹理是一种特殊的统一输入，它曾经总是应用于表面的彩色图像，但现在可以认为是任何大型数据数组。重要的是要注意，尽管着色器具有各种各样的输入，它们可以用不同的方式处理，但是输出却受到极大的限制。这是着色器与在通用处理器上执行的程序不同的最重要方式。基础虚拟机为不同类型的输入和输出提供特殊的寄存器。通过只读常量寄存器或常量缓冲区(constant registers or constant buffers)访问统一输入，之所以这样称呼，是因为它们的内容在一次绘制调用中是恒定的。可用的常量寄存器的数量远远大于可用于变化的输入或输出的寄存器的数量。这是因为变化的输入和输出需要针对每个顶点或像素分别存储，并且统一输入仅存储一次并在绘制调用中的所有顶点或像素之间重复使用。虚拟机还具有用于暂存空间的通用临时寄存器(temporary registers)。可以使用临时寄存器中的整数值对所有类型的寄存器进行数组索引。着色器虚拟机的输入和输出如图3.2所示。

图3.2 DirectX 10下的通用着色器核心虚拟机体系结构和寄存器布局。每个资源旁边都会显示最大可用数量。用斜杠分隔的三个数字表示顶点，几何和像素着色器的限制（从左到右）。

图形计算中常见的操作可在现代GPU上高效执行。通常，最快的运算是标量和向量乘法，加法及其组合，例如乘加和点积。其他运算，例如倒数，平方根，正弦，余弦，求幂和对数，往往会稍微花一些钱，但仍然相当快。纹理化操作（请参见第6章）是有效的，但是其性能可能受到诸如等待检索访问结果所花费的时间等因素的限制。着色语言通过*和+等运算符公开了这些运算中最常见的运算（例如加法和乘法）。其余的则通过内在函数(intrinsic functions)公开，例如**atan（），dot（），log（）*等。对于更复杂的操作，也存在内在函数，例如矢量归一化和反射，叉积，矩阵转置和行列式等。
术语流控制（flow control）是指使用分支指令来更改代码执行流。这些指令用于实现高级语言构造，例如if和case语句，以及各种类型的循环。着色器支持两种类型的流控制。静态流量控制（static
flow control）*分支基于统一输入的值。这意味着代码流在绘图调用中是恒定的。静态流控制的主要好处是允许将相同的着色器用于各种不同的情况（例如，不同数量的灯光）。动态流量控制(Dynamic flow control)基于变化的输入值。这比静态流控制功能强大得多，但成本更高，尤其是如果在着色器调用之间代码流不规则地更改时。如第18.4.2节所述，一次在一个顶点或多个像素上评估着色器。如果流为某些元素选择了if分支，为其他元素选择了else分支，则必须对所有元素都评估两个分支（并且丢弃每个元素的未使用分支）。可以在加载程序之前或在运行时离线编译着色器程序。与任何编译器一样，有用于生成不同输出文件和使用不同优化级别的选项。编译后的着色器以文本字符串形式存储，并通过驱动程序传递给GPU。

3.3 可编程着色的演变（The Evolution of Programmable Shading）

可编程阴影框架的构想可以追溯到1984年，库克的阴影树（shade trees）[194]。一个简单的着色器及其相应的着色树如图3.3所示。 RenderMan着色语言[30，1283]是在80年代后期从这个想法发展而来的，如今仍广泛用于电影制作渲染。在GPU原生支持可编程着色器之前，曾有几次尝试通过多次渲染实时实现可编程着色操作的尝试。 Quake III：Arena脚本语言是该地区在1999年的第一个广泛的商业成功[558，604]。在2000年，Peercy等人。 [993]描述了一种系统，该系统转换了RenderMan着色器以在图形硬件上多次运行。他们发现GPU缺乏使该方法变得非常通用的两个功能：将计算结果用作纹理坐标（依赖于纹理读取(dependent texture reads)）的能力以及对纹理和颜色缓冲区具有扩展范围和精度的数据类型的支持。提出的一种数据类型是一种新颖的（当时）16位浮点表示形式。目前，没有商用的GPU支持可编程着色，尽管大多数都具有高度可配置的管线[898]。

图3.3 一个简单的铜着色器的着色树及其相应的着色器语言程序。（在库克[194]之后）

在2001年初，NVIDIA的GeForce 3是第一个支持可编程顶点着色器[778]的GPU，该着色器通过DirectX 8.0和OpenGL扩展公开。这些着色器以一种类似于汇编的语言进行编程，该语言被驱动程序即时转换为微代码。像素着色器也包含在DirectX 8.0中，但是像素着色器SM 1.1缺少实际的可编程性，驱动程序将受支持的非常有限的程序转换为纹理混合状态，然后将其连接到硬件寄存器组合器中。这些程序不仅限于长度（12条指令或更少），而且缺少Peercy等人的两个要素（依赖纹理读取1和浮动数据）。已经确定对于真正的可编程性至关重要。
着色器此时不允许进行流控制（分支），因此必须通过计算两个项以及在结果之间进行选择或内插来模拟条件。 DirectX定义了着色器模型(Shader Model)的概念，以区分具有不同着色器功能的硬件。 GeForce 3支持顶点着色器模型1.1和像素着色器模型1.1（着色器模型1.0用于从未发售的硬件）。在2001年，GPU的发展更接近于通用的像素着色器编程模型。 DirectX 8.1添加了像素着色器模型1.2至1.4（每个都适用于不同的硬件），从而进一步扩展了像素着色器的功能，增加了其他指令，并为从属纹理读取提供了更多常规支持。
2002年见证了DirectX 9.0的发布，其中包括Shader Model 2.0（及其扩展版本2.X），该版本具有真正的可编程顶点和像素着色器。在OpenGL下使用各种扩展名也公开了类似的功能。添加了对任意相关纹理读取的支持以及16位浮点值的存储，最终完成了Peercy等人确定的一组要求。在2000年[993]。诸如指令，纹理和寄存器之类的着色器资源的限制增加了，因此着色器可以具有更复杂的效果。还增加了对流量控制的支持。着色器的长度和复杂性不断增长，使得汇编编程模型变得越来越麻烦。幸运的是，DirectX 9.0还包含了一种新的着色器编程语言，称为HLSL（高级着色语言）。 HLSL是由Microsoft与NVIDIA合作开发的，后者发布了名为Cg [818]的跨平台变体。大约在同一时间，OpenGL ARB（架构审查委员会）为OpenGL发布了某种类似的语言，称为GLSL [647，1084]（也称为GLslang）。这些语言在很大程度上受到C编程语言的语法和设计理念的影响，并且还包含来自RenderMan着色语言的元素。
Shader Model 3.0于2004年推出，是一项增量改进，将可选功能转变为需求，进一步增加了资源限制，并增加了对顶点着色器中纹理读取的有限支持。当在2005年末（Microsoft的Xbox 360）和2006年（Sony Computer Entertainment的PLAYSTATION 3系统）推出新一代游戏机时，它们都配备了Shader Model 3.0级GPU。固定功能的流水线并没有完全失效：任天堂的Wii控制台于2006年底交付，带有固定功能的GPU [207]。但是，几乎可以肯定这是该类型的最后一个控制台，因为即使是移动设备（例如手机）也可以使用可编程着色器（请参见第18.4.3节）。
提供了用于着色器开发的其他语言和环境。例如，Sh语言[837，838]允许通过C ++库生成和组合GPU着色器[839]。这个开源项目在许多平台上运行。另一方面，已经引入了几种视觉编程工具，以允许艺术家（其中大多数人不太喜欢使用C语言编写程序）来设计着色器。此类工具包括用于链接预定义着色器构建块的可视图形编辑器，以及将结果图形转换为着色语言（例如HLSL）的编译器。图3.4中显示了一个这样的工具（mental mill，包含在NVIDIA的FX Composer 2中）的屏幕快照。 McGuire等。 [847]考察了视觉着色器编程系统，并提出了该概念的高层抽象扩展。

图3.4 用于着色器设计的可视着色器图形系统。各种操作封装在功能框中，可在左侧选择。选中后，每个功能框都有可调参数，如右图所示。每个功能框的输入和输出相互链接以形成最终结果，如中间框架的右下方所示。（Screenshot from mental mill, mental images, inc.）

编程性的下一步是2007年。ShaderModel 4.0（包含在DirectX 10.0 [123]中，也可以通过扩展在OpenGL中使用）引入了几个主要功能，例如几何体着色器和流输出。
Shader Model 4.0包括了用于所有着色器（顶点，像素和几何）的统一编程模型，这是前面介绍的通用着色器核心。资源限制进一步增加，并增加了对整数数据类型（包括按位运算）的支持。 Shader Model 4.0的另一个显着特点是它仅支持高级语言着色器（DirectX的HLSL和OpenGL的GLSL），没有用户可写的汇编语言界面，如以前的模型中那样。
GPU供应商，Microsoft和OpenGL ARB继续完善和扩展可编程着色的功能。除了现有API的新版本之外，诸如NVIDIA的CUDA [211]和AMD的CTM [994]之类的新编程模型还针对非图形应用程序。第18.3.1节简要讨论了GPU（GPGPU）上的通用计算领域。

3.3.1 着色器模型的比较（Comparison of Shader Models）

尽管本章重点介绍Shader Model 4.0（撰写本文时是最新的），但开发人员经常需要支持使用较旧的着色模型的硬件。因此，我们将简要比较几种最新的着色模型的功能：2.0（及其2.X的扩展版本），3.0和4.0.2。所有差异的列表不在本书讨论范围之内。可从Microsoft开发人员网络（MSDN）及其DirectX SDK [261]获得详细信息。
由于它的发行版本不同，因此我们将重点放在DirectX上，而不是OpenGL不断发展的扩展级别，其中有些已由OpenGL体系结构审查委员会（ARB）批准，有些则针对特定供应商。该扩展系统的优势在于，可以立即使用特定独立硬件供应商（independent hardware vendor，IHV）的尖端功能。 DirectX 9和更早的版本通过公开功能位来支持IHV变化，这些功能位可以检查以查看GPU是否支持功能。借助DirectX 10，Microsoft大大地偏离了这种做法，转向了所有IHV必须支持的标准化模型。尽管此处重点关注DirectX，但以下讨论也与OpenGL有关，因为相同时间段的关联基础GPU具有相同的功能。
表3.1比较了各种着色器模型的功能。在表中，VS代表顶点着色器，PS代表像素着色器（Shader Model 4.0引入了几何着色器，其功能类似于顶点着色器）。如果VS和PS均未出现，则该行适用于顶点着色器和像素着色器。由于虚拟机是4路SIMD，因此每个寄存器可以存储一到四个独立的值。指令插槽是指着色器可以包含的最大指令数。最高已执行的步骤表示考虑分支和循环的情况下可以执行的最大指令数。温度寄存器显示可用于存储中间结果的通用寄存器的数量。常量寄存器指示可以输入到着色器的常量值的数量。流控制，谓词是指通过分支指令和谓词计算条件表达式并执行循环的能力（即，有条件地执行或跳过指令的能力）。纹理显示了着色器可以访问的不同纹理的数量（请参见第6章）（每个纹理可以多次访问）。整数支持是指能够使用按位运算符和整数算术对整数数据类型进行运算的能力。 VS输入寄存器显示了顶点着色器可以访问的各种输入寄存器的数量。内插器寄存器是顶点着色器的输出寄存器和像素着色器的输入寄存器。之所以称它们为“顶点着色器”，是因为从顶点着色器输出的值在被发送到像素着色器之前在三角形上进行了插值。最后，PS输出寄存器显示可以从像素着色器输出的寄存器数，每个寄存器绑定到一个不同的缓冲区或渲染目标（render target）。

表3.1 （以图片代替）着色器功能，由DirectX着色器模型版本[123、261、946、1055]列出

3.4 顶点着色器（The Vertex Shader）

顶点着色器是图3.1所示功能管线中的第一阶段。尽管这是进行任何图形处理的第一阶段，但值得注意的是，在此阶段之前发生了一些数据操作。在DirectX所谓的输入汇编器（input assembler）[123，261]中，可以将许多数据流编织在一起，以形成沿管道发送的一组顶点和图元。例如，一个对象可以由一个位置阵列和一个颜色阵列表示。输入汇编器将通过本质上创建具有位置和颜色的顶点来创建此对象的三角形（或线或点）。第二个对象可以使用相同的位置数组（以及不同的模型转换矩阵）和不同的颜色数组表示。数据表示在12.4.5节中详细讨论。输入汇编器中也支持执行实例化（instancing）。这允许一个对象被绘制多次，每个实例具有一些变化的数据，所有这些都可以通过一个绘制调用进行。第15.4.2节介绍了实例化的使用。 DirectX 10中的输入汇编器还用标识符编号标记每个实例，图元和顶点，随后的任何着色器阶段均可访问该标识符编号。对于早期的着色器模型，必须将此类数据显式添加到模型中。
三角形网格由一组顶点和附加信息表示，这些信息描述了形成每个三角形的顶点。顶点着色器是处理三角形网格的第一阶段。顶点着色器无法获取描述形成了哪些三角形的数据。顾名思义，它专门处理传入的顶点。一般而言，顶点着色器提供了一种修改，创建或忽略与每个多边形的顶点关联的值的方法，例如其颜色，法线，纹理坐标和位置。通常，顶点着色器程序会将顶点从模型空间转换为同构的剪辑空间。顶点着色器至少必须始终输出此位置。
此功能于2001年随DirectX 8首次引入。由于它是流水线的第一阶段，很少调用，因此可以在GPU或CPU上实现，然后将结果发送到GPU进行光栅化。这样做使得从较旧的硬件到较新的硬件的转换是速度问题，而不是功能问题。当前生产的所有GPU都支持顶点着色。
顶点着色器本身与前面3.2节中描述的通用核心虚拟机几乎相同。传入的每个顶点都由顶点着色器程序处理，然后输出在三角形或直线上插值的多个值。3顶点着色器既不能创建也不能破坏顶点，并且一个顶点生成的结果不能传递给另一个顶点。由于每个顶点都是独立处理的，因此可以将GPU上任意数量的着色器处理器并行应用于传入的顶点流。
随后的章节介绍了许多顶点着色器效果，例如阴影体积创建，用于动画关节的顶点混合以及轮廓渲染。顶点着色器的其他用途包括：

镜头效果（Lens effects），使屏幕出现鱼眼，在水下或以其他方式变形。
定义对象（Object definition），通过仅创建一次网格并使其由顶点着色器变形来进行对象定义。
对象扭转、弯曲和锥化操作。
程序变形（Procedural deformations），例如旗帜，布料或水的移动[592]。
原始创作（Primitive creation），通过将退化的网格发送到管道中，并根据需要为其分配面积。较新的GPU中的几何着色器已取代了此功能。
通过将整个帧缓冲区的内容用作经过程序变形的屏幕对齐网格上的纹理，可以实现页面卷曲，热雾，水波纹和其他效果。
顶点纹理获取（在SM 3.0及更高版本中可用）可用于将纹理应用于顶点网格，从而可以廉价地应用海洋表面和地形高度场[23，703，887]。
使用顶点着色器完成的一些变形如图3.5所示。

3.5 几何着色器（The Geometry Shader）

几何着色器是在2006年末发布的DirectX 10中添加到硬件加速的图形管道中的。它位于管道中顶点着色器之后，并且可以选择使用。虽然是Shader Model 4.0的必需部分，但在较早的着色器模型中未使用它。
几何着色器的输入是单个对象及其关联的顶点。该对象通常是网格，线段或仅是点中的三角形。另外，扩展的图元可以由几何着色器定义和处理。特别是，可以传入三角形外部的三个附加顶点，并且可以使用折线上的两个相邻顶点。见图3.6。

几何着色器处理此图元并输出零个或多个图元。输出为点，折线和三角形条的形式。例如，通过一次调用几何着色器程序，可以输出多个三角带。重要的是，几何着色器根本不会生成任何输出。通过这种方式，可以通过编辑顶点，添加新图元以及删除其他图元来选择性地修改网格。
几何着色器程序设置为输入一种类型的对象并输出一种类型的对象，并且这些类型不必匹配。例如，可以输入三角形，并将其质心输出为点，每个三角形输入一个。即使输入和输出对象类型匹配，也可以省略或扩展每个顶点处携带的数据。例如，可以计算三角形的平面法线并将其添加到每个输出顶点的数据中。与顶点着色器相似，几何着色器必须为生成的每个顶点输出均匀的剪切空间位置。
保证几何着色器以与输入相同的顺序从图元输出结果。这会影响性能，因为如果许多着色器单元并行运行，则必须保存和排序结果。作为功能和效率之间的折衷，在Shader Model 4.0中，每次执行最多可以生成1024个32位值。因此，以单个叶子作为输入生成一千个灌木叶子是不可行的，也不是几何着色器的推荐用法。不建议将简单表面细分为更复杂的三角形网格[123]。这个阶段更多地是关于以编程方式修改输入的数据或制作有限数量的副本，而不是大量复制或放大它。例如，一种用途是生成六个转换后的数据副本，以便同时渲染立方体贴图的六个面；见8.4.3节。可以利用几何着色器的其他算法包括从点数据创建各种大小的粒子，沿着轮廓拉伸鳍以进行毛发渲染以及为阴影算法找到对象边缘。有关更多信息，请参见图3.7。这些和其他用途将在本书的其余部分中讨论。

3.5.1 流输出（Stream Output）

GPU管线的标准用法是通过顶点着色器发送数据，然后栅格化生成的三角形并在像素着色器中处理它们。始终通过管道传递的数据，无法访问中间结果。流输出的想法是在Shader Model 4.0中引入的。在顶点着色器（以及可选的几何形状着色器）处理了顶点之后，除了可以发送到栅格化阶段之外，还可以将它们输出到流（即有序数组）中。实际上，光栅化可以完全关闭，然后将管道纯粹用作非图形流处理器。可以将通过这种方式处理的数据通过管道发送回去，从而允许进行迭代处理。如第10.7节所述，这种类型的操作对于模拟流水或其他粒子效果特别有用。

3.6 像素着色器（The Pixel Shader）

顶点和几何着色器执行完操作后，便会裁剪并设置图元以进行栅格化，如上一章所述。
流水线的这一部分在其处理步骤中是相对固定的，而不是可编程的。遍历每个三角形，并在整个三角形的区域内插值顶点的值。像素着色器是下一个可编程阶段。在OpenGL中，此阶段称为片段着色器（fragment shader），在某些方面它是一个更好的名称。这个想法是，三角形完全或部分覆盖每个像素的单元，并且所描绘的材质是不透明或透明的。光栅化器不会直接影响像素存储的颜色，而是会生成或多或少地描述三角形如何覆盖像素单元的数据。然后是在合并期间，使用此片段的数据来修改存储在像素处的内容。
顶点着色器程序的输出有效地成为像素着色器程序的输入。在Shader Model 4.0.5中，总共16个矢量（每个4个值）可以从顶点着色器传递到像素着色器。使用几何着色器时，可以将32个矢量输出到像素着色器[261]。
Shader Model 3.0的引入专门为像素着色器添加了其他输入。例如，添加了三角形的哪一侧可见作为输入标志。该知识对于一次通过每个三角形的正面和背面渲染不同的材质非常重要。片段的屏幕位置也可用于像素着色器。
像素着色器可以访问相邻像素的信息（尽管是间接的）的一种情况是梯度或导数信息的计算。像素着色器可以获取任何值并计算其沿x和y屏幕轴的每个像素的变化量。这对于各种计算和纹理寻址很有用。这些梯度对于诸如过滤之类的操作尤其重要（请参见第6.2.2节）。大多数GPU通过处理2x2或更多的像素来实现此功能。当像素着色器请求渐变值时，将返回相邻像素之间的差异。此实现的一个结果是，无法在受动态流控制影响的着色器的某些部分中访问渐变信息，组中的所有像素都必须处理相同的指令。这是一个基本限制，即使在脱机渲染系统中也存在[31]。访问渐变信息的能力是像素着色器的独特功能，其他任何可编程着色器阶段均不共享。
像素着色器程序通常会设置片段颜色以在最终合并阶段进行合并。光栅化阶段生成的深度值也可以由像素着色器修改。模板缓冲区值不可修改，而是传递到合并阶段。在SM 2.0及更高版本中，像素着色器也可以丢弃传入的片段数据，即不生成任何输出。此类操作可能会降低性能，因为通常无法再使用GPU通常执行的优化。有关详细信息，请参见第18.3.7节。雾计算和alpha测试等操作已从SM 4.0中的合并操作变为像素着色器计算[123]。
当前的像素着色器能够执行大量处理。在单个渲染过程中计算任意数量的值的能力引发了多个渲染目标（multiple render targets,MRT）的想法。代替将像素着色器程序的结果保存到单个颜色缓冲区中，可以为每个片段生成多个矢量并将其保存到不同的缓冲区中。这些缓冲区必须具有相同的尺寸，并且某些体系结构要求它们各自具有相同的位深度（尽管根据需要使用不同的格式）。表3.1中的PS输出寄存器的数目是指可访问的独立缓冲器的数目，即4或8。与可显示的彩色缓冲器不同，在任何其他目标上还有其他限制。例如，通常不能执行抗锯齿。即使有这些限制，MRT功能还是更有效地执行渲染算法的有力辅助。如果要从同一组数据中计算多个中间结果图像，则仅需要一次渲染通道，而不是每个输出缓冲区一次。与MRT相关的另一个关键功能是从这些结果图像中读取纹理的能力。

3.7 合并阶段（The Merging Stage）

如第2.4.4节所述，合并阶段是将各个片段（在像素着色器中生成）的深度和颜色与帧缓冲区组合在一起的阶段。此阶段是模板缓冲区和Z缓冲区操作发生的地方。此阶段中发生的另一种操作是颜色混合，它最常用于透明度和合成操作（请参见5.7节）。
合并阶段在固定功能阶段（例如剪切）和完全可编程的着色器阶段之间占据了一个有趣的中间点。尽管它不是可编程的，但其操作是高度可配置的。可以将颜色混合设置为执行大量不同的操作。最常见的是涉及颜色和Alpha值的乘法，加法和减法的组合，但是其他操作（例如最小和最大值）以及按位逻辑操作也是可能的。 DirectX 10添加了将像素着色器中的两种颜色与帧缓冲区颜色进行混合的功能，此功能称为双色混合（dual-color blending）。
如果采用了MRT功能，则可以在多个缓冲区上执行混合。 DirectX 10.1引入了对每个MRT缓冲区执行不同混合操作的功能。在以前的版本中，始终对所有缓冲区执行相同的混合操作（请注意，双色混合与MRT不兼容）。

3.8 效果（Effects）

到目前为止，流水线之旅已集中在各个可编程阶段。虽然顶点，几何和像素着色器程序是控制这些阶段所必需的，但它们并不是真空存在的。首先，单独的着色器程序在隔离方面不是特别有用：顶点着色器程序将其结果提供给像素着色器。必须加载这两个程序才能完成任何工作。程序员必须对顶点着色器的输出与像素着色器的输入进行一些匹配。可以通过几次遍历执行的任何数量的着色器程序来产生特定的渲染效果。除了着色器程序本身之外，有时还必须在特定配置中设置状态变量，以使这些程序正常工作。例如，渲染器的状态包括是否以及如何使用Z缓冲区和模板缓冲区，以及片段如何影响现有像素值（例如，替换，添加或混合）。
由于这些原因，各个小组已经开发了效果语言，例如HLSL FX，CgFX和COLLADA FX。效果文件尝试封装执行特定渲染算法所需的所有相关信息[261，974]。它通常定义一些可由应用程序分配的全局参数。例如，单个效果文件可能会定义渲染令人信服的塑料材料所需的顶点和像素着色器。它将显示诸如塑料颜色和粗糙度之类的参数，以便可以针对每个渲染的模型更改这些参数，但使用相同的效果文件。
为了展示效果文件的风格，我们将逐步介绍一个取自NVIDIA FX Composer 2效果系统的精简示例。 DirectX 9 HLSL效果文件实现了Gooch阴影的非常简化的形式[423]。 Gooch阴影的一部分是使用表面法线并将其与灯光的位置进行比较。如果法线指向灯光，则使用温暖的色调为表面着色；如果指向不对，则使用冷色调。介于两者之间的角度在这两种用户定义的颜色之间进行插值。这种阴影技术是非真实感渲染的一种形式，这是第11章的主题。图3.8显示了这种效果的示例。

效果变量在效果文件的开头定义。前几个变量是不可调整的，与摄像机位置相关的参数会自动跟踪效果：

float4x4 WorldXf : World;
float4x4 WorldITXf : WorldInverseTranspose;
float4x4 WvpXf : WorldViewProjection;

语法为id类型：语义（type id:semantic）。 float4x4类型用于矩阵，名称是用户定义的，语义是内置名称。顾名思义，WorldXf是模型到世界的转换矩阵，WorldITXf是该矩阵的逆转置，而WvpXf是从模型空间转换到摄影机剪辑空间的矩阵。这些具有公认语义的值应由应用程序提供，而不在用户界面中显示。接下来，指定用户定义的变量:

float3 Lamp0Pos : Position <
string Object = "PointLight0";
string UIName = "Lamp 0 Position";
string Space = "World";
> = {-0.5f, 2.0f, 1.25f};
float3 WarmColor <
string UIName = "Gooch Warm Tone";
string UIWidget = "Color";
> = {1.3f, 0.9f, 0.15f};
> float3 CoolColor <
string UIName = "Gooch Cool Tone";
string UIWidget = "Color";
> = {0.05f, 0.05f, 0.6f};

此处在尖括号**<>**中提供了一些其他注释，然后指定了默认值。注释是特定于应用程序的，对效果或着色器编译器没有任何意义。此类注释可以由应用程序查询。在这种情况下，注释描述了如何在用户界面中公开这些变量。接下来定义着色器输入和输出的数据结构:

struct appdata {
float3 Position : POSITION;
float3 Normal : NORMAL;
};
struct vertexOutput {
float4 HPosition : POSITION;
float3 LightVec : TEXCOORD1;
float3 WorldNormal : TEXCOORD2;
};

appdata定义模型中每个顶点的数据，因此定义了顶点着色器程序的输入数据。 vertexOutput是顶点着色器生成和消耗的像素着色器。使用**TEXCOORD ***作为输出名称是流水线演变的产物。首先，可以将多个纹理附着到一个表面，因此这些附加数据字段称为纹理坐标。实际上，这些字段保存从顶点传递到像素着色器的所有数据。接下来，定义各种着色器程序代码元素。我们只有一个顶点着色器程序：

vertexOutput std_VS(appdata IN) {
vertexOutput OUT;
float4 No = float4(IN.Normal,0);
OUT.WorldNormal = mul(No,WorldITXf).xyz;
float4 Po = float4(IN.Position,1);
float4 Pw = mul(Po,WorldXf);
OUT.LightVec = (Lamp0Pos - Pw.xyz);
OUT.HPosition = mul(Po,WvpXf);
return OUT;
}

该程序首先使用矩阵乘法计算世界空间中的表面法线。变换是下一章的主题，因此在此我们将不解释为什么使用逆转置。还可以通过应用屏幕外变换来计算世界空间中的位置。从光的位置减去该位置以获得从表面到光的方向向量。最后，将对象的位置转换为剪辑空间，以供光栅化器使用。这是任何顶点着色器程序的必需输出。给定光的方向和世界空间中的表面法线，像素着色器程序将计算表面颜色：

float4 gooch_PS(vertexOutput IN) : COLOR
{
float3 Ln = normalize(IN.LightVec);
float3 Nn = normalize(IN.WorldNormal);
float ldn = dot(Ln,Nn);
float mixer = 0.5 * (ldn + 1.0);
float4 result = lerp(CoolColor, WarmColor, mixer);
return result;
}

向量Ln是归一化的光方向，Nn是归一化的表面法线。通过归一化，这两个向量的点积ldn表示它们之间角度的余弦。我们想使用此值在冷色调和暖色调之间线性插值。函数lerp（）期望一个介于0和1之间的混合器值，其中0表示使用CoolColor，1表示使用WarmColor，以及介于两者之间的值来混合两者。由于角度的余弦值的取值为[1，1]，因此mixer值将此范围转换为[0，1]。然后，该值用于混合色调并生成具有适当颜色的片段。这些着色器是功能。效果文件可以包含许多功能，并且可以包括其他效果文件中的常用功能。一个pass通常包括顶点和像素（和几何）着色器，以及通过所需的任何状态设置。一个technique是一组一个或多个通过以产生所需效果的过程。这个简单的文件只有一项技术，只有一项：

technique Gooch < string Script = "Pass=p0;"; > {
pass p0 < string Script = "Draw=geometry;"; > {
VertexShader = compile vs_2_0 std_VS();
PixelShader = compile ps_2_a gooch_PS();
ZEnable = true;
ZWriteEnable = true;
ZFunc = LessEqual;
AlphaBlendEnable = false;
}
}

这些状态设置强制Z缓冲区以正常方式使用，以进行读写操作，如果片段的深度小于或等于所存储的z深度，则通过传递。 Alpha混合功能已关闭，因为使用此技术的模型被认为是不透明的。这些规则意味着，如果片段的z深度等于或小于存储的片段深度，则使用计算出的片段颜色替换相应像素的颜色。换句话说，使用标准的Z缓冲区用法。
多种技术可以存储在同一效果文件中。这些技术通常是具有相同效果的变体，每种变体针对的是不同的着色器模型（例如，SM 2.0与SM 3.0）。多种效果都是可能的。图3.9仅展示了现代可编程着色器管线的功能。效果通常会封装相关技术。已经开发出各种方法来管理着色器集[845、847、887、974、1271]。

我们已经结束了GPU本身的浏览。 GPU还有很多其他功能，以及可以使用和组合其功能的多种方式。调整以利用这些功能的相关理论和算法是本书的重点。有了这些基础知识之后，重点将转移到提供对转换和视觉外观（管道中的关键元素）的深入了解。

Further Reading and Resources

David Blythe在DirectX 10 [123]上的论文很好地概述了现代GPU管道及其设计背后的原理，并提供了相关文章的参考。
仅关于编程顶点和像素着色器的信息就可以轻松地完成一本书。我们的最佳建议：访问ATI [50]和NVIDIA [944]开发人员网站，以获取有关最新技术的信息。他们免费的FX Composer 2和RenderMonkey交互式着色器设计工具套件提供了一种绝佳的方式来试用着色器，对其进行修改并查看使它们打勾的原因。 Sander [1105]为支持SM 2.0的硬件在HLSL中提供了固定功能管道的实现。
要学习着色器编程的形式方面，需要花费一些工作。 OpenGL着色语言书（OpenGL Shading Language）[1084]从《红皮书》（969）遗漏的地方开始，描述了GLSL（OpenGL可编程着色语言）。为了学习HLSL，DirectX API随每个新版本而不断发展。有关其SDK以外的相关链接和书籍，请参见本书的网站（http://www.realtimerendering.com）。 O Rorke的文章[974]提供了有关效果和管理着色器的有效方法的可读介绍。 Cg语言提供了一层抽象，可以导出到许多主要的API和平台，同时还为主要的建模和动画程序包提供了插件工具。 Sh元编程语言仍然更加抽象，本质上是充当C ++库的工作，该库将相关的图形代码映射到GPU。
有关高级着色器技术的信息，请首先阅读GPU Gems和ShaderX系列书籍。游戏编程宝石（Game Programming Gems）一书也有一些相关文章。 DirectX SDK [261]有许多重要的着色器和算法示例。

你可能感兴趣的:(编程语言)

【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
自动化测试工程师面试，常问的问题有哪些？自动化测试老司机软件测试测试工程师自动化测试面试职场和发展软件测试 selenium 测试工具 android 测试工程师
自动化测试工程师面试是非常重要的环节，面试官会通过一系列的问题来评估候选人的技能和经验。下面是一些常见的问题，以及如何详细而规范地回答这些问题的建议。1.请介绍一下你的自动化测试经验。回答这个问题时，可以从项目经验、使用的自动化测试工具、编写的测试脚本等方面来介绍自己的经验。重点强调你在自动化测试领域的技能和擅长的领域。2.你在自动化测试中使用的编程语言是什么？为什么选择这种语言？回答这个问题时，
使用Python和Playwright破解滑动验证码 asfdsgdf python 开发语言
滑动验证码是一种常见的验证码形式，通过拖动滑块将缺失的拼图块对准原图中的空缺位置来验证用户操作。本文将介绍如何使用Python中的OpenCV进行模板匹配，并结合Playwright实现自动化破解滑动验证码的过程。所需技术OpenCV模板匹配：用于识别滑块在背景图中的正确位置。Python：主要编程语言。Playwright：用于浏览器自动化，模拟用户操作。破解过程概述获取验证码图像：下载背景图和
爬虫技术抓取网站数据 Bearjumpingcandy 爬虫
爬虫技术是指通过程序自动访问网页并提取数据的技术。一般来说，爬虫技术包含以下几个步骤：确定目标网站：确定需要抓取的网站，并了解其页面结构和数据特点。分析页面结构：分析网页的结构和源代码，找到需要抓取的数据在页面中的位置和标识。编写爬虫程序：使用编程语言（如Python）编写爬虫程序，实现对目标网站的自动访问和数据提取。处理抓取数据：对抓取到的数据进行清洗、去重、整合等处理，以便后续的分析和利用。爬
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
Go编程语言前景怎么样？参加培训好就业吗 QFdongdong
Go语言专门针对多处理器系统应用程序的编程进行了优化，使用Go编译的程序可以媲美C或C++代码的速度，而且更加安全、支持并行进程。不仅可以开发web,可以开发底层，目前知乎就是用golang开发。区块链首选语言就是go,以-太坊，超级账本都是基于go语言，还有go语言版本的btcd.Go的目标是希望提升现有编程语言对程序库等依赖性(dependency)的管理，这些软件元素会被应用程序反复调用。由
由于直接在一个回答中提供完整且多语言的游戏商城代码是不现实的（因为每种语言都有其独特的语法和库），我将为你概述一个游戏商城的核心概念，并提供几种不同编程语言的基本框架或示例代码段。 uthRaman 游戏 python 开发语言
商城系统概述hailiangwang.com游戏商城系统通常包含以下部分：用户系统（登录、注册、用户信息）商品列表（游戏、DLC、虚拟货币等）购物车系统支付系统订单系统2.示例框架（伪代码）首先，我们给出一个伪代码框架，描述商城的核心逻辑。plaintextclassUser:deflogin(username,password):#验证用户登录passdefregister(username,p
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
go语言安装快速入门吉祥鸟hu
[TOC]go语言是什么Go是一个开源的编程语言，它能让构造简单、可靠且高效的软件变得容易。Go是从2007年末由RobertGriesemer,RobPike,KenThompson主持开发，后来还加入了IanLanceTaylor,RussCox等人，并最终于2009年11月开源，在2012年早些时候发布了Go1稳定版本。现在Go的开发已经是完全开放的，并且拥有一个活跃的社区如何安装环境笔者这
前端HTML+CSS+JS的入门学习俊昭喜喜里前端 html css
一.HTMLHTML（HyperTextMarkupLanguage）即超文本标记语言，是用于创建网页和网页应用程序的标准标记语言。它不是一种编程语言，而是一种标记语言，通过一系列的元素（elements）来告诉浏览器如何显示网页上的内容，如文本、图片、链接、表格、列表等。HTML文档由一系列的标签（tags）组成，这些标签告诉浏览器如何显示内容。标签通常成对出现，例如和，其中是开始标签，表示一个
笔记：Python顺序结构练习题辞言i 笔记 python
文章目录前言一、什么是顺序结构？二、练习题1.题目2.填空题3.简答题4.编程题总结前言本次笔记旨在帮助读者加深对Python编程语言中顺序结构和选择题的理解。在学习Python编程过程中，掌握程序的基本结构以及条件语句的使用至关重要。通过本次练习题，读者将有机会测试自己对这些概念的掌握程度，并通过实际应用进一步巩固所学知识。本次练习题将涵盖Python中的顺序结构的练习题，旨在帮助读者提高解决问
OpenCV结构分析与形状描述符（24）检测两个旋转矩形之间是否相交的一个函数rotatedRectangleIntersection()的使用 jndingxin OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述测两个旋转矩形之间是否存在交集。如果存在交集，则还返回交集区域的顶点。下面是一些交集配置的例子。斜线图案表示交集区域，红色顶点是由函数返回的。rotatedRectangleIntersection()这个函数看起来像是用于检测两个旋转矩形之间是否相交的一个方法。
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
Python前沿技术：机器学习与人工智能 4.0啊 Python 人工智能 python 机器学习
Python前沿技术：机器学习与人工智能一、引言随着科技的飞速发展，机器学习和人工智能（AI）已经成为了计算机科学领域的热门话题。Python作为一门易学易用且功能强大的编程语言，已经成为了这两个领域的首选语言之一。本文将深入探讨Python在机器学习和人工智能领域的应用，以及一些前沿技术和工具。二、Python机器学习基础2.1机器学习概述机器学习是人工智能（AI）的一个关键子集，它的核心在于让
Rust中的所有权和借用规则详解代码云1 rust 开发语言后端
Rust是一种系统编程语言，其设计目标包括内存安全、并发安全以及性能。为了实现这些目标，Rust引入了一系列独特的编程概念，其中最为核心的就是所有权（Ownership）和借用（Borrowing）规则。本文将详细解释Rust中的所有权和借用规则，以及它们如何确保内存安全和并发安全。一、所有权规则在Rust中，每一个值都有一个与之关联的所有者。这个所有者可以是变量、数据结构或者是其他形式的存储。所
chatgpt赋能python：如何在Python中计算平均值 tulingtest ChatGpt python chatgpt numpy 计算机
如何在Python中计算平均值计算平均值是数据分析、统计和机器学习等许多领域中的常见任务。Python作为一门功能强大且易于学习的编程语言，为计算平均值提供了多种方法。在本文中，我们将介绍如何在Python中计算平均值。什么是平均值简单来说，平均值是一组数字的总和除以数字的数量。例如，对于数字序列1，3，5，7，9，平均值是(1+3+5+7+9)/5=5。平均值在数据分析中非常有用，因为它可以提供
chatgpt赋能python：如何在Python中安装Keras库？ turensu ChatGpt python chatgpt keras 计算机
如何在Python中安装Keras库？Keras是一个简单易用的神经网络库，由FrançoisChollet编写。它在Python编程语言中实现了深度学习的功能，可以使您更轻松地构建和试验不同类型的神经网络。如果您是一名Python开发人员，肯定会想知道如何在您的Python项目中安装Keras库。在本文中，我们将向您展示如何安装和配置Keras库。步骤1：安装Python要使用Keras库，您需
程序员35岁会失业吗？ Good kid. 经验分享笔记
35岁被认为是程序员职业生涯的分水岭，许多程序员开始担忧自己的职业发展是否会受到年龄的限制。有人担心随着年龄的增长，技术更新换代的速度会使得资深程序员难以跟上；而另一些人则认为，丰富的经验和深厚的技术积累是年轻程序员无法比拟的宝贵财富。那么，让我们来探讨一下这个话题。技术更新与个人适应性确实，技术的快速发展对程序员的职业技能有一定的影响。新的编程语言、框架和工具不断涌现，程序员需要不断学习和适应这
Python教程：面向对象无敌开心 python 开发语言
模块3：Python高级模块概述本课程旨在介绍Python编程语言中的面向对象编程（OOP）概念和技术。学生将学习如何使用类、对象、继承、多态等OOP的关键要素来构建灵活、可重用和可扩展的代码。通过实际编程练习和项目，学生将提高他们的编程技能，学会设计和实现面向对象的解决方案。面向对象编程是在面向过程编程的基础上发展来的，它比面向过程编程具有更强的灵活性和扩展性。面向对象编程是程序员发展的分水岭，
Python最全的股票数据API接口 w_traveler python 开发语言大数据
python最全的股票数据API接口使用python是一种有效的方式来获取高频股票数据，以便进行股票行情数据分析和量化交易。python是一种广泛应用于金融数据领域的编程语言，可用于与股票数据API接口进行交互。通过调用股票数据API接口，我们可以获取实时的股票数据，包括tick数据和k线历史数据。tick数据提供了每次交易的详细信息，而k线历史数据则提供了一段时间内港股、美股、A股、沪深行情数据
Python——俄罗斯方块星和月 python pygame 开发语言
俄罗斯方块游戏是一款经典的益智游戏，通常使用编程语言Python来实现。下面是一个简单的俄罗斯方块游戏的示例代码：importpygameimportrandom#定义颜色BLACK=(0,0,0)WHITE=(255,255,255)RED=(255,0,0)GREEN=(0,255,0)BLUE=(0,0,255)CYAN=(0,255,255)MAGENTA=(255,0,255)YELLO
Python最全的股票数据API接口 w_traveler python 开发语言
1、前言Python最全的股票数据API接口在当今数字化的金融世界中，股市API很重要，通过股票API接口获取准确且实时的股票数据对于投资者和程序开发者来说至关重要。Python作为一种广泛使用的编程语言，提供了丰富的工具和库，使得获取股票数据变得轻而易举。本文将介绍Python提供的最全面的股票数据API接口，为您提供全方位的投资行情服务，包括美股、港股、A股的行情数据和tick数据、k线数据，
Protobuf学习 - 入门 weixin_30892987 c/c++python 数据结构与算法
古之立大事者，不惟有超世之才，亦必有坚忍不拔之志--苏轼·《晁错论》从公司的项目源码中看到了这个东西，觉得挺好用的，写篇博客做下小总结。下面的操作以C++为编程语言，protoc的版本为libprotoc3.2.0。一、Protobuf？1.是什么？GoogleProtocolBuffer(简称Protobuf)是一种轻便高效的结构化数据存储格式，平台无关、语言无关、可扩展，可用于通讯协议和数据存
Java 学习路线：语言、框架、中间件与数据库高危型 java
Java是一门功能强大、应用广泛的编程语言，适用于企业级应用、Web开发、大数据处理、Android开发等各种场景。这里为大家介绍了一下我认为较为合适的学习路线一、Java基础1.1Java语言基础1.1.1安装JDK和IDE安装JDK：下载JDK：访问Oracle官网，下载最新的JavaDevelopmentKit（JDK）。安装JDK：按照操作系统要求安装JDK并配置环境变量。Windows上
Linux 调试器 GDB 使用指南方歧 LInux linux 运维服务器
在Linux环境下开发和调试程序时，GNU调试器（GDB）是一个强大的工具。它支持多种编程语言（如C、C++、Fortran等），并且可以帮助开发人员检测、排除和修复程序中的错误。GDB能够让你在程序运行时暂停，查看内存和变量的状态，甚至修改程序的执行流程，是开发人员不可或缺的调试工具之一。在本篇博客中，我们将详细介绍如何使用GDB进行调试，帮助你快速上手并掌握这款工具的基本功能。一、GDB简介G
【C++】面试基础重点知识洁洁！ c++c++面试算法
进程虚拟地址空间划分和布局函数调用堆栈的详细过程进程虚拟地址空间划分和布局任何的编程语言=》都会产生两种东西1.指令2.数据当一个程序运行时，Linux操作系统会给当前进程分配一个2的32次方的一块虚拟地址空间也就是4个G。（×8632位Linux系统下）拓展：它存在，你可以看得见，它是物理的它存在，你看不见，它是透明的它不存在，你却可以看见，它是虚拟的它不存在，你也看不见，它是被删除的用户空间（
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n