大汉李伟

Vertex Shaders

学习了顶点处理，你就知道固定功能流水线怎么将顶点从模型空间坐标系统转化到屏幕空间坐标系统。虽然固定功能流水线也可以通过设置渲染状态和参数来改变最终输出的结果，但是它的整体功能还是受限。当我们想实现一个外来的光照模型，外来的Fog或者点大小计算方式，等等，我们可能就放弃使用固定功能流水线，转而使用CPU来实现这些计算。

使用vertex shaders，它用一段小程序替换固定功能处理。这段小程序的输入是模型空间的顶点，输出齐次剪裁空间的顶点，并且还携带一些信息，如：per-vertex diffuse 和 specualr，雾，透明度，纹理坐标和点大小。

这一节我们将先讲述vertex shaders的汇编语言编程模型。

Vertex Shader Arichitecture

Direct3D对于不同的图形处理器有不同的vertex shaders架构版本。每个版本都有不同数目和类型的寄存器和不同的指令集。一般情况，高版本一般是低版本的衍生品，提供了更多的指令和更少限制。我们将先看完整的1.1版本，然后讨论各个版本在上面的增量。

DirectX 9.0c 支持的vertex shader版本包括1.1,2.0,2.x和3.0。这些版本的汇编语言的语法标志是：vs_1_1, vs_2_0, vs_2_x和vs_3_0。在老的SDK和文档里面，你也许会看到vs_2_a和vs_2_b，他们已经融合到了vs_2_x版本里面了。当你安装SDK的时候，vertex shader的特殊版本也将会安装，如vs_2_sw和vs_3_sw，这两个版本只用于软件处理，专门用于做模拟和调试之用。shader的软件版本实现了2.0和3.0架构所有的功能，并且大部分的shader验证将被放开。

shader 版本	vs_1_1	vs_2_0	vs_2_x	vs_3_0
指令数目	128	256	>=256	>=512

所有的架构都共享一个公共的执行模型。执行程序称做shader，它在每个顶点上执行一次。shader包含一个或多个指令，每个指令由一个操作码与0个或多个操作数组成的。shader可以访问五组不同的寄存器：顶点数据的input寄存器，渲染参数的const寄存器，用于查询const寄存器的地址寄存器，存储临时数据的临时寄存器，采样纹理的采样寄存器，shader输出结果的ouput寄存器。不同类型寄存器的数目如下表。

Version	a0	aL	bn	cn	in	on	p0	rn	sn	vn
vs_1_1	1	0	0	>=96	0	13	0	12	0	16
vs_2_0	1	1	16	>=256	16	13	0	12	0	16
vs_2_x	1	1	16	>=256	16	13	1	>=12	0	16
vs_3_0	1	1	16	>=256	16	12	1	32	4	16

每个临时寄存器都存储一个四维的向量值，大多数指令都是在四维向量上进行操作。每个值都是一个浮点值，一般有6个小数数字。指令一般是通用算术运算，如加，乘和一般的向量计算（点积，向量矩阵乘法）。跟一般的CPU不一样的是，低版本的shader一般不支持流控制，以便于shader更加简单和容易硬件加速。

input 寄存器

顶点组件通过合适的顶点声明映射到对应的semantics上。semantics使用dcl_usage指令与shader的输入寄存器关联。输入寄存器是只读的，只能用作顶点shader指令的数据源。虽然不同的操作数能应用到不同的修饰符，每个指令只能引用一个input regesiter。

const 寄存器和地址寄存器

不随着每个顶点变化的参数可以存放在const 寄存器。所有的shader版本都支持浮点const,整数const ， bool const只能用在2.0以上的shader版本。每个指令一次只能访问一个const 寄存器，但是不同的源操作数可以访问带有修饰符的同一个const寄存器。 const寄存器值在shader 里面一般是通过def, defb和defi指令定义的，它也能来自于设备，通过方法：SetVertexShaderConstantF, SetVertexShaderConstantB 和 SetVertexShaderConstantI。你可以认为通过shader指令定义的值为local const，而通过设备方法定义的const为global const。

地址寄存器是一个带符号的整数，记录了距离base const寄存器的位置偏移量。const寄存器是只读的，地址寄存器是可写的。当地址寄存器越界，它的值将是(0,0,0,0)。在使用地址寄存器之前，必须先初始化它。

shader 1.1 只能使用地址寄存器的x组件来作为索引。并且地址寄存器只能被设置成mov指令的目的地，当使用它的时候它将进行四舍五入成整数。 shader 2.0以上的版本提供了更加通用的一种使用方式。寄存器的四个组件都可以用来作为索引，能够同时索引const寄存器的不同的部分。mova指令用于设置地址寄存器的值。

output寄存器

output寄存器用于存储shader计算的结果。output寄存器是可写的。它用来存储顶点的同次剪裁空间的坐标以及每个顶点相关的数据，如颜色，纹理坐标信息。3.0之前的shader版本，output寄存器将会分别命名。位置寄存器oPos, 颜色寄存器oD0和oD1，fog 寄存器oFog，点大小寄存器oPts和纹理坐标寄存器oT0到oT7。每个顶点shader都得写oPos的四个组件。fog系数和点大小的缩放值将分别取oFog和oPts寄存器的x组件。oFog和oPts将被缩放到【0，1】区间。在shader 3.0版本，output寄存器将会使用dcl_usage指令定义。

临时寄存器

顶点shader里面通常会有大量的工作。shader 通常会将数据从输入寄存器移动到临时寄存器，然后在临时寄存器上执行计算，最后把结果写入到输出寄存器。其他类型的寄存器在一个指令可能只使用一次，但是临时寄存却有可能使用多次。在一个指令里面有可能有3个临时寄存器被读，一个被写。任何读取一个没有写入数据的临时寄存器都会产生错误。

循环计数器寄存器

shader 2.0或者更高版本使用loop和endloop指令来控制流，循环计数寄存器al包含计数器的当前值。在循环体外部，这个值是未定义的。在循环体内部它的值将是固定数组的偏移量。在shader 3.0中，循环计数寄存器将用于索引输出寄存器和const数组。

条件寄存器

shader 2.x 或者更高版本将提供了条件寄存器，它包含一个boo值的四维向量。bool值将用于执行条件控制流。setp_comp是唯一的赋值条件寄存器的指令。条件寄存器bool值用来控制if ,callnz,breakp指令。

采样寄存器

shader3.0 采用采样寄存器来访问纹理。采样寄存器本身使用texldl指令来采样纹理。采样寄存器在使用前必须使用dcl_usage声明。使用采样寄存器，顶点shader能够执行纹理查询。

寄存器修饰符

每个指令默认情况下操作在源操作数和目的操作数的四维向量值上。为了提高顶点shader的灵活性，并且使指令数减少，每个操作数可以包含一个修饰符来提取某几个维度的值。对于顶点shader指令，共有四种修饰符：目的操作数写掩码，源操作数multiplex，源操作数negation和绝对值操作数。修饰符的语法如下：

目的寄存器写掩码： r.xyzw

源寄存器multiplex: r.[xyzw][xyzw][xyzw][xyzw]

源寄存器negation: -r

绝对值： r_abs

逻辑negation： !r

multiplex修改符允许一个四维向量从一个源寄存器的四个组件构造得到。一个组件可能被组合到一个向量的多个组件。

一个操作数也能使用多个修饰符，多个修饰符也能应用到一个指令里面。

Vertex Shader 1.1 架构

shader 1.1架构是最简单的架构，没流控制也没有条件分支。最少有96个顶点shader const 寄存器。D3DCAPS9::MaxVertexShaderConst定义最大数目的const寄存器。constant寄存器在被地址寄存器的x组件索引。

指令用于声明，基本运算，矩阵计算，简单比较以及基本光照计算。更高版本的shader能完全支持1.1的指令，只是在某些指令上有些微小的变动。

Vertex Shader 2.0 架构

2.0架构保留了1.1所有的指令和寄存器，并且增加了很多额外的功能。版本2.0主要的改进增加了是静态流控制。静态条件指令包括subroutine，分支和循环指令。在静态流控制里面，计算分支点的条件表达式指向那些在shader执行过程中是const的值。使用静态流控制，执行固定次数的循环，并且条件执行遵循同样的路径使用同一组constants来绘制primitives。 primitives的不同的batch处理可以通过改变constants来改变它们的行为。所有的流控制指令都是成对出现，并且属于一个指令block。

提供了新的constant寄存器文件来定义了用于管理控制流的constants。在控制流里面，你能写一个顶点shader应用到不同类型的顶点。定义流的constants可以在两次draw primitives调用之间重新更新。

2.0版本或者更高版本也增强了地址寄存器的使用，提供了新的bool和整数寄存器文件。寄存器a0的四个组件都可以用来索引浮点数寄存器文件。bool和整数寄存器文件不可以被索引。地址寄存器的任何一个组件都可以用作一个索引，但是在一个指令里面的所有的源操作数必须用同样的组件和base寄存器。

地址寄存器能够使用mova指令来赋值，mov指令用于向临时寄存器和output寄存器写值。新的算术指令包括：abs,crs,lrp,nrm, pow, sgn和sincos指令。bool constant寄存器用于if,else,endif指令的条件分支。每个寄存器都有一个组件包含一个bool值。bool 寄存器文件的值能通过defb指令赋值。非条件suroutine使用call调用。subroutine的调用对象是lable和ret之间的block。使用bool寄存器的条件subroutine使用callnz调用。整数constant寄存器文件里面每个寄存器都有四个组件，但是第四个组件必须是0。 寄存器控制了rep, endrep,loop和endloop循环的执行次数。rep使用一个重复次数定义了一个简单的循环，在循环过程中，不会访问内部计数寄存器。 Loop指令定义了一个循环，这个循环通过al 循环计数寄存器控制内部计数器。在循环开始之前，就初始化这个寄存器。每当循环一次，它就加1。这个循环计数寄存器也可以像地址寄存器一样来索引constant寄存器数组。整数寄存器文件的值能通过defi定义或者通过API SetVertexShaderConstantI方法定义。

顶点Shader 2.x 架构

顶点2.x引入了版本2.0架构的扩展。在版本2.0的基础上增加了条件，静态流控制的深度嵌套和动态流控制指令。D3DCaps9的VS20Caps（它是一个D3DVSSHADERCAPS2_0结构）描述了可选的支持情况。2.x可选的支持包括predicate寄存器，动态流控制，大于12个临时寄存器和静态流控制的深度嵌套。

typedef struct _D3DVSHADERCAPS2_0

{

DWORD Caps;

INT DynamicFlowControlDepth;

INT NumTemps;

INT StaticFlowControlDepth;

} D3DVSHADERCAPS2_0;

如果Caps的D3DVS20CAPS_PREDICATION为被设置，设备将支持predicate寄存器p0和它相关的指令setp_comp，if, callnz和breakp。predicate寄存器是一个四维的bool向量，只能通过setp_cmp赋值。

NumpTemps制定了能支持的临时寄存器rn的数目，一般至少是12个，它的实际值将在【12，32】之间，D3DVS20_MIN_NUMTEMP和D3DVS20_MAX_NUMTEMPS指定了最大值和最小值。

动态流控制的指令包括if_comp和break_comp。如果dynamicFlowControlDepth不是0，它将能支持。

顶点Shader 3.0架构

顶点shader 3.0放开了很多限制，产生了input和output寄存器文件，增加了saturate指令修饰符，并且使用新的采样寄存器和相关指令来做纹理采样。临时寄存器的数目上升到32个。最小的指令slot可以达到512。input 和 output寄存器文件可以像浮点const 寄存器一样被索引。它允许shader在一个循环里面访问input寄存器，然后产生ouput。output寄存器不用指定特定的名字，它就像input寄存器，统一命名为on。它可以使用dcl_usage指定把output寄存器与一个semantics关联。这样就可以将shader的output映射到像素shader的input semantics。

sn采样寄存器与dcl_texture关联。声明之后，就可以使用texldl指令从对应的纹理采样。

Shader指令语法

在内部Direct3D使用一个DWORD数组来encode一个shader程序。这个encoding可以被认为是一个shader程序的机器语言。因为很难直接创建一个DWORD数组程序指令，SDK提供了工具把一个shader程序文本编译成机器语言。

shader指令的语法也跟大多数CPU汇编语言类似，首先是操作码，然后是操作数。shader 程序文本首先被解析成一串可解析的符号。空格和注释将会被忽略。跟其它汇编语言不同的是，它不必一行只能允许一条指令。一行可以写多条指令。

每个shader指令是由一个操作码和多个操作数组成，并且他们都是大小写敏感的。通常const寄存器操作数一般是c0....。但是，可以通过地址寄存器a0来索引const寄存器，c[16+a0.x] 或者c16[a0.x]。

执行模型

顶点shader的执行模型是相当简单，每个指令按照它在DWORD里面的次序执行。每个顶点shader的开始都必须放置一个vs指令，用来定义顶点shader的架构版本。 3.0之前的版本，都必须把值存放在oPos寄存器；3.0版本，output postion semantic关联的寄存器必须要赋值。

顶点软件处理

使用软件或者混合处理创建的设备可以在CPU上运行顶点shader。顶点软件处理能够执行所有的顶点shader版本。

顶点shader 1.1 指令

顶点shader指令分成两组，一组是简单指令，一组是复杂指令。简单指令只在一个slot里面执行，复杂指令需要在多个slot里面执行。1.1支持的指令如下：

Instruction	Slots	Function
add d,s0,s1	1	add
dcl_usage d	——	declare input register
def d,v0,v1,v2,v3	——	constant definition
dp3 d,s0,s1	1	3D dot product
dp4 d,s0,s1	1	4D dot product
dst d,s0,s1	1	distance
exp d,s	<=10	full-precision exponentiate(指数)
expp d,s	1	patial-precision exponentiate
frc d,s	<=3	fractional part(小数部分)
lit d,s	1	lighting
log d,s	<=10	full-precision logarithm（全精度对数）
logp d,s	1	partial-precision(半精度对数)
m3*2 d,s0 ,s1	<=2	vector, 3*2 matrix product
m3*3 d,s0,s1	<=3	vector, 3*3 matrix product
m3*3 d,s0,s1	<=4	vector, 3*4 matrix product
m4*3 d,s0,s1	<=3	vector, 4*3 matrix product
m4*4 d,s0,s1	<=4	vector,4*4 matrix product
mad d,s0,s1,s2	1	multiply accumulate
max d,s0,s1	1	maximum
min d,s0,s1	1	minimum
mov d,s	1	copy
mul d,s0,s1	1	multiply
nop	1	no operation
rcp d,s	>=1	reciprocal(倒数)
rsp d,s	>=1	reciparocal square root
sge d,s0,s1	1	>= compare
slt d,s0,s1	1	< compare
sub d,s0,s1	1	sutract
vs _major_minor_	——	shader version

在详细讨论每个指令之前，我们先看看一个简单的shader程序。这个shader 程序把输入顶点数据直接写入到对应的output寄存器。

vs_1_1

dcl_position v0

dcl_color0 v1

dcl_color1 v2

dcl_fog v2.w

dcl_texcoord0 v3

dcl_texcoord1 v4

dcl_texcoord2 v5

dcl_texcoord3 v6

mov oPos, v0

mov oDo , v1

mov oD1, v2.xyz

mov oFog, v2.w

mov oT0,v3

mov oT1,v4

mov oT2,v5

mov oT3,v6

指令声明

　每个顶点shader都必须使用vs指令声明它的版本号码，而且这个指令必须是这个shader程序的第一个指令。在shader通过SetVertexShader绑定到到设备的时候，顶点shader的constants也需要绑定。def 指令可以用来定义一个四浮点值的constant寄存器。def指令必须出现在版本指令之后，在任何计算指令之前。

def d,v0,v1,v2,v3 -------------> d<---------(v0,v1,v2,v3)

为了将顶点的input寄存器映射到顶点对应的组件，dcl_usage指令被使用。

dcl_positionn s

dcl_blendweightn s

dcl_blendindicesn s

dcl_normaln s

dcl_psizen s

dcl_texcoordn s

dcl_tangentn s

dcl_binormaln s

dcl_tessfactorn s

dcl_colorn s

dcl_fogn s

dcl_depthn s

dcl_sample s

基本算术指令

mov指令用来拷贝数据从源操作数到目的操作数。基本的运算执行只使用add,sub,mul 和mad指令。向量的加减使用add和sub指令。

mov d ,s d<-------s

add d,s0,s1 d<---------(s0x+s1x,s0y+s1y,s0z+s1z,s0w+s1w)

sub d, s0,s1 d<---------(s0x-s1x,s0y-s1y,s0z-s1z,s0w-s1w)

mul d,s0,s1 d<---------(s0x s1x,s0y s1y,s0z s1z,s0w s1w)

mad d,s0,s1,s2 d<---------(s0x s1x + s2x, s0y s1y + s2y, s0z s1z + s2z, s0w s1w + s2w)

rcp d, s 只计算w 组件。

如果sw = 1, d = (1,1,1,1); 如果sw = 0, d = (无穷大，无穷大，无穷大，无穷大)；否则，d= (1/sw,1/sw,1/sw,1/sw)。

rsp d,s

如果abs(sw) = 1, d = (1,1,1,1)；如果abs(sw) = 0，d = (无穷大，无穷大，无穷大，无穷大)；否则 d= (1/squart root(sw), 1/squart root(sw),1/squart root(sw),1/squart root(sw))

dp3 d, s0,s1

d = (f,f,f,f) f = s0x s1x + s0y s1y + s0z s1z

dp4 d, s0,s1

d= (f,f,f,f) f = s0x s1x + s0y s1y + s0z s1z + s0w s1w

min d , s0,s1

d = (min(s0x,s1x),min(s0y,s1y),min(s0z,s1z),min(s0w,s1w))

max d, s0,s1

d = (max(s0x,s1x),max(s0y,s1y),max(s0z,s1z),max(s0w,s1w))

exp d,s

d = (f,f,f,f) f=2为底指数为sw的幂

log d,s

如果|sw| = 0 ,d = (负无穷大，负无穷大，负无穷大，负无穷大)；否则，d= (f,f,f,f) f= log2(|sw|)

矩阵指令

m3*2, m3*3,m3*4,m4*4都是向量与矩阵相乘的指令。他们第一个操作数是向量，第二次操作数是矩阵。矩阵存放在连续的寄存器里面，并且在同一个寄存器文件里面。只有4*4,3*4修改了所有的四个组件，m3*2只修改xy,m3*3和m4*3只计算xyz。

比较指令

虽然1.1里面不可以使用分支指令，但是执行一些有限的比较也是可能的。如果你想要在diffuse color上再增加一个color。既然分支计算不允许，你只能写两个shader。一个增加颜色，一个不增加颜色。然而，你也可以在一个shader里面实现，当你不想增加的时候，另外一个颜色是0。sge和slt指令让你可以这么多。

sge d,s0,s1

d = (s0x >= s1x, s0y>=s1y,s0z >= s1z, s0w >= s1w)。 True的时候组件是1.0， False的时候组件值是0.0。

slt d,s0,s1

d= (s0x < s1x, s0y < s1y, s0z

光照指令

dst 和 lit指令用于光照效果的计算。dst计算向量s0（*,k的平方，k的平方，*）和 s1=(*,1/k,*,1/k)的距离向量。 lit指令计算光照系数，给定两个dot product和一个指数。源寄存器的x组件包含顶点法线和光线的点积，y组件包含顶点法线和halfway向量的点积，w组件包含一个指数。这个指数范围将在[-128,128]。

dst d,s0, s1

d = (1,k,k2,1/k) s0=(*,k的平方，k平方，*) s1= (*,1/k,*,1/k)

lit d, s

如果sx >0 , sy >0 , d = (1,sx,sy为底指数为sw的幂，1)；

如果sx>0, sy<=0 , d = (1,sx,0,1)

否则，d= (1,0,0,1)

顶点Shader2.0 指令

defb和def 定义bool和整数constant寄存器。

defb d, v

d = v

defi d, i0,i1,i2,i3

d= (i0,i1,i2,i3)

mova d, s

d= (round(sx),round(sy),round(sz),round(sw))

abs d,s

d= (|sx|,|sy|,|sz|,|sw|)

sgn d,s0,s1,s2

d= (f(s0x),f(s0y),f(s0z),f(s0w))

f(x) =-1(x<0); 0 (x=0); 1;(x>0)

crs d,s0,s1 d为s0和s1的叉积

nrm d, s normalize向量s。

Instruction	Slots	Function
abs d,s	1	absolute value
call l	2	call a subroutine
callnz l,b	3	contionally call a subroutine
crs d, s0,s1	2	vector cross product
defb d, v0	——	bool constant definition
defi d,v0,v1,v2,v3	——	integer constant definition
else	1	start a else block
endif	1	end an if or esle block
endloop	2	end a loop block
endrep	2	end a repeat block
if b	3	start an if block
label l	——	start subroutine block
loop aL, i	3	start a loop block
lrp d,s0,s1,s2	2	linear interpolation
mova d,s	1	write a address register
nrm d, s	3	vector normalization
pow d,s0,s1	3	full precision s0为底s1为指数的幂
rep i	3	start a repeat block
ret	1	end a subroutine block
sgn d, s	3	sign function
sincos d, s0,s1,s2	8	sine and cosine,d = (cos(soc),sin(s0c),?,?);目的寄存器必须是一个临时寄存器，并且必须使用写掩码.x,.y和.xy。s1,s2是浮点固定寄存器，他们的值分别是D3DSINCOSCONST1和D3DSINCOSCONST2。

最简单的循环是一个repeat block，如下：

rep i //使用一个整数const寄存器作为操作数，它的x组件将是循环的次数，范围在[0,255]。

count <---ix

loop <----pc+1 //pc指向程序计数器，pc+1就是下个程序指令的地址

if count = 0 then pc <-------endloop

endrep

endloop <----- pc+1

count <---------count -1

if count >0 then pc <------- loop

loop循环重复执行loop和endloop之间的代码block，一个loop block通过aL寄存器控制循环，al寄存器将作为目的操作数。

loop aL,i

aL <--- iy

count <----ix

loop <-------pc=1

if count = 0 then pc<--------endloop

endloop

endloop <----- pc+1

count <---------count -1

aL <----------aL + iz

if count >0 then pc <------- loop

一个subroutine block将包含在lable和ret指令块。为了使用一个subroutine，你必须在shader之前使用ret结束 main routine。

label l

l <------------pc+1

ret

pc <----------pop(pc)

call l

push(pc,pc+1)

pc <------------l

callnz l,b

if(b = true) then

push(pc,pc+1)

pc<-----l

endif

版本2.0 flow control 嵌套限制

GPU有限的的资源使shader里面的流控制增加了一些限制。每种流控制指令（循环，分支，subroutine）都有对应的的嵌套限制。在一个指令block里面嵌入另一个指令block，这就是嵌套block。嵌套限制如下表：

Feature	2.0	2.x	3.0
Call Nesting	1	1-4	4
static condition	16	16	24
Dynamic Conditions	——	0-24	0-24
Loop Nesting	1	1-4	4
static Flow count	16	16	无穷大

除了对嵌套的限制外，对控制流指令的数目也有限制。控制流指令的总数目称作静态流计数（static flow count）。if ,else,rep,loop,call和callnz都会增加static flow count。在2.0里面，静态流条件指令只能出现在一个routine的top层。 call 和callnz也只能有一层调用，你不能在call里面在调用另外一个call。Loop和rep也只能有一层嵌套，rep 可以放在if block里面，但是它不能放在loop block。

顶点Shader 2.x指令

它在2.0的基础上增加了predicate寄存器以及动态流控制。prediation指令一般是使用一个指令的修饰符来实现的。

新指令如下表：

Instruction	Slots	Function
break	1	break out of a loop
break_comp s0,1	3	conditionally break out of a loop
break p	3	conditionally break out of a loop
callnz l,p	3	conditionally call a subroutine
if_comp s0,s1	3	start a dynamic if block
if p	3	start a dynamic if block
setp_comp d,s0,s1	1	set predicate register

//p0= (true,false,false,true)

(p0.x) add r3,r1,r2 //r3 = r1+r2

(p0) add r4,r1,r2 //r4.x = r1.x + r2.x

// r4.w = r1.w + r2.w

(!p0.x) add r5, r1,r2 // r5 unchangned

setp_comp指令是唯一能写入predicate寄存器的指令。

setp_eq d,s0,s1

d = (s0x= s1x,s0y= s1y,s0z = s1z,s0w = s1w)

setp_ne , setp_ge,setp_gt,setp_le,setp_lt 这些指令都用于predicate寄存器赋值。

if 指令可以将predicate寄存器的某个组件结合起来使用，

break_eq s0.c,s1.c

if s0c= s1c then pc<--- endloop

break_ne,break_ge,break_gt,break_le,break_lt 也break_eq类似。

if_eq s0.c,s1.c

if(s0c = s1c) then ...

if_ne, if_ge,if_gt,if_le,if_lt 与if_eq类似。

顶点Shader 3.0指令

在3.0架构里面，所有的ouput寄存器都必须声明。声明语法类似input的声明语法，关联一个semantic usage和索引。地址寄存器除了索引const 寄存器外，还可以索引input和output寄存器。3.0新增指令如下表：

Instruction	Slots	Function
dcl_position d	0	declare a positon output
dcl_blendweightn d	0	declare a blend weight output
dcl_blendindicesn d	0	declare a blend indices output
dcl_psizen d	0	declare a point size output
dcl_normaln d	0	declare a normal vector ouput
dcl_fogn d	0	declare a fog factor output
dcl_texcoordn d	0	declare a texture coordinate output
dcl_tangentn d	0	declare a tangent vector output
dcl_binormaln d	0	declare a binormal vector output
dcl_tessfactorn d	0	declare a tessellation factor output
dcl_depthn d	0	declare a depth output
dcl_2d s	0	declare a 2D texture sampler
dcl_cube s	0	declare a cube texture sampler
dcl_volume s	0	declare a volume texture sampler
texldl s	2 or 5	sample texture

3.0 架构在顶点处理阶段引入了采样功能。源纹理的拓扑结构使用dcl_2d,dcl_cube,dcl_volume指令声明的。每个指令都携带单个操作数，它将采样寄存器sn与一个纹理关联起来。如： dcl_2d s, dcl_cube s , dcl_volume s。

一旦采样寄存器被声明，texldl指令用于将一个纹理采样到一个临时寄存器。下面的代码描述了它的基本原理。

texldl d, s0,s1 //s0是纹理的纹理坐标，s1是采样寄存器，指示哪个纹理将会采样。

L = s0w + SSLODBias //s0w用于选择mipmap level，如果这个值是负数，它将选择纹理的the most detailed miplevel。它的小数部分将用于两个miplevel之前插值。

if(L<=0) then L = max(SSMaxMipLevel，0)

L = max(SSMaxMipLevel,0)

filter = SSMagFilter

q = lookup(s0,s1,L,filter) //对纹理进行采样

else

L = Max(SSMaxMipLevel,L)

filter = SSMinFilter

q = Lookup(s0,s1,floor(L),filter)

if (SSMipFilter = Linear) then

r = lookup(s0,s1,ceil(L),filter)

f = s0w - floor(s0w)

q = (1-f)q + fr

endif

d = q

Manipulating Shaders

我们可以使用CreateVertexShader, SetVertexShader和GetVertexShader方法来管理顶点shader。应用程序可以使用D3DX把顶点shader源代码编译DWORD指令数组，提供给CreateVertexShader使用。如果你想要构建运行时动态shaders，最简单的方法就是从字符串构建shader函数，然后把字符串编译成DWORD指令数组。汇编shader比high level shader 语言要快，因为它不必重新汇编shader。虽然high leve shader语言更消耗CPU,但是动态创建的high-level shader也可以按照这样的方式执行。

设备的顶点shader constant 文件属性可以直接通过GetVertexShaderConstant和SetVertexShaderConstant管理。每个寄存器文件都它自己的设备方法，如：

HRESULT GetVertexShaderConstantB(DWORD start, BOOL* value, DWORD count);

HRESULT GetVertexShaderConstantF(DWORD start, float* value, DWORD count);

HRESULT GetVertexShaderConstantI(DWORD start, int* value, DWORD count);

HRESULT SetVertexShaderConstantB(DWORD start, const BOOL *value, DWORD count);

HRESULT SetVertexShaderConstantF(DWORD start, const float* value, DWORD count)

HRESULT SetVertexShaderConstantI(DWORD start, const int * value, DWORD count);

start 参数指示第一个寄存器的序号，count指示四维向量值的数目，value指向一个值的数组。下面的例子将在寄存器c15里面存放一个值：

const float data[4] = {1.f,0.f,0.f,0.f};

device->SetVertexShaderConstantF(15,&data[0],1);

顶点shader constant随着顶点shader 声明隐式的变化。constant寄存器的内容一直维持到设备rest。如果几个顶点shader使用同样的constant寄存器layout，constant寄存器可以只load一次，应用程序能够在几个顶点shader里面前后前换，而不必重新load constant寄存器。设备能支持的最大的constant寄存器的数目定义在D3DCAPS9::MaxVertexShaderConst。版本1.1至少是96个。

如果D3DCAPS9::VertexShaderVersion非0，设备将支持顶点shader。

Drawing Multiple Instances

顶点shader 3.0架构支持以不同的速率采样不同的顶点流。这使我们能够能够绘制一个模型的多个实例，模型的数据将随着每个顶点和每个实例变化。场景数据被至少将被分成两组流，一组为每顶点的数据，一组为每实例的数据。source流的采样频率可以通过方法SetStreamSourceFreq方法设置。

HRESULT SetStreamSourceFreq(UINT stream, UINT frequency);

frequency将告诉runtime库在跳到下一组组件之前每组顶点组件将需要重用多少次。Flags 将告诉runtime库是否将将流解析成每顶点或者每实例。顶点shader 3.0版本支持instancing的索引流。顶点流的序号一般是从0开始，实例流的序号一般从大序号开始。

最简单的例子如，使用相同的几何体，不同的每实例数据绘制n个几何体实例。几何体数据将重复n次，实例数据将只重复一次。

对于indexed primitives,将几何流的频率设置为D3DSTREAMSOURCE_INDEXDATA与流重复次数的“或”连接，将实例流的平率设置为D3DSTREAMSOURCE_INSTANCEDATA 与重用次数的"或"连接。

如下例子：

struct GeometryVertex

{

D3DVECTOR m_position;

D3DVECTOR m_normal;

}

struct InstanceVertex

{

D3DVECTOR m_offset; //每个实例位置的偏移量

D3DCOLOR m_diffuse; //每个实例的diffuse color

}

IDirect3DVertexBuffer9 *geometry = fill_geometry();

IDirect3DVertexBuffer9* instance = fill_instance();

THR(device->SetStreamSource(0,geometry,0,sizeof(GeometryVertex)));

THR(device->SetStreamSourceFreq(0,D3DSTREAMSOURCE_INDEXEDDATA|20));

THR(device->SetStreamSource(1,instances,0,sizeof(InstanceVertex)));

THR(device->SetStreamSourceFreq(1,D3DSTREAMSOURCE_INSTANCEDATA | 1));

Common Computation

Constant generation

既然每个指令只能引用一个constant寄存器，使用多个constant寄存器作为源操作数是非法的。你可以使用mov指令将一个constant赋值给一个临时寄存器。然而，如果这个constant的只是1或者0，你可以使用调用指令来产生值，而不用浪费一个constant。

slt r0,r0,r0 //r0= (0,0,0,0)

sge r0,r0,r0 //r0= (1,1,1,1)

Fractional Part

expp的结果的y组件存放的是源操作数w组件的小数部分。

expp r1.y r0.x ; r1.y = r0.x - floor(r0.x)

mov r1.x ,r1.y

Absolute value

max r0 r0,-r0

Division

rcp r2.x, r1.x ;1/r1.x

mul r2.x, r2.x, r0.x

Square root

rsq r1.x,r0.x

mul r1.x ,r1.x,r0.x

conditional selection

; r0 = (c1 < c2) ? r3:r4

slt r0, r1,r2; c = (r1
mul r3,r3,r0 ;r3 = r3*r0

sge r0,r1,r2 ;c = (r1 >= r2)

mad r0 , r0 , r4, r3; r0 = c*r4 + r3

clamping to an interval

；interval [A, B]

def c0 , A, B, 0，0

;r0 = clamp(r0,A,B)

max r0, r0,c0.x

min r0,r0,c0.y

floor and ceiling
vector cross product

c = a和b的叉积 = （aybz - az by, az bx - ax bz, ax by - aybx)

vector normalization
Transposed matrix multipliation
signum function
minimum and maximum vector component
trigonometric functions
exponential and logarithmic functions

固定功能处理

寄存器layout

使用在固定流水线的临时寄存器的layout如下表：

r0 scratch

r1 scratch

r2 scratch

r3(Rd) scratch, light vector

r4(Rr,Rf,Rl) scratch , reflectance, eye or light vectors

r5(Rs, Rv) scratch, sphere vector, eye vector

r6(Rx) scratch, specular color

r7(Rc) scratch, diffuse color

r8(RH) scratch, half-angle vector

r9(Rh) homogeneous eye space position

r10(R3) cartesian eye space position

r11(Rn) eye space normal

constant 寄存器 layout

下面表给出了固定流水线constant 寄存器的layout。

Register Meaning or Value

C[NORMAL0_MATRIX_X]
C[NORMAL0_MATRIX_Y]
C[NORMAL0_MATRIX_Z] inverse transpose world * view matrix 0

C[NORMAL1_MATRIX_X]
C[NORMAL1_MATRIX_Y]
C[NORMAL1_MATRIX_Z] inverse transpose world * view matrix 1

C[NORMAL2_MATRIX_X]
C[NORMAL2_MATRIX_Y]
C[NORMAL2_MATRIX_Z] inverse transpose world * view matrix 2

C[NORMAL3_MATRIX_X]
C[NORMAL3_MATRIX_Y]
C[NORMAL3_MATRIX_Z] inverse transpose world * view matrix 3

c[WORLDVIEW0_MATRIX_X]
c[WORLDVIEW0_MATRIX_Y]
c[WORLDVIEW0_MATRIX_Z] world * view matrix 0

c[WORLDVIEW1_MATRIX_X]
c[WORLDVIEW1_MATRIX_Y]
c[WORLDVIEW1_MATRIX_Z] world* view matrix 1

c[WORLDVIEW2_MATRIX_X]
c[WORLDVIEW2_MATRIX_Y]
c[WORLDVIEW2_MATRIX_Z] world * view matrix 2

c[WORLDVIEW3_MATRIX_X]
c[WORLDVIEW3_MATRIX_Y]
c[WORLDVIEW3_MATRIX_Z] world*view matrix 3

c[PROJECTION_MATRIX_X]
c[PROJECTION_MATRIX_Y]
c[PROJECTION_MATRIX_Z]
c[PROJECTION_MATRIX_W] projection matrix

c[COMPOSITE_MATRIX_X]
c[COMPOSITE_MATRIX_Y]
c[COMPOSITE_MATRIX_Z]
c[COMPOSITE_MATRIX_W] world * view * projection matrix

c[TEXTURE_MATRIX_X]
c[TEXTURE_MATRIX_Y]
c[TEXTURE_MATRIX_Z]
c[TEXTURE_MATRIX_W] texture matrix

c[GLOBAL_ILLUMINATION] RGBA,emission + global ambient

c[LIGHT_POSITION] x,y,z

c[LIGHT_HALF_ANGLE] x,y,z for infinite light w/local viewer

c[LIGHT_AMBIENT] RGB,light * material

c[LIGHT_DIFFUSE] RGB, light * material

c[LIGHT_SPECULAR] RGB, light * material, specular power

c[LIGHT_ATTENUATION] a0,a1,a2,spot power

c[LIGHT_SPOT_DIRECTION] x,y,z,cos(CUTOFF)

c[POINT_PARAMETER] size, max,min

c[POINT_ATTENUATION] a0,a1,a2

c[TEXTURE_OBJECT_PLANE_X]
c[TEXTURE_OBJECT_PLANE_Y]
c[TEXTURE_OBJECT_PLANE_Z]
c[TEXTURE_OBJECT_PLANE_W] x,y,z,w
x,y,z,w
x,y,z,w
x,y,z,w

c[TEXTURE_EYE_PLANE_X]
c[TEXTURE_EYE_PLANE_Y]
c[TEXTURE_EYE_PLANE_Z]
c[TEXTURE_EYE_PLANE_W] x,y,z,w
x,y,z,w
x,y,z,w
x,y,z,w

c[EYE_POSITION] x,y,z,w

c[CONSTANT0] -1,0,1,0.5

坐标转换

顶点位置和法线被一个连接的世界和视图矩阵所转换。如果使用skinning，位置和法线还要被每个skinning矩阵转换。

;position

m4*4 Rh, vPosition , c[MODELVIEW0_MATRIX_X]

;normal

m3*3 Rn, vNormal, c[NORMAL0_MATRIX_X]

顶点blending

; weight preparation

mov r0, c[WEIGHT]

mov r0.w, c[CONSTANT0].z

dp4 r0.y , r0, c[CONSTANT0].xyyz

dp4 r0.z , r0, c[CONSTANT0].xxyz

dp4 r0.w, r0,c[CONSTNAT0].xxxz

;position /normal blend

mul Rh, r0.x, Rh          //1st weight

mul Rn, r0.x ,Rn

mad Rh,r0.y,r3,Rh   // 2th weight

mad Rn,r0.y,r2,Rn

mad Rh,r0.z,r5,Rh   // 3th weight

mad Rn,r0.z, r5,Rn

mad Rh,r0.w,r7,Rh // 4th weight

mad Rn, r0.w,r6,Rn

位置输出

m4*4 oPos, Rh,c[PROJECTION_MATRIX_X]

normalize eye normal

dp3 Rn.w,Rn,Rn

rsq Rn.w Rn.w

mul Rn,Rn, Rn.w

non-Homogeneous eye position

rcp r0.w, Rh.w

mul Re,Rh,r0.w

Eye space vectors

顶点和眼睛之间的距离：

add r0, -Re,c[EYE_POSITION]

dp3 r0.w,r0,r0

rsq r1.w,r0.w

mul Rv, r0,r1.w

dst Rf, r0.w, r1.w

Fog output

;radial fog

mov oFog.x Rf.y

;linear Z fog

mov oFog.x -Re.z

Point Parameters

对于point sprites，顶点shader需要计算一个点的大小，输出到oPts寄存器。

dp3 r0.w Rf, c[POINT_PARAMETER_ATTENUATION]

rsq r0.w r0.w

mul r0.w r0.w, c[POINT_PARAMETER].x

mul r0.w, r0.w, c[POINT_PARAMETER].y

mul oPts.w r0.w, c[POINT_PARAMETER].z

Lighting

初始化

;diffsue only

mov Rc c[GLOBAL_ILLUMINATION]

; diffuse and specular

mov Rc c[GLOBAL_ILLUMINATION]

mov Rx, c[CONSTANT0].y

infinite Light 或者 infinite Viewer

dp3 r0.x , Rn , c[Light_position]

dp3 r0.y, Rn, c[LIGHT_HALF_ANGEL_VECTOR]

mov r0.w , c[LIGHT_SPECULAR].w

lit r0, r0

mad Rc.xyz, r0.x , c[LIGHT_AMBIENT], Rc

mad Rc.xyz, r0.y, c[LIGHT_DIFFUSE], Rc

mad Rc.xyz, r0.z, c[LIGHT_SPECULAR],Rx

SpotLight , Local viewer

;light direction/distance vectors

add r0, -Re, c[LIGHT_POSITION]

dp3 r0.w, r0,r0

rsq r1.w,r0.w

mul r1, r0,r1.w

dst Rd, r0.w, r1.w

; half-angle vector

add Rh, Rv, Rl

;normalize

dp3 Rh.w Rh, Rh

rsq Rh.w, Rh.w

mul Rh, Rh, Rh.w

;distance attenuation

dp3 r0.y , Rl, -c[LIGHT_SPOT_DIRECTION]

add r0.x , r0.y , -c[LIGHT_SPOT_DIRECTION].w

mov r0.w, c[LIGHT_ATTENUATION].w

lit r0,r0

mul Rd, Rd.w, r0.z

dp3 r0.x, Rn, Rl

dp3 r0.y, Rn, RH

mov r0.w, c[LIGHT_SPECULAR].w

lit r0,r0

mul r0,r0,Rd.w

mad Rc.xyz, r0.x, c[LIGHT_AMBIENT], Rc

mad Rc.xyz, r0.y, c[LIGHT_DIFFUSE], Rc

mad Rc.xyz, r0.z, c[LIGHT_SPECULAR], Rc

Lighting output

;diffuse only

mov oDO, Rc

;diffuse and specular

mov oD0 , Rc

mov oD1, Rx

Texture 坐标generation

纹理坐标可以直接从顶点产生，或者由应用程序直接传递给shader。

；pass-thru

mov r0, v[TEX0]

Initialization

;reflection vector

mul r0, Rn, c[EYE_POSITION].w

dp3 Rr.w Rn, Rv

mad Rr, Rr.w, R0,-Rv

;sphere map vector

add r0,c[CONSTANT0].yyzy,Rr

dp3 r0.w , r0, r0

rsq r0.w r0.w

mul r0.xyz, r0, c[CONSTANT0].wwyy

mad Rs,r0.w,r0,c[CONSTANT0].wwyy

Texture Coordinate Generation

;object space plane

m4*4 r0, vPosition, c[TEXTURE_OBJECT_PLANE_X]

;eye space plane

m4*4 r0,Rh, c[TEXTURE_EYE_PLANE_X]

;sphere map

mov r0.xy, Rs

;normal vector

mov r0.xyz, Rn

;reflection vector

mov r0.xyz, Rr

Texture Coordinate Transform

m4*4 oT0,r0,c[TEXTURE_MATRIX_X]

你可能感兴趣的:(Vertex Shaders)

OpenGL（4）着色器一个不务正业的程序猿 OpenGL 着色器 apache
文章目录一、着色器1、什么是着色器？2、着色器类型2.1、顶点着色器（VertexShader）2.2、片段着色器（FragmentShader）3、着色器属性3.1、`layout`属性3.2、`in`属性3.3、`out`属性3.4、总结4、示例前言：在OpenGL开发中，着色器（Shader）是用于控制图形渲染管线各个阶段的小程序。它们是用GLSL（OpenGLShadingLanguage
OpenGL疑惑阳光开朗_大男孩儿 OpenGL 算法 c++qt OpenGL
本篇文章基于完整例子和调用关系qtOpenGL-CSDN博客进行的疑惑补充，建议先观看例子，在看此篇。1.为什么glBindVertexArray解绑和绑定是一样的？glBindVertexArray是用来绑定和解绑顶点数组对象（VAO）的。绑定VAO的目的是告诉OpenGL在当前上下文中使用哪个VAO，它会保存和管理与该VAO相关的顶点缓冲区对象（VBO）和其他状态。绑定VAO（glBindVe
【Unity Shaders】Reflecting Your World —— Unity3D中的遮罩反射（Masking Reflections）妈妈说女孩子要自立自强 Unity Shaders Unity Shaders
本系列主要参考《UnityShadersandEffectsCookbook》一书（感谢原书作者），同时会加上一点个人理解或拓展。这里是本书所有的插图。这里是本书所需的代码和资源（当然你也可以从官网下载）。==========================================分割线==========================================写在前面有时候，我们
【Unity Shaders】Reflecting Your World —— Unity3D中的法线贴图和反射妈妈说女孩子要自立自强 Unity Shaders Unity Shaders
本系列主要参考《UnityShadersandEffectsCookbook》一书（感谢原书作者），同时会加上一点个人理解或拓展。这里是本书所有的插图。这里是本书所需的代码和资源（当然你也可以从官网下载）。==========================================分割线==========================================写在前面有很多情况你
【Unity Shaders】Reflecting Your World —— 在Unity3D中创建Cubemaps 妈妈说女孩子要自立自强 Unity Shaders Unity Shaders 图形 Shader 游戏 unity unity3d
本系列主要参考《UnityShadersandEffectsCookbook》一书（感谢原书作者），同时会加上一点个人理解或拓展。这里是本书所有的插图。这里是本书所需的代码和资源（当然你也可以从官网下载）。==========================================分割线==========================================写在前面为了在Sha
快速入门Anthropic Chat模型的使用 wad485486aw python 开发语言
在这篇文章中，我们将深入探讨如何开始使用Anthropic的Chat模型。你将学习如何通过AWSBedrock和GoogleVertexAI来访问这些模型。此外，我们还将介绍如何安装和使用langchain-anthropic包来集成Anthropic的聊天功能。技术背景介绍Anthropic提供了一系列强大的聊天模型，这些模型可以通过不同的平台访问，如AWSBedrock和GoogleVerte
顶点着色器和片段着色器无敌最俊朗@ UnityShader 着色器
在Unity渲染中，**顶点着色器（VertexShader）和片段着色器（FragmentShader）**是图形渲染管线中的两个核心阶段。我们可以通过一个比喻来理解它们的分工：想象你要画一幅由三角形组成的3D模型，顶点着色器负责确定每个三角形的“顶点位置”，而片段着色器负责给每个像素“填色”。1.顶点着色器（VertexShader）——定位形状作用：顶点着色器是渲染管线的第一步，它处理模型的
OpenGL渲染管线蓝裕安 OpenGL
渲染管线相当于一个工作流程应用阶段-->几何阶段-->光栅化阶段几何阶段：顶点着色器光栅化阶段：片元着色器顶点着色器，片元着色器是可编程的ShaderVertexSharder和FragmentShader是用GLSL(GraphicLibraryShaderLanguage)语言类的c语言写的VAO:位置，颜色教程：主页-LearnOpenGLCN
学习创建sharpGL（no）苜柠 SharpGL c#
未能成功使用 #region舍弃 GLSL语言：顶点着色器的shader（这里填写5,6是为了演示，可取0,1,2,3...） //顶点着色器 conststringvertexCode="#version330core\n"+ //3.30版本(版本申明) "layout(location=0)invec3position_1;\n"+ //三个浮点数vector向量表示位置。pos
算法-数据结构-图-邻接表构建程序员南飞算法数据结构 java 职场和发展
邻接表的基本概念顶点（Vertex）：图中的每个顶点用一个节点表示。每个顶点存储一个链表或数组，用于记录与该顶点直接相连的其他顶点。边（Edge）：如果顶点A和顶点B之间有一条边，那么在A的邻接表中会记录B，同时在B的邻接表中也会记录A（如果是无向图）。存储方式：邻接表可以用多种方式实现，比如：链表：每个顶点对应一个链表，链表中存储与该顶点相连的其他顶点。动态数组：每个顶点对应一个动态数组（如Ar
使用Google Cloud Vertex AI构建RAG匹配引擎 vaidfl python
技术背景介绍RAG（Retrieval-AugmentedGeneration）是一种结合信息检索和生成技术的框架。在GoogleCloudPlatform的VertexAI中，我们可以利用MatchingEngine来快速高效地从大规模的数据集中检索相关文档或上下文。利用预先创建的索引，RAG能够根据用户提供的问题检索到最有用的信息，并辅助生成更精确的回答。核心原理解析RAG匹配引擎在Verte
3D晶格与图论：BFS在空间网络中的应用 t0_54coder 3d 图论宽度优先个人开发
引言在现代计算科学中，3D晶格模拟是许多物理、化学和材料科学研究中的重要工具。通过将3D空间中的每个单元看作图论中的顶点（Vertex），并通过边（Edge）连接相邻的单元，可以构建一个复杂的图结构来模拟和分析这些晶格的特性。本文将探讨如何使用BoostGraphLibrary（BGL）来实现这一模拟，并通过广度优先搜索（Breadth-FirstSearch,BFS）来识别和统计晶格中的孤立互联
采用大话问答模式搞定渲染管线实现细节（探索阶段）你一身傲骨怎能输 Shader 着色器图形渲染
传统的渲染流程传统的渲染流程（也称为固定功能渲染管线）是指在早期图形API（如OpenGL和DirectX）中使用的一种渲染方法。在这种方法中，渲染管线的各个阶段是固定的，开发者只能通过设置特定的状态和参数来控制渲染过程，而不能自定义各个阶段的行为。以下是传统渲染流程的主要阶段：1.顶点处理（VertexProcessing）在顶点处理阶段，顶点数据（如位置、法线、颜色、纹理坐标等）从应用程序传递
YIUI Unity UI框架安装与使用教程翟培任Lame
YIUIUnityUI框架安装与使用教程YIUIUnity3DUGUIFramework项目地址:https://gitcode.com/gh_mirrors/yi/YIUI1.项目目录结构及介绍YIUI项目的目录结构如下：YIUI/├──YIUIFramework/│├──Assets/││├──Scripts/││├──Resources/││├──Scenes/││├──Shaders/││
图的存储结构：邻接矩阵和邻接表 Lee Neo #数据结构数据结构
图graph顶点vertex弧arc弧尾tail弧头head有向图digraph边edge无向图undigraph权weight网network邻接点adjacent依附incident度degree出度OutDegree入度Indegree路径path邻接矩阵adjacencymatrix一、邻接矩阵存储（数组表示）借助矩阵（二维数组）表示元素（图的任意两个顶点）之间的关系用一维数组（顶点表）存
数据结构：利用邻接矩阵构造图及图的输出c++ Belieber53 c++数据结构算法
输入：请输入顶点数及弧数请按照（顶点，顶点，权值）格式输入各边依附的顶点及权值输出：图的结构如下，用邻接矩阵输出#include#include#include#defineINFINITYINT_MAX//最大值#defineMAX_VERTEX_NUM20//最大顶点个数#defineFALSE0#defineTRUE1#defineOK1#defineERROR-2#defineOVERFL
php将excel文件内容转为json,利用JavaScript将Excel转换为JSON示例代码胡安黄
前言JSON是码农们常用的数据格式，轻且方便，而直接手敲JSON却是比较麻烦和令人心情崩溃的(因为重复的东西很多)，所以很多码农可能会和我一样，选择用Excel去输入数据，然后再想办法转换成JSON格式。今天教大家使用JS将Excel转为JSON的方法。1.新建HTML文件ConvertExcelFileToJSON我们可以使用标签接收上传文件。代码如下：2.监听inputchange事件$(do
VertexList（顶点列表）里的 normal（法线）云缘若仙 directx12 3d directx12 3d
含义在三维空间里，每个顶点的法线是一个单位向量（长度为1），它垂直于该顶点所在的表面。对于平面来说，平面上所有顶点的法线方向是相同的；而对于曲面，每个顶点的法线方向通常会根据曲面的局部几何形状而有所不同。作用1.光照计算光照计算是法线最主要的应用场景之一。在大多数光照模型（如Phong光照模型、Blinn-Phong光照模型等）中，法线用于确定光线与物体表面的夹角，从而计算出该点的光照强度。漫反射
C++自研3D教程OPENGL版本---动态批处理的基本实现千年奇葩三维引擎 3d 算法
又开始找工作了，借机休息出去旅行两个月，顺便利用这段时间整理下以前写的东西。以下是一个简单的动态批处理实现：#include#include#include#include//顶点结构体structVertex{floatx,y,z;//位置floatr,g,b;//颜色};//动态批处理类classDynamicBatch{public:DynamicBatch(){//初始化VAO和VBOgl
图论- DFS/BFS遍历左灯右行的爱情图论深度优先宽度优先
DFS/BFS遍历深度优先搜素(DFS)Vertex模版-遍历所有节点为什么成环会导致死循环呢临接矩阵和临接表版-遍历所有节点遍历所有路径-临接矩阵和临接表版广度优先搜索(BFS)不记录遍历步数的需要记录遍历步数的需要适配不同权重边的深度优先搜素(DFS)Vertex模版-遍历所有节点//多叉树节点classNode{intval;Listchildren;}//多叉树的遍历框架voidtrave
3D图形学与可视化大屏：什么是片段着色器，有什么作用。大美工控设计师 3d 着色器 gltf
一、片段着色器的概念在3D图形学中，片段着色器（FragmentShader）是一种在图形渲染管线中负责处理片段（像素）的程序。它的主要任务是确定每个像素的颜色和其他属性，如透明度、深度等。片段着色器是可编程的，这意味着开发者可以通过编写特定的代码来控制像素的渲染方式，从而实现各种视觉效果。二、片段着色器的工作原理（一）输入片段着色器接收来自顶点着色器（VertexShader）的输出作为输入。顶
directx12 3d+vs2022游戏开发第六章笔记八绘制几何体云缘若仙 directx12 3d 3d 笔记算法 directx12 3d
1.顶点与输入布局在DirectX123D中，顶点是构建几何体的基本单元，它不仅包含了空间位置信息，还可以存储颜色、法线、纹理坐标等其他属性数据。通过定义不同的顶点结构体，可以创建出满足各种需求的顶点格式。例如，以下结构体定义了一个包含位置和颜色信息的顶点：structVertex{ XMFLOAT3Pos; XMFLOAT4Color;};在这个结构体中，XMFLOAT3类型的Pos
Tree Queries（ Codeforces Round 629 (Div. 3) ） BoBoo文睡不醒 acm训练集合笔记
TreeQueries（CodeforcesRound629(Div.3)）Youaregivenarootedtreeconsistingofnnnverticesnumberedfrom111tonnn.Therootofthetreeisavertexnumber111.Atreeisaconnectedundirectedgraphwithn−1n-1n−1edges.Youaregive
allegro snap pick to快捷键设置时间飞行1号 allegro笔记嵌入式硬件
右键Snappickto快捷键的设置下面是我常用的快捷键，可以自己设置快捷键，如果需要更多，把@后缀改成上图的其中一个即可#捕捉线段顶点funckeyss"prepopup;popdyn_option_select'Snappickto@:@SegmentVertex'"#捕捉鼠标所在的线段位置funckeysx"prepopup;popdyn_option_select'Snappickto@:
数据结构考前一天蒟蒻的贤数据结构
线性表：矩阵，链表（单链表必考）栈和队列：出入判断，括号匹配，中缀转后缀字符串数组：模式匹配next，nextval数组，数组寻址，三角矩阵对应一维数组k，二叉树：二叉链表，求叶子数量，求深度，左右转换，前中后遍历，森林与二叉树转化，哈夫曼树，哈夫曼编码，图：DFS，BFS，邻接矩阵，邻接表（EdgeNode,VertexNode），最小生成树（prime加点，kruskal加边），最短路径（di
数据结构图邻接矩阵表示法大和田数据结构数据结构有向图 c++
图邻接矩阵表示法图的邻接表表示法看这里基本结构：enumGraphKind{DG,DN,UDG,UDN};templatestructArcCell{VRTypeadj;InfoType*info;};templateusingAdjMatrix=ArcCell[MAX_VERTEX_NUM][MAX_VERTEX_NUM];templatestructMGraph{VertexTypevexs[
利用邻接表创建无向图 FG. 数据结构与算法
#includeusingnamespacestd;#defineMVNum100#defineOK1typedefcharVerTexType;//顶点信息typedefintOtherInfo;//和边相关的信息typedefstructArcNode{//边结点intadjvex;//该边所指向的顶点的位置structArcNode*nextarc;//指向下一条边的指针OtherInfoi
使用Google Cloud Vertex AI进行文本和多模态生成 sagvWSRJHMNEB 人工智能计算机视觉 python
技术背景介绍GoogleCloudVertexAI是一个强大的框架，提供了多种AI模型的开放访问和动态部署，包括文本、代码和多模态生成模型。通过VertexAI，用户可以利用不同的基础模型，如Gemini、Palm、和Llama，来实现复杂的AI应用。VertexAI不仅限于文本生成，还支持多模态输入，如图像和音频，极大地扩展了AI应用的潜力。核心原理解析VertexAI提供了一种简化的方式来使用
使用Google Vertex AI Search进行企业级高级搜索 hgSdaegva 人工智能 python
技术背景介绍GoogleVertexAISearch（前称为EnterpriseSearchonGenerativeAIAppBuilder）是GoogleCloud提供的VertexAI机器学习平台的一部分。VertexAISearch允许组织快速建立由生成式AI驱动的搜索引擎，为客户和员工提供服务。它基于各种GoogleSearch技术，包括语义搜索，通过使用自然语言处理和机器学习技术来推断内
拓扑排序（邻接链表，邻接矩阵，栈，队列） Ytisonimul 数据结构算法
用c写的邻接链表（或邻接矩阵）存储，栈（或队列）实现的拓扑排序。#include#include#defineSTACK_INIT_SIZE100#defineVNUM100#defineSTACKINCREMENT10#defineOVERFLOW0#defineERROR0#defineOK1#defineMAX_VERTEX_NUM20typedefintStatus;typedefchar
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，

r0	scratch
r1	scratch
r2	scratch
r3(Rd)	scratch, light vector
r4(Rr,Rf,Rl)	scratch , reflectance, eye or light vectors
r5(Rs, Rv)	scratch, sphere vector, eye vector
r6(Rx)	scratch, specular color
r7(Rc)	scratch, diffuse color
r8(RH)	scratch, half-angle vector
r9(Rh)	homogeneous eye space position
r10(R3)	cartesian eye space position
r11(Rn)	eye space normal

Register	Meaning or Value
C[NORMAL0_MATRIX_X] C[NORMAL0_MATRIX_Y] C[NORMAL0_MATRIX_Z]	inverse transpose world * view matrix 0
C[NORMAL1_MATRIX_X] C[NORMAL1_MATRIX_Y] C[NORMAL1_MATRIX_Z]	inverse transpose world * view matrix 1
C[NORMAL2_MATRIX_X] C[NORMAL2_MATRIX_Y] C[NORMAL2_MATRIX_Z]	inverse transpose world * view matrix 2
C[NORMAL3_MATRIX_X] C[NORMAL3_MATRIX_Y] C[NORMAL3_MATRIX_Z]	inverse transpose world * view matrix 3
c[WORLDVIEW0_MATRIX_X] c[WORLDVIEW0_MATRIX_Y] c[WORLDVIEW0_MATRIX_Z]	world * view matrix 0
c[WORLDVIEW1_MATRIX_X] c[WORLDVIEW1_MATRIX_Y] c[WORLDVIEW1_MATRIX_Z]	world* view matrix 1
c[WORLDVIEW2_MATRIX_X] c[WORLDVIEW2_MATRIX_Y] c[WORLDVIEW2_MATRIX_Z]	world * view matrix 2
c[WORLDVIEW3_MATRIX_X] c[WORLDVIEW3_MATRIX_Y] c[WORLDVIEW3_MATRIX_Z]	world*view matrix 3
c[PROJECTION_MATRIX_X] c[PROJECTION_MATRIX_Y] c[PROJECTION_MATRIX_Z] c[PROJECTION_MATRIX_W]	projection matrix
c[COMPOSITE_MATRIX_X] c[COMPOSITE_MATRIX_Y] c[COMPOSITE_MATRIX_Z] c[COMPOSITE_MATRIX_W]	world * view * projection matrix
c[TEXTURE_MATRIX_X] c[TEXTURE_MATRIX_Y] c[TEXTURE_MATRIX_Z] c[TEXTURE_MATRIX_W]	texture matrix
c[GLOBAL_ILLUMINATION]	RGBA,emission + global ambient
c[LIGHT_POSITION]	x,y,z
c[LIGHT_HALF_ANGLE]	x,y,z for infinite light w/local viewer
c[LIGHT_AMBIENT]	RGB,light * material
c[LIGHT_DIFFUSE]	RGB, light * material
c[LIGHT_SPECULAR]	RGB, light * material, specular power
c[LIGHT_ATTENUATION]	a0,a1,a2,spot power
c[LIGHT_SPOT_DIRECTION]	x,y,z,cos(CUTOFF)
c[POINT_PARAMETER]	size, max,min
c[POINT_ATTENUATION]	a0,a1,a2
c[TEXTURE_OBJECT_PLANE_X] c[TEXTURE_OBJECT_PLANE_Y] c[TEXTURE_OBJECT_PLANE_Z] c[TEXTURE_OBJECT_PLANE_W]	x,y,z,w x,y,z,w x,y,z,w x,y,z,w
c[TEXTURE_EYE_PLANE_X] c[TEXTURE_EYE_PLANE_Y] c[TEXTURE_EYE_PLANE_Z] c[TEXTURE_EYE_PLANE_W]	x,y,z,w x,y,z,w x,y,z,w x,y,z,w
c[EYE_POSITION]	x,y,z,w
c[CONSTANT0]	-1,0,1,0.5