桌面/服务器RISC的多媒体扩展

由于所有的桌面微处理都支持图形显示,并且晶体管的成本下降,所以不可避免的,需要支持图形操作。很多图形系统用分别用8个bit来表示三原色中的一种,再用剩下的8个bit来表示像素位置。

音频相关特效,比如扬声器,麦克风之类应用在远程会议,电子游戏上面。音频取样需要超过8个bit的精度,不过一般不会超过16个。

所有的微处理器都支持字节和半字的数据存储,来减少内存占用,但是因为一般的算术操作很少涉及到这种数,所以除了数据传输指令,没有其他指令是操作这些类型的数的。Intel i860的设计师发现图形和音频的很多数据操作都是相似的向量计算。以1989年的晶体管集成度,一个单独的向量处理单元的成本太高。不过,可以通过阻断一个64位ALU内部的进位,达到短向量的操作目的。一个64位的ALU,可以同时操作8个8bit操作数,4个16bit操作数,或者2个32位操作数。这样分隔ALU的代价很小。很多应用程序使用了这个特性,比如MPEG(视频),DOOM(3D图形),Adobe photoshop(数字图像),还有远程会议(音频和图像处理)。

就像病毒,这些多媒体支持很快就占据了所有的桌面微处理器。HP是第一个支持多媒体的桌面RISC。我们应该看到,这种支持并不均衡,IBM分割了多媒体支持。PowerPC支持了指令,但是Power版本没有支持。

这些扩展被叫做子字并行,向量,或者单指令多数据(SIMD)。由于Intel销售用来形容80x86的MMX扩展,所以SIMD变成最流行的叫法。图20汇总了各个体系结构的支持。

桌面/服务器RISC的多媒体扩展_第1张图片
图20 桌面RISC多媒体扩展汇总。B代表byte(8个bit),H代表半字(16个bit),W代表字(32个bit)。所以8B的意思是一条指令一次操作8个字。pack和unpack用2*2W的意思是两个操作数都是两个字大小。注意MDMX有向量/标量操作,当作为标量的时候代表是向量寄存器组的一个元素。这个图是对完整多媒体指令的简化汇总,省略了很多细节。比如,MIPS MDMX包含两个操作数的复用指令,HP MAX2包括计算平均值的指令,SPARC VIS包括将寄存器设置为常数。还有,这个表没有包括MDMX,MAX和VIS的内存对齐操作。

从图20可以看出,一般来说MIPS MDMX一条指令操作8个字节或者4个半字,HP PA-RISC MAX2操作4个半字,SPARC VIS操作4个半字或者两个字,Alpha对应的操作很少。Alpha MAX只有字节版本的比较,最小,最大,以及绝对值比较,将加减乘的操作交给软件来处理。MIPS还添加了一条指令的两个32位浮点的操作,但是在MIPS V中多媒体扩展有所改变(见“MIPS64指令独特点”一节)。

有一个在通用微处理器上面不常见的特性叫做饱和操作。饱和操作是指,当一次计算结果溢出的时候,将结果设置为最大的正数,或者最小的负数,而不是对结果做取模。这种特性一般出现在DSP上面(见下一个小节),这种饱和操作在做过滤的时候会很有用。

这些机器很大程度上都用现有的寄存器来保存操作数:Alpha和HP RA-RISC用整数寄存器,MIPS和Sun用浮点寄存器。数据读写的操作就使用标准的读写指令。PowerPC ActiveC 添加了32个128位的寄存器。MIPS添加了一个192位(3*64)的寄存器当作这些操作的累加器。3倍宽的数据宽度,让它可以分隔成8个24位或者4个48位。这个宽的累加器可以用在加,减,和乘加指令上面。MIPS声称可以提高2到4倍的效率。

也许图20中最让人惊讶的是体系结构间的指令开始缺乏一致性。在所有体系结构中都有的操作只有逻辑运算(与/或/异或)。如果省略掉节俭的Alpha,还有一致的操作是对4个半字的加法和减法。

每个体系结构制造商都申明这些指令是用在手工优化的子程序库中,这是因为,编译器很难为所有的桌面RISC体系结构生成合适的多媒体扩展指令。(也就是说,即使写的是C语言的代码,编译器也很难把它编译成多媒体扩展指令。要用这些指令,只能手工写汇编的库来做优化)。

你可能感兴趣的:(桌面/服务器RISC的多媒体扩展)