汇编指令速查及SSE指令宏实现

80X86汇编指令
一、数据传输指令
─────────────────────────────────────── 
    它们在存贮器和寄存器、寄存器和输入输出端口之间传送数据. 
    1. 通用数据传送指令. 
        MOV    传送字或字节. 
        MOVSX  先符号扩展,再传送. 
        MOVZX  先零扩展,再传送. 
        PUSH    把字压入堆栈. 
        POP    把字弹出堆栈. 
        PUSHA  把AX,CX,DX,BX,SP,BP,SI,DI依次压入堆栈. 
        POPA    把DI,SI,BP,SP,BX,DX,CX,AX依次弹出堆栈. 
        PUSHAD  把EAX,ECX,EDX,EBX,ESP,EBP,ESI,EDI依次压入堆栈. 
        POPAD  把EDI,ESI,EBP,ESP,EBX,EDX,ECX,EAX依次弹出堆栈. 
        BSWAP  交换32位寄存器里字节的顺序 
        XCHG    交换字或字节.( 至少有一个操作数为寄存器,段寄存器不可作为操作数) 
        CMPXCHG 比较并交换操作数.( 第二个操作数必须为累加器AL/AX/EAX ) 
        XADD    先交换再累加.( 结果在第一个操作数里 ) 
        XLAT    字节查表转换. 
                ── BX 指向一张 256 字节的表的起点, AL 为表的索引值 (0-255,即 
                0-FFH); 返回 AL 为查表结果. ( [BX+AL]->AL ) 
    2. 输入输出端口传送指令. 
        IN      I/O端口输入. ( 语法: IN 累加器, {端口号│DX} ) 
        OUT    I/O端口输出. ( 语法: OUT {端口号│DX},累加器 ) 
          输入输出端口由立即方式指定时, 其范围是 0-255; 由寄存器 DX 指定时, 
          其范围是 0-65535. 
    3. 目的地址传送指令. 
        LEA    装入有效地址. 
          例: LEA DX,string  ;把偏移地址存到DX. 
        LDS    传送目标指针,把指针内容装入DS. 
          例: LDS SI,string  ;把段地址:偏移地址存到DS:SI. 
        LES    传送目标指针,把指针内容装入ES. 
          例: LES DI,string  ;把段地址:偏移地址存到ES:DI. 
        LFS    传送目标指针,把指针内容装入FS. 
          例: LFS DI,string  ;把段地址:偏移地址存到FS:DI. 
        LGS    传送目标指针,把指针内容装入GS. 
          例: LGS DI,string  ;把段地址:偏移地址存到GS:DI. 
        LSS    传送目标指针,把指针内容装入SS. 
          例: LSS DI,string  ;把段地址:偏移地址存到SS:DI. 
    4. 标志传送指令. 
        LAHF    标志寄存器传送,把标志装入AH. 
        SAHF    标志寄存器传送,把AH内容装入标志寄存器. 
        PUSHF  标志入栈. 
        POPF    标志出栈. 
        PUSHD  32位标志入栈. 
        POPD    32位标志出栈. 

二、算术运算指令 
─────────────────────────────────────── 
        ADD    加法. 
        ADC    带进位加法. 
        INC    加 1. 
        AAA    加法的ASCII码调整. 
        DAA    加法的十进制调整. 
        SUB    减法. 
        SBB    带借位减法. 
        DEC    减 1. 
        NEC    求反(以 0 减之). 
        CMP    比较.(两操作数作减法,仅修改标志位,不回送结果). 
        AAS    减法的ASCII码调整. 
        DAS    减法的十进制调整. 
        MUL    无符号乘法. 
        IMUL    整数乘法. 
          以上两条,结果回送AH和AL(字节运算),或DX和AX(字运算), 
        AAM    乘法的ASCII码调整. 
        DIV    无符号除法. 
        IDIV    整数除法. 
          以上两条,结果回送: 
              商回送AL,余数回送AH, (字节运算); 
          或  商回送AX,余数回送DX, (字运算). 
        AAD    除法的ASCII码调整. 
        CBW    字节转换为字. (把AL中字节的符号扩展到AH中去) 
        CWD    字转换为双字. (把AX中的字的符号扩展到DX中去) 
        CWDE    字转换为双字. (把AX中的字符号扩展到EAX中去) 
        CDQ    双字扩展.    (把EAX中的字的符号扩展到EDX中去) 

三、逻辑运算指令 
─────────────────────────────────────── 
        AND    与运算. 
        OR      或运算. 
        XOR    异或运算. 
        NOT    取反. 
        TEST    测试.(两操作数作与运算,仅修改标志位,不回送结果). 
        SHL    逻辑左移. 
        SAL    算术左移.(=SHL) 
        SHR    逻辑右移. 
        SAR    算术右移.(=SHR) 
        ROL    循环左移. 
        ROR    循环右移. 
        RCL    通过进位的循环左移. 
        RCR    通过进位的循环右移. 
          以上八种移位指令,其移位次数可达255次. 
              移位一次时, 可直接用操作码.  如 SHL AX,1. 
              移位>1次时, 则由寄存器CL给出移位次数. 
                如  MOV CL,04 
                    SHL AX,CL 

四、串指令 
─────────────────────────────────────── 
            DS:SI  源串段寄存器  :源串变址. 
            ES:DI  目标串段寄存器:目标串变址. 
            CX      重复次数计数器. 
            AL/AX  扫描值. 
            D标志  0表示重复操作中SI和DI应自动增量; 1表示应自动减量. 
            Z标志  用来控制扫描或比较操作的结束. 
        MOVS    串传送. 
            ( MOVSB  传送字符.    MOVSW  传送字.    MOVSD  传送双字. ) 
        CMPS    串比较. 
            ( CMPSB  比较字符.    CMPSW  比较字. ) 
        SCAS    串扫描. 
            把AL或AX的内容与目标串作比较,比较结果反映在标志位. 
        LODS    装入串. 
            把源串中的元素(字或字节)逐一装入AL或AX中. 
            ( LODSB  传送字符.    LODSW  传送字.    LODSD  传送双字. ) 
        STOS    保存串. 
            是LODS的逆过程. 
        REP            当CX/ECX<>0时重复. 
        REPE/REPZ      当ZF=1或比较结果相等,且CX/ECX<>0时重复. 
        REPNE/REPNZ    当ZF=0或比较结果不相等,且CX/ECX<>0时重复. 
        REPC          当CF=1且CX/ECX<>0时重复. 
        REPNC          当CF=0且CX/ECX<>0时重复. 

五、程序转移指令 
─────────────────────────────────────── 
    1>无条件转移指令 (长转移) 
        JMP    无条件转移指令 
        CALL    过程调用 
        RET/RETF过程返回. 
    2>条件转移指令 (短转移,-128到+127的距离内) 
        ( 当且仅当(SF XOR OF)=1时,OP1<OP2 ) 
        JA/JNBE 不小于或不等于时转移. 
        JAE/JNB 大于或等于转移. 
        JB/JNAE 小于转移. 
        JBE/JNA 小于或等于转移. 
          以上四条,测试无符号整数运算的结果(标志C和Z). 
        JG/JNLE 大于转移. 
        JGE/JNL 大于或等于转移. 
        JL/JNGE 小于转移. 
        JLE/JNG 小于或等于转移. 
          以上四条,测试带符号整数运算的结果(标志S,O和Z). 
        JE/JZ  等于转移. 
        JNE/JNZ 不等于时转移. 
        JC      有进位时转移. 
        JNC    无进位时转移. 
        JNO    不溢出时转移. 
        JNP/JPO 奇偶性为奇数时转移. 
        JNS    符号位为 "0" 时转移. 
        JO      溢出转移. 
        JP/JPE  奇偶性为偶数时转移. 
        JS      符号位为 "1" 时转移. 
    3>循环控制指令(短转移) 
        LOOP            CX不为零时循环. 
        LOOPE/LOOPZ    CX不为零且标志Z=1时循环. 
        LOOPNE/LOOPNZ  CX不为零且标志Z=0时循环. 
        JCXZ            CX为零时转移. 
        JECXZ          ECX为零时转移. 
    4>中断指令 
        INT    中断指令 
        INTO    溢出中断 
        IRET    中断返回 
    5>处理器控制指令 
        HLT    处理器暂停, 直到出现中断或复位信号才继续. 
        WAIT    当芯片引线TEST为高电平时使CPU进入等待状态. 
        ESC    转换到外处理器. 
        LOCK    封锁总线. 
        NOP    空操作. 
        STC    置进位标志位. 
        CLC    清进位标志位. 
        CMC    进位标志取反. 
        STD    置方向标志位. 
        CLD    清方向标志位. 
        STI    置中断允许位. 
        CLI    清中断允许位. 

六、伪指令 
─────────────────────────────────────── 
        DB      定义字节. 
        DW      定义字(2字节). 
        PROC    定义过程. 
        ENDP    过程结束. 
        SEGMENT 定义段. 
        ASSUME  建立段寄存器寻址. 
        ENDS    段结束. 
        END    程序结束.


SSE指令的宏实现

;--------------------------------------------------------------
;应用此文件要以masm32软件包为背景,请更改下

;边include语句后的路径为软件包中macros.asm的

;实际路径,以确保能正确包含进此文件(请确保你

;没有删除软件包中的macros.asm)。

;例如:你的masm32软件包安装在E盘根目录下

;则应将下边语句改成include E:\masm32\macros\macros.asm

;使用时在源程序的asm文件中加入“include 此文件路径”

;例如:你将此文件放在E:\masm32\include目录下

;则在源文件中加入此行语句include E:\masm32\include\MyMacro.inc

;做好这些工作后,就能在源程序中使用SSE3、SSSE3、SSE4.1指令了。

;例如:

;pshufb	xmm(4),MakeXmmword(8080808080808080h,0001020304050607h)

;psrlq	xmm(7),16

;pextrb	edx,xmm(5),0

;■■■■■■■■■■■■■
;■SSE4.1中有条指令未实现■
;■■■■■■■■■■■■■
;--------------------------------------------------------------

;++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
;1.此文件免费,仅供参考学习,请勿用于任何形式的商业行为
;
;2.尊重个人劳动成果,请勿随意改动,引用请注明出处
;
;3.不负责此文件的绝对正确性,因引用此文件造成的程序bug或任何其它
;
;损失概不负责
;++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

include	G:\masm32\macros\macros.asm

ArgsReverse	MACRO	arglist:VARARG
		LOCAL	txt, arg
		txt	TEXTEQU	<>
		FOR	arg,<arglist>
			txt CATSTR <arg>,<!,>,txt
		ENDM
		txt	SUBSTR	txt,1, @SizeStr(%txt)-1
		EXITM	<txt>
		ENDM

Reverse		MACRO	arg:req
		LOCAL	txt
		txt	TEXTEQU	<>
		FORC	Char,<arg>
			txt CATSTR <Char>,txt
		ENDM
		EXITM	<txt>
		ENDM

MakeDword	MACRO	args:VARARG
		LOCAL	ValueName,NumberOfArgs,ReversedArgs
		.data
		align	4
		NumberOfArgs = argcount(args)
		ReversedArgs textequ ArgsReverse(args)
		IF NumberOfArgs eq 4
			ValueName	byte	ReversedArgs
		ELSEIF NumberOfArgs eq 2
			ValueName	word	ReversedArgs
		ELSEIF NumberOfArgs eq 1
			ValueName	dword	ReversedArgs
		ENDIF
		.code
		EXITM	<ValueName>
		ENDM

MakeQword	MACRO	args:VARARG
		LOCAL	ValueName,NumberOfArgs,ReversedArgs
		.data
		align	16
		NumberOfArgs = argcount(args)
		ReversedArgs textequ ArgsReverse(args)
		IF NumberOfArgs eq 8
			ValueName	byte	ReversedArgs
		ELSEIF NumberOfArgs eq 4
			ValueName	word	ReversedArgs
		ELSEIF NumberOfArgs eq 2
			ValueName	dword	ReversedArgs
		ELSEIF NumberOfArgs eq 1
			ValueName	qword	ReversedArgs
		ENDIF
		.code
		EXITM	<qword ptr ValueName>
		ENDM

MakeXmmword	MACRO	args:VARARG
		LOCAL	ValueName,NumberOfArgs,ReversedArgs
		.data
		align	16
		NumberOfArgs = argcount(args)
		ReversedArgs textequ ArgsReverse(args)
		FORC	Char,<args>
			IFIDN	<Char>,<.>
				IF NumberOfArgs eq 4
					ValueName	real4	ReversedArgs
				ELSEIF NumberOfArgs eq 2
					ValueNmae	real8	ReversedArgs
				ENDIF
				EXITM
			ENDIF
		ENDM
		IFNDEF	ValueName
			IF NumberOfArgs eq 16
				ValueName	byte	ReversedArgs
			ELSEIF NumberOfArgs eq 8
				ValueName	word	ReversedArgs
			ELSEIF NumberOfArgs eq 4
				ValueName	dword	ReversedArgs
			ELSEIF NumberOfArgs eq 2
				ValueName	qword	ReversedArgs
			ENDIF
		ENDIF
		.code
		EXITM	<oword ptr ValueName>
		ENDM

Shared		MACRO	Dest,Src,BinCode:VARARG
		LOCAL	Last,Current,VarNum,Count
		VarNum	= argcount(BinCode)
		Count	= 0
		WHILE	Count NE VarNum - 2
			db	getarg(Count + 1,BinCode)
			Count = Count + 1
		ENDM
		Last	equ	$
		addps	Dest,Src
		Current	equ	$
		ORG	Last
		db	getarg(VarNum - 1,BinCode),getarg(VarNum,BinCode)
		ORG	Current
		ENDM

ExInShared	MACRO	Dest,Src,Imm8,BinCode:VARARG
		LOCAL	Last,Current,VarNum,Count
		VarNum	= argcount(BinCode)
		Count	= 0
		WHILE	Count NE VarNum - 3
			db	getarg(Count + 1,BinCode)
			Count = Count + 1
		ENDM
		Last	equ	$
		IF	isregister(Src)
			pinsrw	Dest,Src,Imm8
		ELSE
			pinsrw	Dest,word ptr Src,Imm8
		ENDIF
		Current	equ	$
		ORG	Last
		db	getarg(VarNum - 2,BinCode),getarg(VarNum - 1,BinCode),getarg(VarNum,BinCode)
		ORG	Current
		ENDM
;SSE3指令
movshdup	MACRO	Dest,Src
		Shared	Dest,Src,0f3h, 0fh, 16h
		ENDM
movsldup	MACRO	Dest,Src
		Shared	Dest,Src,0f3h, 0fh, 12h
		ENDM
movddup		MACRO	Dest,Src
		Shared	Dest,Src,0f2h, 0fh, 12h
		ENDM
addsubps	MACRO	Dest,Src
		Shared	Dest,Src,0f2h, 0fh,0d0h
		ENDM
addsubpd	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh,0d0h
		ENDM
haddps		MACRO	Dest,Src
		Shared	Dest,Src,0f2h, 0fh, 7ch
		ENDM
hsubps		MACRO	Dest,Src
		Shared	Dest,Src,0f2h, 0fh, 7dh
		ENDM
haddpd		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 7ch
		ENDM
hsubpd		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 7dh
		ENDM
;SSSE3指令
phaddw		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 01h
		ENDM
phaddsw		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 03h
		ENDM
phaddd		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 02h
		ENDM
phsubw		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 05h
		ENDM
phsubsw		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 07h
		ENDM
phsubd		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 06h
		ENDM
pabsb		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 1ch
		ENDM
pabsw		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 1dh
		ENDM
pabsd		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 1eh
		ENDM
pmaddubsw	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 04h
		ENDM
pmulhrsw	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 0bh
		ENDM
pshufb		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 00h
		ENDM
psignb		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 08h
		ENDM
psignw		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 09h
		ENDM
psignd		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 0ah
		ENDM
;SSE4.1指令
pmulld		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 40h
		ENDM
pmuldq		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 28h
		ENDM
dpps		MACRO	Dest,Src,Imm8
		Shared	Dest,Src,066h, 0fh, 3ah, 40h
		db	Imm8
		ENDM
dppd		MACRO	Dest,Src,Imm8
		Shared	Dest,Src,066h, 0fh, 3ah, 41h
		db	Imm8
		ENDM
movntdqa	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 2ah
		ENDM
blendps		MACRO	Dest,Src,Imm8
		Shared	Dest,Src,066h, 0fh, 3ah, 0ch
		db	Imm8
		ENDM
blendpd		MACRO	Dest,Src,Imm8
		Shared	Dest,Src,066h, 0fh, 3ah, 0dh
		db	Imm8
		ENDM
blendvps	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 14h
		ENDM
blendvpd	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 15h
		ENDM
pblendvb	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 10h
		ENDM
pblendw		MACRO	Dest,Src,Imm8
		Shared	Dest,Src,066h, 0fh, 3ah, 0eh
		db	Imm8
		ENDM
pminsb		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 38h
		ENDM
pmaxsb		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 3ch
		ENDM
pminuw		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 3ah
		ENDM
pmaxuw		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 3eh
		ENDM
pminud		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 3bh
		ENDM
pmaxud		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 3fh
		ENDM
pminsd		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 39h
		ENDM
pmaxsd		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 3dh
		ENDM
roundps		MACRO	Dest,Src,Imm8
		Shared	Dest,Src,066h, 0fh, 3ah, 08h
		db	Imm8
		ENDM
roundss		MACRO	Dest,Src,Imm8
		Shared	Dest,Src,066h, 0fh, 3ah, 0ah
		db	Imm8
		ENDM
roundpd		MACRO	Dest,Src,Imm8
		Shared	Dest,Src,066h, 0fh, 3ah, 09h
		db	Imm8
		ENDM
roundsd		MACRO	Dest,Src,Imm8
		Shared	Dest,Src,066h, 0fh, 3ah, 0bh
		db	Imm8
		ENDM
insertps	MACRO	Dest,Src,Imm8
		Shared	Dest,Src,066h, 0fh, 3ah, 21h
		db	Imm8
		ENDM
;extractps	MACRO	Dest,Src,Imm8
;
;		ENDM
pinsrb		MACRO	Dest,Src,Imm8
		ExInShared	Dest,Src,Imm8,066h, 0fh, 3ah, 20h
		ENDM
pinsrd		MACRO	Dest,Src,Imm8
		ExInShared	Dest,Src,Imm8,066h, 0fh, 3ah, 22h
		ENDM
pextrb		MACRO	Dest,Src,Imm8
		ExInShared	Src,Dest,Imm8,066h, 0fh, 3ah, 14h
		ENDM
pextrwm		MACRO	Dest,Src,Imm8
		ExInShared	Src,Dest,Imm8,066h, 0fh, 3ah, 15h
		ENDM
pextrd		MACRO	Dest,Src,Imm8
		ExInShared	Src,Dest,Imm8,066h, 0fh, 3ah, 16h
		ENDM
pmovsxbw	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 20h
		ENDM
pmovzxbw	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 30h
		ENDM
pmovsxbd	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 21h
		ENDM
pmovzxbd	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 31h
		ENDM
pmovsxbq	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 22h
		ENDM
pmovzxbq	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 32h
		ENDM
pmovsxwd	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 23h
		ENDM
pmovzxwd	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 33h
		ENDM
pmovsxwq	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 24h
		ENDM
pmovzxwq	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 34h
		ENDM
pmovsxdq	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 25h
		ENDM
pmovzxdq	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 35h
		ENDM
mpsadbw		MACRO	Dest,Src,Imm8
		Shared	Dest,Src,066h, 0fh, 3ah, 42h
		db	Imm8
		ENDM
phminposuw	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 41h
		ENDM
pcmpeqq		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 29h
		ENDM
ptest		MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 17h
		ENDM
packusdw	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 2bh
		ENDM
;SSE4.2指令
pcmpestri	MACRO	Dest,Src,Imm8
		Shared	Dest,Src,066h, 0fh, 3ah, 61h
		db	Imm8
		ENDM
pcmpestrm	MACRO	Dest,Src,Imm8
		Shared	Dest,Src,066h, 0fh, 3ah, 60h
		db	Imm8
		ENDM
pcmpistri	MACRO	Dest,Src,Imm8
		Shared	Dest,Src,066h, 0fh, 3ah, 63h
		db	Imm8
		ENDM
pcmpistrm	MACRO	Dest,Src,Imm8
		Shared	Dest,Src,066h, 0fh, 3ah, 62h
		db	Imm8
		ENDM
pcmpgtq 	MACRO	Dest,Src
		Shared	Dest,Src,066h, 0fh, 38h, 37h
		ENDM


你可能感兴趣的:(汇编)