一、数据传输指令 ─────────────────────────────────────── 它们在存贮器和寄存器、寄存器和输入输出端口之间传送数据. 1. 通用数据传送指令. MOV 传送字或字节. MOVSX 先符号扩展,再传送. MOVZX 先零扩展,再传送. PUSH 把字压入堆栈. POP 把字弹出堆栈. PUSHA 把AX,CX,DX,BX,SP,BP,SI,DI依次压入堆栈. POPA 把DI,SI,BP,SP,BX,DX,CX,AX依次弹出堆栈. PUSHAD 把EAX,ECX,EDX,EBX,ESP,EBP,ESI,EDI依次压入堆栈. POPAD 把EDI,ESI,EBP,ESP,EBX,EDX,ECX,EAX依次弹出堆栈. BSWAP 交换32位寄存器里字节的顺序 XCHG 交换字或字节.( 至少有一个操作数为寄存器,段寄存器不可作为操作数) CMPXCHG 比较并交换操作数.( 第二个操作数必须为累加器AL/AX/EAX ) XADD 先交换再累加.( 结果在第一个操作数里 ) XLAT 字节查表转换. ── BX 指向一张 256 字节的表的起点, AL 为表的索引值 (0-255,即 0-FFH); 返回 AL 为查表结果. ( [BX+AL]->AL ) 2. 输入输出端口传送指令. IN I/O端口输入. ( 语法: IN 累加器, {端口号│DX} ) OUT I/O端口输出. ( 语法: OUT {端口号│DX},累加器 ) 输入输出端口由立即方式指定时, 其范围是 0-255; 由寄存器 DX 指定时, 其范围是 0-65535. 3. 目的地址传送指令. LEA 装入有效地址. 例: LEA DX,string ;把偏移地址存到DX. LDS 传送目标指针,把指针内容装入DS. 例: LDS SI,string ;把段地址:偏移地址存到DS:SI. LES 传送目标指针,把指针内容装入ES. 例: LES DI,string ;把段地址:偏移地址存到ES:DI. LFS 传送目标指针,把指针内容装入FS. 例: LFS DI,string ;把段地址:偏移地址存到FS:DI. LGS 传送目标指针,把指针内容装入GS. 例: LGS DI,string ;把段地址:偏移地址存到GS:DI. LSS 传送目标指针,把指针内容装入SS. 例: LSS DI,string ;把段地址:偏移地址存到SS:DI. 4. 标志传送指令. LAHF 标志寄存器传送,把标志装入AH. SAHF 标志寄存器传送,把AH内容装入标志寄存器. PUSHF 标志入栈. POPF 标志出栈. PUSHD 32位标志入栈. POPD 32位标志出栈. 二、算术运算指令 ─────────────────────────────────────── ADD 加法. ADC 带进位加法. INC 加 1. AAA 加法的ASCII码调整. DAA 加法的十进制调整. SUB 减法. SBB 带借位减法. DEC 减 1. NEC 求反(以 0 减之). CMP 比较.(两操作数作减法,仅修改标志位,不回送结果). AAS 减法的ASCII码调整. DAS 减法的十进制调整. MUL 无符号乘法. IMUL 整数乘法. 以上两条,结果回送AH和AL(字节运算),或DX和AX(字运算), AAM 乘法的ASCII码调整. DIV 无符号除法. IDIV 整数除法. 以上两条,结果回送: 商回送AL,余数回送AH, (字节运算); 或 商回送AX,余数回送DX, (字运算). AAD 除法的ASCII码调整. CBW 字节转换为字. (把AL中字节的符号扩展到AH中去) CWD 字转换为双字. (把AX中的字的符号扩展到DX中去) CWDE 字转换为双字. (把AX中的字符号扩展到EAX中去) CDQ 双字扩展. (把EAX中的字的符号扩展到EDX中去) 三、逻辑运算指令 ─────────────────────────────────────── AND 与运算. OR 或运算. XOR 异或运算. NOT 取反. TEST 测试.(两操作数作与运算,仅修改标志位,不回送结果). SHL 逻辑左移. SAL 算术左移.(=SHL) SHR 逻辑右移. SAR 算术右移.(=SHR) ROL 循环左移. ROR 循环右移. RCL 通过进位的循环左移. RCR 通过进位的循环右移. 以上八种移位指令,其移位次数可达255次. 移位一次时, 可直接用操作码. 如 SHL AX,1. 移位>1次时, 则由寄存器CL给出移位次数. 如 MOV CL,04 SHL AX,CL 四、串指令 ─────────────────────────────────────── DS:SI 源串段寄存器 :源串变址. ES:DI 目标串段寄存器:目标串变址. CX 重复次数计数器. AL/AX 扫描值. D标志 0表示重复操作中SI和DI应自动增量; 1表示应自动减量. Z标志 用来控制扫描或比较操作的结束. MOVS 串传送. ( MOVSB 传送字符. MOVSW 传送字. MOVSD 传送双字. ) CMPS 串比较. ( CMPSB 比较字符. CMPSW 比较字. ) SCAS 串扫描. 把AL或AX的内容与目标串作比较,比较结果反映在标志位. LODS 装入串. 把源串中的元素(字或字节)逐一装入AL或AX中. ( LODSB 传送字符. LODSW 传送字. LODSD 传送双字. ) STOS 保存串. 是LODS的逆过程. REP 当CX/ECX<>0时重复. REPE/REPZ 当ZF=1或比较结果相等,且CX/ECX<>0时重复. REPNE/REPNZ 当ZF=0或比较结果不相等,且CX/ECX<>0时重复. REPC 当CF=1且CX/ECX<>0时重复. REPNC 当CF=0且CX/ECX<>0时重复. 五、程序转移指令 ─────────────────────────────────────── 1>无条件转移指令 (长转移) JMP 无条件转移指令 CALL 过程调用 RET/RETF过程返回. 2>条件转移指令 (短转移,-128到+127的距离内) ( 当且仅当(SF XOR OF)=1时,OP1<OP2 ) JA/JNBE 不小于或不等于时转移. JAE/JNB 大于或等于转移. JB/JNAE 小于转移. JBE/JNA 小于或等于转移. 以上四条,测试无符号整数运算的结果(标志C和Z). JG/JNLE 大于转移. JGE/JNL 大于或等于转移. JL/JNGE 小于转移. JLE/JNG 小于或等于转移. 以上四条,测试带符号整数运算的结果(标志S,O和Z). JE/JZ 等于转移. JNE/JNZ 不等于时转移. JC 有进位时转移. JNC 无进位时转移. JNO 不溢出时转移. JNP/JPO 奇偶性为奇数时转移. JNS 符号位为 "0" 时转移. JO 溢出转移. JP/JPE 奇偶性为偶数时转移. JS 符号位为 "1" 时转移. 3>循环控制指令(短转移) LOOP CX不为零时循环. LOOPE/LOOPZ CX不为零且标志Z=1时循环. LOOPNE/LOOPNZ CX不为零且标志Z=0时循环. JCXZ CX为零时转移. JECXZ ECX为零时转移. 4>中断指令 INT 中断指令 INTO 溢出中断 IRET 中断返回 5>处理器控制指令 HLT 处理器暂停, 直到出现中断或复位信号才继续. WAIT 当芯片引线TEST为高电平时使CPU进入等待状态. ESC 转换到外处理器. LOCK 封锁总线. NOP 空操作. STC 置进位标志位. CLC 清进位标志位. CMC 进位标志取反. STD 置方向标志位. CLD 清方向标志位. STI 置中断允许位. CLI 清中断允许位. 六、伪指令 ─────────────────────────────────────── DB 定义字节. DW 定义字(2字节). PROC 定义过程. ENDP 过程结束. SEGMENT 定义段. ASSUME 建立段寄存器寻址. ENDS 段结束. END 程序结束.
SSE指令的宏实现
;-------------------------------------------------------------- ;应用此文件要以masm32软件包为背景,请更改下 ;边include语句后的路径为软件包中macros.asm的 ;实际路径,以确保能正确包含进此文件(请确保你 ;没有删除软件包中的macros.asm)。 ;例如:你的masm32软件包安装在E盘根目录下 ;则应将下边语句改成include E:\masm32\macros\macros.asm ;使用时在源程序的asm文件中加入“include 此文件路径” ;例如:你将此文件放在E:\masm32\include目录下 ;则在源文件中加入此行语句include E:\masm32\include\MyMacro.inc ;做好这些工作后,就能在源程序中使用SSE3、SSSE3、SSE4.1指令了。 ;例如: ;pshufb xmm(4),MakeXmmword(8080808080808080h,0001020304050607h) ;psrlq xmm(7),16 ;pextrb edx,xmm(5),0 ;■■■■■■■■■■■■■ ;■SSE4.1中有条指令未实现■ ;■■■■■■■■■■■■■ ;-------------------------------------------------------------- ;++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ ;1.此文件免费,仅供参考学习,请勿用于任何形式的商业行为 ; ;2.尊重个人劳动成果,请勿随意改动,引用请注明出处 ; ;3.不负责此文件的绝对正确性,因引用此文件造成的程序bug或任何其它 ; ;损失概不负责 ;++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ include G:\masm32\macros\macros.asm ArgsReverse MACRO arglist:VARARG LOCAL txt, arg txt TEXTEQU <> FOR arg,<arglist> txt CATSTR <arg>,<!,>,txt ENDM txt SUBSTR txt,1, @SizeStr(%txt)-1 EXITM <txt> ENDM Reverse MACRO arg:req LOCAL txt txt TEXTEQU <> FORC Char,<arg> txt CATSTR <Char>,txt ENDM EXITM <txt> ENDM MakeDword MACRO args:VARARG LOCAL ValueName,NumberOfArgs,ReversedArgs .data align 4 NumberOfArgs = argcount(args) ReversedArgs textequ ArgsReverse(args) IF NumberOfArgs eq 4 ValueName byte ReversedArgs ELSEIF NumberOfArgs eq 2 ValueName word ReversedArgs ELSEIF NumberOfArgs eq 1 ValueName dword ReversedArgs ENDIF .code EXITM <ValueName> ENDM MakeQword MACRO args:VARARG LOCAL ValueName,NumberOfArgs,ReversedArgs .data align 16 NumberOfArgs = argcount(args) ReversedArgs textequ ArgsReverse(args) IF NumberOfArgs eq 8 ValueName byte ReversedArgs ELSEIF NumberOfArgs eq 4 ValueName word ReversedArgs ELSEIF NumberOfArgs eq 2 ValueName dword ReversedArgs ELSEIF NumberOfArgs eq 1 ValueName qword ReversedArgs ENDIF .code EXITM <qword ptr ValueName> ENDM MakeXmmword MACRO args:VARARG LOCAL ValueName,NumberOfArgs,ReversedArgs .data align 16 NumberOfArgs = argcount(args) ReversedArgs textequ ArgsReverse(args) FORC Char,<args> IFIDN <Char>,<.> IF NumberOfArgs eq 4 ValueName real4 ReversedArgs ELSEIF NumberOfArgs eq 2 ValueNmae real8 ReversedArgs ENDIF EXITM ENDIF ENDM IFNDEF ValueName IF NumberOfArgs eq 16 ValueName byte ReversedArgs ELSEIF NumberOfArgs eq 8 ValueName word ReversedArgs ELSEIF NumberOfArgs eq 4 ValueName dword ReversedArgs ELSEIF NumberOfArgs eq 2 ValueName qword ReversedArgs ENDIF ENDIF .code EXITM <oword ptr ValueName> ENDM Shared MACRO Dest,Src,BinCode:VARARG LOCAL Last,Current,VarNum,Count VarNum = argcount(BinCode) Count = 0 WHILE Count NE VarNum - 2 db getarg(Count + 1,BinCode) Count = Count + 1 ENDM Last equ $ addps Dest,Src Current equ $ ORG Last db getarg(VarNum - 1,BinCode),getarg(VarNum,BinCode) ORG Current ENDM ExInShared MACRO Dest,Src,Imm8,BinCode:VARARG LOCAL Last,Current,VarNum,Count VarNum = argcount(BinCode) Count = 0 WHILE Count NE VarNum - 3 db getarg(Count + 1,BinCode) Count = Count + 1 ENDM Last equ $ IF isregister(Src) pinsrw Dest,Src,Imm8 ELSE pinsrw Dest,word ptr Src,Imm8 ENDIF Current equ $ ORG Last db getarg(VarNum - 2,BinCode),getarg(VarNum - 1,BinCode),getarg(VarNum,BinCode) ORG Current ENDM ;SSE3指令 movshdup MACRO Dest,Src Shared Dest,Src,0f3h, 0fh, 16h ENDM movsldup MACRO Dest,Src Shared Dest,Src,0f3h, 0fh, 12h ENDM movddup MACRO Dest,Src Shared Dest,Src,0f2h, 0fh, 12h ENDM addsubps MACRO Dest,Src Shared Dest,Src,0f2h, 0fh,0d0h ENDM addsubpd MACRO Dest,Src Shared Dest,Src,066h, 0fh,0d0h ENDM haddps MACRO Dest,Src Shared Dest,Src,0f2h, 0fh, 7ch ENDM hsubps MACRO Dest,Src Shared Dest,Src,0f2h, 0fh, 7dh ENDM haddpd MACRO Dest,Src Shared Dest,Src,066h, 0fh, 7ch ENDM hsubpd MACRO Dest,Src Shared Dest,Src,066h, 0fh, 7dh ENDM ;SSSE3指令 phaddw MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 01h ENDM phaddsw MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 03h ENDM phaddd MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 02h ENDM phsubw MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 05h ENDM phsubsw MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 07h ENDM phsubd MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 06h ENDM pabsb MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 1ch ENDM pabsw MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 1dh ENDM pabsd MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 1eh ENDM pmaddubsw MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 04h ENDM pmulhrsw MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 0bh ENDM pshufb MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 00h ENDM psignb MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 08h ENDM psignw MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 09h ENDM psignd MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 0ah ENDM ;SSE4.1指令 pmulld MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 40h ENDM pmuldq MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 28h ENDM dpps MACRO Dest,Src,Imm8 Shared Dest,Src,066h, 0fh, 3ah, 40h db Imm8 ENDM dppd MACRO Dest,Src,Imm8 Shared Dest,Src,066h, 0fh, 3ah, 41h db Imm8 ENDM movntdqa MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 2ah ENDM blendps MACRO Dest,Src,Imm8 Shared Dest,Src,066h, 0fh, 3ah, 0ch db Imm8 ENDM blendpd MACRO Dest,Src,Imm8 Shared Dest,Src,066h, 0fh, 3ah, 0dh db Imm8 ENDM blendvps MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 14h ENDM blendvpd MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 15h ENDM pblendvb MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 10h ENDM pblendw MACRO Dest,Src,Imm8 Shared Dest,Src,066h, 0fh, 3ah, 0eh db Imm8 ENDM pminsb MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 38h ENDM pmaxsb MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 3ch ENDM pminuw MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 3ah ENDM pmaxuw MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 3eh ENDM pminud MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 3bh ENDM pmaxud MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 3fh ENDM pminsd MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 39h ENDM pmaxsd MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 3dh ENDM roundps MACRO Dest,Src,Imm8 Shared Dest,Src,066h, 0fh, 3ah, 08h db Imm8 ENDM roundss MACRO Dest,Src,Imm8 Shared Dest,Src,066h, 0fh, 3ah, 0ah db Imm8 ENDM roundpd MACRO Dest,Src,Imm8 Shared Dest,Src,066h, 0fh, 3ah, 09h db Imm8 ENDM roundsd MACRO Dest,Src,Imm8 Shared Dest,Src,066h, 0fh, 3ah, 0bh db Imm8 ENDM insertps MACRO Dest,Src,Imm8 Shared Dest,Src,066h, 0fh, 3ah, 21h db Imm8 ENDM ;extractps MACRO Dest,Src,Imm8 ; ; ENDM pinsrb MACRO Dest,Src,Imm8 ExInShared Dest,Src,Imm8,066h, 0fh, 3ah, 20h ENDM pinsrd MACRO Dest,Src,Imm8 ExInShared Dest,Src,Imm8,066h, 0fh, 3ah, 22h ENDM pextrb MACRO Dest,Src,Imm8 ExInShared Src,Dest,Imm8,066h, 0fh, 3ah, 14h ENDM pextrwm MACRO Dest,Src,Imm8 ExInShared Src,Dest,Imm8,066h, 0fh, 3ah, 15h ENDM pextrd MACRO Dest,Src,Imm8 ExInShared Src,Dest,Imm8,066h, 0fh, 3ah, 16h ENDM pmovsxbw MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 20h ENDM pmovzxbw MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 30h ENDM pmovsxbd MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 21h ENDM pmovzxbd MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 31h ENDM pmovsxbq MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 22h ENDM pmovzxbq MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 32h ENDM pmovsxwd MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 23h ENDM pmovzxwd MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 33h ENDM pmovsxwq MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 24h ENDM pmovzxwq MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 34h ENDM pmovsxdq MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 25h ENDM pmovzxdq MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 35h ENDM mpsadbw MACRO Dest,Src,Imm8 Shared Dest,Src,066h, 0fh, 3ah, 42h db Imm8 ENDM phminposuw MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 41h ENDM pcmpeqq MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 29h ENDM ptest MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 17h ENDM packusdw MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 2bh ENDM ;SSE4.2指令 pcmpestri MACRO Dest,Src,Imm8 Shared Dest,Src,066h, 0fh, 3ah, 61h db Imm8 ENDM pcmpestrm MACRO Dest,Src,Imm8 Shared Dest,Src,066h, 0fh, 3ah, 60h db Imm8 ENDM pcmpistri MACRO Dest,Src,Imm8 Shared Dest,Src,066h, 0fh, 3ah, 63h db Imm8 ENDM pcmpistrm MACRO Dest,Src,Imm8 Shared Dest,Src,066h, 0fh, 3ah, 62h db Imm8 ENDM pcmpgtq MACRO Dest,Src Shared Dest,Src,066h, 0fh, 38h, 37h ENDM