汇编中的寄存器说明

 汇编语言和CPU以及内存,端口等硬件知识是连在一起的. 这也是为什么汇编语言没有通用性的原因. 下面简单讲讲基本知识(针对INTEL x86及其兼容机) ============================ x86汇编语言的指令,其操作对象是CPU上的寄存器,系统内存,或者立即数. 有些指令表面上没有操作数, 或者看上去缺少操作数, 其实该指令有内定的操作对象, 比如push指令, 一定是对SS:ESP指定的内存操作, 而cdq的操作对象一定是eax / edx. 在汇编语言中,寄存器用名字来访问. CPU 寄存器有好几类, 分别有不同的用处: 1. 通用寄存器: EAX,EBX,ECX,EDX,ESI,EDI,EBP,ESP(这个虽然通用,但很少被用做除了堆栈指针外的用途) 这些32位可以被用作多种用途,但每一个都有"专长". EAX 是"累加器"(accumulator), 它是很多加法乘法指令的缺省寄存器. EBX 是"基地址"(base)寄存器, 在内存寻址时存放基地址. ECX 是计数器(counter), 是重复(REP)前缀指令和LOOP指令的内定计数器. EDX是...(忘了..哈哈)但它总是被用来放整数除法产生的余数. 这4个寄存器的低16位可以被单独访问,分别用AX,BX,CX和DX. AX又可以单独访问低8位(AL)和高8位(AH), BX,CX,DX也类似. 函数的返回值经常被放在EAX中. ESI/EDI分别叫做"源/目标索引寄存器"(source/destination index),因为在很多字符串操作指令中, DS:ESI指向源串,而ES:EDI指向目标串. EBP是"基址指针"(BASE POINTER), 它最经常被用作高级语言函数调用的"框架指针"(frame pointer). 在破解的时候,经常可以看见一个标准的函数起始代码: push ebp ;保存当前ebp mov ebp,esp ;EBP设为当前堆栈指针 sub esp, xxx ;预留xxx字节给函数临时变量. ... 这样一来,EBP 构成了该函数的一个框架, 在EBP上方分别是原来的EBP, 返回地址和参数. EBP下方则是临时变量. 函数返回时作 mov esp,ebp/pop ebp/ret 即可. ESP 专门用作堆栈指针. 2. 段寄存器: CS(Code Segment,代码段) 指定当前执行的代码段. EIP (Instruction pointer, 指令指针)则指向该段中一个具体的指令. CS:EIP指向哪个指令, CPU 就执行它. 一般只能用jmp, ret, jnz, call 等指令来改变程序流程,而不能直接对它们赋值. DS(DATA SEGMENT, 数据段) 指定一个数据段. 注意:在当前的计算机系统中, 代码和数据没有本质差别, 都是一串二进制数, 区别只在于你如何用它. 例如, CS 制定的段总是被用作代码, 一般不能通过CS指定的地址去修改该段. 然而,你可以为同一个段申请一个数据段描述符"别名"而通过DS来访问/修改. 自修改代码的程序常如此做. ES,FS,GS 是辅助的段寄存器, 指定附加的数据段. SS(STACK SEGMENT)指定当前堆栈段. ESP 则指出该段中当前的堆栈顶. 所有push/pop 系列指令都只对SS:ESP指出的地址进行操作. 3. 标志寄存器(EFLAGS): 该寄存器有32位,组合了各个系统标志. EFLAGS一般不作为整体访问, 而只对单一的标志位感兴趣. 常用的标志有: 进位标志C(CARRY), 在加法产生进位或减法有借位时置1, 否则为0. 零标志Z(ZERO), 若运算结果为0则置1, 否则为0 符号位S(SIGN), 若运算结果的最高位置1, 则该位也置1. 溢出标志O(OVERFLOW), 若(带符号)运算结果超出可表示范围, 则置1. JXX 系列指令就是根据这些标志来决定是否要跳转, 从而实现条件分枝. 要注意,很多JXX 指令是等价的, 对应相同的机器码. 例如, JE 和JZ 是一样的,都是当Z=1是跳转. 只有JMP 是无条件跳转. JXX 指令分为两组, 分别用于无符号操作和带符号操作. JXX 后面的"XX" 有如下字母: 无符号操作: 带符号操作: A = "ABOVE", 表示"高于" G = "GREATER", 表示"大于" B = "BELOW", 表示"低于" L = "LESS", 表示"小于" C = "CARRY", 表示"进位"或"借位" O = "OVERFLOW", 表示"溢出" S = "SIGN", 表示"负" 通用符号: E = "EQUAL" 表示"等于", 等价于Z (ZERO) N = "NOT" 表示"非", 即标志没有置位. 如JNZ "如果Z没有置位则跳转" Z = "ZERO", 与E同. 如果仔细想一想,就会发现 JA = JNBE, JAE = JNB, JBE = JNA, JG = JNLE, JGE= JNL, JL= JNGE, .... 4. 端口 端口是直接和外部设备通讯的地方。外设接入系统后,系统就会把外设的数据接口映射到特定的端口地址空间,这样,从该端口读入数据就是从外设读入数据,而向外设写入数据就是向端口写入数据。当然这一切都必须遵循外设的工作方式。端口的地址空间与内存地址空间无关,系统总共提供对64K个8位端口的访问,编号0-65535. 相邻的8位端口可以组成成一个16位端口,相邻的16位端口可以组成一个32位端口。端口输入输出由指令IN,OUT,INS和OUTS实现,具体可参考汇编语言书籍

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/jiangredsheep/archive/2005/03/12/318072.aspx

 

  汇编的程序往往不是独立编写使用的,它经常被其它高级语言调用。
  在开发中需要高速的代码的时候,我就会把他做成汇编的子程序,然
  后让VC的程序来调用。
   在WIN32平台上的汇编的编写使用的模式不同于DOS,在DOS上写程序
  往往使用small、large 等模式,但是在WIN32上一定要使用flat模式。
  也就是说需要在源文件中定义.model flat。
   在老式的C上,函数名汇编成 _func() 这样的形式,但是C++就没有那
  么简单了。C++的目标代码中的函数名与源代码中的函数名非常的不同。
  所以需要在使用汇编子程序的时候用 extern "C"指明这个按照C的习惯
  来编译。
   下面这个例子是用qsort()对整数数组进行排序,CompInt()使用汇编
  写的比较两个数据大小的回调函数。CompInt1()使用C++写的。大家
  可以比较一下这两个函数的速度上的差异。
  汇编部分的编译方法,形成.obj文件后把它加入到你的VC工程中去。
  ml /c XXX.asm
  //#######################################################################
  // VC代码部分
  #include "stdafx.h"
  #include <windows.h>
  #include "stdio.h"
  #include <stdlib.h>
  // 汇编自函数的原型声明
  extern "C" int CompInt(const void*, const void*);
  void OutInt(int x, int y)
  {
  printf("%d %d/n", x, y);
  }
  int CompInt1(const void *p1, const void *p2)
  {
  if(*(int*)p1 > *(int*)p2)
   return 1;
  else if(*(int*)p1 < *(int*)p2)
   return -1;
  else
   return 0;
  }
  #define SIZE (1024*1024)
  int a[SIZE];
  LARGE_INTEGER t0, t1, f;
  void main()
  {
  int i;
  srand(102344);
  for(i=0; i<SIZE; i++)
  {
   a[i] = rand()*10*SIZE/RAND_MAX;
  }
  printf("/n");
  puts("sorting...");
  QueryPerformanceFrequency(&f);
  QueryPerformanceCounter(&t0);
  qsort(a, SIZE, sizeof(int), CompInt);
  printf("------------------------complete/n");
  QueryPerformanceCounter(&t1);
  printf("t = %lf/n", (double)(t1.QuadPart-t0.QuadPart)/((double)(f.QuadPart)));
  }
  #################################################################################################
  // 汇编代码部分
  .586
  .MODEL FLAT
  _OutInt PROTO NEAR32,
  .CODE
  _CompInt PROC
   push ebx;
   push ecx;
  
   mov ecx, [esp+12]; // 取参数
   mov eax, [ecx];
   mov ecx, [esp+16];
   mov ebx, [ecx]
  
   ; push eax; // 调用C中的子函数,还没有在C++上面试通
   ; push ebx; // 另外,我发现C的函数不会保护寄存器,很奇怪
   ; push eax; // 所以要自己保护寄存器
   ; push ebx;
   ; call _OutInt;
   ; add esp, 8
   ; pop ebx;
   ; pop eax;
  
   cmp eax, ebx; // 比较,分三种情况返回
   jc l_c;
   jz l_z;
   mov eax, 1
   pop ecx;
   pop ebx
   ret ; // a>b 返回
  l_z:
   mov eax, 0; // 相等
   pop ecx; // 清零的方法比较傻,请勿耻笑
   pop ebx
   ret
  l_c:
   mov eax, 0ffffffffh; // a < b
   pop ecx;
   pop ebx
   ret
  _CompInt ENDP
  END

你可能感兴趣的:(c,框架,汇编,dos,Integer,语言)