街机模拟游戏逆向工程(HACKROM)教程:[1]数据的存储与读取

街机模拟游戏逆向工程(HACKROM)教程:[1]数据的存储与读取_第1张图片

简介

在计算机中,数据存储的介质一直在变化,从最早的穿孔纸带,到现在的固态硬盘。但存储的原理是一直没有变化的,在计算机中,我们所存储的数据,一直都是以二进制的形式被存储存在不同的介质中。

计算机用位 (bits) 来存储数据,每一位可以是两种状态之一:0或1,这就是二进制数字。而这种形式十分不方便记忆,所以,为了方便记忆,每个二进制数字,都可以转换为十六进制数字或十进制数字。

二进制 十六进制 十进制
0001 $01 1
0010 $02 2
0011 $03 3
0100 $04 4
0101 $05 5
0110 $06 6
0111 $07 7
1000 $08 8
1001 $09 9
1010 $0A 10
1011 $0B 11
1100 $0C 12
1101 $0D 13
1110 $0E 14
1111 $0F 15

数据长度

在计算机中,最小的长度为位(bits),也是计算机中用来存储的基本单位。

当我们把8个位(bits),放到一起,那我们就得到了一个单字节(byte)的长度。

把两个单字节长度放到一起,就可以得到一个字 (word)的长度,或者叫双字节。

我们把两个字(word)放到一起,就可以得到一个长字 (long-word),或者叫四字节。

在街机游戏的逆向研究中,我们通常使用一个名为M68K的汇编语言,在这个汇编语言中,我们常用的数据长度就是这三种,分别用B,W,L来表示这三种数据的长度。而位的形式,在这个汇编中,也常常会使用。

长度 二进制 十六进制
字节 0010 1100 2C
0010 1100 1111 0101 2C F5
长字 0010 1100 1111 0101 1001 1101 0111 0110 2C F5 9D 76

二进制存储原理

我们以最早的穿孔纸带为例,来说明数据是如何存储的:

位(bits) 7 6 5 4 3 2 1 0
10进制 16进制值
1 $01
2 $02
3 $03
4 $04
5 $05
6 $06
7 $07
8 $08
9 $09
10 $0A
11 $0B
12 $0C
13 $0D
14 $0E
15 $0F
16 $10
32 $20
128 $80
255 $FF

 我们把纸带的每一行看成是一个字节的长度,在纸带中,用1来表示该位置已穿孔,代表该位为1。用0来表示该位置未穿孔,代表该位为0。这样,我们就把这些数据保存在了一个纸带上面。

而对于现代的比如硬盘,光盘,它们的存储原理是一样的,只是存储的介质发生了变化,硬盘是用磁性物质的S和N极代表示该位置为0和1,光盘是用一个个凹凸来表示该位置的0和1。

当然,因为二进制数值难于阅读和记忆,我们用各种工具软件,从中读出来的数据是已经被转换为了16进制数值。

助记符

因为我们从计算机中所读取到的数据都是二进制,我们基本上很难去阅读和记忆,所以,这时我们需要一个翻译器,把他们翻译成人类方便理解的方式。比如在m68K汇编中,会把读取到的比如:

0011 1101 0111 1100 0000 0000 0000 0101 0000 0000 1111 1100
3D             7C            00               05              00              FC

 如果只查看二进制或十六进制数值,我们很难理解,这段数据有什么作用。所以,M68K把他翻译为一段方便阅读和记忆的助记符:

move.w  #5,$FC(a6)

 我们把这段助记符分成四个部份:

1、命令:                - move ,代表了这句代码在程序中的作用

2、操作长度:         - 指定该指令想要操作的数值长度,以B(字节),W(字),L(长字)表示

3、源操作数:        - 表示了数据的从哪里读取

4、目的操作数:    - 表示了数据在运算后会哪里会被修改或者操作

你可能感兴趣的:(经验分享,汇编,游戏程序)