《编程珠玑》读书笔记(一)

第一章

以下转载自 http://www.cnblogs.com/wuyuegb2312/p/3136831.html

位向量的定义和应用:位向量/位图在充分利用小空间存储大数据方面很有优势。Linux内核中很多用到了位向量。

一般地,对于多个对象和一个性质,这些对象可能满足(true)也可能不满足(false)这条性质。那么,为了表示所有对象对这个性质的满足情况,最容易想到的方式是分配一个int型变量(这里不讨论布尔型,C++没有对布尔型占用空间有明确规定;本文主要讨论C)作为标志,用1表示满足条件,用0表示不满足条件。同时为了方便查询,把这些对象的标志整合成一个数组。显然,使用int来表示是0还是1有些太浪费空间了,即使把int改为char,浪费的情况也只是减轻了一部分,仍有很大的空间被浪费。考虑到计算机中最小的数据单位是非0即1的二进制位,对于一个对象,使用一个二进制位就足够了。很多语言都具有位运算,利用位运算是可以完成本段开始处提出的要求的。当然,因为不能用一个变量名直接表示一个位,那么可以将多个位组合成一个基本数据类型,通过对这个基本数据类型进行操作,达到使用位的方法。同时,为了方便,延续使用int数组的做法,把这些由位组合成的基本数据类型也组成数组。

经过这样分析,位向量的实现方法大体是:多个位组成一个基本数据类型,基本数据类型组合成数组。根据这个思路就可以写出位向量的表示了。在阅读下面代码前,建议读者尝试自己独立完成,这是一些提示:简单起见,使用int作为位组成的基本数据类型,且int使用32位表示;int数组中元素的个数如何计算?

#define N           10000000 //number of elements
#define BITPERWORD  32 //bits of int depends on machine
int a[(N-1)/BITPERWORD + 1]; //allocate space for bitmap 
//《编程珠玑》原书中是N/BITPERWORD + 1
//如果N恰为BITPERWORD的倍数,那么又要浪费一个int的空间了
//N取0时,仍会浪费一个int的空间
//N非0非BITPERWORD的倍数时,最多是最后一个int不完全利用而已



写完了表示,就需要为这个数据结构增加对应的操作了。对于每个位的操作,有三种:设置为0、设置为1、读取当前值。根据上文位向量的表示,实现这三种操作。同样建议读者先尝试独立完成。以下代码参考自《编程珠玑》习题1.2。

#define SHIFT       5    //32 = 2^5
#define MASK        0x1F // vaule 11111 in binary

//i代表需要进行操作的第i个对象
//i>>SHIFT相当于i/32,将i定位到具体是哪个int中,即a[i>>SHIFT]
//i&MASK相当于i%32 只保留i的0至4位,即i在int中的第几位,然后把1左移这么多位
//将a[i>>SHIFT]和(1<<(i&MASK))视需要进行操作
//同1做或运算或即为位设置
//同1取反再做与运算即为位清除
//同1做与,结果为0则原位为0,为1则原位为1
void set(int i)     {        a[i>>SHIFT] |=  (1<<(i&MASK));}
void clr(int i)     {        a[i>>SHIFT] &= ~(1<<(i&MASK));}
void test(int i)    { return a[i>>SHIFT] &   (1<<(i&MASK));}

使用位向量前不要忘记对所有位进行初始化:
for(i=0;i
Q:为什么不用看上去比较直接的i / 32或者i % 32?

A:提高效率

你可能感兴趣的:(编程珠玑)