编程珠玑(第二版)读书笔记【1、2】

第一章

问题:

一个文件F,包含最多1000万条无序的、不重复的记录,每条记录都是一个7位的十进制正整数,利用1MB左右的内存空间,按照整数的大小对文件进行升序排序,将结果保存到文件FO中。

分析:

1MB内存,共有1024*1024*8=8388608bit,如果每个正整数采用32位二进制存储,可以存放1024*1024*8/32=262144条记录。一个7位十进制正整数在[1,10000000)之间。

解决方案1

使用基于临时文件的归并排序,大致的方法如下:

第一次从F中读取前250000条记录,在内存中用快速排序进行排序,输出到一个临时文件TmpF0中,之后以此类推,每次从F中读取250000条记录,排序后存入临时文件TmpFi中。

最后,将临时文件TmpF0-TmpF39,这40个临时文件进行归并,存入FO

解决方案2

40趟读取F,方法大致如下:

40趟,第一趟从F中找出数值在0-249999之间的记录,放入内存,用快速排序进行排序,然后保存到输出文件FO中。这样就省去了临时文件,但需要从头到尾将输入文件F读取40次。

解决方案3

位图法,方法大致如下:

由于记录的数值不超过1000万,可以用1000万个bit来标记一个整数是否存在,这样需要1.192MB的内存空间就可以标记所有的7位正整数。先将这1000万个bit全部置零,然后对F扫描,如果一个数值存在,则将对应的位置1,最后将对应位为1的数值按照升序写入文件FO

第二章

第二章中解决了三个小问题;

A、找出顺序文件中缺失的记录。用的是二分查找的方法。

B、在正比于n的时间内将一个n元一维向量循环左移i个位置(i < n)

此问题解决方法是将向量中0i-1号元素翻转,再将in-1号元素翻转,最后将整个向量翻转,即:

Reverse(0, i-1);

Reverse(I, n-1);

Reverse(0, n-1);

C、找出英语词典中所有变位词的集合。变位词就是例如potsstoptops这样的单词。

此问题解决方法是给词典中的每一个单词做标识,比如将每个单词中的字母按字典序排列后作为该单词的标识,然后所有单词按照标识排序,最后去掉重复的标识。

你可能感兴趣的:(读书笔记)