多路归并排序

将一个大文件分割为小文件,对小文件进行内存排序,在对排序后的小文件做合并即可。关于合并,可以采用堆来实现,堆中存储每个小文件中的最小值,以此从堆中取出最小值,输入到结果文件,同时从最小值对应文件中取出下一个最小值,保持堆依然存储每个小文件的最小值。

如果只需要对文件按键值分组(不关心键之间的顺序),则采用哈希函数,将不同的键值对应的记录划分到不同的文件,对子文件进行排序即可,然和直接合并子文件即可。

你可能感兴趣的:(多路归并排序)