(4.1)亿万级数据处理(分而治之/Hash映射 + HashMap统计 + 堆/快速/归并排序)
秘技一:分而治之/Hash映射+HashMap统计+堆/快速/归并排序Hash任意长度的输入(又叫做预映射,pre-image)通过散列算法变换成固定长度的输出(散列值)。这种转换是一种压缩映射,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,而不可能从散列值来唯一的确定输入值。简单说就是一种将任意长度的消息压缩到某一固定长度的函数。hash映射:简单来说,为了便于内存中处理大