第一题:
用天平(只能比较,不能称重)从一堆小球中找出其中唯一一个较轻的,用x次天平,最多可以从y个小球中找出较轻的那个,求y与x的关系式。
分析:
y = 3^x.
例如:Y= 9.
先分成3堆abc,每堆3个小球;
第一次称找出在abc中哪一堆:称a和b,如果天平不倾斜,则a和b一样重,较轻的一个球肯定在c堆中,否则就在ab中较轻的一堆中;
第二次称找出具体是哪个:假设第一称测出在a堆中,a堆中有3个球xyz,称x和y,如果一样重,则轻的为z,否则就为x和y中较轻的那个。
又如Y = 81.
先分成3堆abc,每堆27个小球;
第一次称,分出轻的在abc哪一堆中(每堆27个),然后把该堆分成3堆xyz,每堆9个;
第二次称,分出轻的在xyz哪一堆中(每堆9个),然后把该堆分成3堆mno,每堆3个;
第三次称,分出轻的在mno哪一堆中(每堆3个),然后进行第四次;
第四次称,分出该堆中轻的哪个,结束。
-----------------------------------------------------------------------------------------
第二题:
有一个很大很大的输入流,大到没有存储器可以将其存储下来,而且只输入一次,如何从这个输入流中随机取得m个记录。
分析:
用大小为m的数组arr[0:m-1]来保存随机抽取的元素,,arr[0:m-1]逐步初始化为输入流的前m个元素的一个随机排列。对于输入流中第k个(k>m)元素,随机生成[0,k-1]内的整数i,如果i<=m,则由第k个元素覆盖掉arr[i-1],否则就丢弃掉第k个元素。
参考链接:http://blog.csdn.net/jiyanfeng1/article/details/7937715
-----------------------------------------------------------------------------------------
第三题:
大量的url字符串,如何从中去除重复的,优化时间空间复杂度。
分析:
1.如果内存空间足够把字符串一次存入内存中,则使用hash_map<string,bool>;
2.如果内存空间不足够把字符串一次存入内存中,则先用hash的方法把这些字符串分配到n个硬盘空间,保证每个空间能够一次读入内存中,之后再采取1中的方法hash_map<string,bool>.